Está en la página 1de 14

Calidad de la evidencia y grado de recomendacin

Autores

Introduccin

Merc Marzo Castillejo 1


Cristina Viana Zulaica 2

1. Especialista en Medicina Familiar y Comunitaria y en M. Preventiva y Salud Pblica.


Divisi dAtencin Primaria del Institut
Catal de la Salut. Miembro del grupo de
trabajo GRADE. Coordinadora del Comit
cientco de semFYC
2. Especialista en M. Familiar y Comunitaria.
Servicio de Atencin Primaria de ElviaMesoiro- SERGAS- A Corua.
Miembros de grupos de la Red Temtica de
Investigacin sobre Medicina Basada en la
Evidencia (Expte FIS: G03/090)
Guas Clnicas 2007; 7 Supl 1: 6

Elaborada por mdicos con revisin posterior por


colegas.
Conicto de intereses: Ninguno declarado.

www.sterra.com

n el captulo 5 se han descrito los pasos a seguir en el proceso de elaboracin de una Gua de Prctica Clnica (GPC). Se seal que para dar
respuesta a las preguntas clnicas y asegurar que las recomendaciones estn
basadas en la mejor evidencia disponible, los diferentes estudios identicados a partir de la bsqueda de la
literatura se deben evaluar con la
Los conceptos de calidad, nivel de evinalidad de disponer de los datos
dencia y grado de recomendacin fory de la informacin ms apropiaman el eje central de la denicin de
dos1 (lectura crtica de la literatuGPC basada en la evidencia, ya que
ra). El objetivo de este captulo
son los instrumentos que proporcioes revisar de forma ms especnan a los clnicos reglas slidas para
ca los apartados de sntesis de
valorar la investigacin publicada, dela evidencia y formulacin de las
terminar su validez y su utilidad en la
recomendaciones.
prctica clnica.
En el desarrollo de una GPC,
los conceptos de calidad, nivel de
evidencia y grado de recomendacin forman el eje central de la denicin
de GPC basada en la evidencia, ya que son los instrumentos que intentan
estandarizar y proporcionar a los clnicos reglas slidas para valorar la investigacin publicada, determinar su validez y resumir su utilidad en la prctica
clnica2. Este proceso debera ser transparente y realizarse de forma sistemtica3.
La estrategia de separar los niveles de evidencia y los grados de recomendacin tuvo su origen en la Canadian Task Force on Preventive Health Care
(CTFPHC)4. La CTFPHC fue creada en el ao 1976 a partir de una Conferencia
de los Ministros de Sanidad de las diez provincias de Canad. La CTFPHC ,
en el desarrollo de su metodologa, contempl el peso de la evidencia cientca para hacer recomendaciones ya fueran a favor o en contra de incluir
intervenciones de prevencin en las personas asintomticas4. En esta metodologa se introduce la nocin de que la evidencia cientca se presenta de
manera jerrquica, y que algunos diseos de estudio estn ms sujetos a
sesgos que otros y, por lo tanto, justican en menor medida las decisiones
clnicas2.
Posteriormente diferentes instituciones y sociedades cientcas tambin
han contemplado estas diferencias en la apreciacin de la calidad de las
evidencias y han ido desarrollando diversos sistemas de clasicaLa existencia de diferentes clasicaciocin para evaluar y estructurar la
nes para evaluar y clasicar la evidenevidencia y establecer los grados
cia y las diferentes interpretaciones de
de recomendacin. Actualmente
los grados de evidencia hace que en
existen ms de 100 sistemas de
el ao 2000 se cree el grupo de traclasicacin para valorar la calibajo GRADE. Este grupo que intenta
5
dad de la evidencia . En el anexo
construir y validar una clasicacin que
1 se describen las clasicaciones
equilibre la sencillez con la necesidad
ms conocidas y utilizadas en
de integrar todos los aspectos impornuestro medio:
tantes a la hora de evaluar las eviden Canadian Task Force on
cias y graduar las recomendaciones.
Preventive
Health
Care
(CTFPHC)4,6,7
US Preventive Services Task Force (USPSTF). (actualmente integrada en
la Agency for Healthcare Research and Quality-AHRQ)7,8
US Agency for Health Care Policy and Research (actualmente denominada
AHRQ)9
Centro de Medicina Basado en la Evidencia de Oxford (OCEBM)10
Scottish Intercollegiate Guidelines Network (SIGN)11
National Institute for Clinical Excellence (NICE)12,13
En la mayora de las clasicaciones se opta por sealar unos niveles de evidencia y grado de recomendaciones que slo tienen en cuenta los estudios
sobre intervenciones teraputicas. La clasicacin del Centro de Medicina
Basada en la Evidencia de Oxford, se justica por la necesidad de evaluar

Calidad de la evidencia y grado de recomendacin


no slo las intervenciones teraputicas y preventivas,
sino tambin aquellas ligadas al diagnstico, pronstico, factores de riesgo y evaluacin econmica10. La
clasicacin de NICE opta por adaptar la clasicacin
de SIGN para estudios de intervencin y la clasicacin de Oxford para estudios de pruebas diagnsticas13.
La descripcin de las clasicaciones disponibles,
su calidad y limitaciones han sido evaluadas por diferentes autores. Para las personas interesadas en
profundizar en el tema se puede ampliar informacin
con los siguientes documentos de revisin: Una de
estas revisiones es la realizada por la AHRQ, donde
se evalan 19 clasicaciones5 y la otra realizada por
el grupo de trabajo de GRADE donde se evalan 7 de
estas clasicaciones14.
La proliferacin de clasicaciones para evaluar y
clasicar la evidencia y las diferentes interpretaciones de los grados de evidencia plantea potenciales
problemas para los usuarios2,15. Por un lado, esta
situacin entra en contradiccin con el propio concepto de Medicina Basada en la Evidencia (MBE), ya
que la MBE es un instrumento que en parte ha sido
creado para reducir las inconsistencias innecesarias y
ayudar a estandarizar la prctica clnica. Y en consecuencia, los diferentes criterios de las clasicaciones
disponibles y las inconsistencias en la nomenclatura,
introducen una amplia gama de variabilidad en las
prcticas basadas en la evidencia cientca2.
En el ao 2000 y con el objetivo de abordar las
deciencias de los actuales sistemas de clasicacin,
personas de las diferentes instituciones que han
desarrollado estas clasicaciones y/o elaboran GPC
crearon el grupo de trabajo Grading of Recommendations Assessment, Development and Evaluation
(GRADE) Working Group15, 16. Este grupo de trabajo
ha desarrollado el sistema GRADE, el cual persigue
hacer juicios ms coherentes y que la comunicacin
de dichos juicios pueda respaldar opciones mejor
fundamentadas en la atencin sanitaria15. El nuevo sistema para guiar los juicios complejos trata de
equilibrar la necesidad de sencillez con la necesidad
de considerar de forma global y transparente todos
los aspectos importantes de la gradacin de la evidencia. Los autores de GRADE han desarrollado ampliamente el instrumento para evaluar los estudios
de intervencin y actualmente se est avanzando en
la validacin de esta clasicacin para los estudios
de diagnstico. El grupo GRADE public su primer
artculo explicando en qu consiste esta clasicacin
en un BMJ del ao 200415, y la traduccin de este
artculo al castellano se puede encontrar en la web
(http://www.gradeworkinggroup.org/).

Experiencia sobre la sntesis de evidencias en nuestro medio

n nuestro medio la elaboracin de GPC basadas en la evidencia cientca no es todava muy


abundante. Hace unos aos ya constatamos que las
instituciones que empezaron a elaborarlas con una
metodologa rigurosa se podan contar con los dedos
de una mano17. Actualmente, y segn podemos identicar a travs del portal GuaSalud, las GPC que han
cumplido los criterios de calidad y que estn en este
catlogo del Sistema Nacional de Salud, todava son
muy escasas18.
En nuestro entorno, los diferentes grupos que estn elaborarndo GPC, han buscando informacin en
las mismas fuentes y han revisado los documentos
y materiales de los grupos internacionales (SIGN,
New Zealand, AHQR yNICE) que elaboran GPC. Sin

Guas Clnicas 2007; 7 Supl 1: 6


embargo las diferentes instituciones elaboradoras de
guas en nuestro medio, ha optado por una clasicacin diferente. A modo de ejemplos las GPC de Osakidetza han utilizado la clasicacin de SIGN, en el
Institut Catal de la Salut, la clasicacin de la AHQR
y en el proyecto de semFYC junto a las diversas sociedades cientcas y el Centro Cohrane Iberoamericano, la clasicacin de Oxford. Posiblemente esto
haya generado un poco ms de inconsistencia y confusin a los usuarios de nuestras GPC. No obstante,
algunas de estas instituciones ya estn debatiendo
la pertinencia de utilizar el sistema de clasicacin
GRADE19. En el anexo 2, transcribimos una nota metodolgica sobre el sistema de clasicacin GRADE
elaborada para la revista de Atencin primaria basada en la evidencia.

Aspectos metodolgicos en el proceso


de la sntesis de la evidencia y grado
de recomendacin

ndependientemente de la clasicacin escogida, en


todo proceso de elaboracin de una GPC se deben
seguir una serie de pasos que a continuacin vamos
a describir.

El grupo de elabora-

Identicar la evidencin de la gua adems


cia
de identicar la inforEs un paso preparatorio
macin suministrada
al proceso de clasicar
por la literatura cientla calidad de la evidencia
ca necesita conocer el
y graduar las recomenfuncionamiento de los
daciones y esencial para
servicios sanitarios, el
articular las respuestas a
nivel de actividad y las
las preguntas clnicas. Es
variaciones locales que
una tarea laboriosa, en
la que se trata de enconpuedan ser signicatitrar la mejor evidencia a
vas. Esta informacin
partir de una bsqueda
ayuda a identicar las
de la bibliografa en las
diferencias entre la
fuentes ms relevantes,
prctica clnica actual
con rigor y con la mnima
y la ideal y las expepresencia de sesgos19.
riencias de los pacienEn este punto el objetites, de tal manera que
vo tambin es identicar
las recomendaciones
aspectos en los que la
tengan el mximo imfalta de evidencias haga
pacto.
necesario articular mtodos de consenso.
La bsqueda bibliogrca se debe realizar mediante una estrategia que ha de ser sensible (habilidad para encontrar informacin relevante) y especca (habilidad para excluir documentos irrelevantes),
cualidades relacionadas con los descriptores utilizados y el perodo de tiempo establecido entre los lmites. El grupo elaborador tras consultar a expertos
en el tema objeto de la gua decide los lmites que se
establecen. Se intentar incluir los aos en los que se
hayan publicado ms estudios y con resultados ms
relevantes. Si existe una revisin sistemtica (RS), la
bsqueda adicional se limitar a la actualizacin tras
la publicacin de la RS , en los casos en los que la
RS no mencione todos los resultados relevantes nos
plantearemos realizar una nueva bsqueda. En ocasiones es necesario contactar con los autores de los
trabajos publicados o pendientes de publicacin19.
Todos los pasos mencionados deben ser repetibles y trasparentes, documentado la estrategia de
bsqueda, y los criterios de inclusin y exclusin de
los originales para identicar evidencias, as como los
trminos elegidos.
Al identicar la evidencia hay una serie de docu-

www.sterra.com

Guas Clnicas 2007; 7 Supl 1: 6


mentos que deberan ser excluidos19
Estudios con diseos poco adecuados si hay documentos de mejor calidad
Material comercial
Folletos divulgativos
Artculos, comentarios y editoriales que interpretan los resultados de lo publicado
Experiencias individuales salvo que formen parte
de un estudio bien diseado
Revisin y gradacin de la evidencia
Los estudios encontrados tras la bsqueda se revisarn para elegir los que ofrecen datos ms tiles para
responder a las preguntas clnicas y asegurar que las
recomendaciones estn basadas en la mejor evidencia. Estos pasos, al igual que en apartado anterior,
se deben realizar de manera explcita, reproducible y
transparente20. La revisin se llevar a cabo mediante un proceso de revisin sistemtica que incluye lo
siguiente12:
Seleccin de estudios relevantes
Antes de disponer de los artculos completos se hace
un proceso de criba que incluye varios pasos, en cada
uno de ellos se elimina aquel material no relevante
segn los criterios predenidos:
Lectura de los ttulos
Lectura de los resmenes
Examen de los resmenes en funcin de los objetivos de la gua
Revisin de documento completo
Para evitar sesgos se recomienda que dos personas
individualmente repitan el mismo proceso con una
seleccin aleatoria de resmenes20.
Evaluacin de la calidad de los estudios
Una vez que se han seleccionado los estudios, el
siguiente paso es evaluar su calidad y validez. La
evaluacin se realiza cumplimentando una planilla
de lectura crtica que consta de una serie de preguntas especcas acerca del diseo y resultados del
estudio. Las planillas con los criterios de calidad son
diferentes segn el tipo de estudio (ensayo clnico,
estudios de cohortes, estudios de pruebas diagnsticas) y para cada estudio la evaluacin se realiza de
acuerdo a los aspectos que se recogen en cada una
de las planillas21.
En nuestro medio las planillas de lectura crtica
ms utilizadas por los elaboradores de GPC son las
de SIGN, que podemos encontrar en su manual para
elaboradores de GPC (SIGN 50)11, el cul est traducido al espaol y tambin las planillas de CASPE, a
las cules se puede acceder a travs de Internet22
La evaluacin es un aspecto clave en la revisin
y la deberan realizar al menos 2 revisores de forma
independiente. Para la evaluacin global de cada estudio muchos elaboradores de guas utilizan la escala
++, + -, que reeja la posibilidad de ausencia
de sesgos. El resultado de la evaluacin denir el
nivel de evidencia del estudio y su consiguiente impacto en la clase de la recomendacin.
Sntesis de los resultados
Obtencin de los datos y tablas de evidencia:
Los resultados de la evaluacin se incluyen en una
tabla de evidencia, estas tablas ayudan a identicar
los parecidos y diferencias entre los estudios en sus
aspectos clave: caractersticas de la poblacin, intervenciones y medidas de resultado.
Las tablas de evidencia facilitan la comparacin y
ayudan a comprobar la posibilidad de calcular un estimador de efecto. La sntesis de la evidencia puede
realizarse por mtodos cualitativos y cuantitativos.

www.sterra.com

Calidad de la evidencia y grado de recomendacin


Los mtodos cualitativos consisten en resumir lo encontrado en los estudios individuales que reejen con
la mayor exactitud la relevancia de la evidencia encontrada. Los mtodos cuantitativos se realizan cuando
Para realizar la eliminacin de los traexisten estudios con el misbajos no relevantes de la seleccin promo diseo y se dispone de
ducto de la bsqueda bibliogrca se
los datos necesarios, se utirealiza un proceso de criba cuyos dos
liza una tcnica estadstica
primeros pasos son la lectura de los
que combina los resultados
ttulos y de los resmenes de los trabade diferentes estudios con el
jos seleccionados.
mismo diseo que es el metaanlisis. Mediante anlisis
de sensibilidad se puede conocer el impacto de los
datos perdidos12.
La evaluacin conjunta de los distintos estudios
se recoge en forma de una tabla de evidencia que
resume la calidad global de la evidencia y el balance
entre los benecios y los riesgos. Al resumir la informacin hemos de tener en cuenta:
El volumen de la evidencia: De cuntos estudios
disponemos? De cuntos pacientes disponemos?
La validez interna: Qu calidad tienen los estudios? Qu tipo de sesgos les afecta?
La aplicabilidad: Hasta
qu punto se pueden apliLas tablas de evidencia facilitan la
car estas intervenciones a
comparacin y ayudan a comprobar la
nuestra poblacin? Estas
posibilidad de calcular un estimador de
intervenciones estn disefecto, cuando se comparan estudios
ponibles en aquellos lugacuantitativos con el mismo diseo y
res donde se ha de implese dispone de los datos necesarios se
mentar la GPC?
puede realizar un metaanlisis.
Generalizacin
/Validez
externa: Hasta que punto se pueden extrapolar los datos de otras poblaciones?: Riesgo basal, edad, etc. Personal capacitado, otros actores culturales.
Consistencia: Los resultados de los estudios son
consistentes: en los diferentes diseos de estudios, entre diferentes poblaciones?
Impacto clnico: Teniendo en cuenta el tamao de
la muestra, la magnitud del efecto, el benecio
relativo comparando con otras opciones, recursos
implicados, los costes, el balance entre benecios
y riesgos.
Niveles de evidencia:
A los estudios de intervencin que renen un mnimo
de criterios de calidad se les asignan a un nivel de
evidencia que ser til tanto para el grupo elaborador, como para que los usuarios de la gua conozcan
el tipo de evidencia en el que se ha basado la recomendacin.
En este punto y teniendo en cuenta la necesidad
de escoger una clasicacin, nos parece que hasta que la colaboracin internacional no llegue a un
acuerdo, la opcin de NICE es muy acertada. Como
hemos comentado en los apartados previos NICE ha
optado por utilizar la clasicacin de SIGN para los
estudios de intervencin y la clasicacin de Oxford
para los estudios de diagnsticos [Anexo 1: Descripcin de las clasicaciones ms conocidas y utilizadas
en nuestro medio]. No obstante, pensamos que en
un futuro prximo GRADE ser una realidad a nivel
internacional. Y como hemos descrito en el anexo 2
la iniciativa GRADE en el apartado de calidad de la
evidencia, propone juzgar la calidad de la evidencia
en los diferentes estudios para cada una de las variables (resultados importantes), tener solo en cuenta
las variables clave a la hora de tomar una decisin
y describir la calidad global a partir de las variables
clave.

Calidad de la evidencia y grado de recomendacin


Gradacin de la evidencia
Al realizar la evaluacin de la calidad, como hemos
comentado, a los artculos se les asigna un cdigo
que se representa ++, + -. Los estudios incluidos en el grupo -, en general, no se usan para
sentar recomendaciones12, pero se consideran las siguientes posibilidades:
Si hay estudios de buena calidad que ayuden a
responder a las preguntas clnicas y sus resultados son consistentes, se rechazan los estudios del
grupo -.
Si las conclusiones de los estudios clasicados
como - forman parte de un cuerpo de evidencia
razonable que muestra las
mismas conclusiones, aunTodo el material producto de los diferenque de manera dbil, que
tes pasos de la elaboracin de la gua:
otros estudios -, se pueden
bsqueda bibliogrca, planillas de
incluir en la tabla de evidenlectura crtica, tabla de evidencia, etc.,
cia para demostrar el alcance
sirve de base al grupo de trabajo de la
de la consistencia.
GPC para elaborar las recomendacio Si los estudios - sugieren
nes, para ello realiza una interpretacin
una diferencia en los resulde las pruebas cientcas disponibles y
tados se deben dejar en la
mediante un mtodo de consenso se
tabla de evidencia para ser
alcanza un acuerdo sobre el contenido
discutido posteriormente en
de las mismas.
el grupo.
Elaboracin de recomendaciones
El grupo de elaboracin de la gua adems de identicar la informacin suministrada por la literatura
cientca necesita conocer el funcionamiento de los
servicios sanitarios, el nivel de actividad y las variaciones locales que puedan ser signicativas. Esta
informacin ayuda a identicar las diferencias de la
prctica clnica actual, la provisin de servicios y las
experiencias de los pacientes, de tal manera que la
orientacin de las recomendaciones tenga el mximo
impacto en los servicios y en los resultados19
Todo el material previo (bsqueda bibliogrca,
planillas de lectura crtica, tabla de evidencia, etc.)
nos sirve de base para elaborar las recomendaciones.
Esta elaboracin se produce a partir de la interpretacin de las pruebas cientcas disponibles y es derivada de un mtodo de consenso que inevitablemente
involucra valores de juicio por parte del grupo que
elabora la GP. Este proceso debe ser explcito, para
que el juicio hecho a partir de las evidencias sea lo
ms claro posible13.
Diferentes factores contribuyen al proceso de elaboracin de las recomendaciones:
La naturaleza de la evidencia (susceptibilidad al
sesgo)
Aplicabilidad de la evidencia a la poblacin de inters
Costos
Caractersticas del sistema de salud
Creencias y valores de grupo que confecciona las
recomendaciones.
Las recomendaciones de la gua generalmente se clasican de acuerdo al peso de la evidencia sobre la
que se apoyan. Es importante esto y que las recomendaciones estn formuladas de manera clara. Muchos usuarios de las guas se centran exclusivamente
en la lectura de las recomendaciones sin examinar el
documento completo de la gua, la clasicacin del
grado de recomendacin supone una indicacin de
la conanza en que se producirn los resultados deseados.
Los pasos a seguir en el desarrollo de las recomendaciones son:
Traducir la evidencia en recomendaciones
Una vez que se ha examinado la evidencia y se
ha discutido su adecuacin para responder a las

Guas Clnicas 2007; 7 Supl 1: 6


preguntas clnicas es necesario transformarla en
recomendacin. Si el peso de la evidencia es muy
fuerte (nivel 1 de evidencia), el proceso se puede
realizar de manera sencilla. En muchos casos el
peso de la evidencia no est tan claro.
Redactar las recomendaciones
Es un aspecto muy importante por el motivo ya
comentado, puede ser la nica referencia para un
nmero importante de usuarios. El grupo de elaboracin debe estar de acuerdo con el resultado
nal. Algunos aspectos a tener en cuenta a la hora
de redactar las recomendaciones son13:
Redactar de una en una
Redaccin no ambigua
Estar orientadas a la accin
Ordenadas por tema y siempre que sea posible
asignada a una grupo determinado
No utilizar nombres comerciales en el caso de
frmacos o de tcnicas comercializadas.
No incluir dosis de frmacos
Explicitar cuando la recomendacin de un frmaco en la GPC es con una indicacin no incluida en su cha tcnica
Utilizar tcnicas que mejoren la calidad de presentacin de las recomendaciones.
Resaltadas claramente respecto a los comentarios que se hagan.
Las recomendaciones deben tener en consideracin al paciente, intentarn evitar el uso de
palabras tales como sujeto en lugar de personas o pacientes.
Clasicando las recomendaciones
Enlazando con el apartado de niveles de evidencia
y siguiendo la clasicacin escogida (SIGN para
estudios de intervencin y Oxford para pruebas
diagnsticas), las recomendaciones se han de clasicar de acuerdo al peso de la evidencia sobre la
que se sustentan.
Actualmente, y como hemos comentado en la introduccin, se cuestiona la utilidad de un sistema
de clasicacin basado solamente en el nivel de
evidencia porque no tiene en cuenta la importancia de la actualizacin de las recomendaciones en
la prctica y la mejora del cuidado del paciente.
El desarrollo de la iniciativa GRADE persigue que
en un futuro se puedan incluir estos aspectos a
la hora de presentar las recomendaciones de las
GPC. Tal como se ha descrito en el anexo 2 esta
iniciativa en el apartado de fuerza de la recomendacin tiene en cuenta las consideraciones acerca
de: todas las variables de resultado claves, la calidad de la evidencia, el balance entre benecios
y riesgos, la contextualizacin de la evidencia a
las circunstancias especcas (valores y preferencias), la incertidumbre sobre el riesgo basal, as
como la consideracin de los costes (utilizacin de
recursos). Y a modo de ejmplo la categora de recomendacin sugerida por GRADE de Hazlo (recomendamos o deberamos recomendar) es un
recomendacin fuerte a favor de, e indica que los
benecios claramente sobrepasan los riesgos y
que la gran mayora de personas bien informadas
haran la misma eleccin (alta conanza, poca incertidumbre).
Priorizacin de las recomendaciones para la implementacin
Muchas guas con frecuencia contienen un nmero considerable de recomendaciones producto de
una importante cantidad de preguntas clnicas, la
priorizacin de las recomendaciones se hace con
el objetivo de ayudar a los usuarios de las guas,
y resaltar criterios que puedan ser utilizados como
indicadores de calidad asistencial. Es recomenda-

www.sterra.com

Guas Clnicas 2007; 7 Supl 1: 6


ble priorizar un nmero de recomendaciones que
no sea superior a diez. Se pueden usar muchos
criterios para realizar la seleccin, no existen normas escritas de cmo hacerlo pero es importante
tener en cuenta13:
El alto impacto clnico
Un alto impacto en la reduccin de la variabilidad
Implica un uso ms eciente de los recursos

Decisiones de grupo y consenso

a elaboracin de una GPC en muchas ocasiones


exige que los miembros del grupo tomen decisiones colectivas. Desde la realizacin de preguntas clnicas a la elaboracin de recomendaciones. No hay
normas en las que basarse para decidir cual es la
manera ms adecuada de hacerlo. De manera prctica se recurre a los mtodos de consenso que se
describen a continuacin23.
Grupos focales
Mtodo til para usar en temas en los que no se dispone de informacin suciente para formular una
recomendacin, permite interpretar con mayor profundidad perspectivas especiales, como ocurre, por
ejemplo, con grupo tnicos o inmigrantes.
Mtodos formales de consenso
Ofrecen una alternativa explcita y transparente para
el proceso de toma de decisiones. La eleccin de uno
de estos mtodos formales que seguidamente describimos, est en funcin de las ventajas e inconvenientes de la pregunta a responder, de las necesidades del grupo y de la disponibilidad de tiempo.
En muchas ocasiones se usan frmulas hbridas para
hacerlas ms operativas. Es importante describir el
proceso usado y sus resultados. Los casos en los que
el grupo no cumple las condiciones de un grupo de
consenso han de quedar reejados en el documento,
detallando los aspectos en los que no ha habido convergencia. Hemos de sealar la importancia del papel
del facilitador en la calidad del proceso para cada uno
de los tres mtodos que se describen25.

www.sterra.com

Calidad de la evidencia y grado de recomendacin


Tcnica de Delphi
Se realizan varios envos por correo a los participantes, en el primero de ellos se pregunta sobre su opinin de un tema determinado. En envos sucesivos los
participantes reciben un resumen de los resultados
de las rondas anteriores con la posibilidad de revisar
sus opiniones. Los participantes no se relacionan entre s. Las opiniones de los participantes se agregan
mediante mtodos estadsticos. Este mtodo tiene la
ventaja de que se realiza intercambio de informacin
entre una cantidad importante de personas sin gran
coste, tiene el inconveniente de que se pierden los
aspectos positivos del debate del grupo.
Tcnica de grupo nominal
Es una tcnica de identicacin y de priorizacin que
permite obtener resultados de manera rpida aunque
con menos consenso. Los participantes convocados
por correo o de manera presencial elaboran un listado individualmente, la lista de ideas se devuelve a las
personas cuando estn reunidas para debatir sobre
ellas, posteriormente se emite un voto en privado. Es
muy importante el papel del facilitador, cada idea se
discute por turno y se discuten todas las ideas.
Conferencia de consenso
Consiste en un grupo seleccionado de 10 personas
que se renen para conseguir un consenso, el grupo
se complementa con expertos que no toman parten
de las decisiones del grupo. Tras escucharles se retiran y consideran las preguntas a la luz de la evidencia presentada e intentan alcanzar el consenso.
Las partes abiertas y las privadas del proceso son
compartidas.
Mtodo Rand
Tcnica de consenso que es una modicacin del
mtodo de Delphi al que incorpora elementos de la
tcnica de grupo nominal. Se considera un mtodo
ms explcito y reproductible. En nuestro medio se
ha utilizado con xito para la elaboracin de guas
con escasas evidencias de calidad26.

Calidad de la evidencia y grado de recomendacin

Guas Clnicas 2007; 7 Supl 1: 6

Anexo 1. Descripcin de las clasicaciones ms conocidas y utilizadas en nuestro medio.


Canadian Task Force on Preventive Health Care (CTFPHC)4,6,7

Tabla 1. Grados de recomendacin para las intervenciones especcas de prevencin


A

Existe buena evidencia para recomendar la intervencin clnica de prevencin

Existe moderada evidencia para recomendar la intervencin clnica de prevencin

La evidencia disponible es conictiva y no permite hacer recomendaciones a favor o en contra de la intervencin clnica
preventiva; sin embargo, otros factores podran inuenciar en la decisin.

Existe moderada evidencia para recomendar en contra de la intervencin clnica de prevencin

Existe buena evidencia para recomendar en contra la intervencin clnica de prevencin

Existe evidencia insuciente (en cantidad y en cualidad) para hacer una recomendacin; sin embargo, otros factores
podran inuenciar en la decisin.

Tabla 2. Niveles de evidencia - Graduacin de los diseos de estudio


I

Evidencia a partir de ensayos clnicos aleatorizados

II-1

Evidencia a partir de ensayos clnicos sin aleatorizacin

II-2

Evidencia a partir de estudios de cohortes y casos y controles, preferiblemente realizados por ms de un centro o grupo de investigacin.

II-3

Evidencia a partir de comparaciones en el tiempo o entre sitios, con o sin la intervencin; podran incluirse resultados
espectaculares provenientes de estudios no aleatorizados

III

Opinin de expertos, basados en la experiencia clnica; estudios descriptivos o informes de comits de expertos

Tabla 3. Niveles de evidencia - Calidad de la graduacin (validez interna)


Buena

Un estudio (incluyendo el meta-anlisis y la revisin sistemtica) que cumple los criterios especcos de estudio bien diseado*

Moderada

Un estudio (incluyendo el meta-anlisis y la revisin sistemtica) que no cumple (o no est claro que cumpla)
al menos uno de los criterios especcos de estudio bien diseado*, aunque no tiene defectos fatales.

Insuciente

Un estudio (incluyendo el meta-anlisis y la revisin sistemtica) que tiene en su diseo al menos un defecto fatal o no cumple (o no est claro que cumpla) al menos uno de los criterios especcos de estudio bien
diseado*, aunque no presentaerrores fatales o una acumulacin de defectos menores que hagan que los
resultados del estudio no permitan elaborar las recomendaciones.

www.sterra.com

Guas Clnicas 2007; 7 Supl 1: 6

Calidad de la evidencia y grado de recomendacin

U.S. Preventive Services Task Force (USPSTF)7,8 The U.S. Preventive Services Task Force (USPSTF) grada
sus recomendaciones segn una de estas cinco clasicaciones (A, B, C, D, I) reejando la fuerza de la recomendacin y la magnitud del benecio neto (benecio menos riesgo).

Tabla 1. Fuerza de las recomendaciones


A

La USPSTF recomienda claramente que los clnicos proporcionen la intervencin a los pacientes que cumplan los criterios.
La USPSTF ha encontrado buena evidencia de que la medida mejora de manera importante los resultados en salud y
concluye que los benecios superan ampliamente a los riesgos).

La USPSTF recomienda que los clnicos proporcionen la intervencin a los pacientes. La USPSTF ha encontrado evidencia
moderada de que la medida mejora de manera importante los resultados en salud y concluye que los benecios superan
a los riesgos.

La USPSTF no recomienda a favor o en contra de la intervencin. La USPSTF ha encontrado al menos evidencia moderada
de que la medida puede mejorar los resultados en salud, pero los benecios son muy similares a los riesgos y no puede
justicarse una recomendacin general.

La USPSTF recomienda en contra que los clnicos proporcionen la intervencin a los pacientes asintmaticos. La USPSTF
ha encontrado al menos evidencia moderada de que la medida es inecaz o que los riesgos superan a los benecios.

La USPSTF concluye que la evidencia es insuciente para recomendar a favor o en contra de la intervencin. No existe
evidencia de que la intervencin es inecaz, o de calidad insuciente, o conictiva y que el balance entre los riesgos y los
benecios no se puede determinar.

Tabla 2. Niveles de evidencia - Calidad de la evidencia


Buena

La evidencia incluye resultados consistentes a partir de estudios bien diseados y realizados en poblaciones
representativas que directamente evalan efectos sobre resultados de salud

Moderada

La evidencia es suciente para determinar efectos sobre resultados de salud, pero la fuerza de la evidencia es
limitada por el nmero, la calidad, o la consistencia de los estudios individuales, la generalizacin a la prctica
rutinaria, o la naturaleza indirecta de la evidencia sobre los resultados de salud.

Insuciente

La evidencia es insuciente para evaluar los efectos sobre los resultados de salud debido al nmero limitado
o al poder de estudios, defectos importantes en su diseo o realizacin, inconsistencias en la secuencia de la
evidencia, o falta de informacin sobre resultados de salud importantes.

Agency for Healthcare Research and Quality

Tabla 1. Grados de recomendacin


A

Existe buena evidencia en base a la investigacin para apoyar la recomendacin

Existe moderada evidencia en base a la investigacin para apoyar la recomendacin

La recomendacin se basa en la opinin de expertos o en un panel de consenso

Existe evidencia de riesgo para esta intervencin

Tabla 2. Clasicacin de las recomendaciones en funcin del nivel de evidencia disponible


Ia

La evidencia cientca procede a partir de meta-anlisis de ensayos clnicos controlados y aleatorizados

Ib

La evidencia cientca procede de al menos un ensayo clnico controlado y aleatorizado

IIa

La evidencia cientca procede de al menos un estudio prospectivo controlado, bien diseado y sin aleatorizar

IIb

La evidencia cientca procede de al menos un estudio casi experimental, bien diseado.

III

La evidencia cientca procede de estudios descriptivos no experimentales, bien diseados como estudios comparativos, de correlacin o de casos y controles

IV

La evidencia cientca procede de documentos u opiniones de expertos y/o experiencias clnicas de autoridades de
prestigio

Recoge los niveles de evidencia cientca Ia y Ib

Recoge los niveles de evidencia cientca IIa, IIb y IIII

Recoge el nivel de evidencia IV

www.sterra.com

Calidad de la evidencia y grado de recomendacin

Guas Clnicas 2007; 7 Supl 1: 6

Centre for Evidence-Based Medicine, Oxford

Estudios sobre tratamiento, prevencin, etiologa y complicaciones


Grado de recomendacin

Nivel de evidencia

Fuente

1a

Revisin sistemtica de ECA, con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma direccin.

1b

ECA individual (con intervalos de conanza estrechos)

1c

Ecacia demostrada por la prctica clnica y no por la experimentacin

2a

Revisin sistemtica de estudios de cohortes, con homogeneidad, o sea


que incluya estudios con resultados comparables y en la misma direccin.

2b

Estudio de cohortes individual y ensayos clnicos aleatorios de baja calidad (< 80% de seguimiento)

2c

Investigacin de resultados en salud

3a

Revisin sistemtica de estudios de casos y controles, con homogeneidad, o sea que incluya estudios con resultados comparables y en la
misma direccin.

3b

Estudios de casos y controles individuales

Serie de casos y estudios de cohortes y casos y controles de baja calidad.

*Si tenemos un nico estudio con IC amplios o una revisin sistemtica con heterogeneidad estadsticamente signicativa,
se indica aadiendo el signo (-) al nivel de evidencia que corresponda y la recomendacin que se deriva es una D

Estudios de diagnstico
Grado de recomendacin

Nivel de evidencia

Fuente

1a

Revisin sistemtica de estudios diagnsticos de nivel 1 (alta calidad),


con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma direccin y GPC validadas

1b

Estudios de cohortes que validen la calidad de una prueba especca,


con unos buenos estndares de referencia (independientes de la prueba) o a partir de algoritmos de estimacin del pronstico o de categorizacin del diagnstico

1c

Pruebas diagnsticas con especicidad tan alta que un resultado positivo conrma el diagnstico y con sensibilidad tan alta que un resultado
negativo descarta el diagnstico.

2a

Revisin sistemtica de estudios diagnsticos de nivel 2 (mediana


calidad) con homogeneidad, o sea que incluya estudios con resultados
comparables y en la misma direccin

2b

Estudios exploratorios que, a travs de p. e. una regresin logstica,


determinan qu factores son signicativos , y que sean validados con
unos buenos estndares de referencia (independientes de la prueba), o
a partir de algoritmos de estimacin del pronstico o de categorizacin
del diagnstico, o de validacin de muestras separadas

3b

Comparacin cegada u objetiva de un espectro una cohorte de pacientes que podra normalmente ser examinado para un determinado trastorno, pero el estndar de referencia no se aplica a todos los pacientes
del estudio

Los estndares de referencia no son objetivables, cegados o independientes.


Las pruebas positivas y negativas son vericadas usando estndares
de referencia diferentes
El estudio compara pacientes con un trastorno determinado conocido
con pacientes diagnosticados de otra condicin.

Opinin de expertos sin valoracin crtica explcita, ni basada en siologa, ni en investigacin juiciosa ni en los principios fundamentales

www.sterra.com

Guas Clnicas 2007; 7 Supl 1: 6

Calidad de la evidencia y grado de recomendacin

Estudios de historia natural y pronstico


Grado de recomendacin

Nivel de evidencia

Fuente

1a

Revisin sistemtica de estudios de cohortes, con homogeneidad, o sea


que incluya estudios con resultados comparables y en la misma direccin y GPC validadas.

1b

Estudios de cohortes individuales con > 80% de seguimiento

1c

Resultados a partir de la efectividad y no de su ecacia demostrada a


travs de un estudio de cohortes

2a

Revisin sistemtica de estudios de cohorte retrospectiva o de grupos


controles no tratados en un ECA, con homogeneidad, o sea que incluya
estudios con resultados comparables y en la misma direccin.

2b

Estudio de cohorte retrospectiva o seguimiento de controles no tratados


en un ECA, o GPC no validadas.

2c

Investigacin de resultados en salud

Serie de casos y estudios de cohortes de pronstico de poca calidad

*Si tenemos un nico estudio con IC amplios o una revisin sistemtica con heterogeneidad estadsticamente signicativa,
se indica aadiendo el signo (-) al nivel de evidencia que corresponda y la recomendacin que se deriva es una D

Anlisis econmico y anlisis de decisiones


Grado de recomendacin

Nivel de evidencia

Fuente

1a

Revisin sistemtica de estudios econmicos de nivel 1 (alta calidad),


con homogeneidad, o sea que incluya estudios con resultados comparables y en la misma direccin

1b

Anlisis basados en los costes clnicos o en sus alternativas; revisiones sistemticas de la evidencia; e inclusin de anlisis de anlisis de
sensibilidad

1c

Anlisis en trminos absolutos de riesgos y benecios clnicos: claramente tan buenas o mejores, pero ms baratas, claramente tan malas o
peores pero ms caras

2a

Revisin sistemtica de estudios econmicos de nivel 2 (mediana


calidad) con homogeneidad, o sea que incluya estudios con resultados
comparables y en la misma direccin.

2b

Anlisis basados en los costes clnicos o en sus alternativas; revisiones


sistemticas con evidencia limitada; estudios individuales; e inclusin
de anlisis de anlisis de sensibilidad

2c

Investigacin de resultados en salud

3b

Anlisis sin medidas de coste precisas pero incluyendo un anlisis de


sensibilidad que incorpora variaciones clnicamente sensibles en las
variables importantes

Anlisis que no incluye anlisis de la sensibilidad

Opinin de expertos sin valoracin crtica explcita, ni basada en teoras


econmicas

www.sterra.com

Calidad de la evidencia y grado de recomendacin

Guas Clnicas 2007; 7 Supl 1: 6

Scottish Intercollegiate Guidelines Network (SIGN)

Tabla 1. Niveles de evidencia


1++

Metaanlisis de gran calidad, revisiones sistemticas de ensayos clnicos aleatorizados o ensayos clnicos aleatorizados
con muy bajo riesgo de sesgos.

1+

Metaanlisis de gran calidad, revisiones sistemticas de ensayos clnicos aleatorizados o ensayos clnicos aleatorizados
con bajo riesgo de sesgos.

1-

Metaanlisis de gran calidad, revisiones sistemticas de ensayos clnicos aleatorizados o ensayos clnicos aleatorizados
con alto riesgo de sesgos.

2++

Revisiones sistemticas de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de


casos-controles de alta calidad, con muy bajo riesgo de confusin, sesgos o azar y una alta probabilidad de que la
relacin sea causal.

2+

Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusin, sesgos o azar y una moderada probabilidad de que la relacin sea causal

2-

Estudios de cohortes o de casos y controles con alto riesgo de sesgo

Estudios no analticos, como informe de casos y series de casos

Opinin de expertos

Tabla 2. Grados de Recomendacin


A

Al menos un metaanlisis, revisin sistemtica o ensayo clnico aleatorizado calicado como 1++ y directamente
aplicable a la poblacin objeto, o una revisin sistemtica de ensayos clnicos aleatorizados o un cuerpo de evidencia consistente principalmente en estudios calicados como 1+ directamente aplicables a la poblacin objeto y que
demuestren globalmente consistencia de los resultados.

Un volumen de evidencia que incluya estudios calicados como 2++ directamente aplicables a la poblacin objeto y
que demuestren globalmente consistencia de los resultados, o extrapolacin de estudios calicados como 1++ o 1+.

Un volumen de evidencia que incluya estudios calicados como 2+ directamente aplicables a la poblacin objeto y que
demuestren globalmente consistencia de los resultados, o extrapolacin de estudios calicados como 2++.

Niveles de evidencia 3 o 4, o evidencia extrapolada desde estudios clasicados como 2+

NICE: Guideline Development Methods

Tabla 1. Niveles de evidencia para estudios de intervencin


1++

Metaanlisis de gran calidad, revisiones sistemticas de ensayos clnicos aleatorizados o ensayos clnicos aleatorizados
con muy bajo riesgo de sesgos.

1+

Metaanlisis de gran calidad, revisiones sistemticas de ensayos clnicos aleatorizados o ensayos clnicos aleatorizados
con bajo riesgo de sesgos.

1-

Metaanlisis de gran calidad, revisiones sistemticas de ensayos clnicos aleatorizados o ensayos clnicos aleatorizados
con alto riesgo de sesgos*.

2++

Revisiones sistemticas de alta calidad de estudios de cohortes o de casos-controles, o estudios de cohortes o de


casos-controles de alta calidad, con muy bajo riesgo de confusin, sesgos o azar y una alta probabilidad de que la
relacin sea causal.

2+

Estudios de cohortes o de casos-controles bien realizados, con bajo riesgo de confusin, sesgos o azar y una moderada probabilidad de que la relacin sea causal.

2-

Estudios de cohortes o de casos y controles con alto riesgo de sesgo*

Estudios no analticos, como informe de casos y series de casos

Opinin de expertos

* Los estudios con un nivel de evidencia no deberan utilizarse como base para elaborar una recomendacin
Adaptado de Scottish Intercollegiate Guidelines Network

10

www.sterra.com

Guas Clnicas 2007; 7 Supl 1: 6

Calidad de la evidencia y grado de recomendacin

Tabla 2. Clasicacin de las recomendaciones para estudios de intervencin


A

Al menos un meta-anlisis, o un ensayo clnico aleatorio categorizados como 1++, que sea directamente aplicable a la poblacin diana, o
Una revisin sistemtica o un ensayo clnico aleatorio o un volumen de evidencia con estudios categorizados
como 1+, que sea directamente aplicable a la poblacin diana y demuestre consistencia de los resultados
Evidencia a partir de la apreciacin de NICE

Un volumen de evidencia que incluya estudios calicados de 2++, que sean directamente aplicables a la poblacin objeto y que demuestren globalmente consistencia de los resultados, o
Extrapolacin de estudios calicados como 1++ o 1+.

Un volumen de evidencia que incluya estudios calicados de 2+, que sean directamente aplicables a la poblacin
objeto y que demuestren globalmente consistencia de los resultados, o
Extrapolacin de estudios calicados como 2++.

Evidencia nivel 3 o 4, o
Extrapolacin de estudios calicados como 2+ o
Consenso formal

D (BPP)

Un buen punto de prctica (BPP) es una recomendacin para la mejor prctica basado en la experiencia del grupo
que elabora la gua

IP

Recomendacin a partir del manual para procedimientos de intervencin de NICE

Tabla 3. Niveles de evidencia para estudios de diagnstico


Ia

Al menos un meta-anlisis, o un ensayo clnico aleatorio categorizados como 1++, que sea directamente aplicable a la poblacin diana, o
Una revisin sistemtica o un ensayo clnico aleatorio o un volumen de evidencia con estudios categorizados
como 1+, que sea directamente aplicable a la poblacin diana y demuestre consistencia de los resultados
Evidencia a partir de la apreciacin de NICE

Ib

Un volumen de evidencia que incluya estudios calicados de 2++, que sean directamente aplicables a la poblacin objeto y que demuestren globalmente consistencia de los resultados, o
Extrapolacin de estudios calicados como 1++ o 1+.

II

Un volumen de evidencia que incluya estudios calicados de 2+, que sean directamente aplicables a la poblacin
objeto y que demuestren globalmente consistencia de los resultados, o
Extrapolacin de estudios calicados como 2++.

III

Evidencia nivel 3 o 4, o
Extrapolacin de estudios calicados como 2+ o
Consenso formal

IV

Un buen punto de prctica (BPP) es una recomendacin para la mejor prctica basado en la experiencia del grupo
que elabora la gua

* Homogeneidad signica que no hay variaciones o estas son pequeas en la direccin y grado de los resultados entre los
estudios individuales que incluye la revisin sistemtica.
Estudios de nivel 1:
- aquellos que utilizan una comparacin ciega de la prueba con un estndar de referencia validado (gold standard)
- en una muestra de pacientes que reeja a la poblacin a quien se aplicara la prueba.
Estudios nivel 2 son aquellos que presentan una sola de esta caractersticas:
- poblacin reducida (la muestra no reeja las caractersticas de la poblacin a la que se le va a aplicar la prueba)
- utilizan un estndar de referencia pobre (denido como aquel donde la prueba es incluida en la referencia, o aquel en
que las pruebas afectan a la referencia)
- la comparacin entre la prueba y la referencia no est cegada
- Estudios de casos y controles.
Estudios de nivel 3 son aquellos que presentan al menos dos o tres de las caractersticas sealadas anteriormente.
Adaptado de The Oxford Centre for Evidence-based Medicine Levels of Evidence (2001) and the Centre for Reviews and Dissemination Report Number 4 (2001).

Tabla 4. Clasicacin de las recomendaciones para los estudios diagnstico


A (ED)

Estudios con un nivel de evidencia Ia o Ib

B (ED)

Estudios con un nivel de evidencia II

C (ED)

Estudios con un nivel de evidencia III

D (ED)

Estudios con un nivel de evidencia IV

ED = Estudios diagnsticos

www.sterra.com

11

Calidad de la evidencia y grado de recomendacin

Anexo 2. La iniciativa GRADE: la calidad de la evidencia y la fuerza de las


recomendaciones

a calidad de la evidencia indica hasta qu punto


podemos conar en que el estimador del efecto
es correcto y la fuerza de una recomendacin signica hasta qu punto podemos conar en que poner
en prctica una recomendacin conllevar ms benecios que riesgos. GRADE propone realizar juicios
secuenciales acerca de: 1) La calidad de la evidencia
en los diferentes estudios para cada uno de los resultados importantes; 2) Los resultados clave para una
decisin; 3) La calidad global de la evidencia para estos resultados claves; 4) El balance entre benecios
y riesgos y, 5) La fuerza de las recomendaciones.
La calidad de la evidencia
El primer paso consiste en escoger las variables de
resultado (ya sean de benecios o de riesgos) y juzgar la calidad de la evidencia (validez) de los diferentes estudios de donde proceden las variables de
resultado, considerando su diseo, la calidad metodolgica, la consistencia y si la evidencia es directa o
indirecta (directness).
El diseo del estudio se reere al tipo de estudio,
que en trminos generales se clasica en Ensayo
Clnico Aleatorizado (ECA) y estudio observacional.
El punto de partida de la calidad de la evidencia
es de alta para el ECA y de baja para los estudios
observacionales (tabla 1).
La calidad del estudio hace referencia a los mtodos utilizados y a su realizacin. Cada tipo de
estudio se dene por unos criterios que se deben
juzgar para cada resultado clave. La calidad de la
evidencia puede bajar en (-1) (-2), en funcin de
las limitaciones de los ECA y aumentar o disminuir
en el caso de los estudios observacionales (tabla
1).
La consistencia se reere a la similitud en las estimaciones del efecto entre los estudios para las
variables de resultado. Si hay inconsistencias importantes sin una causa que lo explique, la calidad
puede igualmente disminuir (-1) (tabla 1).
El tipo de evidencia directa o indirecta indica hasta qu punto los sujetos, las intervenciones, las
comparaciones y los resultados de los estudios
son similares a la pregunta de nuestro inters. En
el caso de existir algn grado de incertidumbre
acerca de si la evidencia es directa, se disminuye
una o dos categoras. (tabla 1).
Otros aspectos que podran disminuir la calidad de la
evidencia son disponer de datos imprecisos y sospechar un sesgo de informacin (reporting bias) (tabla
1).
Todos estos componentes descritos nos clasican
la calidad de la evidencia para cada variable de resultado. Una calidad alta indica que es muy poco probable que nuevos estudios modiquen nuestra conanza en el resultado estimado; una calidad moderada,
que es probable que nuevos estudios tengan un impacto importante en la conanza que tenemos en el
resultado estimado y que stos puedan modicar el
resultado; una calidad baja, que es muy probable
que nuevos estudios tengan un impacto importante
en la conanza que tenemos en el resultado estimado y que stos puedan modicar el resultado; y una
calidad muy baja que cualquier resultado estimado
es incierto.
Los resultados clave para una decisin
En esta etapa se escogen aquellas variables de re-

12

Guas Clnicas 2007; 7 Supl 1: 6


sultado que son claves para tomar una decisin. La
puntuacin de cada una de las variables de resultado
va del 1 al 9: una puntuacin entre 1 y 3, dene a la
variable como poco importante; de entre 4 y 6, como
importante y de entre 7 y 9, como clave.
La calidad global de la evidencia
Se valora la calidad global de la evidencia considerndola segn el nivel de calidad mas bajo conseguido por las variables de resultado claves. Si las variables claves incluyen riesgos o daos, stas deberan
tenerse en cuenta, an incluso habiendo incertidumbre de si la evidencia es directa. Si la evidencia para
todas las variables claves favorece a la misma alternativa y hay evidencia de alta calidad para algunas,
aunque no para todas las variables, la calidad global
se puede considerar alta. Evidencias dbiles sobre
riesgos y daos poco importantes no deberan disminuir el grado de evidencia global.
El balance entre benecios y riesgos
Es aconsejable que los juicios sobre el balance entre benecios y riesgos, se lleven a cabo antes de
considerar los costes y teniendo en cuenta tanto las
variables claves como las importantes. Las preguntas
a responder son: Cul es la magnitud del benecio
y hasta qu punto los resultados son reproducibles y
precisos?, Cul es la magnitud del riesgo, dao y la
carga que representan y hasta qu punto los resultados son reproducibles y precisos? Hasta qu punto
los benecios superan a los riesgos, daos y la carga
que representan?. Los benecios compensan a los
riesgos, daos y la carga que representan?. Este balance se clasica en: benecios netos, balance entre
benecios y riesgos, balance incierto, ausencia de
benecios netos y riesgos netos.
La fuerza de las recomendaciones
En una ltima etapa se juzga la fuerza de la recomendacin y los juicios requieren consideraciones
acerca de: todas las variables de resultado claves,
la calidad de la evidencia, el balance entre benecios
y riesgos, la contextualizacin de la evidencia a las
circunstancias especcas (valores y preferencias), la
incertidumbre sobre el riesgo basal, as como la consideracin de los costes (utilizacin de recursos). Las
categoras de recomendaciones sugeridas por GRADE
son: Hazlo (do it), probablemente hazlo (probably do
it), no recomendacin, probablemente no lo hagas
(probably dont do it), no lo hagas. (dont do it).
Hazlo (recomendamos o deberamos recomendar) es un recomendacin fuerte a favor de e indica
que los benecios claramente sobrepasan los riesgos
y que la gran mayora de personas bien informadas
haran la misma eleccin (alta conanza, poca incertidumbre). En este caso la mayora de los pacientes
recibiran la intervencin sin necesidad de ayuda en
la decisin y no se esperara mucha variacin en la
prctica clnica. Probablemente hazlo (sugerimos,
podramos, consideramos), es una recomendacin dbil a favor de, e indica que la mayora de
personas bien informadas haran la misma eleccin,
pero un grupo sustancial no la llevara a cabo (incertidumbre signicativa) y que los benecios y los riesgos estn equilibrados o son inciertos. En este caso
ser til la ayuda en la decisin y se espera mucha
variacin en la prctica clnica. En este caso la decisin se realizar teniendo en cuenta otros factores y
se espera mucha variacin en la prctica clnica. Este
mismo razonamiento se aplicar a la recomendacin
de no hacer y probablemente no hacer.
La informacin sobre GRADE y sus publicaciones
estn disponibles en http://www.gradeworkinggroup.

www.sterra.com

Guas Clnicas 2007; 7 Supl 1: 6


org/. La publicacin del BMJ y otros materiales de
trabajo se han traducido al castellano2 y estn accesibles en la web de GRADE. GRADEpro es el software
para elaborar las recomendaciones siguiendo la sistemtica descrita previamente. El grupo de trabajo
est avanzando en la mejora del propio sistema y en
la aplicacin del mismo a los estudios de diagnstico y de coste-efectividad. Actualmente varias organizaciones estn interesadas en GRADE: Cochrane,
WHO, American College of Chest Physicians, UpToDate, etc. La sociedad espaola de medicina familiar

Calidad de la evidencia y grado de recomendacin


y comunitaria (semFYC) est tambin considerando
adoptar el sistema de clasicacin de GRADE para la
elaboracin de sus recomendaciones3.
1. Alonso-Coello P, Zhou Q, Martinez MJ, Mills E, Heels-Ansdell D,
Johanson JF, Guyatt G. Flavonoids for the treatment of hemorrhoids: a systematic review and metanalysis. Br J Surg 2006; 93:
909-920.
2. Marzo M, Alonso-Coello P. La clasicacin de la calidad de la evidencia y la fuerza de las recomendaciones GRADE Working Group.
Aten Primaria. 2006;37(1):5-8
3. Marzo M. Basora J, Rotaeche R, Mascort J. La trayectoria cientca de semFYC. Hacia dnde queremos avanzar? Aten Primaria
2005;35(9):447-8

Tabla 1. Criterios GRADE para valorar la calidad de la evidencia


Calidad de la evidencia

Diseo de estudio

Disminuir si*

Aumentar si*

Alta

ECA

Importante (-1) o muy importante


(-2) limitacin de la calidad del
estudio

Asociacin: evidencia de una


fuerte asociacin: RR > 2 < 0,5
basado en estudios observacionales sin factores de confusin
(+1). Evidencia de una muy
fuerte asociacin RR > 5 < 0,2
basada en evidencia sin posibilidad de sesgos (+2)

Moderada
Baja

Estudio observacional

Muy baja

Cualquier otra evidencia

Inconsistencia importante (-1)


Alguna (-1) o gran (-2) incertidumbre acerca de la que evidencia sea directa
Datos escasos o imprecisos (-1)
Alta probabilidad de sesgo de
noticacin (-1)

Bibliografa
1. Shekelle PG, Woolf SH, Eccles M, Grimsahw J. Developing guidelines. BMJ 1999; 318:593-596
2. Upshur RE. Are all evidence-based practices alike? Problems in
the ranking of evidence. CMAJ 2003;169:672-3.
3. National Institute for Clinical Excelence (NICE). Clinical guidelines
development methods. [Internet]. London: NICE ; February 2004
(updated March 2005) [acceso 24 de marzo del 2005] Disponible
en: http://www.nice.org.uk/page.aspx?o=201982
4. Canadian Task Force on Preventive Health Care. History and methods. Disponible en: http://www.ctfphc.org [acceso 24 de marzo
del 2005]
5. West S, King V, Carey TS, et al. Systems to Rate the Strength
of Scientic Evidence. Evidence Report/Technology Assessment
No. 47 (Prepared by the Research Triangle Institute-University
of North Carolina Evidence-based Practice Center under Contract
No. 290-97-0011). AHRQ Publication No. 02-E016. Rockville, MD:
Agency for Healthcare Research and Quality. April 2002.
6. Canadian Task Force on Preventive Health Care. New grades for
recommendations from the Canadian Task Force on Preventive
Health Care. CMAJ 2003;169:207-8
7. Harris RP, Helfand M, Woolf SH, Lohr KN, Mulrow CD, Teutsch SM
for the Methods Word Group, third U.S. et al. Preventive Services
Task Force. Current methods of the U.S. Preventive Services Task
Force: a review of the process. Am J Prev Med 2001;20(3S):2135
8. U.S. Preventive Services Task Force Ratings: Strength of Recommendations and Quality of Evidence. Guide to Clinical Preventive
Services. [Internet] Third Edition: Periodic Updates, 2000-2003.
Rockville: Agency for Healthcare Research and Quality. [acceso 24
de marzo de 2005]. Disponible en: http://www.ahrq.gov/clinic/
3rduspstf/ratings.htm
9. Agency for Healthcare Research and Quality (AHRQ). EPC Evidence Reports [Internet]. Rockville: AHRQ. [acceso 24 de marzo
del 2005] Disponible en: http://www.ahrq.gov/clinic/epcindex.
htm#methodology
10. Centre for Evidence-Based Medicine de Oxford. Levels of Evidence and Grades of Recommendation [Internet]. Oxford: Centre
for Evidence-Based Medicine de Oxford [acceso 24 de marzo del
2005]. Disponible en http://www.cebm.net/levels_of_evidence.
asp
11. Scotish Intercollegiate Guidelines Network. A guideline developers handbook [Monografa en Internet]. Edinburgh: Scottish
Intercollegiate Guidelines NetworK; February 2001, updated May
2004 [acceso 24 de marzo de 2005] Disponible en: http://www.
show.scot.nhs.uk/sign/guidelines/fulltext/50/index.html
12. National Institute for Clinical Excellence (NICE). Guidelines Development methods. Guideline Development Methods- Chapter 7:
Reviewing and grading the evidence [Internet]. London: NICE;
February 2004 (updated March 2005) [acceso 24 de marzo del
2005] Disponible en: http://www.nice.org.uk/pdf/GDM_Chapter7_0305.pdf
13. National Institute for Clinical Excellence (NICE). Guidelines Deve-

www.sterra.com

Gradiente dosis respuesta (+1)


Todos los posibles factores confusores podran haber reducido el
efecto observado (+1)

lopment methods. Guideline Development Methods - Chapter 11


Creating guideline recommendations [Internet]. London: NICE;
February 2004 (updated March 2005) [acceso 24 de marzo del
2005] Disponible en: http://www.nice.org.uk/pdf/GDM_Chapter11_0305.pdf
14. The GRADE Working Group. Systems for grading the quality of
evidence and the strength of recommendations I: Critical appraisal of existing approaches. BMC Health Serv Res 2004;4:38.
http://www.biomedcentral.com/content/pdf/1472-6963-4-38.pdf
[acceso 24 de marzo del 2005]
15. Atkins D, Best D, Briss PA, Eccles M, Falck-Ytter Y, Flottorp S, et al;
GRADE Working Group. Grading quality of evidence and strength
of recommendations. BMJ 2004 ;328:1490.
16. Grading of Recommendations of Assessment Development and
Evaluations. GRADE working group. [Internet]. GRADE [acceso
24 de marzo de 2005]. Disponible en: http://www.gradeworkinggroup.org/
17. Marzo M, Alonso Coello P, Bonll X. Las guas de prctica clnica en
Espaa. Med Clin (Barc) 2002; 118 (Supl 3):30-5
18. Guia Salud. Catlogo de Guas de Prctica Clnica en el Sistema
Nacional de Salud. [Internet]. Ministerio de Sanidad y Consumo,
Gobierno de Aragn [acceso 24 de marzo del 2005] Disponible
en: http://www.guiasalud.es/
19. National Institute for Clinical Excelence (NICE): Guideline Development Methods. Chapter 6: Identifying the evidence. Information for National Collaborating Centers and Guideline Developers
[Internet]. London: NICE; February 2004 (updated March 2005)
[acceso 24 de marzo del 2005]. Disponible en: http://www.nice.
org.uk/pdf/GDM_Chapter6.pdf
20. Gmez E, De Villar de E, Lacalle JR, Briones E, Reyes A, Alvarez
R et al. Estudio de la reproductibilidad y validez de una revisin
sistemtica de la bibliografa mdica. Med. Clin. (Barc) 1999; 112
(Supl 1): 74-78.
21. Informacin farmacoteraputica de la comarca (INFAC).
Metodologa de la elaboracin de una recomendacin en la gua
de prctica clnica de la hipertensin arterial (HTA): Ecacia de
la dieta hiposdica [Internet]. INFAC; mayo 2002; Volumen 10n5. [acceso 24 de marzo del 2005]. Disponible en: http://www.
euskadi.net/sanidad
22. Programa en habilidades de lectura crtica. Espaa [Internet].
CASPE [acceso 24 de marzo de 2005]. Diponible en http://www.
redcaspe.org/homecasp.asp
23. National Institute for Clinical Excelence (NICE): Guideline Development Methods. Chapter 9: Making group decisions and reaching
consensus. Information for National Collaborating Centers and
Guideline Developers. [Internet]. London: NICE; February 2004
(updated February 2005) [acceso 24 de marzo del 2005]. Disponible en: http://www.nice.org.uk/pdf/GDM_Chapter9.pdf
24. Briones Prez de la Blanca E, Marn Len I, Alvarez Gil R, Reyes Domnguez A. Fundamentos de consenso en el mbito de las
ciencias de la salud. En: Metodologa de expertos. Consenso en
Medicina. Berra de Unamuno A, Marn Len I, Alvarez Gil R. (Eds).
Granada: Escuela Andaluza de Salud Pblica; 1996.p. 13.
25. Fitch K, Bernstein SJ, Aguilar MS, Burnand B, La Calle JR, Lzaro P,

13

Calidad de la evidencia y grado de recomendacin


van het Loo M, McDonnell J, Vader JP, Kahan JP. The RAND/UCLA
appropriateness method users manual [monografa en Internet].
RAND Health Santa Mnica; 2001 [acceso 24 de marzo de 2005].
Disponible en: http://www.rand.org/pubs/monograph_reports/
MR1269/
26. Alonso Ortiz del Ro C, Medrano Ortega FJ, Romero Alonso A, Villar

14

Guas Clnicas 2007; 7 Supl 1: 6


Conde E, Caldern Sandubete E, Marn Len I et al. Gua PRETEMED 2003. Gua de prolaxis de enfermedad tromboemblica
27. en patologa mdica [Interent]. Crdoba: SADEMI; 2003
[acceso 24 de marzo de 2005]. Disponible en: http://samfyc.es/
descargas/Pretemed.pdf

www.sterra.com