Documentos de Académico
Documentos de Profesional
Documentos de Cultura
T2. Angeles Olivia Garcia Rodriguez
T2. Angeles Olivia Garcia Rodriguez
resultados.
8 Existen Los Satisfacción Grado de El análisis fue Los Calidad de los Análisis de
métodos de resultados son de la precisión de riguroso. resultados resultados. sensibilidad
comprobación aplicables en reproducibilid los resultados. son ausente.
de resultados. el medio. ad de la precisos.
prueba y su
interpretación
.
9 Replicabilida Se consideran Prueba Considera si Corresponde Los Los resultados Aplicable a la
d en otra todos los aceptable el ámbito de a la pregunta resultados coinciden con población.
población. resultados según el caso. estudio es de son creíbles. la evidencia.
para la demasiado investigación.
decisión. diferente al
del escenario.
10 Se consideran Costo/benefic Los Aceptable la Aplica la Los Aplicación de Costes
todos los io. resultados prueba en este investigación. resultados se los resultados. trasladables al
resultados. modifican el caso. pueden estudio.
actuar. aplicar a mi
medio.
11 Adecuado Modificaran Los Influencia en la Aplicable al
costo/benefici los resultados resultados decisión estudio.
o. la conducta del estudio clínica.
clínica, y en coinciden
salud o los con
costos. evidencia
disponible.
3
status exert an
influence on general
body health.
0081&lng=en&t malocclusion”
lng=es.
8
En 2004 se comunica la propuesta del grupo de trabajo GRADE, formado por un conjunto
internacional y multidisciplinar de metodólogos, expertos en GPC y médicos clínicos, que
pretenden obviar los problemas descritos. Se trata de un método riguroso y transparente tanto en
la clasificación del nivel de evidencia como en la asignación del grado o fortaleza de la
recomendación.
Formulación de las preguntas clínicas en formato PICO y búsqueda de las respuestas
9
Una vez establecido el alcance de una GPC es necesario definir una serie de preguntas clínicas
que se agruparán en apartados de organización, prevención, diagnóstico, tratamiento, pronóstico,
etc. Para pasar de una pregunta clínica genérica a una formulada de forma específica de tal modo
que facilite la búsqueda bibliográfica y la elaboración de recomendaciones para cada cuestión, se
prefiere el método PICO, acrónimo de Pacientes-Intervención-Comparación-
resultados/Outcomes. Así:
a. Paciente: o población, estadios de enfermedad, grupos de edad, comorbilidad, etc.
b. Intervención: tratamiento, prueba diagnóstica, agente etiológico, etc.
c. Comparación: posible alternativa a la intervención en estudio como tratamiento
habitual o placebo, patrón oro de referencia de una prueba diagnóstica, ausencia de agente
etiológico, etc.
d. Resultados (outcomes): variables de resultados relevantes en caso de estudios sobre
eficacia, pronóstico o etiología, y estimadores de validez en el caso de pruebas diagnósticas
(sensibilidad, especificidad, coeficientes de probabilidad, etc.).
Al formular las preguntas clínicas en formato PICO queda definido de forma concreta y sin
ambigüedad lo que se pretende averiguar y, además, como a cada tipo de pregunta corresponde
un tipo de estudio con el diseño adecuado para su respuesta, el formato ayuda a realizar la
búsqueda en la literatura. Durante la confección de las preguntas clínicas hay que definir todas las
posibles variables de resultado o desenlace, cuestión aún más relevante cuando se utiliza en la
elaboración de las recomendaciones el sistema GRADE, donde se califican las variables según su
importancia para clínicos y pacientes y se las pondera en una escala que va del 1 al 9.
Únicamente las variables con puntuación del 7 al 9 son consideradas clave para afectar una
decisión en el sistema GRADE y es a estas variables clave a las que hay que especificar las
preguntas clínicas. Las respuestas a estas preguntas sobre resultados clave serán las que
principalmente se utilizarán para graduar las recomendaciones. Las variables con puntuación del
4 al 6 se califican de importantes, pero no clave para la toma de decisiones. Las puntuadas del 1
al 3 se consideran no importantes y no se incluyen en la evaluación, tampoco influirán en las
recomendaciones.
Finalmente, se gradúa la fuerza de las recomendaciones con arreglo a un sistema determinado.
Niveles de evidencia
GRADE define la calidad de la evidencia como el grado de confianza que tenemos en que la
estimación de un efecto sea la adecuada para efectuar una recomendación. Para cada uno de los
desenlaces o resultados clave se efectúa una evaluación; así, una misma comparación de una
intervención terapéutica o preventiva puede recibir diferentes asignaciones de la calidad de la
evidencia. En la clasificación del nivel de calidad de la evidencia, el sistema GRADE establece 4
categorías: alta, moderada, baja y muy baja. Lo que representa o significa cada una de las 4
categorías, en su concepción inicial y en la actual, se expone en la tabla 2.
Tabla 2.
Niveles de
calidad Definición actual Concepto anterior
La confianza en la estimación del
Alta confianza en la coincidencia entre el efecto no variará en posteriores
Alto efecto real y el estimado estudios
Posteriores estudios pueden tener un
Moderada confianza en la estimación del importante impacto en nuestra
efecto. Hay posibilidad de que el efecto confianza en la estimación del
Moderado real esté alejado del efecto estimado efecto
Confianza limitada en la estimación del Es muy probable que posteriores
efecto. El efecto real puede estar lejos del estudios cambien nuestra confianza
Bajo estimado en la estimación del efecto
Poca confianza en el efecto estimado. El
efecto verdadero muy probablemente sea Cualquier estimación es muy
Muy bajo diferente del estimado incierta
En una primera etapa el sistema GRADE considera de calidad alta los estudios experimentales
(ensayos clínicos aleatorizados) y de calidad baja los estudios observacionales (casos y controles,
cohortes). En un segundo paso, para refinar el nivel de calidad, el sistema establece una serie de
ítems que hay que considerar y que pueden hacer bajar o subir el escalón o nivel de la calidad
inicialmente asignada.
Todos estos ítems determinan, con arreglo a las puntuaciones que se expresan en la tabla 3, un
ascenso o un descenso en el nivel de la calidad de la evidencia. Terminado el análisis, los
expertos del GRADE resumen toda la evidencia, respecto a las preguntas concretas y las
variables de resultado o desenlace previamente escogidas, en una tablas-resumen que denominan
perfil de evidencia (evidence profiles [GRADE EP]) y sumario de hallazgos (summary of
findings [GRADE SoF]). Las tablas EP y SoF tienen diferentes propósitos y van dirigidas a
colectivos distintos.
Tabla 3.
Nivel de
calidad a Nivel de calidad
Tipo de estudio priori Desciende si Sube si a posteriori
Estudios
aleatorizados Alta Riesgo de sesgo Efecto Alta
−1 importante +1 grande
−2 muy
importante +2 muy grande
Inconsistencia Dosis-respuesta Moderada
+1 gradiente
−1 importante evidente
−2 muy
importante
Estudios No evidencia Todos los factores
observacionales Baja directa de confusión: Baja
+1 reducirían el
−1 importante efecto
−2 muy
importante observado
+1 sugerirían un
Imprecisión efecto
espurio si no hay
−1 importante efecto observado Muy baja
−2 muy
importante
Sesgo de
publicación
−1 probable
−2 muy probable
Grado de recomendación
12
Bibliografía:
Aguayo, J.L., Flores, B., y Soria, V., (2014). Sistema GRADE: clasificación de la calidad de la
evidencia y graduación de la fuerza de la recomendación, en Revista Cirugía Española, vol. 92
(2), 82-88. Recuperado de: https://www.elsevier.es/es-revista-cirugia-espanola-36-articulo-
sistema-grade-clasificacion-calidad-evidencia-S0009739X13003394
DOI:10.1016/j.ciresp.2013.08.002
13
3. Niveles de evidencia clasificados según la validez interna o calidad metodológica del estudio,
en buena, moderada e insuficiente (Tabla 4).
Esta sistematización propuesta por el epidemiólogo David L. Sackett (la que se emplea
generalmente), jerarquiza la evidencia en niveles que van del 1 a 5; siendo el nivel 1 la “mejor
evidencia” y el nivel 5 la “peor, la más mala o la menos buena”, según como se quiera leer (Tabla
5). Hasta hoy, ha sido ampliamente utilizada por diferentes grupos científicos. A cada ámbito o
escenario clínico le otorga el diseño de estudio más apropiado para la elaboración de las
recomendaciones. Así, en el escenario de terapia, los diseños más puntuados corresponden a las
revisiones sistemáticas (RS) de ensayos clínicos controlados con asignación aleatoria (EC); en
escenarios de pronóstico, los estudios de cohortes; en escenarios de diagnóstico, los estudios de
pruebas diagnósticas con estándar de referencia, etc.
15
evaluada para su aplicación en “exámenes periódicos de salud”. Por otro lado, analizó el coste-
efectividad de las intervenciones, por ende, su aporte vino a complementar lo que había generado
el grupo de CTFPHC. La fuerza de las recomendaciones va desde la letra A hasta la E,
otorgándose una A cuando existe buena evidencia que respalda la recomendación; y una E, que
indica que existe buena evidencia que sustenta la recomendación de evitar
la intervención (Tabla 6).
Para jerarquizar la calidad de la evidencia, se otorga mayor peso a aquellos diseños que
metodológicamente ofrecen menor riesgo de sesgos y errores aleatorios (Tabla 7). Esta
clasificación tiene la ventaja que contempla nuevos aspectos que condicionan la elaboración
de recomendaciones ya no sólo a la calidad de la evidencia (siempre controversial) sino también
al beneficio neto y al “costo de sufrimiento de padecer el evento de interés en estudio”,
aproximándose a una perspectiva más global que emerge desde la posición de quien padece la
condición de salud o evento de interés en estudio.
Esta propuesta se caracteriza por valorar la evidencia según el área temática o escenario clínico y
el tipo de estudio que involucra al problema clínico en cuestión. Lo anterior es una innovación y
es complementaria a lo expuesto por las otras iniciativas. Esta, tiene la ventaja que gradúa la
evidencia de acuerdo al mejor diseño para cada escenario clínico, otorgándole intencionalidad,
agregando las RS en los distintos ámbitos. Así, por ejemplo, al tratarse de un escenario clínico
relacionado con pronóstico de un evento de interés, la evidencia será valorada a partir de una RS
de estudios de cohortes con homogeneidad, o en su defecto de estudios de cohortes individuales
con un seguimiento superior al 80% de la cohorte; en cambio, si el escenario se refiere a terapia o
tratamiento, la evidencia se valorará principalmente a partir de RS de EC, o en su defecto de EC
individuales con intervalos de confianza estrechos.
18
19
Esta propuesta, se origina también teniendo como foco de interés la temática del tratamiento. Se
diferencia de las anteriores por su particular énfasis en el análisis cuantitativo que involucra a las
RS y otorga importancia a la reducción del error sistemático. Se compone de niveles de evidencia
y grados de recomendación según esos niveles (Tablas 9 y 10).
Bibliografía:
Manterola, C., Zamando, D., y Grupo MINCIR, (2009). Cómo interpretar los “Niveles de
Evidencia” en los diferentes escenarios clínicos, en Revista Chilena de Cirugía, vol.61 (6), 582-
595. Recuperado de: https://www.redalyc.org/pdf/3455/345531939017.pdf
21