Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Amstar en Español
Amstar en Español
Resumen
El número de revisiones sistemáticas (RS) de estudios de intervenciones sanitarias publicadas ha aumentado rápidamente.
Estos documentos de síntesis son ampliamente utilizados para la toma de decisiones clínicas y de políticas de salud, pero están
VXMHWRVDXQDVHULHGHVHVJRV\HVLPSRUWDQWHTXHORVXVXDULRVSXHGHQLGHQWLÀFDUODV56GHPHMRUFDOLGDG&RQVLGHUDQGRODUHOH
vancia de la actualización de la herramienta Ameasurement Tool to Assess Systematic Reviews (AMSTAR) para la valoración
crítica de RS de estudios de intervenciones en salud, el autor resume los aspectos más relevantes de la publicación de Shea y
col, traduce el instrumento y su guía de aplicación, y comenta los aspectos salientes del instrumento AMSTAR-2 junto con sus
potenciales implicancias en el desarrollo y reporte de RS.
Abstract
The number of published systematic reviews (SR) of studies of healthcare interventions has increased rapidly. These synthesis
documents are used extensively for clinical and policy decisions, but they are subject to a range of biases and it is important that
users can distinguish high quality SR. Taking in consideration the relevance of the updated Ameasurement Tool to Assess Sys-
tematic Reviews (AMSTAR) tool for the assessment of SR of healthcare interventions, the author synthetizes the most relevant
features of the article by Shea et al, translates the tool and it´s user´s guide, and comments on the AMSTAR-2 highlights and their
potential implications in development and report of SR.
Principales características del instrumento AMSTAR-2 Cabe aclarar que no siempre los elementos enumerados en el
Se han diseñados muchos instrumentos para evaluar los diferentes &XDGURVHUiQFRQVLGHUDGRVFRPRFUtWLFRVSRUHMHPSORHOULHVJRGH
aspectos de una revisión, pero pocos de ellos permiten una eva- sesgo puede ser considerado menos importante cuando una revisión
luación crítica integral1-15. La herramienta Ameasurement Tool to As- se limita a ensayos controlados aleatorizados (ECA) de alta calidad.
sess Systematic Reviews (AMSTAR) fue desarrollado para evaluar Si no se realizó la síntesis estadística de los resultados mediante el
RS de ensayos aleatorizados16-18. AMSTAR-2 permite una evaluación meta-análisis, tampoco se aplicará el dominio sobre métodos meta-
más detallada de las RS que incluyen también estudios no aleatoriza- analíticos.
dos de intervenciones sanitarias, que son cada vez más incorporados
en las RS. De hecho, casi la mitad de las revisiones sistemáticas Aplicación
publicadas incluyen ahora estudios de intervención no aleatorizados Los autores recomiendan que si se empleará AMSTAR-2 para valo-
(EINA)19-21. rar la calidad de una o más RS para basar decisiones importantes
AMSTAR-2 es un cuestionario que contiene 16 dominios (ver Apén- a nivel clínico y de políticas sanitarias, el equipo de evaluación a-
GLFH ÀJXUD FRQ RSFLRQHV GH UHVSXHVWD VLPSOHV ´VLµ FXDQGR HO cuerde en forma previa ciertas pautas a tener en cuenta al aplicar la
UHVXOWDGRHVSRVLWLYR´QRµFXDQGRQRVHFXPSOLyHOHVWiQGDURKD\ herramienta, incluyendo el contexto de la práctica o la política sani-
LQIRUPDFLyQLQVXÀFLHQWHSDUDUHVSRQGHU\´VLSDUFLDOµHQFDVRVHQ taria y las preguntas clínicas pertinentes (estructura PICO: población,
que hubo adherencia parcial al estándar. La herramienta actualizada intervención, comparación, resultados). Por ejemplo, las RS disponi-
incluye una extensa guía para el usuario (ver Apéndice, Guía del bles pueden haber incluido estudios con diferentes comparadores o
XVXDULR$XQTXHQRSURSRUFLRQDXQDFDOLÀFDFLyQJOREDOGHODVGHELOL- diferentes períodos de seguimiento, por lo que debe establecerse su
dades en los siete dominios considerados críticos, dado que pueden relevancia para las preguntas importantes relacionadas con la política
afectar sustancialmente la validez de una revisión y sus conclusiones en cuestión. Las posibles fuentes de sesgo también deben ser acor-
YHUFXDGURVXUJHQFXDWURQLYHOHVGHFRQÀDQ]DDOWDPRGHUDGD dadas. Por ejemplo, en estudios observacionales de efectos de inter-
baja y críticamente baja (ver tabla 1).
6. Consideración del riesgo de sesgo en la interpretación de los resultados de la revisión (ítem 13)
Tabla 19DORUDFLyQGHODFRQÀDQ]DJHQHUDOHQORVUHVXOWDGRVGHODUHYLVLyQ
CONFIANZA JUSTIFICACIÓN
Alta Ninguna debilidad crítica y hasta una no crítica: la RS proporciona un resumen exacto y completo de los resultados de los estudios
disponibles.
Media Ninguna debilidad crítica y más de una debilidad no crítica (aunque si son muchas podría justificarse una baja confianza): la RS tiene
debilidades, pero no hay defectos críticos, pudiendo proporcionar un resumen preciso de los resultados de los estudios disponibles.
Baja Hasta una debilidad crítica, con o sin puntos débiles no críticos: la RS puede no proporcionar un resumen exacto y completo de los
estudios disponibles
Críticamente Baja Más de una debilidad crítica, con o sin debilidades no críticos: la RS no es confiable
4 EVIDENCIA - Actualización en la Práctica Ambulatoria - Enero/Marzo 2018 - Disponible en internet: www.evidencia.org.ar volumen 21 nro. 1
venciones, la confusión por indicación (o gravedad de la enfermedad) TXH ORV XVXDULRV DGRSWHQ HO SURFHVR GH FDOLÀFDFLyQ EDVDGR HQ ORV
puede ser problemática cuando las intervenciones se reservan para dominios críticos (Cuadro 1), o en alguna variación sobre la base de
ciertos subgrupos de pacientes22. Asimismo, estos estudios deberían estos principios.
reclutar nuevos usuarios de una tecnología o fármaco para evitar el Los estudios no aleatorizados grandes, a menudo realizados con
sesgo de prevalencia23. Si el inicio de una intervención tiende a re- grandes bases de datos administrativas, son cada vez más utilizados
trasarse, la elección del comparador puede introducir un sesgo de para evaluar el verdadero impacto mundial de una amplia gama de
tiempo inmortal24/RVHUURUHVGHPHGLFLyQFODVLÀFDQHUUyQHDPHQWH tecnologías y prácticas de salud. Aunque estos estudios a menudo
la exposición y los resultados y pueden desbalancear los grupos de XVDQ PpWRGRV VRÀVWLFDGRV OD FRQIXVLyQ UHVLGXDO R HO IUDFDVR SDUD
FRPSDUDFLyQ8QDGHVFULSFLyQVHOHFWLYDGHP~OWLSOHVDQiOLVLV\UHVXO- manejar adecuadamente otras fuentes de sesgo puede conducir
tados también pueden desvirtuar los efectos de una intervención. a estimaciones de efecto inexactas. La inclusión de grandes estu-
Si bien el manual del usuario de AMSTAR 2 proporciona orientación dios observacionales en los meta-análisis puede generar estima-
sobre las distintas secciones (ver Apéndice, Guía del usuario), algu- ciones precisas, pero sesgadas de los efectos de las intervenciones
nos de los juicios de los evaluadores pueden ser complejos (p.ej. si evaluadas19.
los autores de la revisión han evaluado adecuadamente el riesgo Los dominios del AMSTAR-2 provienen de los instrumentos Cochrane
de sesgo en EINA) y puede necesitarse asesoramiento tanto sobre de riesgo de sesgo para estudios aleatorizados y no aleatorizados27,28.
metodología como sobre el contenido. El conocimiento de los con- 6LQHPEDUJR$067$5DFWXDOPHQWHQRHVSHFLÀFDTXpLQVWUXPHQ-
tenidos puede ser a veces necesario para determinar si los autores tos de riesgo de sesgo deberían haber utilizado los autores de la re-
de la revisión han hecho una evaluación adecuada de los elementos visión para evaluar los estudios no aleatorizados incluidos en una RS.
3,&2GRPLQLRGHO$067$5HLGHQWLÀFDUSRVLEOHVIDFWRUHVGH El instrumento ROBINS-I, que es la herramienta más completa para
confusión. los EINA, fue lanzado en 2016, por lo que es poco realista esperar
que los autores de las revisiones iniciadas antes de su lanzamiento lo
Acuerdo inter-evaluador hayan utilizado28. Los evaluadores de RS mediante el AMSTAR-2 de-
Se midió el acuerdo (mediante kappa) entre evaluadores, quienes berían cerciorarse de que el instrumento para la valoración del riesgo
tuvieron acceso a la guía del usuario. Los valores variaron sustan- GHVHVJRXWLOL]DGRWHQJDVXÀFLHQWHFDSDFLGDGGLVFULPLQDWRULDSDUDORV
cialmente a través de los dominios y entre los pares de evaluadores, GRPLQLRVHVSHFLÀFDGRV8QDUHYLVLyQUHDOL]DGDSRU6DQGHUVRQ\FRO
pero la mayoría de los valores se encontraban en un rango acepta- LGHQWLÀFyKHUUDPLHQWDVSDUDHYDOXDUODFDOLGDGGHORVHVWXGLRVRE-
ble, con 46 de las 50 puntuaciones kappa en rango de acuerdo mode- servacionales, sin arribar a conclusiones acerca de si alguna de ellas
rado o mejor, y 39, acuerdo bueno o mejor. debería ser preferida sobre las otras29. Los instrumentos populares
de evaluación para estudios individuales, tales como la escala New-
Usabilidad FDVWOH2WWDZD\ODOLVWDGHYHULÀFDFLyQ6,*1QRVyORVHFHQWUDQHQOD
Los tiempos para completar el AMSTAR-2 oscilaron entre 15 y 32 validez y además se utilizan para generar una puntuación global, algo
minutos. Estas estimaciones no incluyen el tiempo necesario para que no se recomienda30,31.
leer la RS. Los comentarios de los evaluadores incluyeron: que se AMSTAR-2 ofrece una amplia evaluación de la calidad, incluyendo
necesita más tiempo para evaluar los análisis de estudios no alea- defectos que puedan haber surgido por una mala conducción de la
WRUL]DGRV\PL[WRVSRUFXHVWLRQHVPHWRGROyJLFDVGHGLFKRVHVWXGLRV 56FRQHIHFWRVLQFLHUWRVHQVXVUHVXOWDGRV(QHVWHVHQWLGRGLÀHUH
que era común que los autores de una revisión mencionaran la pres- de otro instrumento de riesgo de sesgo en las RS, el ROBIS)32. RO-
encia o ausencia de sesgo de publicación, pero sin aportar ninguna %,6HVXQLQVWUXPHQWRWULIiVLFRVRÀVWLFDGRTXHVHFHQWUDHVSHFtÀFD-
HYLGHQFLD\TXHORVDXWRUHVGHODUHYLVLyQVXHOHQUHYHODUVXVSRVLEOHV mente en el riesgo de sesgo introducido por la realización de la RS.
FRQÁLFWRVGHLQWHUHVHVSHURQRODIRUPDHQTXHORJHVWLRQDURQ Cubre la mayoría de los tipos de preguntas de investigación, incluy-
endo diagnóstico, pronóstico y etiología. Por el contrario, AMSTAR-2
Discusión está destinado a ser utilizado para RS de intervenciones sanitarias,
Debe remarcarse que las respuestas al AMSTAR-2 no deben ser pero inevitablemente hay una superposición de dominios entre am-
utilizadas para obtener una puntuación global,25,26 y se recomienda bas.
Comentario
Aunque no se ha realizado aun una extensa validación de la he- so, no es tan frecuente, y muchas RS bien conducidas podrían
rramienta AMSTAR-2, ésta sigue los pasos clave en la realización VHUFODVLÀFDGDVFRPRGHEDMDFRQÀDQ]D$IDYRUGHHVWDSRVLFLyQ
de una RS de manera exhaustiva, reteniendo 10 dominios de es que si no existe protocolo, estamos expuestos a innumerable
la herramienta validada originalmente y adicionando seis más. cantidad de decisiones como por ejemplo reportar selectivamente
Además de ser una lista de cotejo para quienes desarrollan o resultados, o realizar análisis post hoc, que podrían sesgar las
leen una RS, también puede ser muy útil como herramienta de conclusiones. De hecho, la ausencia de protocolo suele asociarse
aprendizaje, para valorar uno de los diseños más frecuentemente a RS de menor calidad metodológica. Por otro lado, en el ítem 15
utilizados en la toma de decisiones basadas en la evidencia. El VH H[LJH OD UHDOL]DFLyQ GH SUXHEDV JUiÀFDV R HVWDGtVWLFDV SDUD
desarrollo de AMSTAR-2 se basó en gran medida en el consenso evaluar la posibilidad de sesgo de publicación. Aunque desea-
de un grupo de expertos, pero también en una amplia retroali- ble, esto no siempre es posible cuando el número de estudios
mentación de los usuarios del instrumento original y sigue en es menor a diez. En estos casos no aplicables, si los revisores
SURFHVRGHUHÀQDPLHQWRSHUPDQHQWH'HKHFKRORVDXWRUHVDQL- discutieron apropiadamente la probabilidad y la magnitud del im-
man a los usuarios de AMSTAR-2 a proporcionar información si pacto del sesgo de publicación, este ítem debiera considerarse
adaptan al instrumento para ámbitos particulares e informar de su FRPRYiOLGRDXQVLQJUiÀFDVRSUXHEDV
experiencia en www.amstar.ca. Actualmente desde Cochrane Argentina estamos realizando una
En otras herramientas de valoración de RS, incluyendo al AM- pru eba de la implementación de esta herramienta en español.
STAR original, no se discriminaba la importancia de los ítems, lo
TXH SRGtD JHQHUDU YDORUDFLRQHV JOREDOHV HQJDxRVDV 8QD JUDQ Conclusiones del comentador
IRUWDOH]DGHHVWDKHUUDPLHQWDHVODGHÀQLFLyQGHGRPLQLRVFUtWLFRV AMSTAR-2 ha puesto la vara alta y aunque muchas RS serán
DSDUWLUGHORVFXDOHVYDORUDUODFRQÀDQ]DJHQHUDOHQORVUHVXOWD- FODVLÀFDGDV FRPR GH EDMD FRQÀDQ]D HV GH HVSHUDU TXH VX
dos de la revisión. Podría ser cuestionable que con sólo alguno HQWUDGD HQ HVFHQD \ IXWXUD YDOLGDFLyQ LQÁX\DQ ODV QXHYDV 56
GHORVGRPLQLRVFUtWLFRVXQD56VHDFRQVLGHUDGDGHEDMDFRQÀDQ- y sus actualizaciones, que querrán cumplir con el estándar
za. Por ejemplo, la disponibilidad de protocolo, aunque en ascen- metodológico presentado.
Ciapponi A. AMSTAR-2: herramienta de evaluación crítica de revisiones sistemáticas de estudios de intervenciones de salud. Evid Act Pract Ambul.
Traducido, resumido y comentado de: Shea BJ, y col. AMSTAR 2: a critical appraisal tool for systematic reviews that include
randomised or non-randomised studies of healthcare interventions, or both%0-M30,'>3XE0HGLQGH[HGIRU0('-
LINE] PMCID: PMC5833365
Referencias Bibliográficas
:KLWLQJ 3 \ FRO7KH GHYHORSPHQW RI 48$'$6 D WRRO IRU WKH TXDOLW\ DVVHVVPHQW RI VWXGLHV RI GLDJQRVWLF DFFXUDF\ LQFOXGHG LQ V\VWHPDWLF UHYLHZV %0& 0HG 5HV 0HWK-
RGRO
2. Wong WC, y col. Development of a quality assessment tool for systematic reviews of observational studies (QATSO) of HIV prevalence in men having sex with men and associ-
DWHGULVNEHKDYLRXUV(PHUJ7KHPHV(SLGHPLROSPLG
3. Verhagen AP, y col. The Delphi list: a criteria list for quality assessment of randomized clinical trials for conducting systematic reviews developed by Delphi consensus. J Clin
(SLGHPLROSPLG
4. Downs SH, Black N. The feasibility of creating a checklist for the assessment of the methodological quality both of randomised and non-randomised studies of health care
LQWHUYHQWLRQV-(SLGHPLRO&RPPXQLW\+HDOWKSPLG
0XUUD\-\FRO'UDZLQJFRQFOXVLRQVDERXWFDXVHVIURPV\VWHPDWLFUHYLHZVRIULVNIDFWRUV7KH&DPEULGJH4XDOLW\&KHFNOLVWV-([S&ULPLQRO
6. Terwee CB, y col. Rating the methodological quality in systematic reviews of studies on measurement properties: a scoring system for the COSMIN checklist. Qual Life
5HVSPLG
%pUDUG $ \ FRO 5HOLDELOLW\ RI &KDOPHUV· VFDOH WR DVVHVV TXDOLW\ LQ PHWDDQDO\VHV RQ SKDUPDFRORJLFDO WUHDWPHQWV IRU RVWHRSRURVLV $QQ (SLGHPLRO
pmid:11118928.
7KRPSVRQ6\FRO$SURSRVHGPHWKRGRIELDVDGMXVWPHQWIRUPHWDDQDO\VHVRISXEOLVKHGREVHUYDWLRQDOVWXGLHV,QW-(SLGHPLROSPLG
9. Deeks JJ, ycol. Statistical methods for examining heterogeneity and combining results from several studies in meta-analysis. Systematic reviews in health care: meta-analysis
LQFRQWH[W:LOH\ 6RQV
6DFNV+6\FRO0HWDDQDO\VHVRIUDQGRPL]HGFRQWUROOHGWULDOV1(QJO-0HGSPLG
2[PDQ$'*X\DWW*+9DOLGDWLRQRIDQLQGH[RIWKHTXDOLW\RIUHYLHZDUWLFOHV-&OLQ(SLGHPLROSPLG
2[PDQ$'\FRO(YLGHQFH%DVHG0HGLFLQH:RUNLQJ*URXS8VHUV·JXLGHVWRWKHPHGLFDOOLWHUDWXUH9,+RZWRXVHDQRYHUYLHZ-$0$SPLG
13. Scottish Intercollegiate Guidelines Network. Methodology Checklist 1: Systematic Reviews and Meta-analyses. www.sign.ac.uk/checklists-and-notes.html
14. Aromataris E, y col. Summarizing systematic reviews: methodological development, conduct and reporting of an umbrella review approach. Int J Evid Based
+HDOWKFSPLG
:KLWLQJ3\FRO52%,6JURXS52%,6$QHZWRROWRDVVHVVULVNRIELDVLQV\VWHPDWLFUHYLHZVZDVGHYHORSHG-&OLQ(SLGHPLROSPLG
6KHD%-\FRO'HYHORSPHQWRI$067$5DPHDVXUHPHQWWRROWRDVVHVVWKHPHWKRGRORJLFDOTXDOLW\RIV\VWHPDWLFUHYLHZV%0&0HG5HV0HWKRGROSPLG
6KHD%-\FRO$067$5LVDUHOLDEOHDQGYDOLGPHDVXUHPHQWWRROWRDVVHVVWKHPHWKRGRORJLFDOTXDOLW\RIV\VWHPDWLFUHYLHZV-&OLQ(SLGHPLROSPLG
6KHD%-\FRO([WHUQDOYDOLGDWLRQRIDPHDVXUHPHQWWRROWRDVVHVVV\VWHPDWLFUHYLHZV$067$53/R62QHHSPLG
(JJHU0\FRO6SXULRXVSUHFLVLRQ"0HWDDQDO\VLVRIREVHUYDWLRQDOVWXGLHV%0-SPLG
5HQHKDQ $* \ FRO %RG\PDVV LQGH[ DQG LQFLGHQFH RI FDQFHU D V\VWHPDWLF UHYLHZ DQG PHWDDQDO\VLV RI SURVSHFWLYH REVHUYDWLRQDO VWXGLHV /DQFHW
pmid:18280327.
3DJH 0- \ FRO (SLGHPLRORJ\ DQG UHSRUWLQJ FKDUDFWHULVWLFV RI V\VWHPDWLF UHYLHZV RI ELRPHGLFDO UHVHDUFK D FURVVVHFWLRQDO VWXG\ 3/R6 0HGH
pmid:27218655.
6DODV0\FRO&RQIRXQGLQJE\LQGLFDWLRQDQH[DPSOHRIYDULDWLRQLQWKHXVHRIHSLGHPLRORJLFWHUPLQRORJ\$P-(SLGHPLRO
5D\:$(YDOXDWLQJPHGLFDWLRQHIIHFWVRXWVLGHRIFOLQLFDOWULDOVQHZXVHUGHVLJQV$P-(SLGHPLRO
6XLVVD6,PPRUWDOWLPHELDVLQSKDUPDFRHSLGHPLRORJ\$P-(SLGHPLRO
*UHHQODQG62·5RXUNH.2QWKHELDVSURGXFHGE\TXDOLW\VFRUHVLQPHWDDQDO\VLVDQGDKLHUDUFKLFDOYLHZRISURSRVHGVROXWLRQV%LRVWDWLVWLFVSPLG
-QL3\FRO7KHKD]DUGVRIVFRULQJWKHTXDOLW\RIFOLQLFDOWULDOVIRUPHWDDQDO\VLV-$0$
+LJJLQV-3\FRO&RFKUDQH%LDV0HWKRGV*URXS&RFKUDQH6WDWLVWLFDO0HWKRGV*URXS7KH&RFKUDQH&ROODERUDWLRQ·VWRROIRUDVVHVVLQJULVNRIELDVLQUDQGRPL]HGWULDOV
%0-GSPLG
6WHUQH-$\FRO52%,16,DWRROIRUDVVHVVLQJULVNRIELDVLQQRQUDQGRPLVHGVWXGLHVRILQWHUYHQWLRQV%0-L
29. Sanderson S, y col. Tools for assessing quality and susceptibility to bias in observational studies in epidemiology: a systematic review and annotated bibliogra hy. Int J Epi-
GHPLRO
30. Wells GA, y col. The Newcastle-Ottawa Scale (NOS) for assessing the quality of observational studies in meta-analyses.www.ohri.ca/programs/clinical_epidemiology/oxford.
asp
31. Scottish Intercollegiate Guidelines Network SIGN 50: Methodology Checklist 3: Cohort Studies. www.sign.ac.uk/checklists-and-notes.html
:KLWLQJ3\FRO52%,6JURXS52%,6$QHZWRROWRDVVHVVULVNRIELDVLQV\VWHPDWLFUHYLHZVZDVGHYHORSHG-&OLQ(SLGHPLROSPLG
225
6 EVIDENCIA - Actualización en la Práctica Ambulatoria - Enero/Marzo 2018 - Disponible en internet: www.evidencia.org.ar volumen 21 nro. 1
Fig 1. AMSTAR-2: herramienta de evaluación crítica de revisiones sistemáticas de estudios de intervenciones de salud
1.¿Las preguntas de investigación y los criterios de inclusión para la revisión incluyen los componentes PICO?
Sí Opcional
Población
Población Ventana temporal de seguimiento
Sí
Intervención
No
Comparación
Resultado (Outcome)
2.¿El reporte de la revisión contiene una declaración explícita de que los métodos de la revisión fueron establecidos con anterioridad a su realización
y justifica cualquier desviación significativa del protocolo?
Sí Parcial Sí
Los autores afirman que tuvieron un protocolo o guía escrita Además de lo anterior, el protocolo debe estar
que incluía TODO lo siguiente: registrado y también debería haber especificado: Sí
Pregunta(s) de la revisión Un meta-análisis / plan de síntesis, si aplicara, y Sí Parcial
Una estrategia de búsqueda Un plan para investigar causas de heterogeneidad No
Criterios de inclusión / exclusión Justificación para cualquier desviación del
3.¿Los autores de la revisión explicaron su decisión sobre los diseños de estudio a incluir en la revisión?
Para sí parcial (TODO lo siguiente): Para sí, también debería tener (TODO lo siguiente):
Buscaron por lo menos en 2 bases de datos (relevantes a la Haber buscado en listas de referencias / bibliografía de
pregunta de investigación) los estudios incluidos
Proporcionaron palabras clave y/o estrategia de búsqueda Haber buscado en registros de ensayos/estudios Sí
Al menos dos revisores estuvieron de acuerdo de forma independiente en la selección de los estudios elegibles y consensuaron
qué estudios incluir, o Sí
No
Dos revisores seleccionaron una muestra de los estudios elegibles y lograron un buen acuerdo (al menos 80%), siendo el resto
seleccionado por un solo revisor
dos revisores extractaron los datos de una muestra de los estudios elegibles y lograron un buen acuerdo (al menos 80%), No
siendo el resto extractado por un solo revisor
Para sí parcial (TODO lo siguiente): Para sí, también describe (TODO lo siguiente): Sí
Se proporciona una lista de todos los estudios Sí Parcial
potencialmente relevantes, evaluados por texto completo, Fue justificada la exclusión de la revisión de cada
pero excluidos de la revisión estudio potencialmente relevante
No
8.¿Los autores de la revisión describieron los estudios incluidos con suficiente detalle?
Para sí parcial (TODO lo siguiente): Para sí, también describe (TODO lo siguiente):
9.¿Los autores de la revisión usaron una técnica satisfactoria para evaluar el riesgo de sesgo de los estudios individuales incluidos en la revisión?
10.¿Los autores de la revisión reportaron las fuentes de financiación de los estudios incluidos en la revisión?
Para sí:
Sí
Debe haber informado sobre las fuentes de financiación para los estudios individuales incluidos en la revisión
Nota: informar que los revisores buscaron esta información pero que no fue reportado por los autores del estudio, No
también califica
11.Si se realizó un meta-análisis, ¿los autores de la revisión usaron métodos apropiados para la combinación estadística de resultados?
Para sí: Sí
Los autores justifican la combinación de los datos en un meta-análisis, y No
utilizaron una técnica apropiada de ponderación para combinar los resultados de los estudios, ajustada por heterogeneidad si No Meta-
estuviera presente, e Análisis
investigaron las causas de la heterogeneidad
Ensayos Clínicos Aleatorizados (ECA)
Para sí:
Los autores justifican la combinación de los datos en un meta-análisis, y Sí
utilizaron una técnica apropiada de ponderación para combinar los resultados de los estudios, ajustada por heterogeneidad si No
estuviera presente, y
No Meta-
combinaron estadísticamente las estimaciones de efecto de EINA que fueron ajustados por confusión, en lugar de combinar Análisis
datos crudos, o justificaron combinar datos crudos las estimaciones de efecto ajustado cuando no hubieran estado disponibles, y
reportaron estimaciones de resumen separadas para los ECA y EINA por separado cuando ambos se incluyeron en la revisión
8 EVIDENCIA - Actualización en la Práctica Ambulatoria - Enero/Marzo 2018 - Disponible en internet: www.evidencia.org.ar volumen 21 nro. 1
12.Si se realizó un meta-análisis, ¿los autores de la revisión evaluaron el impacto potencial del riesgo de sesgo en estudios individuales sobre los
resultados del meta-análisis u otra síntesis de evidencia?
Para sí:
Sí
Sólo incluyeron ECA de bajo riesgo de sesgo, o
No
Si la estimación combinada se basó en ECA y/o EINA con diferentes riesgos de sesgo, los autores realizaron análisis para No Meta-
investigar su posible impacto en las estimaciones sumarias del efecto Análisis
13.¿Los autores de la revisión consideraron el riesgo de sesgo de los estudios individuales al interpretar / discutir los resultados de la revisión?
Para sí:
14.¿Los autores de la revisión proporcionaron una explicación satisfactoria y discutieron cualquier heterogeneidad observada en los resultados
de la revisión?
Para sí:
Si hubo heterogeneidad, los autores realizaron una investigación de sus fuentes y discutieron su impacto en los No
resultados de la revisión.
15.Si se realizó síntesis cuantitativa ¿los autores de la revisión llevaron a cabo una adecuada investigación del sesgo de publicación (sesgo de
estudio pequeño) y discutieron su probable impacto en los resultados de la revisión?
Para sí:
Sí
Realizaron pruebas gráficas o estadísticas para sesgo de publicación y discutieron la probabilidad y la magnitud del No
impacto del sesgo de publicación
No Meta-
Análisis
16.¿Los autores de la revisión informaron de cualquier fuente potencial de conflicto de intereses, incluyendo cualquier financiamiento recibido
para llevar a cabo la revisión?
Para sí:
Sí
Los autores informaron carecer de conflicto de intereses, o
No
Los autores describen sus fuentes de financiación y cómo fueron gestionados los potenciales conflictos de intereses.
Muchos de los dominios en AMSTAR-2 resultan auto-explicativos. vención, grupo de control y resultado) como marco organizativo
Sin embargo, se brinda una orientación adicional dado que a men- para una pregunta de un estudio. Algunas veces debe adicionarse el
udo lo temas son complejos y están sujetos a diferentes interpreta- marco temporal si esto es crítico para determinar la probabilidad de
ciones, en un amplio espectro de intervenciones. que un estudio capte resultados clínicos relevantes (por ejemplo, si
Los criterios deben ser aplicados en entornos donde se realizan revi- un efecto de la intervención solo se espera después de varios años).
siones sistemáticas (RS) de intervenciones (generalmente clínicas) Los componentes PICO deberían describirse detalladamente en el
ELHQGHÀQLGDV reporte de la RS y deberían permitir que el evaluador juzgue la se-
AMSTAR 2 no está diseñado para generar un puntaje global ya que lección de estudios, su “combinabilidad” y la aplicabilidad de los re-
VRQORVGRPLQLRVFUtWLFRVORVTXHPiVSXHGHQGHELOLWDUODFRQÀDQ]D sultados. Los autores de las RS no siempre explicitan los elementos
en una revisión sistemática. de PICO, pero estos deben ser discernibles a través de una lectura
cuidadosa de las secciones del resumen, la introducción y los méto-
1. ¿Las preguntas de investigación y los criterios de inclusión GRV3DUDFDOLÀFDU¶6t·ORVHYDOXDGRUHVGHEHQDVHJXUDUVHTXHORV
para la revisión incluyen los componentes PICO? elementos PICO se describen en alguna parte del informe.
Es una práctica común usar la descripción PICO (población, inter-
10 EVIDENCIA - Actualización en la Práctica Ambulatoria - Enero/Marzo 2018 - Disponible en internet: www.evidencia.org.ar volumen 21 nro. 1
8. ¿Los autores de la revisión describieron los estudios inclui- XVXDOPHQWHVHFXDQWLÀFDQFRQORVGDWRVGHOtQHDGHEDVHUHSRUWD-
GRVFRQVXÀFLHQWHGHWDOOH" dos en los estudios individuales. La posible confusión de línea base
Se deben proporcionar la descripción de los temas, las interven- puede ser abordada de varias maneras, incluido el diseño (por
ciones, los controles, los resultados, el diseño, el análisis y el ámbito ejemplo, al igualar por puntaje de propensión), el ajuste (por ejem-
de los estudios incluidos en la revisión. Los detalles deberían ser plo, mediante regresión logística) y otras técnicas como el análisis
VXÀFLHQWHVSDUDTXHXQHYDOXDGRURXVXDULRMX]JXHHQTXpPHGLGD GHYDULDEOHVLQVWUXPHQWDOHV\ODLQFOXVLyQGHH[SRVLFLRQHV¶WUD]DGR-
los estudios fueron elegidos de manera apropiada (en relación con UDV·(VFRP~QVXSRQHUTXHLQFOXVRFRQWpFQLFDVVRÀVWLFDGDVQRVH
la pregunta PICO) y si las poblaciones e intervenciones en estudio ajustarán completamente todos los factores de confusión, lo que sig-
son relevantes para su práctica o la política de salud en cuestión. QLÀFDTXHVRQDVRFLDFLRQHVGpELOHVLQFOXVRVLVRQHVWDGtVWLFDPHQWH
Las descripciones también proporcionan un marco para estudiar la VLJQLÀFDWLYDV\GHEHQLQWHUSUHWDUVHFRQFDXWHOD
heterogeneidad en los efectos de la intervención (por ejemplo, por Sesgo de selección de muestra. Esto ocurre cuando los sujetos son
dosis, rango de edad, entorno clínico, etc.). muestreados de una manera sesgada que distorsiona directamente
la verdadera relación entre la exposición y el resultado. No requiere
9. ¿Los autores de la revisión usaron una técnica satisfactoria un tercer factor, como en el caso de la confusión. Por ejemplo, no se
para evaluar el riesgo de sesgo de los estudios individuales in- debería estudiar la asociación entre el tabaquismo y las enferme-
cluidos en la revisión? dades del corazón al reclutar sujetos derivados a una clínica de
Esta es una parte crucial de la evaluación de cualquier RS, particu- cesación tabáquica. La selección de sujetos con la exposición de in-
larmente aquellas que incluyen EINA. La pregunta clave de eva- terés no debe estar relacionada con su resultado. Del mismo modo,
luación es si en la revisión se tuvo en cuenta el riesgo de sesgo al la selección de sujetos con el resultado no debe estar relacionado
resumir e interpretar los resultados. con su estado de la exposición. El momento de la selección también
Cuando la revisión se limita a ECA, recomendamos consultar el puede ser importante. Si los sujetos han estado usando un medica-
Manual Cochrane para determinar si los autores de la revisión han mento durante algún tiempo antes del enrolamiento (usuarios fre-
hecho una adecuada evaluación de riesgo de sesgo de los ECA in- cuentes), serán un grupo tolerante con un menor riesgo de resulta-
GLYLGXDOHV(VWDVHFFLyQVHUHÀHUHDOGHVDItRSODQWHDGRSRUORV(,1$ dos adversos. Por esta razón, los estudios fármaco-epidemiológicos
Los autores de la revisión deberían haber utilizado un enfoque sis- DFWXDOHV UHFOXWDQ ¶QXHYRV XVXDULRV· GH PHGLFDPHQWRV DQiORJR DO
temático para la evaluación de riesgo de sesgo, preferiblemente con inicio del tratamiento en un ECA). Otros sesgos de muestreo tem-
XQLQVWUXPHQWRGHFDOLÀFDFLyQDGHFXDGDPHQWHGHVDUUROODGR6LVH poral (como el sesgo de tiempo inmortal y el sesgo de inicio) son
ha usado un instrumento no estándar, éste debería ser capaz de de- a veces importantes. Se recomienda que los usuarios se dirijan al
tectar fallas metodológicas serias. Hay varios instrumentos de riesgo documento de orientación del ROBINS-I para obtener más infor-
de sesgo (para estudios individuales), incluida la escala de Newcas- mación.
tle Ottawa, la escala SIGN, y la Herramienta de Evaluación de Méto- Sesgo en la medición de exposiciones y resultados. La medición de
dos Mixtos (MMAT). El instrumento de evaluación más completo es XQDH[SRVLFLyQRGHOWUDWDPLHQWRSXHGHFODVLÀFDUVH HUUyQHDPHQWH
el instrumento Cochrane presentado recientemente, ROBINS-I, por si no se realiza un registro preciso en tiempo real. Por lo general,
lo que es posible que esta herramienta no haya estado disponible en los estudios fármaco-epidemiológicos modernos usan registros de
el momento en que se realizó una revisión. Los desarrolladores de prescripciones o dispensación como sustituto de consumo. Pero la
AMSTAR 2 nos basamos en los instrumentos Cochrane de riesgo adherencia al tratamiento dispensado no será del 100%, por lo que
de sesgo para ECA HOFRQVXPRUHDOVHFODVLÀFDUiHUUyQHDPHQWHSRUHVWHPpWRGRVLHO
(http://handbook.cochrane.org/chapter_8/8_5_the_cochrane_col- error no es diferencial, se subestimaría una eventual diferencia. Sin
laborations_tool_for_assessing_risk_of_bias.htm) y de EINA (www. embargo, algunas preguntas de investigación dependen del recu-
riskofbias.info). Cualquiera sea el instrumento utilizado por los au- erdo (p. ej., exposición ultravioleta y melanoma). Esto puede llevar
tores de la revisión, los evaluadores deberían sentirse satisfechos de DXQDFODVLÀFDFLyQHUUyQHDGLIHUHQFLDO3RUHMHPSORORVSDGUHVGH
que aborda los elementos enumerados en el ítem 9 del instrumento. un niño que ha muerto de síndrome de muerte súbita del lactante
Debe tenerse en cuenta que la guía que se proporciona aquí no es pueden tener mayor recuerdo de cualquier medicamento que ad-
exhaustiva: AMSTAR-2 solo aborda los dominios de sesgo recono- ministraron al bebé antes del evento.
cidos con mayor frecuencia. Al revisar el riesgo de sesgo evaluado La medición de los resultados también puede verse afectada por
por los autores de la revisión, debe buscarse el consejo de expertos FODVLÀFDFLyQ HUUyQHD TXH VL IXHUD QR GLIHUHQFLDO VXEHVWLPDUtD XQD
en métodos y de contenido, si ellos no están incluidos en su equipo, HYHQWXDOGLIHUHQFLD6LQHPEDUJRODFODVLÀFDFLyQHUUyQHDQRGLIHUHQ-
TXLHQHVGHEHUtDQSURSRUFLRQDUFRQVHMRVHVSHFtÀFRVVREUHTXpIDF- cial puede introducir sesgos. Por ejemplo, si se realizan ecografías
WRUHVGHFRQIXVLyQVRQLPSRUWDQWHVFyPRLGHQWLÀFDUORVVHVJRVGH de miembros inferiores con más frecuencia en mujeres con piernas
selección y de medición que probablemente sean relevantes para hinchadas y doloridas que están tomando anticonceptivos orales, la
la revisión y qué técnicas de ajuste de confusión serían apropiadas. selección de individuos de una clínica de ecografías puede sesgar
La siguiente lista de dominios de riesgo de sesgo ha sido selecciona- la asociación entre los anticonceptivos orales y la trombosis venosa
da del instrumento ROBINS-I / ACROBAT-NRSI, el más pertinente profunda.
para RS que incluyen EINA: Reporte selectivo de resultados y análisis. Los grandes estudios
Confusión. La confusión ocurre cuando los efectos de dos interven- observacionales pueden analizar bases de datos poblacionales que
ciones asociadas o dos exposiciones (por ejemplo, el tabaquismo y UHJLVWUDQP~OWLSOHVUHVXOWDGRVHQXQDSREODFLyQGHÀQLGD6LORVUHVXO-
el consumo de alcohol) no se han separado durante el análisis. Esto WDGRVQRHVWiQSUHHVSHFLÀFDGRVSUHIHULEOHPHQWHHQXQSURWRFROR
puede dar como resultado un efecto atribuido a una variable, cuan- registrado) los investigadores pueden tentarse de analizar múltiples
do en realidad se debe a la otra. En los estudios de intervenciones, resultados e informar selectivamente aquellos que parecen ser
la confusión también puede estar relacionada con la indicación de diferentes entre individuos expuestos y no expuestos. Además, ha-
tratamiento, por ejemplo, cuando un medicamento se administra bitualmente puede disponerse de varios métodos potenciales para
preferentemente a pacientes con tasas más altas de comorbilidades analizar un conjunto de datos no aleatorizados (por ejemplo, difer-
que el fármaco de comparación y donde estas condiciones comórbi- entes formas de categorizar la intervención, o diferentes modelos
das están asociadas con el resultado de interés. Estas evaluaciones de ajuste multivariable). Si el plan de análisis en el protocolo no se
12 EVIDENCIA - Actualización en la Práctica Ambulatoria - Enero/Marzo 2018 - Disponible en internet: www.evidencia.org.ar volumen 21 nro. 1
15. Si se realizó una síntesis cuantitativa ¿los autores de la re- 16. ¿Los autores de la revisión informaron cualquier fuente
visión llevaron a cabo una adecuada investigación de la posi- SRWHQFLDOGHFRQÁLFWRGHLQWHUHVHVLQFOX\HQGRFXDOTXLHUÀQDQ-
bilidad de sesgo de publicación (sesgo de estudio pequeño) ciamiento recibido para llevar a cabo la revisión?
y discutieron su impacto probable en los resultados de la re- Como se señaló al comentar riesgo de sesgo, los estudios individua-
visión? OHV ÀQDQFLDGRV SRU LQWHUHVHV SULYDGRV SXHGHQ JHQHUDU UHVXOWDGRV
Este es un tema muy importante, pero puede ser difícil para los au- más propensos a favorecer la intervención que los estudios inde-
tores de la revisión y para los evaluadores resolverlo de forma com- pendientes. La misma suposición se aplica a las RS. Los autores
SOHWD3RUORJHQHUDOVHXVDQSUXHEDVHVWDGtVWLFDVRJUiÀFRV\VL GHEHQUHSRUWDUVXVIXHQWHVGHÀQDQFLDPLHQWRGLUHFWR\ODVUHYLVWDV
estas pruebas son positivas, se considera que indican la presencia generalmente lo requieren para su publicación, pero la evaluación
de sesgo de publicación. Sin embargo, las pruebas negativas no GHORVFRQÁLFWRVGHLQWHUHVHVGHORVUHYLVRUHVQRVHGHWLHQHDKt'H-
son una garantía de la ausencia de este tipo de sesgo. Hasta cierto EHQLQIRUPDUVXVRWURVOD]RV/DUHYLVLyQSXHGHVHUÀQDQFLDGDGH
punto, la importancia del sesgo de publicación depende del contexto forma independiente, pero sus autores pueden tener vínculos con
y del ámbito. empresas que fabrican o comercializan los productos incluidos en
Por ejemplo, una serie de estudios en apariencia metodológica- ODUHYLVLyQVLVWHPiWLFD/RVFRQÁLFWRVGHLQWHUHVHVSURIHVLRQDOHVVRQ
mente sólidos, patrocinados por la industria (por ejemplo, poderosos, pero más difíciles de discernir ya que rara vez se repor-
estudios con drogas, dispositivos, o toxinas putativas) podrían ser tan. Cuando los investigadores tienen un involucramiento profesio-
más propensos a verse más afectados por el sesgo de publicación nal de larga data en un campo de investigación, se puede manifestar
TXHHVWXGLRVVLPLODUHVUHDOL]DGRVVLQÀQDQFLDPLHQWRGHSHQGLHQWHGH XQFRQÁLFWRGHLQWHUpVGHHVWHWLSRFXDQGRXQDUHYLVLyQFRQIURQWD
la industria. Los aspectos clave incluyen: si los autores han hecho FRQVXVFUHHQFLDVPiVDUUDLJDGDV/RVSRVLEOHVFRQÁLFWRVGHLQWHUpV
VXPHMRUHVIXHU]RSDUDLGHQWLÀFDUHOVHVJRGHSXEOLFDFLyQDWUDYpV profesionales serán difíciles de evaluar, pero se pueden inferir si los
GHE~VTXHGDVELEOLRJUiÀFDVPiVSURIXQGDVHLQWHQVDVVHJ~QVHD revisores han publicado en forma extensa en el campo que se está
necesario y de acuerdo con el ámbito), si mostraron el impacto pro- revisando y sus estudios están incluidos en la RS. Si bien puede
bable del sesgo de publicación en su interpretación y discusión de DUJXPHQWDUVHTXHORVHIHFWRVGHOFRQÁLFWRGHLQWHUpVSRGUtDQPDQL-
los resultados, y si realizaron un análisis de sensibilidad para de- festarse como fallas en otros dominios de sesgo, los desarrolladores
WHUPLQDU FXiQWRV HVWXGLRV ¶QXORV· IDOWDQWHV VHUtDQ QHFHVDULRV SDUD GHO$067$5FUHHPRVTXHHVWHtWHPVLHPSUHGHEHFODVLÀFDUVHSRU
invalidar los resultados obtenidos. separado.