Está en la página 1de 20

Journal of Abnormal Psychology © 2019 American Psychological Association

en prensa. No es la versión de registro. artículo final disponible en:


https://doi.org/10.1037/abn0000421

Evaluar el valor probatorio de Psychological empíricamente su


Tratamientos (EST): Una revisión meta-Científico

* Universidad John Kitchener * Universidad Alexander J.


Sakaluk de Victoria Williams, de Kansas

Robyn Universidad de Kathleen T. Rhyner Canandaigua


Utah, E. Kilshaw VA Medical Center

tratamientos con apoyo empírico (o terapias; EST) son el estándar de oro en las intervenciones terapéuticas para la psicopatología. Sobre la base
de un conjunto de criterios metodológicos y estadísticos, la APA ha asignado determinadas combinaciones de tratamiento de diagnóstico de estado
de EST y ha valorado aún más su apoyo empírico tan fuerte, Modest, y / o polémicos. Emergentes preocupaciones acerca de la posibilidad de
reproducir los resultados de la investigación en psicología clínica ponen de relieve la necesidad de examinar críticamente el valor probatorio de la
investigación de TAE. Por lo tanto, se realizó una revisión meta-científica de la literatura EST, usando los ensayos clínicos presentados en una
base de datos en línea APA existente de EST, y un conjunto de nuevas métricas de valor probatorio (es decir, las tasas de misre- portado
estadísticas, poder estadístico, R-Index y factores de Bayes). Nuestros análisis indican que las estimaciones de potencia y replicabilidad eran
concerningly baja en casi todos los EST, y de forma individual, algunos EST obtuvieron una puntuación deficiente en varias métricas, la EST
fuertes en su defecto a superar continuamente sus homólogos modesto. Por último, encontramos evidencia de mejoras en el tiempo de la potencia
estadística dentro de la literatura EST, pero no por la fuerza de la evidencia de la eficacia EST. Se describen las implicaciones de nuestros
hallazgos para la práctica de los psicoterapeutas y ofrecer recomendaciones para mejorar el valor probatorio de la investigación de TAE avanzar.
encontramos evidencia de mejoras en el tiempo de la potencia estadística dentro de la literatura EST, pero no por la fuerza de la evidencia de la
eficacia EST. Se describen las implicaciones de nuestros hallazgos para la práctica de los psicoterapeutas y ofrecer recomendaciones para
mejorar el valor probatorio de la investigación de TAE avanzar. encontramos evidencia de mejoras en el tiempo de la potencia estadística dentro de
la literatura EST, pero no por la fuerza de la evidencia de la eficacia EST. Se describen las implicaciones de nuestros hallazgos para la práctica de
los psicoterapeutas y ofrecer recomendaciones para mejorar el valor probatorio de la investigación de TAE avanzar. Resumen Científico general: Esta
revisión sugiere que Alt- hough la evidencia subyacente para un pequeño número de terapias con apoyo empírico es consistentemente fuerte en una serie de métricas, la evidencia es mixta

Datos, código de análisis, material complementario: https://osf.io/73drs/

palabras clave: tratamientos con apoyo empírico; valor probatorio; meta-ciencia; replicabilidad

Clínico sustenta la eficacia de todo el obras y psicoterapia si es así, para quién y bajo qué condiciones han guiado
promesas de la industria y la psicoterapia es ethically- cota la investigación para la mejor parte de un siglo (por ejemplo, Eysenck, 1952).
para entregar. Preguntas sobre si Sin embargo, sólo a partir de la década de 1970 han controlado ensayos
como los utilizados en la medicina florecieron en el campo de la psicología
* Williams y Sakaluk comparten el primer autoría; su orden fue arbitrariamente decidió por
(por ejemplo, Klerman et al., 1974). En un esfuerzo por sintetizar y difundir
un lanzamiento de moneda impugnada amargura. Los autores agradecen sinceramente a
mejor los resultados de esta investigación eficacia, una División 12 Grupo de
los Dres. Corker, Frito, Grubbs, Kirk, y Nuijten para su consulta sobre asuntos
Trabajo de la APA (1995) creó una lista continuamente actualizada de las
metodológicos y clínicos a toda nuestra opinión, y Kyle Dirck y el Dr. Robert Williams por terapias que han alcanzado un cierto nivel de apoyo a la investigación para el

sus útiles sugerencias sobre versiones anteriores del manuscrito. Esta investigación fue tratamiento de pacientes con diagnósticos específicos. Estas terapias
llegaron a ser conocidos como los tratamientos con apoyo
apoyada por una subvención Insight Desarrollo SSHRC adjudicado a Sakaluk. Sakaluk es
empírico-psicológicos (o terapias) (EST; Kendall, 1998).
un consultor de estadística a otras revistas y experto metodológico / cuantitativa que ha

publicado sobre la crisis replicabilidad antes. Williams es director de la clínica psicológica

que ha utilizado las tecnologías ecológicamente racionales en su propia práctica y anima a El nivel de apoyo probatorio para cada EST se ha clasificado
adicionalmente de acuerdo con un conjunto de criterios metodológicos
los alumnos a usarlos. Rhyner es un psicólogo VA.
y estadísticos (Chambless et al., 1998). Al recomendar criterios
actualizados para la evaluación de ESTs, Tolin et al. (2015) sostiene
que la EST

1
S AKALUK, W illiams, K ILSHAW, Y R hyner 2

movimiento ha “tenido un impacto sustancial en la psicología y disciplinas de salud propuesto una serie de otras métricas para evaluar la solidez de los resultados
mental relacionados”, señalando la difusión de tecnologías ecológicamente de investigación más allá de la violación de p <
racionales a través de la página web de la División 12 como un “efecto inmediato . 05 umbral. Aunque ninguna de las siguientes métricas, de forma individual,
tangible.” Por otra parte, muchos meta-análisis y revisiones de la literatura apoyan es un gasoducto hacia el “verdadero” valor probatorio de un determinado
la eficacia de EST específicas (por ejemplo, Kliem, Kröger, y Kosfelder, 2010) o conjunto de efectos, cada uno de ellos capturan alguna característica única
grupos de EST (por ejemplo, Hollon, Thase y Markowitz, 2002), y algunos de evidencia persuasiva. En conjunto, pueden proporcionar una imagen
investigadores han argumentado que la calidad de las tecnologías ecológicamente robusta del estado de la evidencia que subyace en la literatura EST. Creemos
racionales que subyacen en la evidencia ha mejorado con el tiempo (Thoma et al., que cualquier terapia que merece el término apoyado empíricamente debe
2012). vaya bien a través de estas métricas.

En primer lugar, la información errónea de la estadística inferencial (por


Evaluar el valor probatorio de EST ejemplo, los grados de libertad, valores estadísticos de prueba, pags- valores) es
una práctica sorprendentemente común en la investigación psicológica, con casi el
Tradicional criterios de probatorio valor.
50% de los artículos publicados utilizando NHST contiene al menos un error de
Chambless y sus colegas articulan los criterios originales que la
información, y aproximadamente el 13% que contiene un informe de errores
división 12 utiliza para identificar las tecnologías ecológicamente
“bruto” que socava conclusiones de significación estadística (Nuijten, Hartgerink,
racionales y clasificarlos por la fuerza de su confianza evi- científica
van Assen, Epskamp, ​y Wicherts, 2016). Por lo general el producto de un simple
subyacente (por criterios expandidos, ver Chambless et al, 1998;.
error humano, las estadísticas declaradas de modo inexacto, sin embargo,
Chambless y Hollon, 1998). Específicamente, tera- tartas que han
erosionan la confianza en la credibilidad de los resultados. En el caso de las
demostrado repetidamente mejoras sig- estadísticamente sig- más
tecnologías ecológicamente racionales, los lectores deben poner mayor confianza
de no-tratamiento, placebo u otro tratamiento alternativo, se
en terapias para las que se informaron con precisión los resultados de apoyo.
describen por la División 12 apoyado tan fuertemente. Bastante
soportados tera- tartas son los que han sólo una vez
significativamente outper- formado sin tratamiento, placebo, u otro
tratamiento alternativo; y terapias que han mostrado una mejora
A continuación, el poder estadístico, que se refiere a la probabilidad de
inconsistente sobre no-tratamiento, placebo u otro tratamiento alter-
ejecución largo de detectar un efecto cuando sea realmente existe-ha sido una
nativa se designan como teniendo apoyo sial controvertido (ver
preocupación recurrente en la replicabilidad de los resultados científicos
https: //www.div12.
(Maxwell, 2004). A pesar de las recomendaciones que estudia llevarse a cabo
con una potencia del 80% para el tamaño del efecto esperado, opiniones
recientes han encontrado que el estudio de las ciencias sociales promedio
Aunque estos criterios marcaron un paso deseable a- las salas de
posee solamente una ocasión de detectar el 44% de una existente medianas
mayor rigor en la evaluación de los tratamientos psicológicos, su
verdadero efecto (Szucs y Ioannidis, 2017). El poder puede ser computada post
dependencia de la significación estadística para determinar EST-estado
hoc utilizando el diseño de un estudio, tamaño de la muestra, y la magnitud del
presenta una preocupación. Como casi una década de la crisis
efecto observado. Aunque estas estimaciones de potencia post-hoc son
replicabilidad (ver Nelson et al.,
estimaciones generalmente no fiables de verdadero poder en singular, cuando
2018) ha demostrado, mal uso común y malentendidos de las pruebas
se suman todos los estudios que se hacen aproximaciones cada vez más
de hipótesis nula significación (NHST) hace que la significación
precisos de
estadística de una precaria y el nivel de evidencia fácilmente
engañosa. A pesar de que las conversaciones sobre la crisis
poder verdadero (ver
replicabilidad han comenzado recientemente en el ámbito clínico
Schimmack, 2012). En consecuencia, en el caso de la literatura EST, los
(Tackett et al.,
revisores deben tener más confianza en terapias fundados en estudios bien
2017), existe una creciente conciencia de que muchos de los fac- tores que
con motores capaces de detectar de forma fiable los efectos de tamaño
socavan la posibilidad de reproducir los resultados en otras áreas de la
razonable.
psicología (Colaboración Ciencia Abierta,
Como una extensión de los cálculos de potencia, el
2015) han de haber impactado la ciencia clínica literatura tura,
Replicabilidad-Index (Índice de R-; Schimmack, 2016) se puede utilizar para
así (ver Coyne & Kok, 2014; Cuijpers y Cristea, 2016; Flint,
evaluar aún más el grado de verosimilitud un conjunto de reportados efectos
Cuijpers, Horder, Koole, y Munafo, 2014).
significativos es, dado el nivel de potencia observado para esos efectos. precios
inflados de importancia más allá de la potencia observada para un conjunto de
métricas alternativas de valor probatorio. Guiada por la
efectos (por ejemplo, efectos de 80% significativas en un conjunto de efectos
preocupación por las consecuencias que la dependencia, la
cuando la energía mediana post-hoc era 0.60) pueden sugieren efectos son
incomprensión, y / o mal uso de NHST pueda tener sobre la posibilidad
inverosímil, y potencialmente el resultado de
de repetir psicológica recomendaciones
(Cumming, 2014), metodólogos psicológicos tienen
S AKALUK, W illiams, K ILSHAW, Y R hyner 3

informe selectivo y / o prácticas de investigación cuestionables (Schimmack, Efectos fueron extraídos de artículos enumerados por la División 12 como
2016). Por lo tanto, los lectores deben tener más confianza en las tecnologías “Referencias clave” o “ensayos clínicos” para cada uno de los EST enumerados
ecológicamente racionales apoyadas por estudios que tienen tasas de no inflados en la página web División 12 (https://www.div12.org/treatments/). De esta
de significación estadística dada su potencia estadística. manera, se procedió con una muestra de la literatura que se definió por otros, la
eliminación de una zona en la que nuestra subjetividad de otro modo podrían
En contraste con la toma de decisiones dicotómica de NHST, sesgar nuestra apreciación de la literatura.
factores de Bayes ofrecen un medio para evaluar hipótesis que compiten
en una métrica continua de la fuerza probatoria. Explícitamente, un Cada artículo típicamente informó de una miríada de pruebas estadísticas
Factor de Bayes es la (promedio ponderado) de razón de verosimilitud que no estaban relacionados con la eficacia de la EST (s) considerado (por
de dos hipótesis diferentes para un conjunto dado de datos. Por ejemplo, ejemplo, las comparaciones demográficas en la línea base, análisis de
en un estudio que compara la eficacia de una EST a la de una condición covarianza, análisis de subgrupos). Por lo tanto, los criterios para la elección de
de control, un factor de Bayes de 10 sugiere que los datos son 10 veces qué efecto (s) que se consideren relevantes para nuestra revisión meta-científica
más probable bajo la hipótesis alternativa (es decir, EST eficacia) que decididos (ver registro previo, https://osf.io/jz7ty/). En resumen, hemos intentado
están bajo una hipótesis nula de ningún efecto (un factor de Bayes de codificar la estadística inferencial y descriptiva (para las comparaciones por
pares entre los grupos de tratamiento / control) descritos por los autores como
“primaria” o, en su defecto, los que aparecen relevantes para la eficacia del
0,10, mientras tanto, indicarían los datos eran 10 veces más probable tratamiento para el diagnóstico en particular.
bajo la hipótesis nula de no efecto). Jeffreys (1961) proporcionó
umbrales descriptivo para la fuerza de la evidencia en un Factor de
Bayes dado, incluyendo
anecdótico pruebas (1 < BF < 3), moderar pruebas (3 < BF < 10), fuerte pruebas
(10 < BF < 30), y muy fuerte pruebas ( BF > 30). Factores de Bayes se
Estrategia de codificación
han extendido recientemente al contexto meta-analítica, donde pueden
ser utilizados para sintetizar la fuerza relativa de pruebas de un efecto Codificadores (todos los autores, excepto Sakaluk) fueron trained- y el sistema
en todos los estudios (por ejemplo, Moden et al., de codificación refinado mediante la aplicación del sistema de codificación para dos
TAE de prueba. Todas las ESTs fueron luego codificados por dos de los tres
2018). En el caso de la literatura EST, los lectores deben tener una mayor codificadores. Debido a que los artículos informaron variabilidad números ous de
confianza en las terapias con datos que son mucho más propensos bajo la efectos (sólo algunos de los cuales cayeron dentro de nuestros criterios), el primer
hipótesis de la eficacia terapéutica que bajo la hipótesis nula de ningún codificador propuso el número de efectos Evant rel-, con el otro codificador de
efecto terapéutico. confirmar (o desafiante) ese número. Se discutieron desacuerdos sobre efectos
La revisión meta-científico actual particulares hasta que se alcanzó un consenso; las cualidades de cada efecto
En la actual revisión meta-científica, evaluamos el valor EV-idential de la relevante eran codificados independiente- mente.
literatura que subyace a 79 EST identificadas con los de la División 12 de la APA.
En lugar de confiar exclusivamente en la significación estadística tradicional, sin
embargo, nuestra opinión adopta una conceptualización más amplia de lo que las
métricas constituyen una prueba a favor (o en contra) de una terapia. En concreto,
Estrategia analítica
utilizamos las tasas de comunicación errónea, las estimaciones de la potencia
estadística, los valores R-Index, y factores de Bayes para contestar las siguientes
Cálculo de las métricas. Utilizamos Schönbrodt de (2018) p-checker aplicación
preguntas:
( http://shinyapps.org/apps/p- corrector / ) Para facilitar la identificación de los
resultados estadísticos declaradas de modo inexacto (Nuijten, Hartgerink,
1. ¿Cuál es el valor probatorio que subyace EST colectivamente e van Assen, Epskamp, ​y Wicherts, 2016) 1, estimación de mediana observó
individualmente? potencia, y el cálculo de los valores de R-índice (Schimmack, 2016). Se
2. ¿Cuál es el valor probatorio de EST clasificados como poseedores de calculó un índice adicional de estadística del tamaño del efecto estimado
apoyo empírico fuerte, con relación a los clasificados como tener sólo un podría ser detectado de forma fiable qué potencia (potencia 80%) dados los
modesto apoyo? tamaños de muestra de las condiciones de tratamiento y de control-utilizando
3. ¿Los estándares de soporte probatorio para EST mejorado el
con el tiempo?
PWR paquete (Champley, 2018) para R.
métodos También utilizamos el BayesFactor paquete (Morey y Rouder, 2018)
para calcular los factores de Bayes ( BF 10) de la evidencia de EST eficacia
Muestra de Efectos relativa a la de las condiciones de control utilizando dos estrategias
analíticas diferentes. Como
S AKALUK, W illiams, K ILSHAW, Y R hyner 4

con todos los métodos bayesianos, el cálculo de BF 10 (Https://osf.io/73drs), incluyendo nuestro conjunto de datos, criterios de selección
requiere la especificación de una distribución previa para cada iniciales (https://osf.io/jz7ty/ registrado previamente), los umbrales de
hipótesis que compiten (es decir, una distribución de probabilidad interpretación, y las aclaraciones / modificaciones realizadas a este protocolo. En
para la hipótesis nula y alternativa, dado los datos; ver Etz, Haaf, el curso de registrándolos previamente, también detallamos cada una de nuestras
Rouder, y Vandekerckhove, 2018). En situaciones como nuestros predicciones individuales para la síntesis y cualquier posible conflicto de intereses.
análisis, un enfoque común es usar un poco informativo anterior, tales
como la distribución de Cauchy (típicamente referido como el Jefferys- A pesar de nuestros esfuerzos para reducir el sesgo en nuestra síntesis, los
Zellner-Siow, o JZS, antes), que no da preferencia a cualquier rango lectores pueden ser escépticos de nuestro proceso y en desacuerdo con especial
particular de probabilidad , y en su lugar permite que los datos codificación y / o decisiones analíticas que hicimos. Teniendo en cuenta la
dominan la probabilidad resultante. calidad de la información estadística en la literatura EST, nuestro equipo de
autoría cree que se justifica tal escepticismo; es probable que no todos estarán
de acuerdo con nuestras decisiones de codificación. Por ello, hemos dado el
En primer lugar, se calculó el rango de persona BF 10 paso adicional de hacer todo nuestro diálogo y la solución de problemas de
de t Estadísticas (o estadística descriptiva) en todos los estudios dentro de esfuerzos transparentes (véase el OSF).
un determinado EST. A continuación, realizó bayesiano meta-análisis (ver
Moden et al., 2018) para sintetizar
BF 10 a través de efectos y para calcular las estimaciones posteriores de
resultados
tamaños del efecto para cada EST 2. Como la mayoría de los estudios
informaron más de un tamaño del efecto relevante y accesible para el software
multinivel bayesiano meta-análisis no es todavía la corriente principal, nos Muestra de efectos y Fiabilidad
ajustamos dos modelos diferentes de meta-análisis: la primera con el menor
Dual-codificación de la muestra de trabajos EST relevantes produjo un
efecto de cada estudio (una pesimista meta-analítica estimación), y la segunda
total de n = 3463 efectos de 453 artículos, aunque no todos estos efectos
utilizando el efecto más grande de cada estudio (una
fueron utilizable, como información omitida estadística (por ejemplo, tamaños
de muestra por grupo, grados de libertad, valor estadístico de prueba, etc.,)
optimista estimación de meta-análisis). Todas BF 10 se calcularon como
prohibió la inclusión de efectos particulares al cálculo de determinados
pruebas de dirección (es decir, unidireccional) de la eficacia del tratamiento
métricas. 4 Se evaluó la fiabilidad de nuestra estrategia de codificación de la
utilizando priors JZS, y observamos si los resultados que satisfacen un
siguiente manera: para un subconjunto de 10 TER, estimaciones de potencia
umbral particular de evidencia son contingentes de la anchura del anterior.
y persona BF 10 rango se calcula utilizando la muestra de cada codificador de
Por último, como por la División de 12 criterios para el establecimiento de
efectos; las estimaciones resultantes eran
una EST como Strong, el meta-análisis de los efectos fuertes de EST (vs.
Modest y controvertida) se limitó a comparaciones con los controles activos,
píldora placebo o tratamiento, o de otra terapia de buena fe. 3 a continuación, en comparación para
consistencia. La fiabilidad de las estimaciones de potencia era excelente ( r
= . 99) con los codificadores de producir resultados idénticos para ocho
ESTs y discrepancias menores para los otros dos. Fiabilidad de la
Evaluación de las métricas. Con el fin de evaluar el valor dencial evi- de la
codificación para el individuo BF 10 fue similar, con sólo dos discrepancias
literatura EST basado en nuestras métricas seleccionadas, tuvimos que determinar
apreciables, y un alto nivel de consistencia entre el mínimo BF 10 ( r =
para cada uno lo que podríamos considerar una fuerte evidencia, modesto, o
controvertido (https://osf.io/2nwrs/). Consultamos con cuatro expertos ological y
. 99) y máximo BF 10 ( r = . 99) calculado para cada EST.
clínicos método- que por lo general se sentían nuestros umbrales para la
interpretación eran razonables (contraria todavía arbitraria-); esto, además de no
ser tomada como evidencia de que se destacan por otras características de
nuestro proceso, ni que nuestra tesis sin- es correcta. Por el contrario, nuestros Las observaciones de baja reproducibilidad y alta flexibilidad
consultores han simplemente- pero no menos importante, se sugiere que nuestro analítica
enfoque de uno de los aspectos más subjetivos de nuestra síntesis no era pletamente
Aunque no se encuentra entre nuestros objetivos originales, uno de
en- ridículo.
los primeros hallazgos, y potencialmente el más importante- de nuestra
síntesis metacientífica era evidente a simple vista: la gran mayoría de los
análisis estadísticos en la literatura EST no se informaron con suficiente
detalle como para hacer pruebas inferenciales verificable (es decir, la
Muestra de Efectos
comprobación de errores de información) o re-analizable (es decir, el
Nos hemos esforzado para hacer tantos aspectos de nuestro proceso de cálculo de las otras métricas de valor probatorio). La falta de datos de
investigación lo más transparente posible. Todas las características de nuestro informes completos para inferencial
proceso de investigación están abiertas
S AKALUK, W illiams, K ILSHAW, Y R hyner 5

Estadísticas (y estadísticas descriptivas, incluyendo incluso el grupo de Bulimia nerviosa) hacía imposible calcular muchas métricas.
medios y desviaciones estándar) es desconcertante teniendo en cuenta las
normas de información estadística de la APA (American Psychological
Association, 2010).
¿Cuál es el valor probatorio de Div. 12
En relación con esto, a menudo no está claro cuál es la prueba
Clasificaciones de Nivel de evidencia?
estadística (s) para los cuales medida (s) constituye la “prueba (s) focal” para
un estudio dado; una razón principal por la que no fueron capaces de utilizar Métricas de valor probatorio a través de la División 12 categorizaciones
otras métricas de valor probatorio (por ejemplo, pags- curva 5, prueba de de fuerza de elementos de prueba se presentan en la Tabla 3. EST
insuficiente varianza) que se basan en la selección de uno y sólo un efecto a clasificados como poseedores de pruebas modesto o Fuerte ambos tenían
partir de una muestra dada. De hecho, incluso para diseños muy commonly- tasas comparativamente bajas de estadísticas declaradas de modo inexacto.
repetidas (por ejemplo, los ensayos controlados aleatorios con pre-test, EST clasificaron como fuertes, sin embargo, estaban mejor alimentado y tenía
post-test y evaluaciones de seguimiento), estudios en nuestra muestra variar estimaciones replicabilidad más fuertes, aunque los estudios de EST tanto
ampliamente con respecto a qué prueba se consideró clave para evaluar la modesto y fuertes eran típicamente preparados para detectar los efectos de
evidencia de la EST en cuestión (por ejemplo, el efecto principal de magnitud comparable. Curiosamente,

BF 10 no indican que la fuerza de la evidencia a favor de la EST fuertes fue


condición en comparación con el tiempo × condición Interacción; ver consistentemente mayor que la fuerza de la evidencia para la EST
Sistema de auto-terapia para la depresión y Terapia de Procesamiento modestos; aunque analítica meta- BF 10 sugeridas EST fuertes están mejor
Cognitivo para el TEPT como ejemplos). soportadas utilizando las estimaciones más optimistas de cada estudio,
Modest EST fueron decididamente mejor admiten cuando se utiliza
estimaciones pesimistas de cada estudio. EST clasificados como dudosos
¿Cuál es el valor probatorio de las TER colectiva e
habían muy pocos efectos utilizables, pero lo que se ha podido calcular las
individualmente?
métricas que sugirieron que su valor probatorio es relativamente baja.
Resumen de las tendencias a través de las tecnologías ecológicamente
racionales. Las estadísticas descriptivas para cada métrica en todas las EST se
enumeran en la Tabla 1. Tasas de ambos errores graves y menores variaron
ampliamente, aunque para la mayoría de las tecnologías ecológicamente
¿Son las normas de la mejora de Evidencial Valor?
racionales, se informó con precisión los resultados. El poder estadístico y R-índice,
por su parte, parecían ser los referentes más consistentemente métricas, como la Por último, se evaluó en qué medida, en su caso, las normas de
investigación EST se suelen poder suficiente con una inflación co-produciendo en pruebas de investigación sobre tecnologías ecológicas subyacente han
el informe de los efectos estadísticamente significativos. Por último, a través de
mejorado con el tiempo. Evaluamos esta posibilidad mediante dos medidas
factores de Bayes EST sugieren que la fuerza de la evidencia a favor de la eficacia
diferentes conceptualizaciones aprovechando relativamente distintas de
del tratamiento es altamente depende de si uno coloca una mayor acción en la
fuerza probatoria: el poder estadístico y analizado meta-(optimista) BF 10.
selección de los efectos más pesimistas u optimistas de esta literatura. 6

Resultados para el análisis de poder estadístico (Figura 1) sugieren que


los niveles de potencia estadística han mejorado con el tiempo.
Resumen de EST individuales. métricas de tendencias en BF 10 ofrecer una imagen mucho menos clara de valor
valor probatorio para cada EST se enumeran en la Tabla 2. El patrón más probatorio en el tiempo. Aunque
común para ESTs individuales se mezcló, con ESTs anotando bien en una BF 10 en general, el aumento de la década de 1970 hasta la década de 1980,
o dos métricas y menos bien en otros. Un pequeño número de ESTs (por muy modesto BF 10 reaparecido periódicamente, incluyendo relativamente
ejemplo, tanto recientemente. Por lo tanto, aunque la calidad metodológica de investigación de
Terapia de Procesamiento Cognitivo y La exposición prolongada para el TEPT) anotado TAE parece estar mejorando gradualmente con el tiempo, no hay un patrón
consistentemente bien a través de todos o la mayoría de las métricas, mientras que convincente que sugiera lo mismo puede decirse de la evidencia de la eficacia
un mayor número de ESTs- incluyendo un número clasificada como fuerte (por del tratamiento per se.
ejemplo,
La activación conductual para la depresión, la remediación cognitiva para la
esquizofrenia, La terapia de comportamiento dialéctica para el trastorno límite
Discusión General
de la personalidad) - realizado relativamente mal en la mayor parte o la
totalidad de nuestras métricas de valor probatorio. calidad de la información Nuestra evaluación meta-científica encontró inconsistente apoyo de la
baja en artículos para otros EST (por ejemplo, Terapia cognitiva conductual fuerza probatoria que subyace en la literatura sobre las TER. Aunque
para el insomnio, Tratamiento de la familia-Basados ​para algunos ESTs cabo bien a través de todas las métricas de replicabilidad
(por ejemplo, Exposición
S AKALUK, W illiams, K ILSHAW, Y R hyner 6

La terapia para las fobias específicas), el soporte para otros ESTs es puede ser inclinado a la conclusión de que la mayoría de las tecnologías
decididamente mixto o débil (por ejemplo, La psicoeducación familiar para la ecológicamente racionales son más o menos similares en su eficacia. Creemos que
esquizofrenia). En resumen, el informe inadecuado de la estadística inferencial, tal conclusión sería injustificada. Capitalizar la naturaleza transitiva de BF 10 ( ver
hipótesis primarias, y los análisis focal es un tema prominente en todas las EST. Morey y Rouder, 2011), nuestra bayesiano meta-análisis hace posible que las
Por otra parte, estaban equipados estudios que apoyan EST para detectar de partes interesadas para cuantificar el apoyo relativo a las tecnologías
forma fiable sólo efectos inverosímilmente grandes (véase Simmons, 2014), ecológicamente racionales que compiten simplemente dividiendo los dos
consistente estuvieron a la altura de recomendaciones para una potencia del respectivos BF 10
80%, y dio estimaciones replicabilidad que cayeron por debajo de lo que es involucrado. Utilizando las estimaciones optimistas para dos TAE para el
actualmente normativo para la investigación clínica (ver Schimmack, 2017 ). TEP como ejemplos, nuestros análisis sugieren que la eficacia de Terapia de
Procesamiento Cognitivo es
38.89E + 24 veces más probable que la de Eye Movement
Los factores individuales y se analizaron los meta-Bayes sugirieron desensibilización y reprogramación
que bajo las selecciones más pesimistas de efectos, la evidencia (11.00E + 26 dividido por 28,82). Las comparaciones como éstas podrían
estadística a menudo favorecida una nula de no efecto del tratamiento; En ser un mecanismo útil para los terapeutas para seleccionar entre terapias
Selecciones optimistas, la evidencia estadística de la eficacia del competidoras, aunque en casos donde las terapias competidoras no
tratamiento era bastante fuerte. Quizás lo más interesante, nuestra exceden un umbral particular de fuerza de la evidencia (por ejemplo, BF 10> 3),
revisión sugiere que no siempre existe una clara distinción entre la esta comparación relativa puede ser menos informativo.
división 12 clasificaciones de EST apoyado firmemente y modestamente,
como selecciones pesimistas meta-análisis de EST fuertes (que estaban Transitivo BF 10 comparaciones y otras métricas de valor probatorio
en el rango de apoyo moderado, de acuerdo con los puntos de corte no siempre rendirá una respuesta clara para los cuales EST tiene una
propuestos por Jeffrey, base más sólida de evidencia. En consecuencia, nuestros análisis
sugieren que, en muchos casos, no tenemos una pájaro dodo ( Rosenzweig,
1961) eran en realidad varios órdenes de magnitud más débil que 1936), sino más bien una no sé de aves. En base a la evidencia
los efectos correspondientes para ESTs modesto. disponible, no saben si hay diferencias en el nivel de apoyo empírico
para EST, y nosotros no saben
Sin embargo, no todos los resultados fueron pesimista: información
errónea estadística era rara, especialmente en comparación con las tasas Si EST ofrecen un beneficio superior al de otras psicoterapias de buena fe en
observadas por Nuijten et al. (2016), y cuando está presente en un grado más el tratamiento de pacientes con diagnósticos específicos.
relativa, fue agrupado dentro de ESTs particulares. Y aunque los estudios se
han mantenido EST poca potencia, nos encontramos con alguna evidencia de Para maximizar el beneficio potencial del tratamiento, los profesionales
que el poder estadístico ha mejorado con el tiempo (aunque la evidencia de la de la salud mental debe utilizar en curso, con frecuencia,
eficacia no tiene). Estos resultados tienen múltiples implicaciones para los la investigación de base Evaluaciones (p.ej,
profesionales como para los investigadores. https://www.div12.org/assessment-repository/ ). Si una
paciente no está progresando, el terapeuta y el paciente debe considerar
terapias de conmutación. Si bien esto ha sido siempre un buen consejo,
que adquiere mayor importancia cuando el terapeuta y el paciente no
puede asumir un determinado EST se basa en pruebas sólidas.
Sugerencias para practicantes EST

Prasad y Cifu (2011) acuñaron el término reversiones médicos para


describir situaciones en las que las prácticas médicas que se ponen en
Sugerencias para futuras EST Investigación y
uso a menudo sin evidencia de eficacia, sólo para caer en desuso
Evaluación de valor probatorio
debido a la evidencia posterior que son ineficaces, no ofrecen ninguna
ventaja sobre otras alternativas menos costosas, o incluso son Nuestra revisión ilumina numerosas vías para mejorar las futuras
iatrogénica. Sin evidencia de la superioridad EST, los campos de salud investigaciones EST y las evaluaciones de los mismos. Desarrollo y
mental pueden necesitar reversiones de psicoterapia si los costos aplicación de normas de información estadística descriptiva e
monetarios y de oportunidad de EST formación, difusión y uso superan inferencial sería un simple cambio; sin embargo, se produciría
los asociados con otras psicoterapias de buena fe. dividendos inmediatos para la calidad de la literatura EST reduciendo
omisiones de información estadística clave. Sin estas piezas de
información, los lectores no pueden “entender completamente los
A la luz de apoyo mixto para el valor probatorio de muchos ESTs, análisis realizados” (APA, 2010, p. 116), incluyendo si fueron
así como similitudes entre ESTs modesto y fuerte en algunas métricas alimentados adecuadamente o incluso
(por ejemplo, BF 10), lectores
S AKALUK, W illiams, K ILSHAW, Y R hyner 7

ya sea que se reportaron correctamente. Una revisión reciente efectos utilizables para el cálculo de cada métrica de valor probatorio variado a
meta-científica (Cristea, Florian, Nutu, y Gentili, través de los artículos y las tecnologías ecológicamente racionales; como resultado,
2018) sugiere que para que estas normas para tener éxito, algunas de nuestras estimaciones se basaron en un número muy limitado de
tendrán que ser aplicadas por la política de importancia. efectos. En estos casos, los lectores deben tener cuidado de no poner demasiado
valor en un mismo índice de valor probatorio.
También se necesita una mayor pre-registro para ayudar a delimitar el cual
hallazgos EST-relacionados son exploratorios y que son confirmatorios. A Teniendo en cuenta estas deficiencias, nuestra opinión debe ser
menudo era el caso de que el efecto (s) “clave” dentro de un determinado recibida con una buena dosis de escepticismo. Sin embargo, estas
estudio no fueron identificados, y cuando estaban, no estaba claro por qué un limitaciones arma de doble filo. Parecería difícil de justificar denunciando la
efecto por un particular, por los síntomas o una medida relacionada función se validez de nuestros resultados debido al limitado alcance de la revisión o la
consideró “clave”, mientras que otro aparentemente medida relacionada no lo escasez de efectos utilizables, mientras que la colocación de la máxima
era. Aunque la investigación exploratoria en EST podría ser beneficioso para el confianza en las evaluaciones existentes de EST-ambas se basan en el
descubrimiento de nuevos caminos para la eficacia terapéutica, los estudios mismo cuerpo limitado de pruebas .
pre-registradas con medidas claramente demarcadas consideradas clave a priori

Conclusión
debe exigirse antes de considerar una fuerte evidencia para un determinado EST.
Las sociedades profesionales podrían contribuir a este esfuerzo proporcionando El movimiento para identificar EST ha sido uno de los más
pautas estandarizadas para qué tipo de comparaciones estadísticas (por ejemplo, importantes en la historia de la psicoterapia; Sin embargo, las
una tiempo × condición clasificaciones existentes de EST deben ser evaluados re a la luz de la
interacción) dentro de los diseños comunes son-y-no son cruciales crisis de la replicación. Esta opinión científica meta produjo soporte
para establecer la eficacia terapéutica. probatorio mixta para muchos EST, con poco apoyo a la investigación
Finalmente, aunque la tendencia hacia una mayor que demuestra consistentemente fuerte
potencia estadística en la investigación de TAE es un desarrollo positivo, y algunos exhibiendo
tiene que haber un mayor esfuerzo continuo para aumentar el valor apoyo consistentemente débil. Cuando un fuerte apoyo probatorio se carece
probatorio ampliamente interpretados de la literatura EST. Como la de todos los EST de un diagnóstico determinado (por ejemplo, Anorexia
mayoria Los estudios siguen siendo nerviosa), psicólogos que trabajan con estos pacientes deben considerar
el poder suficiente para establecer la eficacia clínica, los investigadores clínicos aumentar su uso de evaluaciones basadas en la investigación para rastrear
deben esforzarse para estudios impulsados ​aún-de mayor, sobre todo si tienen la beneficio terapéutico o la falta de ella. Futuras investigaciones-ensayo
intención de detectar pequeños efectos de cualquiera de superioridad respecto a controlado sobre las psicoterapias se beneficiaría
los controles más fuertes o equivalencia con otras tecnologías ecológicas y / o muy de
medicamentos. Como complemento de las pruebas de significación tradicional con pre-registro, normalización de los informes de resultados, y el aumento de
las estrategias de inferencia bayesiana podría iluminar cuando las comparaciones tamaño de las muestras facilitadas por la colaboración entre varios laboratorios.
entre las tecnologías ecológicamente racionales y los controles son simplemente Los investigadores deben tener en cuenta las necesidades de sus colegas para
informativo. En el futuro, sin embargo, la investigación de TAE puede necesitar verificar, replicar, y poner en práctica los resultados de investigación si
evitar el modelo de ensayos pequeños. Un flujo de trabajo combinado de mayor esperamos cumplir con la misión de la psicoterapia para mejorar la salud mental.
laboratorio multi- informes (Chambers, 2013 registrado;. Uhlmann et al,

Notas finales
2018) acoplado en esta crítica analítica a fondo (Sakaluk,
Williams, y Biernat, 2014) produciría el mayor grado de
1. Cualquier efecto marcado como groseramente mal informados por p-
evidencia confirmatoria, precisa de la eficacia de ESTs.
corrector se confirmaron de forma manual por el primer autor. En algunos casos,
los autores indican usando un uno válido de cola de prueba, en cuyo caso, los
resultados no fueron clasificados como declaradas de modo inexacto. En algunos
limitaciones casos, sin embargo, los autores informaron de una estrategia de una cola de
prueba que no era válido (por ejemplo, para un ANOVA, que es ya una prueba de
Nuestra revisión meta-científico está limitado principalmente por su
una cola), en cuyo caso, los resultados se clasificaron como un error de información
ámbito de aplicación. Aunque evitamos la introducción de sesgo en los
bruto.
criterios de inclusión artículo apoyándose en las Referencias clave / ensayos
clínicos identificados por División de 12 para cada tratamiento, esto puede
2. Sólo después resolvimos también incluimos meta-
haber sido a expensas de una revisión más completa. Además, el número de
estimaciones posteriores análisis de los tamaños del efecto de EST, además de
los factores de Bayes, por lo que no propusimos
S AKALUK, W illiams, K ILSHAW, Y R hyner 8

puntos de corte (o veterinario posibles puntos de corte con nuestros consultores). Cristea, I., Florian, N., Nutu, D., y Gentili, C. (2018). ciencia abierta
prácticas en revistas de psicología clínica: un estudio de auditoría.
Por consiguiente, consideramos que una métrica descriptivo y exploratorio, pero
https://doi.org/10.31219/osf.io/t2k56
importante, en nuestra opinión.
Cuijpers, P., y Cristea, IA (2016). ¿Cómo demostrar que su terapia
3. Utilizamos “psicoterapia de buena fe” para referirse a cualquier es eficaz, incluso cuando no lo es: una guía. Epidemiología y Psiquiatría
tratamiento que la lista de la división 12 como un EST para un diagnóstico Ciencias, 25, 428-435.
distinto del que se examina. Por ejemplo, la terapia interpersonal es un EST https://doi.org/10.1017/S2045796015000864
Cumming, G. (2014). Las nuevas estadísticas: por qué y cómo.
para la depresión pero trastorno no obsesivo-compulsivo (TOC). Si un
Psicológico Ciencias, 25, 7-29.
estudio que fue una referencia clave para el tratamiento del TOC se utiliza la Doi: 10.1177 / 0956797613504966 Eysenck, HJ (1952). Los efectos de la
terapia interpersonal como una condición de control, que codifica la terapia psicoterapia: una evaluación.
interpersonal como la psicoterapia de buena fe para el TOC. diario Consultoría de Psicología, dieciséis( 5), 319-324.
http://dx.doi.org/10.1037/h0063633
Etz, A., Haaf, JM, Rouder, JN, y Vandekerckhove, J. (2018).
inferencia bayesiana y someter a prueba las hipótesis se puede especificar.
4. 915 efectos (26%) estaban disponibles a someterse a corrector p- ( información Los avances en los métodos y prácticas en Psychological Science, 1,
errónea, el poder post-hoc, R-Index), 2479 (72%) estaban disponibles para 281-295. doi: 10.1177 / 2515245918773087 Flint, J., Cuijpers, P., Horder,
J., Koole, SL, y Munafò, MR
usar con el PWR paquete; y 1384 (40%) estaban disponibles para usar con el BayesFactor
(2015). ¿Hay un exceso de hallazgos significativos en los estudios publicados de
la psicoterapia para la depresión? Psychological Medicine,
paquete. 45, 439-446.
5. Aunque formal pags- Análisis de la curva no fue posible dada la https://doi.org/10.1017/S0033291714001421
disponibilidad de múltiples valores de p de la misma muestra, hemos Hollon, SD, Thase, ME, y Markowitz, JC (2002). Tratamiento
y la prevención de la depresión. La ciencia psicológica en el Interés
proporcionado histogramas simples de todos los valores p exactos y todos
Público, 3, 39-77. https://doi.org/10.1111/1529-
los valores p significativos en nuestro repositorio OSF. inexacta
1006.00008
significativa pags- Jeffreys, H. (1961). La teoría de la probabilidad. Nueva York, NY:
valores de p < . 05 fueron mucho más comúnmente reportados ( n = 257) Prensa de la Universidad de Oxford.

que eran p < . 01 ( n = 115) o p < . 001 ( n = Kendall, PC (1998). Empíricamente apoyada psicológica
terapias. Journal of Consulting and Clinical Psychology, 66, 3-
131)
6. https://doi.org/10.1037/0022-006X.66.1.3
6. Dada la presencia de un número selecto de extrema Klerman, GL, Dimascio, A., Weissman, M., Prusoff, B., y
Los factores de Bayes, basamos nuestra interpretación de los niveles típicos de Paykel, ES (1974). El tratamiento de la depresión con medicamentos y
valor probatorio en los resúmenes de la mediana (frente a la media). psicoterapia. American Journal of Psychiatry, 131 (2), 186-
191.
Kliem, S., Kröger, C., y Kosfelder, J. (2010). conductual dialéctica
terapia para el trastorno límite de la personalidad: Un meta-análisis utilizando
modelos de efectos mixtos. Journal of Consulting and Clinical
Psicología, 78, 936-951.
referencias
https://doi.org/10.1037/a0021015
Maxwell, SE (2004). La persistencia de los estudios de poca potencia en
Asociación (2010). Manual de Publicación de el americano
la investigación psicológica: causas, consecuencias y remedios.
Psychological Association ( 6 º Edición). Washington, DC: APA. Cámaras, CD
Métodos psicológicos, 9, 147-163. DOI: 10.1037 / 1082- 989X.9.2.147
(2013). informes registrados: Una nueva publicación
iniciativa a Corteza. Corteza, 49, 609-610.
Monden, R., Roest, AM, van Ravenzwaaij, D., Wagenmakers, E.
https://doi.org/10.1016/j.cortex.2012.12.016
J., Morey, R., Wardenaar, KJ, y de Jonge, P. (2018). La base evidencia
Chambless, DL, Baker, MJ, Baucom, DH, Beutler, LE,
comparativa de la eficacia de los antidepresivos de segunda generación en el
Calhoun, KS, Crits-Christoph, P., ... & Johnson, SB (1998). Actualización
tratamiento de la depresión en los EE.UU.: Un meta-análisis bayesiano de
sobre terapias empíricamente validados, II. El psicólogo clínico, 51, 3-16.
Alimentos y Medicamentos comentarios. Journal of Affective Disorders, 235, 393-398.

Chambless, DL, y Hollon, Dakota del Sur (1998). definir empíricamente


https://doi.org/10.1016/j.jad.2018.04.040
terapias compatibles. Journal of Consulting and Clinical Psychology,
Morey, RD, y Rouder, JN (2011). factor de Bayes se acerca a
66, 7-18. https://doi.org/10.1037/0022-
pruebas de hipótesis nulas de intervalo. Métodos psicológicos, dieciséis,
006X.66.1.7
406-419. https://doi.org/10.1037/a0024377
Champely, S. (2018). PWR: Funciones básicas para el análisis de potencia (ver.
Morey, RD, y Rouder, JN (2018). BayesFactor: Computación
1.2-2.). Obtenido de https: //CRAN.R-
de factores de Bayes para diseños comunes (ver. 0.9.12-4.2). Obtenido de https://CRAN.R-project.org
project.org/package=pwr .
Cohen, J. (1962). La potencia estadística de anormal-sociales
Nelson, LD, Simmons, J., y Simonsohn, U. (2018). psicología de
la investigación psicológica: una revisión. El Journal of Abnormal y Social
Renacimiento. Annual Review of Psychology, 69, 511-534.
Psicología, sesenta y cinco, 145-153.
https://doi.org/10.1146/annurev-psych-122216-011836
https://doi.org/10.1037/h0045186
Nuijten, MB, Hartgerink, CH, van Assen, MA, Epskamp, ​S.,
Coyne, JC, y Kok, RN (2014). psicoterapia salvar
Y Wicherts, JM (2016). La prevalencia de errores de información estadística en psicología
la investigación: Un manifiesto. diario de evidencia en
(1985-2013). Métodos de Investigación comportamiento,
psicoterapias, 14, 105-124.
48, 1205-1226. https://doi.org/10.3758/s13428-015-0664-2
S AKALUK, W illiams, K ILSHAW, Y R hyner 9

Colaboración Abierta de Ciencias. (2015). Estimar la reproducibilidad Szucs, D., y Ioannidis, JPA (2017). evaluación empírica de
de psicológico Ciencias. Ciencias, 349, aac4716. publicada tamaños del efecto y poder en la literatura reciente, la neurociencia
https://doi.org/10.1126/science.aac4716 y la psicología cognitiva. PLoS Biology, 15, E2000797.
Prasad, V., y Cifu, A. (2011). reversión médica: ¿por qué debemos levantar
el bar antes de la adopción de nuevas tecnologías. El Yale Revista de Biología y Grupo de Trabajo sobre Promoción y Difusión de Psicología
Medicina, 84, 471-478. Procedimientos. (1995). Formación y difusión de
Rosenzweig, S. (1936). Algunos factores comunes implícitos en diversos empíricamente validados procedimientos psicológicos: Informe y
métodos de psicoterapia. americano diario de recomendaciones. El psicólogo clínico, 48, 3-23.
Orthopsychiatry, 6 (3), 412-415. https://doi.org/10.1111/j.1939- Tackett, JL, Lilienfeld, SO, Patrick, CJ, Johnson, SL,
0025.1936.tb05248.x Krueger, RF, Miller, JD, ... Shrout, PE (2017). Es hora de ampliar la
Rouder, JN, Haaf, JM, y Vandekerckhove, J. (2018). bayesiano conversación replicabilidad: Pensamientos para y desde la ciencia psicológica
inferencia para la psicología, la parte IV: Estimación de parámetros y factores de clínica. Perspectives on Psychological Science, 12,
Bayes. Psychonomic Boletín y reseña, 25 ( 1), 102-113. 742-756.
https://doi.org/10.3758/s13423-017-1420-7 https://doi.org/10.1177/1745691617690042
Sakaluk, JK, Williams, AJ, y Biernat, M. (2014). Analítico Thoma, NC, McKay, D., Gerber, AJ, Milrod, BL, Edwards,
revisar como una solución para la comunicación errónea de los resultados estadísticos de la AR, y Kocsis, JH (2012). Una revisión basada en la calidad de los ensayos
ciencia psicológica. Perspectives on Psychological Science, controlados aleatorios de la terapia cognitivo-conductual para la depresión: Una
9, 652-660. https://doi.org/10.1177/1745691614549257 evaluación y meta-regresión. American Journal
Schimmack, U. (2012). El efecto irónico de resultados significativos en de Psiquiatría, 169, 22-30.
la credibilidad de los artículos de estudio múltiple. Métodos psicológicos, 17, 551-566. https://doi.org/10.1176/appi.ajp.2011.11030433
http://dx.doi.org/10.1037/a0029487 Tolin, DF, McKay, D., Forman, EM, Klonsky, ED, y
Schimmack, U. (2016). La replicabilidad-index: Cuantificación Thombs, BD (2015). Empíricamente apoyado tratamiento:
estadístico investigación integridad. Obtenido de Recomendaciones para un nuevo modelo. Psicología clínica: Ciencia
https://wordpress.com/post/replication- y Práctica, 22, 317-338.
index.wordpress.com/920 https://doi.org/10.1111/cpsp.12122
Schimmack, U. (marzo de 2017). 2016 clasificaciones replicabilidad de 103 Uhlmann, EL, Chartier, CR, Ebersole, CR, Errington, TM,
psicología revistas. Obtenido de Kidwell, M., Lai, CK, ... Nosek, BA (2018, 13 de agosto). Científico
https://replicationindex.wordpress.com/2017/03/01/3950/ . utopía: III. crowdsourcing Ciencias.
Schönbrodt, FD (2018). p-corrector: Uno para todos analizador de p-valor. https://doi.org/10.31234/osf.io/vg649
Obtenido de http://shinyapps.org/apps/p-checker/ .
Simmons, J. (abril de 2014). [ 18] MTurk contra el laboratorio: De cualquier manera nos
necesitan grandes muestras. Obtenido de http://datacolada.org/18 .
S AKALUK, W illiams, K ILSHAW, Y R hyner 10

tabla 1

Las estadísticas descriptivas para cada índice de valor probatorio

% misreported % misreported La mediana del R-Índice 80% de potencia para 80% de potencia para BF 10 Distancia BF 10 Distancia Meta pesimista optimista Meta

(Bruto) (Menor) anuncio Poder Especial detectar Mediana re detectar Mediana re (Min) (Max) BF 10 BF 10

(1-tailed) (2 colas)

METRO 2.07 8.17 . 58 . 52 0.69 0.79 2.03E + 30 4.75E + 29 2.16E + 30 1.05E + 35

MDN 0 0 . 58 . 50 0.69 0,78 0.12 71.24 0.45 140,62

Dakota del Sur 5.15 16.30 . 21 . 24 0.24 0.28 1.66E + 31 3.75E + 30 1.71E + 31 8.41E + 35

min 0 0 . 06 0 0,19 0.21 0,0009 0.1 0,0002 0.07

Max 22 100 1 1 1.16 1.49 1.36E + 32 3.09E + 32 1.36E + 32 6.73E + 36


S AKALUK, W illiams, K ILSHAW, Y R hyner 11

Tabla 2

Métricas de valor probatorio para cada tratamiento empíricamente su

est Div. 12 # De Efectos % % de La mediana dex 80% de potencia BF 10 Distancia Meta Optimista
utilizables
Classification gruesos errores del R-in- para detectar pesimista BF 10 Meta BF 10
ción errores menores anuncio Mediana re (Posterior 95% CR: (Posterior 95% CR:
Poder Especial (1-tailed / 2- LL re/ UL re) LL re/ UL re)
colas)
Terapia de Aceptación Modesto 1/2/2/2 0% *** 0% *** . 61 ** . 21 * 0,62 / 0,69 * 3.45 X**/ 64.69 *** 3.45 ** X 64,69 ***
y Compromiso para (0,10 / 1,04) (0,35 / 1,30)
Ob- Trastorno siva
sessive-compulsión

Terapia de Fuerte 10/13/4/4 0% z *** 0% *** . 63 ** . 56 * 0,58 / 0,66 * . 05 * / ** 4,69 . 06 * (0,02 . 07 * (0,002
/ 0,20) / 0,24)
Aceptación y
Compromiso para el
dolor crónico
Terapia de Modesto 19/50/41/16 11% * 5% * . 51 * . 45 * 0,85 / 0,97 * . 16 * / 2.44E + 12 *** 31,39 *** 15.51E + 17 ***
Aceptación y (0,11 / 0,46) (0,73 / 1,06)
Compromiso para
De- pression
Terapia de Aceptación Modesto 21/91/25/2 una 0% *** 0% *** . 53 * . 39 * 0,55 / 0,62 * . 002 * / 119.89 *** 79,58 *** 79,58 ***
y Compromiso para los (0,32 / 1,14) (0,32 / 1,14)
trastornos de ansiedad
mixtos

Terapia de Modesto 7/19/16/4 14% * 0% * . 50 * . 57 * 0,95 / 1,08 * . 02 * / 19.62 *** . 07 * (0,002 189,64 ***
/ 0,25)
Aceptación y (0,48 / 1,47)
Compromiso para
PSY- cosis
ción aplicada Relaxa- Modesto 6/17/6/2 0% z *** 0% *** . 36 * . 72 ** 0,85 / 0,96 * * 1,63 / 3,03 ** X 1,63 * 3,03 ** X
para el trastorno de (0,08 / 1,74) (0,19 / 2,01)
pánico
ción asertivo Fuerte 6/25/10/2 0% *** 0% *** . 79 ** . 58 * 0,43 / 0,49 ** . 38 * / ** 3.21 X . 38 * (0,01 3,21 ** X
/ 0,54)
comunitario Com- (0,08 / 0,77)
Trata- (ACT) para la
esquizofrenia
vación conductual Fuerte 24/40/24/4 0% *** 0% *** . 15* . 00 * 0,60 / 0,68 * . 08 * / ** 4,03 X . 23 * (0,007 . 82 * (0,02
/ 0,44) / 0,61)
para acti- De-
pression
APY conductual y Fuerte 12/27/27/6 0% *** 0% *** . 54 * . 42 * 0,74 / 0,84 * . 12 * / 44.88 *** . 08 * (0,002 6248.62 ***
/ 0,23)
cognitivo conductual (0,44 / 1,07)
ter- para el dolor de
espalda crónico
S AKALUK, W illiams, K ILSHAW, Y R hyner 12

Conductual aco- ples La Fuerte 10/25/14/6 0% *** 0% *** . 67 ** . 34 * 1.10 / 1.26 * . 17 * / 37.84 *** 5,03 ** (0,09 428,09 ***
terapia para los trastornos / 0,73) (0,33 / 0,98)
por consumo de alcohol

El tratamiento Fuerte 0/2/2/2 -- -- -- -- 0,19 / 0,21 *** 1.36E + 32 *** / 13.40E + 29 1.36E + 32 *** 70.90E + 29 ***
conductual para la (0,84 / 1,14) (4.85 / 5.15)
Obesidad
mentos Modesto 15/27/24/6 0% * 53% * . 51 * . 49 * 1,16 / 1,32 * . * 005 / 24.90 *** . 24 * (0,006 2352.77 ***
/ 0,54)
Biofeedback- Based (0,78 / 1,87)
tratamientos para In-
somnia
Cognitiva Formación Modesto 7/10/8/4 0% *** 0% *** . 77 ** . 83 *** 0,93 / 1,06 * 3,06 ** X/ 73,47 *** 16,07 ** (0,26 16.004,36 ***
adap- tación (CAT) / 1,24) (0,87 / 1,87)
para la esquizofrenia

Cognitiva y Fuerte 42/169/142/12 0% *** 2% *** . 95 *** . 90 *** 0,93 / 1,06 * . * 13 / 9927,95 *** . 11 * (0,002 19.41E + 18 ***
/ 0,27)
conductual Terapias (1,33 / 1,91)
para la ansiedad
generalizada
Disorders der

Cognitiva Sistema de Fuerte 1/3/3/2 0% * 100% * . 89 *** . 78 ** 0,55 / 0,63 * . 04 * / 45.37 *** 7,57 ** (0,15 45,37 ***
análi- sis havioral / 1,09) (0,30 / 1,17)
Be- de Psicoterapia
para la depresión

Cognitiva Be- Fuerte 12/28 / _ / 2 * 8% y 25% * . 72 ** . 77 ** 0,65 / 0,74 * -- . 45 * (0,02 18,74 ***
/ 0,91)
havioral ter- APY (0,34 / 1,55)
(TCC) para la
esquizofrenia
Cognitiva Be- Fuerte 14/39/23/6 0% ** 7% ** . 78 ** . 57 * 0,69 / 0,78 * . 72 * / 26.33 *** 36,06 *** 27.948,16 ***
havioral ter- APY (0,18 / 0,70) (0,43 / 0,93)
para el TDAH
adulto
Cognitiva APY ter- Modest / 3/10/4/3 0% * 33% * . 06 * . 12 * 0,86 / 0,98 * . 10 * / 29.06E + 7 *** N/A 43,05 ***
havioral Be- para controvertido (0,18 / 0,70)
anó- rexia sial
nerviosa
Cognitiva APY ter- Fuerte 20/43/18/4 0% *** 0% *** . 66 ** . 77 ** 0,56 / 0,63 * . 08 * / 76.84 *** . 08 * (0,002 26,04 ***
/ 0,26)
havioral Be- para el (0,22 / 0,98)
trastorno por atracón

Cognitiva APY ter- Fuerte 19/51/22/6 0% ** dieciséis%** . 52 * . 51 * 0,67 / 0,76 * . 09 * / 135,52 *** . 07 * (0,001 6,72 ** (0,14
/ 0,22)
havioral Be- para la / 0,76)
bulimia nerviosa
S AKALUK, W illiams, K ILSHAW, Y R hyner 13

Cognitiva APY ter- Fuerte 12/14/4/0 0% ** 8,33% ** . 54 * . 25 * 0,85 / 0,96 * . 40 * / 2,15 * -- --


havioral Be- para el
dolor de cabeza crónico

Cognitiva Be- Fuerte 0/3/0/0 -- -- -- -- 0,72 / 0,82 * -- -- --


havioral ter- APY
para nia Insom-

Cognitiva Be- Fuerte 6/18/6/5 0% *** 0% *** . 97 *** 1,00 *** 0,64 / 0,72 * . 44 * / *** 2.059.130,48 58739.7 *** 38.42E + 10 ***
havioral ter- APY de (0,47 / 0,99)) (0,81 / 1,33)
obsesiones siva
compulsivo

Cognitiva APY ter- Fuerte 7/72/39/8 14% * 0% ** . 53 * . 48 * 0,60 / 0,68 * . 07 * / *** 72.014.349,23 . 51 * (0,02 39.93E + 8 ***
/ 0,49)
havioral Be- para el (0,88 / 1,45)
Trastorno de Pánico

Cognitiva APY ter- Fuerte 28/95/73/9 4% ** 7% ** . 61 ** . 53 * 0,69 / 0,78 * . 07 * / 1.32E + 11 *** . 0002 * 37.22E + 9 ***
(0,008 / 0,10)
havioral Be- para la (0,83 / 1,28)
ansiedad social der
Disorders

Terapia de procesa- Fuerte 7/48/29/6 0% ** 14% ** . 78 ** . 84 *** 0,55 / 0,63 * . 07 * / 5.47E + 20 *** 14.06E + 22 *** 11.00E + 26 ***
miento cognitiva para el (1,05 / 1,46) (1,15 / 1,56)
trastorno de estrés
postraumático

Re mediación Fuerte 19/43/20/4 dieciséis%* 36.84% * . 58 * . 53 * 0,62 / 0,71 * . 004 * / 2,64 * . 07 * (0,001 1,63 *
/ 0,21)
cognitiva de la (0,05 / 0,73)
esquizofrenia
Cognitiva APY ter- Modesto 21/21/17/5 14% * 24% * . 39 * . 36 * 0,51 / 0,57 * . * 004 / 96.04 *** 1.00 * 594,47 ***
(CT) para el trastorno (0,02 / 0,42) (0,25 / 0,70)
bi- polar
APY ter- cognitiva para Fuerte 31/55/11/4 0% *** 2% *** . 62 ** . 59 * 0,66 / 0,75 * . 06 * / 105.69 *** . 30 * (0,006 91,59 ***
/ 0,34)
depresiones sión (0,25 / 0,80)

comporta- terapia Fuerte 5/15/14/4 20% * 40% * . 53 * . 46 * 0,77 / 0,87 * . 12 * / ** 3,77 X . 11 * (0,003 4,40 ** X
/ 0,30)
dialéctica de Be- límite (0,09 / 0,75)
de la personalidad
para Desven-

Emoción FO Terapia Modesto 8/15/7/4 0% ** 13% ** . 54 * . 33 * 0,77 / 0,88 * . 20 * / ** 8,72 1.65 * 47,07 ***
pie cúbico por segundo (0,05 / 0,78) (0,27 / 1,09)
para la depresión
La exposición y la Fuerte 6/6/6/3 0% *** 0% *** . 57 * .ysesenta
cinco** 0,67 / 0,76 * . 14 * / 14.43 *** . 47 * una . 47 * una
respuesta de Pre- (0,02 / 0,65) (0,02 / 0,65)
S AKALUK, W illiams, K ILSHAW, Y R hyner 14

vención para la Ob-


sessive-compulsión siva
Trastorno de exposición
empanadas tera- para las Fuerte 86/121/78/22 2% *** z 0% ** . 88 *** . 88 *** 1.05 / 1.20 * . 14 * / 19.80E + 7 *** 2878.03 *** 6.73E + 36 ***
fobias específicas (0,26 / 0,70) (1,70 / 2,15)

Eye Movement Fuerte / 7/26/19/6 0% * 29% * . 37 * . 32 * 1,07 / 1,23 * . 12 * / *** 28.287,90 . 17 * (0,06 28,28 ***
/ 0,49)
desensibilización y controvertido (0,78 / 1,74)
Repro- cessing para el sial
trastorno de estrés
postraumático

Centrada en la Familia Fuerte 19/22/11/4 0% ** 5% ** . 54 * . 39 * 0,69 / 0,79 * . 18 * / 18.46 *** 71,29 *** 5064.40 ***
Terapia (FFT) para la (0,22 / 0,83) (0,39 / 1,00)
orden bipolar Desven-

choeducation familia Fuerte 22/37/1/1 9% * y 0% * . 29 * . 30 * 0,85 / 0,96 * 1,32 * 1,32 * una 1,32 * una
PSY- para la (0,04 / 1,06) (0,04 / 1,06)
esquizofrenia
Tratamiento de la Fuerte 8/27/10/4 0% ** 13% ** . 58 * . 54 * 1,13 / 1,29 * . 18 * / ** 6,23 . 36 * (0,01 17,86 ***
/ 0,45)
familia basada en (0,17 / 0,78)
para la anorexia Ner-
vosa
La familia basada en el Modesto 0/8/0/0 -- -- -- -- 0,54 / 0,62 * -- -- --
tratamiento de la bulimia
nerviosa
Amigos se preocupan por Modesto 0/37/0/0 -- -- -- -- 0,43 / 0,49 ** -- -- --
la postura Sub Mixta

Abuso / dependencia
que entrañan
Cambio Auto Modesto 0/11/4/2 -- -- -- -- 0.20 / 0.23 *** . 36 * / ** 3.15 X . 36 * (0,01 3.15 ** X
/ 0,64)
guiada a la (0,09 / 1,06)
postura Sub
Mixta
Abuso / dependencia
que entrañan
Programa Fuerte 14/28/16/4 0% *** 0% *** . 80 *** . 67 ** 0,36 / 0,41 ** . * 10 / 1229,18 *** . 08 * (0,002 6040.20 ***
/ 0,22)
Healthy-Peso de Bu- (0,33 / 0,81)
limia nerviosa
ción Manage- la Modesto 0/0/0/0 -- -- -- -- -- -- -- --
enfermedad y la
recupera- ción (IMR)
para Schizophre- nia

Interpersonal y la Modesto 6/18/9/2 0% *** 0% *** . 52 * . 38 * 0,49 / 0,55 ** . 17 * // 69 * . 45 * (0,01 . 39 * (0,02


/ 0,60) / 0,67)
terapia de ritmo
social
S AKALUK, W illiams, K ILSHAW, Y R hyner 15

(IPSRT) para el
trastorno bi- polar
psicoterapia Fuerte 5/31/20/4 0% *** 0% *** . 25 * . 10 * 0,42 / 0,48 ** . 06 * / 638,05 *** . 13 * (0,005 13.59 *** X
/ 0,34)
interpersonal para el (0,19 / 0,78)
trastorno por atracón

La psicoterapia Fuerte 20/40/7/1 0% *** 0% *** . 50 * . 50 * 0,75 / 0,85 * . 08 * / 638,05 *** 638,05 *** una 638,05 *** una
interpersonal para la (0,83 / 2,11) (0,83 / 2,11)
bulimia vosa Ner-

La psicoterapia Fuerte 0/61/21/8 -- -- -- -- 0,72 / 0,82 * . 03 * / 3.27E + 11 *** . 03 * 2,44 *


(0.0009 / 0.10)
interpersonal para la (0,19 / 0,58)
depresión
Tratamiento basado Modesto 3/16/11/5 0% *** 0% *** .ysesenta
cinco** . 30 * 0,79 / 0,90 * 3,41 ** / *** 450.546,31 955,19 *** 17821383 ***
Mentalization- para límite (0,31 / 0,85) (0,69 / 1,23)
de la personalidad orden
Desven-

Moderada Beber- ing Modesto 13/5/0/0 0% ** 8% ** . 56 * . 50 * 0,61 / 0,69 * -- -- --


para los trastornos por
consumo de alcohol
Motivación Fuerte 0/14/5/2 -- -- -- -- 0.20 / 0.23 *** . 07 * / 1,22 * . 14 * (0,004 1,22 *
/ 0,22)
terviewing In-, de (0,02 / 0,32)
motivación En-
hancement ter- APY
(MET), y MET más
TCC para postura
Sub- Mixed

Abuso / dependencia
que entrañan
-Compo- nente Fuerte 1/13/11/2 0% *** 0% *** . 53 * . 47 * 0,98 / 1,12 * . 14 * /. 86 * . 17 * (0,005 . 86 * (0,03
/ 0,56) / 1,18)
múltiples terapia
cognitivo-conductual
para la fibromialgia
Fi-
nente multi-Compo- Fuerte 4/25/0/0 0% *** 0% *** . 36 * . 22 * 0,66 / 0,75 * -- -- --
la terapia cognitivo
conductual para
Reumatológica Dolor

inten- ción Fuerte 11/14/7/2 0% *** 0% *** . 77 ** . 90 *** 0,87 / 0,99 * . 34 * / 22,08 *** . 33 * (0,01 22,08 ***
/ 0,79)
paradójica de In- (0,41 / 1,75)
somnia
Terapia actual Fuerte 12/18/10/6 0% ** 8% ** . 44 * . 46 * 0,78 / 0,88 * . 07 * / 3.09E + 31 *** 44.90E + 19 46.87E + 23
Cen- cados (0,90 / 1,28) (0,98 / 1,34)
S AKALUK, W illiams, K ILSHAW, Y R hyner dieciséis

para el tratamiento de
contingencia basado en
Premio trastorno de
estrés post-matic traumas Modesto 4/4/0/0 0% *** 0% *** . 58 * . 42 * 0,78 / 0,89 * -- -- --
para los trastornos por
consumo de alcohol

Tratamiento de Modesto 12/39/17/13 0% ** 17% ** . 69 ** . 63 ** 0,55 / 0,61 * . 07 * / 1.16E + 28 *** 1135877.00 1.20E + 12 ***
contingencia del Premio (0,26 / 0,52) (0,42 / 0,69)
base de cocaína De-
pendencia

Tratamiento de Fuerte 2/5/1/1 0% *** 0% *** . 75 *** . 50 * 0,24 / 0,28 *** 1113.06 *** 1113.06 *** una 1113.06 *** una
contingencia del Premio (0,23 / 0,61) (0,23 / 0,61)
base a la postura Sub
Mixta

Abuso / dependencia
que entrañan
Problema-ing Solv- Fuerte 18/45/36/11 0% *** 0% *** . 95 *** . 96 *** 0,56 / 0,64 * . 007 * / 4.59E + 27 *** 227,4 *** 2.36E + 07 ***
terapia para la (0,21 / 0,54) (0,46 / 0,83)
depresión
Prolongada exposi- Fuerte 33/62/37/12 0% ** 18% ** . 89 *** . 93 *** 0,71 / 0,80 * . 01 * / 2.55E + 11 *** 36,46 *** 32999766 ***
ción para el trastorno (0.15, 0.52) (0,61 / 1,00)
de estrés
postraumático
El tratamiento Modest / 1/1/1/0 0% *** 0% *** . 88 *** . 75 ** 0,72 / 0,82 * 37,41 *** -- --
psicoanalítico para el controvertido
trastorno de pánico sial
Psicoeducación para la Fuerte 12/42/4/2 0% *** 0% *** . 63 ** . 67 ** 0,56 / 0,64 * . 65 * / 53.27 *** . 65 * (0,02 53,27 ***
/ 0,66)
orden bipolar Desven- (manía) (0,29 / 1,10)
Modest
(depresiones
sión)
La intervención Sin confianza 0/0/0/0 -- -- -- -- -- -- -- --
psicológica para el evi- /
trastorno de estrés potencialmente
postraumático dañino
Terapia del Modesto 3/8/6/0 0% *** 0% *** . 15* . 00 * 0,47 / 0,53 ** . 07 * / ** 9,52 -- --
comportamiento racional
Emo- tivo para la de-
presión
El entrenamiento de Fuerte 14/86/62/4 0% *** 0% *** . 66 ** . 39 * 0,71 / 0,81 * . 06 * / 135.08 *** . 11 * (0,003 567,29 ***
/ 0,31)
relajación para las (0,42 / 1,19)
entradas somnia
S AKALUK, W illiams, K ILSHAW, Y R hyner 17

cencia / Vida Re- vista Modesto 5/14/13/5 0% *** 0% *** 1.00 *** 1.00 *** 0,75 / 0,85 * . 10 * / 1.15E + 28 *** 53.58E + 16 *** 46.73E + 21 ***
de la terapia para la (1,71 / 2,27) (1,87 / 2,42)
depresión Reminis-

Esquema-FO pie cúbico Modesto 0/1/1/0 -- -- -- -- 0,54 / 0,61 * 2.34E + 24 *** -- --


por segundo Terapia de
límite de la personalidad
para Desven-

Búsqueda de Seguridad Modesto 3/45/16/2 0% * 33% * . 73 ** . 79 ** 1,01 / 1,49 * 1.05 * / *** 509.753,24 1,05 * 509.753,20 ***
de la postura Sub Mixta (0,04 / 1,40) (2,36 / 3,90)

Abuso / dependencia
que entrañan
Búsqueda de Seguridad Fuerte 15/97/37/4 0% ** 6% ** . 41 * . 48 * 0,89 / 1,01 * . 14 * / *** 509.753,24 . 16 * (0,004 1187.52 ***
/ 0,45)
para el trastorno de (1,00 / 1,95)
estrés postraumático
con el uso de sustancias Trastorno
ción / Terapia Fuerte 42/75/48/11 5% ** y 5% ** . 55 * . 51 * 1,13 / 1,29 * . 11 * / 63.52 *** . 05 * (0,001 1058.71 ***
/ 0,15)
auto-Trol Con- (0,33 / 0,82)
auto-Manage- para la
depresión
Sistema de auto-terapia Modesto 2/0/9/0 0% *** 0% *** . 22 * . 45 * 0,75 / 0,86 * . 32 * /. 79 * -- --
para la de- presión

Plazo Corto PSY- Modesto 0/2/2/2 -- -- -- -- 0,42 / 0,47 ** . 06 * /. 10 * . 06 * (0,001 . 09 * (0,002


/ 0,20) / 0,25)
Terapia chodynamic
de De- pression

Re dormir estricción Fuerte 6/74/74/4 0% *** 0% *** . 59 * . 19 * 0,74 / 0,84 * . * 007 / 19.39 *** . 0004 * 7,41 ** (0,16
(0.0009 / 0.11)
ter- APY para / 1,07)
Insom- nia

Fumar ción Cessa- con Modesto 13/34/8/2 0% ** 13% ** . 10 * . 13 * 0,34 / 0,39 ** . 05 * / 15.45 *** . 06 * (0,002 15,54 *** X
/ 0,19)
el aumento de peso (0,14 / 0,67)
Prevención
Aprender-ing Social Fuerte 0/0/0/0 -- -- -- -- -- mi-- -- --
Token eco- Programas
/ omy para nia
Schizophre-

Entrenamiento en Fuerte 34/36/1/1 0% ** 6% ** . 59 * . 48 * 0.97 / 1.10 * 1,37 * 1,37 * una 1,37 * una
habilidades sociales (0,08 / 1,95) (0,08 / 1,95)
(SST) para nia
Schizophre-
Terapia trol estímulo Fuerte 9/61/49/7 22% * 0% * . 58 * . 56 * 1,16 / 1,32 * . * 0009 / 244.81 *** . 11 * (0,002 66.071,82 ***
/ 0,29)
Con- para el insomnio (0,95 / 1,87)
S AKALUK, W illiams, K ILSHAW, Y R hyner 18

El estrés inoculación Modesto 18/41/25/3 0% *** 0% *** . 55 * . 49 * 1,04 / 1,18 * . 12 * / 82.42 *** 3,31 ** X 262,06 ***
Formación ción para el (0,10 / 1,10) (0,56 / 1,55)
trastorno de estrés
postraumático
pleo Em- el Fuerte 32/38/14/4 0% *** 0% *** . 75 ** . 72 ** 0,33 / 0,38 ** 2.30 * / *** 31.855,54 37,12 *** 1276346 ***
apoyo para la (0,15 / 0,60) (0,46 / 0,92)
esquizofrenia
Cuidado sistemática para Strong 4/3/0/0 0% *** 0% *** . 58 * . 41 * 0,24 / 0,28 *** -- -- --
la orden bipolar Desven- (manía)

Enfocado Fuerte / 3/5/1/1 0% *** 0% *** . 59 * . 53 * 0,49 / 0,55 ** . 29 * . 29 * una . 29 * una


transferencia-ter- APY controvertido (0,01 / 0,50) (0,01 / 0,50)
para el Trastorno de sial
Personalidad La frontera
línea

Nota. Número de efectos utilizables (p-checker / pwr / BayesFactor (individual) / BayesFactor (meta). z Resultados inicialmente marcados como misreported se confirmaron a ser ejecutado como pruebas
de una cola. y Efecto descrito como marginalmente significativa fue declaradas de modo inexacto. X Factor de Bayes indica umbral más débil de pruebas si se adopta más amplia antes. una Los mismos
efectos utilizados para las estimaciones pesimistas / optimistas meta-analíticas. ND: No disponible debido a problemas de estimación. *Polémico. **Modesto. *** Fuerte (en base a nuestros umbrales
sugeridos).
S AKALUK, W illiams, K ILSHAW, Y R hyner 19

Tabla 3

Métricas de valor probatorio para Tratamientos Empíricamente soportados agrupados por Div. 12 Nivel de evidencia Categoría

Div. 12 evi- # Se puede utilizar de EF- % Er- bruto % Er- Minor La mediana del R-Índice 80% de potencia para BF 10 Distancia Meta Optimista
dencia Cate- efec- Rors Rors anuncio Poder Especial detectar Me- dian re pesimista BF 10 Meta BF 10
sangriento (Posterior (Posterior
(1-tailed / 2- 95% CR: LL re/ 95% CR: LL re/
colas) UL re) UL re)
Modesto 182/535/267/45 2% ** 10% ** . 53 * . 48 * 0,71 / 0,80 * . 005 * / 1.16E + 28 + 10 12.03E *** *** 47.45E + 61 ***
(0,22 / 0,36) (0,63 / 0,77)
Fuerte 523/1873/824 / 2% ** 7% ** . 64 ** . 67 ** 0,73 / 0,84 * . 002 * / 30.85E + 30 *** 8,65 ** (0,02 81.60E + 62 ***
/ 0,13) (0,45 / 0,56)
Modest (Con- 4/11/5/0 25 * 0% * . 26 * . 27 * 0,86 / 0,98 * . 02 * / 29.07E + 7 *** -- --
controvertida)
Strong (Con- 10/31/20/3 0% ** 10% ** . 50 * . 51 * 1,07 / 1,23 * . 14 * / 28.29E + 3 *** . 13 * (0,004 . 19 * (0,005
/ 0,31) / 0,40)
controvertida)

Nota. Número de efectos utilizables (p-checker / pwr / BayesFactor (individual) / BayesFactor (meta).
* Polémico. **Modesto. *** Fuerte (en base a nuestros umbrales sugeridos).
S AKALUK, W illiams, K ILSHAW, Y R hyner 20

Figura 1. La mediana pairwise diferencia más pequeña ( re) entre EST y control que podría ser detectado de forma fiable (potencia 80%), por años de tiempo

de publicación. regiones sombreadas corresponden a los puntos de corte propuestos para los niveles de valor probatorio.

También podría gustarte