Está en la página 1de 14

Clnica y Salud 26 (2015) 167180

Clnica y Salud
www.elsevier.es/clysa

Tcnicas para el anlisis de disenos de caso nico en la prctica


clnica: ejemplos de aplicacin en el tratamiento de vctimas de
atentados terroristas
Jess Sanz y Mara Paz Garca-Vera
Universidad Complutense de Madrid, Spain

informacin del artculo r e s u m e n

Historia del artculo: En este trabajo se presentan dos tcnicas para el anlisis de datos de los disenos de caso nico en la
Recibido el 11 de julio de 2015 investigacin de los tratamientos psicolgicos: los ndices de no solapamiento de datos para estimar el
Aceptado el 4 de septiembre de 2015 tamano del efecto del tratamiento (o magnitud del cambio teraputico) y la aproximacin estadstica de
On-line el 16 de octubre de 2015
Jacobson y Truax (1991) para estimar la significacin clnica del efecto. A partir del caso de una vctima
del terrorismo que sufra de trastorno por estrs postraumtico, trastorno depresivo mayor y trastorno de
Palabras clave: angustia con agorafobia y que recibi terapia cognitivo conductual centrada en el trauma, se ejemplifica
Diseno de caso nico
el clculo y aplicacin del porcentaje de datos no solapados (PND), el porcentaje de datos que exceden la
Evaluacin de la efectividad de un
tratamiento
mediana (PEM), el no solapamiento de todos los pares (NAP) y la aproximacin estadstica a la significacin
Anlisis de datos clnica y se discuten sus ventajas y limitaciones como complemento al anlisis visual de los datos.
Tamano del efecto 2015 Colegio Oficial de Psiclogos de Madrid. Publicado por Elsevier Espaa, S.L.U. Este es un
Significacin clnica artculo Open Access bajo la licencia CC BY-NC-ND
(http://creativecommons.org/licenses/by-nc-nd/4.0/).

Techniques for the analysis of single-case designs in clinical practice: Examples


of application in the treatment of victims of terrorist attacks

a b s t r a c t

Keywords: This paper presents two techniques for the data analysis of single case designs in psychological treat-
Single-case design ment research: indices of data overlap between phases to estimate the size of treatment effect (or the
Treatment effectiveness evaluation magnitude of therapeutic change) and Jacobson and Truaxs (1991) statistical approach to estimate the
Data analysis
clinical significance of treatment effect. Based on a case of a victim of terrorism who suffered from post-
Effect size
traumatic stress disorder, major depressive disorder and panic disorder with agoraphobia and received
Clinical significance
trauma-focused cognitive-behavioral therapy, this paper illustrates the computation and application of
percentage of non-overlapping data (PND), percentage of data points exceeding the median (PEM), non-
overlap of all pairs (NAP), and statistical approach to clinical significance, and discusses their advantages
and limitations as a complement of visual analysis of data.
2015 Colegio Oficial de Psiclogos de Madrid. Published by Elsevier Espaa, S.L.U. This is an open
access article under the CC BY-NC-ND license (http://creativecommons.org/licenses/by-nc-nd/4.0/).

Uno de los rasgos que ha caracterizado el campo de la psi- pruebas cientficas, que inicialmente se denominaron tratamien-
cologa clnica y de salud en los ltimos 20-25 anos ha sido el tos apoyados empricamente (Labrador Encinas y Crespo Lpez,
desarrollo del movimiento de los tratamientos basados en la evi- 2012). Este movimiento ha acentuado, por un lado, la necesidad de
dencia o, para evitar el anglicismo, de los tratamientos basados en fundamentar empricamente la eficacia y utilidad clnica de los tra-
tamientos psicolgicos y, por otro, el reconocimiento de la brecha
entre investigacin y prctica clnica. La realizacin y disemina-
Autor para correspondencia. Facultad de Psicologa. Universidad Complutense cin de estudios con disenos de caso nico, especialmente de los
de Madrid. Campus de Somosaguas. 28223 Pozuelo de Alarcn, Madrid, Espana. denominados cuasi-experimentales (Kazdin, 1992), podra ayudar
Correo electrnico: jsanz@psi.ucm.es (J. Sanz). de manera singular a cerrar esa brecha a la vez que a profundizar

http://dx.doi.org/10.1016/j.clysa.2015.09.004
1130-5274/ 2015 Colegio Oficial de Psiclogos de Madrid. Publicado por Elsevier Espaa, S.L.U. Este es un artculo Open Access bajo la licencia CC BY-NC-ND
(http://creativecommons.org/licenses/by-nc-nd/4.0/).
168 J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180

en la investigacin sobre tratamientos. Los datos obtenidos en esos comparar distintos resultados en un mismo estudio (p. ej., compa-
estudios podran contribuir de forma directa a la base de conoci- rar si un tratamiento ha sido ms eficaz para reducir la sintomato-
mientos cientficos, podran generar hiptesis para ser investigadas loga de estrs postraumtico que la sintomatologa depresiva).
con disenos ms rigurosos y, en el camino, podran conseguir que El anlisis estadstico de los datos en los disenos de caso nico,
la investigacin sobre tratamientos se ajustara ms y fuera ms aunque mucho menos utilizado, ha pretendido resolver algunos de
relevante para la prctica clnica (Kazdin, 2008). los problemas que aquejan al anlisis visual, especialmente los vin-
Uno de los obstculos con los que se encuentran los psiclogos culados a su subjetividad, al proporcionar un mtodo cuantitativo
clnicos y de la salud que quieren realizar ese tipo de investiga- y un conjunto de reglas para determinar si un cambio teraputico es
ciones es cmo analizar adecuadamente los datos que obtienen. significativo. Por lo tanto, muchos especialistas recomiendan com-
Tradicionalmente, el anlisis de datos en los estudios con disenos plementar el anlisis visual con algn tipo de anlisis estadstico
de caso nico se ha venido realizando mediante un anlisis visual (Bono Cabr y Arnau Gras, 2014; Campbell y Herzinger, 2010), pos-
de la presentacin grfica de los datos tomados durante la fase tura que tambin es compartida por muchos defensores del anlisis
(o fases) de lnea base (LB) y durante la fase (o fases) de trata- visual de los datos (p. ej., Kazdin, 1988, 1992). Sin embargo, las tc-
miento (Barlow y Hersen, 1988; Bono Cabr y Arnau Gras, 2014; nicas estadsticas ms conocidas por los psiclogos clnicos y de la
Kazdin, 1992; Kratochwill y Levin, 1992; Kratochwill et al., 2013). salud como, por ejemplo, las pruebas t y F, no son apropiadas para
Este anlisis visual trata de identificar que tras el tratamiento se los disenos de caso nico ya que tales estadsticos paramtricos
ha producido un cambio en los datos que es consistente, fiable y presuponen la independencia entre los errores de cualquier par de
poco probable que sea debido a fluctuaciones azarosas de los datos datos, mientras que los datos en los disenos de caso nico suelen
entre las fases, de manera que se pueda determinar si el tratamiento correlacionar entre s ya que proceden de la misma persona y, ade-
ha tenido efecto sobre los problemas o trastornos psicolgicos y ms, son observaciones sucesivas en una serie temporal en la que
cul ha sido la magnitud de ese efecto. Para ello, en esos anlisis podran influirse unas a otras, es decir, pueden mostrar dependen-
se examina visualmente, por ejemplo, la estabilidad, variabilidad cia serial o autocorrelacin (Bono Cabr y Arnau Gras, 2014). Como
y tendencia de los datos en la LB, los cambios que se producen en alternativa se han propuesto fundamentalmente tres tipos de an-
el tratamiento respecto a la tendencia de los datos y su nivel y la lisis estadsticos: el anlisis de series temporales, las pruebas no
latencia de dichos cambios, es decir, el tiempo que transcurre entre paramtricas basadas en la aleatorizacin y los ndices para la esti-
el inicio del tratamiento y los cambios en la tendencia y nivel de macin del tamano del efecto basados en el no solapamiento de
los datos. El argumento de los defensores de este tipo de anlisis es los datos entre las fases, aunque la lista de mtodos estadsticos es
sencillo y directo: si un investigador no puede ver con sus ojos un mucho ms amplia e incluye algunos que muy raramente han sido
efecto o un cambio teraputico cuando lo representa grficamente, utilizados (Bono Cabr y Arnau Gras, 2014; Kazdin, 1988; Parker y
es que no existe o es clnicamente irrelevante. Brossart, 2003).
A pesar de lo convincente que puede parecer este argumento, la De esos tres tipos principales de anlisis, los dos primeros pre-
literatura cientfica ha demostrado que en el anlisis visual hay una sentan problemas muy graves para su utilizacin en la prctica
tendencia importante a cometer errores de tipo I. En concreto, se ha clnica. Los anlisis de series temporales requieren un nmero muy
encontrado que en el 25% de las ocasiones se considera efectivo un grande de datos en cada fase de LB y de tratamiento para que sus
tratamiento que no lo es (Campbell y Herzinger, 2010). As mismo, resultados sean precisos (p. ej., un mnimo de 50 datos en cada fase;
varios estudios han encontrado una baja fiabilidad interjueces a la Glass et al., 1975, citado por Bono Cabr y Arnau Gras, 2014). Ade-
hora de interpretar los resultados de los disenos de caso nico sobre ms, su utilizacin es compleja en trminos de los conocimientos
la base del anlisis visual, de manera que dos observadores distin- estadsticos y del trabajo computacional necesarios (Bono Cabr y
tos pueden mostrar poca coincidencia sobre si un tratamiento es Arnau Gras, 2014; Kazdin, 1988). Las pruebas no paramtricas de
efectivo y sobre la magnitud o relevancia de su efecto (Campbell y aleatorizacin, por su parte, requieren la aleatorizacin de algn
Herzinger, 2010). Ambos problemas subrayan las limitaciones que aspecto del diseno. Por ejemplo, en el diseno de caso nico ms
supone una evaluacin basada en los juicios subjetivos de un obser- bsico y ms empleado en la prctica clnica, el diseno con una sola
vador, a pesar de que estos juicios no son completamente subjetivos fase de LB y una sola fase de tratamiento (diseno A-B), las prue-
ya que deben seguir una serie de criterios especficos que deter- bas no paramtricas de aleatorizacin requieren decidir al azar el
minan la toma de decisiones y los datos en que se basen deben momento en que se aplica el tratamiento (Bono Cabr y Arnau Gras,
cumplir unos requisitos determinados (Kratochwill y Levin, 1992; 2014). Sin embargo, por razones clnicas, prcticas y ticas esto
Kratochwill et al., 2013). no suele ser posible en la prctica clnica, ya que dicha seleccin
Por otro lado, algunos de los requisitos mnimos necesarios para podra resultar en una aplicacin muy tarda que fuera imposible o
realizar un anlisis visual adecuado de los datos no se cumplen en contraproducente.
muchos estudios con disenos de caso nico. Por ejemplo, se ha pro- En contraposicin con estos dos tipos de anlisis, los ndices para
puesto que es necesario contar con al menos tres datos en cada una estimar el tamano del efecto basados en el no solapamiento de los
de las fases de LB y tratamiento para poder identificar e interpretar datos entre las fases parecen especialmente relevantes para anali-
un patrn de datos en una fase dada (Kratochwill et al., 2013). Sin zar los estudios con diseno de caso nico en la prctica clnica, ya
embargo, en muchos estudios con disenos de caso nico es difcil que pueden utilizarse con todo tipo de disenos, se pueden calcular
cumplir ese estndar, especialmente en la LB, ya que por cuestio- incluso con un nmero muy pequeno de datos en la LB o en el tra-
nes ticas y clnicas no se puede alargar la LB e incluso, en algunos tamiento, son ms robustos que los ndices basados en los cambios
casos, tan solo se cuenta con un nico dato en la LB: la medida de medias o medianas entre fases, especialmente en esos casos tan
pretratamiento. frecuentes en la prctica clnica en los que hay pocos datos en la
Finalmente, dada la alta heterogeneidad de los estudios con LB o en el tratamiento, y su clculo es extremadamente simple y
disenos de caso nico respecto a sus caractersticas bsicas (p. ej., fcil, pudindose realizar a mano a partir de los grficos de datos
duracin de las fases de LB y de tratamiento, nmero y tipos de (Parker, Vannest y Davis, 2011). Estos ndices no tratan de compro-
medidas, nmero de fases, tipo de diseno, etc.), es difcil con un sim- bar la significacin estadstica del efecto o cambio teraputico, sino
ple anlisis visual de los datos comparar los resultados de un estudio de cuantificar ese cambio y valorar su magnitud, lo que permiti-
con los de otro (p. ej., comparar si un tratamiento ha sido ms eficaz ra superar algunos de los problemas que afectan al anlisis visual
en un paciente que en otro o comparar la efectividad de un trata- de los datos y precisar de forma vlida las inferencias basadas en
miento con la que se ha encontrado en estudios previos) o incluso este (Bono Cabr y Arnau Gras, 2014). As, estos ndices son capaces
J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180 169

de ofrecer una medida de la magnitud del cambio teraputico que BDI-II Lnea base Tratamiento Seguimiento
es ms objetiva que la que se puede obtener mediante un anlisis 50
44 42
visual y que se puede comparar entre distintos estudios, pacientes o 45
40
medidas. Por otro lado, es importante senalar que los ndices de no 35 31
solapamiento de datos desarrollados en los ltimos 10 anos estn 30
27 24
basados en distribuciones de muestreo establecidas que permiten 25
20
la construccin de sus intervalos de confianza y permiten poner 15
9 9 7 7
a prueba el tamano del efecto frente a una hiptesis de nulidad, 10 7 7 4 3
5 11 2
lo cual es especialmente til con disenos de caso nico con pocos 0
datos (Parker et al., 2011). Finalmente, estos ndices responden muy ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 ost es ses ses o
ni n n n P m e e 1a
bien a las exigencias del movimiento de los tratamientos basados e f si si si si si i i i 1 m m
el Se Se Se Se Se Ses Ses Ses 3 6
en la evidencia y a su necesidad de sustentar empricamente los T
tratamientos con un ndice que refleje la magnitud de la mejora
BAI Lnea base Tratamiento Seguimiento
del paciente (Parker et al., 2011).
45 41
Por todas estas ventajas, el primer objetivo del presente trabajo 37
40
fue presentar algunos de los ndices de tamano del efecto ms cono- 35
cidos y ms tiles para el anlisis de datos de los disenos de caso 30 35 27
nico en la prctica clnica, as como ilustrar su utilizacin mediante 25
20 17
su aplicacin en un caso clnico. 15
14

Una limitacin que presentan todos los ndices de tamano del 10 13 6


8 9 7
5 5
3
efecto es que un cambio teraputico de magnitud grande no implica 5 5
0
necesariamente que dicho cambio sea clnicamente significativo o
ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 ost es ses ses o
tenga un valor prctico, es decir, que sea, por ejemplo, el cambio ni n n n P m e e 1a
e f si si si si si i i i 1 m m
requerido para que un paciente pueda funcionar en la sociedad o T el Se Se Se Se Se Ses Ses Ses 3 6
que produzca alguna diferencia real para ese paciente o para las per-
PCL-S Lnea base Tratamiento Seguimiento
sonas de su entorno en su funcionamiento y vida diaria. Es cierto
que hay una mayor relacin entre el tamano del efecto y la significa- 80 71 70 65
cin clnica que entre esta ltima y la significacin estadstica y que 70 60
habitualmente los efectos teraputicos de magnitud grande sue- 60
len ser tambin clnicamente significativos, pero aun as es posible 50
55 37 39
obtener en una investigacin de caso nico ndices de tamano del 40 46 32 28 28 30
efecto iguales a 100% sin que necesariamente los cambios terapu- 30 24
23
ticos tengan una repercusin clara en el funcionamiento cotidiano 20 29
del paciente. Tales ndices de tamano del efecto pueden hacer creer 10
al clnico o investigador que el tratamiento ha sido efectivo, pero en 0
t
este contexto, efectivo querra decir que ha producido un cambio ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os e s es es o
ni m es es 1 a
f si esi esi esi esi sin sin sin P 1 m m
beneficioso de una magnitud grande, pero no que ese cambio sea lo el
e S e S S S S Se Se Se 3 6
T
suficiente grande para suponer que el paciente se ha recuperado de
su trastorno psicolgico y ha vuelto a su funcionamiento normal o Figura 1. Grfico de evolucin teraputica de una vctima del terrorismo en el Inven-
simplemente que se ha producido en dicho trastorno una mejora tario de Depresin de Beck-II (BDI-II), el Inventario de Ansiedad de Beck (BAI) y
de una magnitud clnicamente relevante y con efectos prcticos en la Lista de Verificacin del Trastorno por Estrs Postraumtico, versin especfica
(PCL-S).
la vida del paciente.
En consecuencia, el segundo objetivo del presente artculo fue
presentar un procedimiento para evaluar la significacin clnica de accedan a participar voluntariamente en el proyecto, (c) detec-
los cambios teraputicos en un diseno de caso nico que, por su tar a las vctimas que pudieran presentar un trastorno psicolgico
simplicidad y relevancia, puede ser especialmente til en la prctica relacionado con el atentado terrorista sufrido, (d) citar a estas vcti-
clnica, as como ilustrar su utilizacin mediante su aplicacin en mas para la realizacin de una entrevista diagnstica estructurada
un caso clnico. presencial que corroborara la presencia de un trastorno por estrs
postraumtico, de un trastorno depresivo o de un trastorno de
ansiedad y (e) ofrecer a todas las vctimas que sufran alguno de esos
Un ejemplo de diseno de caso nico: el tratamiento de una trastornos la posibilidad de recibir gratuitamente un tratamiento
vctima del terrorismo psicolgico para los mismos.
La vctima, Nuria (nombre ficticio), era una mujer soltera de 65
Para ilustrar el clculo y la interpretacin de las tcnicas de an- anos, jubilada y con estudios de formacin profesional superior,
lisis de datos que se describirn en este trabajo, en la figura 1 se que result herida en el atentado ocurrido el 13 de septiembre de
presentan los grficos de evolucin teraputica de una de las vcti- 1974 en la cafetera Rolando de Madrid. La banda terrorista ETA
mas del terrorismo que fue tratada en el marco de un proyecto de coloc una bomba en los aseos de la cafetera y caus la muerte
investigacin sobre las consecuencias psicopatolgicas de los aten- de 13 personas y heridas a otras 60. Nuria presentaba un trastorno
tados terroristas a muy largo plazo (ms de 20-30 anos) y sobre por estrs postraumtico acompanado de un trastorno depresivo
la eficacia y utilidad de los tratamientos psicolgicos de dichas mayor recidivante y de un trastorno de angustia con agorafobia.
consecuencias (Moreno et al., manuscrito en edicin editorial). El Por tanto, se le ofreci participar en un programa de tratamiento
proyecto de investigacin implicaba: (a) contactar telefnicamente individual de 16 sesiones semanales de terapia cognitivo conduc-
con todos los socios de varias asociaciones de vctimas del terro- tual centrada en el trauma que inclua, adems, algunas tcnicas
rismo, en especial de la Asociacin Vctimas del Terrorismo (AVT), teraputicas especficas para el trastorno depresivo mayor y el tras-
(b) aplicar, mediante una entrevista telefnica, diversos instrumen- torno de angustia (p. ej., planificacin de actividades agradables,
tos de cribado psicopatolgico a todas las vctimas adultas que exposicin interoceptiva) (Garca-Vera et al., en prensa; Moreno
170 J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180

et al., manuscrito en edicin editorial). Durante la evaluacin diag- Tabla 1


Valores convencionales para interpretar los ndices de tamano del efecto PND, PEM
nstica pretratamiento, Nuria complet las adaptaciones espanolas
y NAP en disenos de caso nico
del Inventario de Depresin de Beck-II (BDI-II; Beck, Steer y Brown,
2011), del Inventario de Ansiedad de Beck (BAI; Beck y Steer, 2011) ndice Valores Interpretacin Referencia
y de la Lista de Verificacin del Trastorno por Estrs Postraum- PND < 50% Tratamiento no efectivo Scruggs
tico, versin especfica (PCL-S; Vzquez, Prez-Sales y Matt, 2006; 50% 69% Efectividad cuestionable y
Weathers, Litz, Herman, Huska y Keane, 1993), instrumentos que 70% 89% Tratamiento bastante Mastropieri
efectivo (1998)
fueron posteriormente aplicados cada dos semanas de tratamiento
> 90% Tratamiento muy efectivo
empezando por la sesin 1, tal y como se muestra en la figura 1. Para PEM < 70% Tratamiento cuestionable o Ma
entender mejor esta figura y las figuras y ejemplos que se presen- no efectivo (2006)
tarn ms adelante sobre este caso, cabe recordar que el rango de 70% 89% Tratamiento
moderadamente efectivo
puntuaciones del BDI-II y del BAI es de 0 a 63 y el de la PCL-S es de
90% 100% Tratamiento muy efectivo
17 a 85 y en los tres instrumentos una mayor puntuacin indica una NAP 0 65% Efecto dbil Parker
mayor frecuencia y gravedad de sntomas de depresin, ansiedad o 66% 92% Efecto medio y
estrs postraumtico, respectivamente. 93% 100% Efecto grande Vannest
Durante la entrevista de cribado telefnico Nuria tambin haba (2009)
Nota. PND = porcentaje de datos no solapados; PEM = porcentaje de datos que
completado la PCL-S, una versin breve del BDI-II (BDI-II-SF; Sanz, exceden la mediana; NAP = no solapamiento de todos los pares.
Garca-Vera, Fortn y Espinosa, 2005) y una versin breve del BAI
(BAI-PC; Beck, Steer, Ball, Ciervo y Kabat, 1997; Sanz y Garca-
Vera, 2012). Tras convertir, mediante las oportunas ecuaciones de condiciones tambin podra ocurrir que el tratamiento s tuviera
regresin (Sanz et al., 2005; Sanz y Garca-Vera, 2012), las puntua- efecto aumentando la pendiente de la tendencia mostrada en la LB,
ciones del BDI-II-SF y del BAI-PC a puntuaciones del BDI-II y del BAI, pero esto no quedara adecuadamente reflejado por los ndices que,
respectivamente, esas medidas psicopatolgicas de la evaluacin de nuevo, siempre indicaran la mxima efectividad independien-
telefnica pasaron a formar parte de la LB junto con las medi- temente de cul fuera la pendiente.
das tomadas durante la evaluacin diagnstica pretratamiento y Por razones de espacio, a continuacin se describirn solo tres
las tomadas durante la primera sesin de tratamiento (vase la ndices basados en el no solapamiento de los datos que han sido
fig. 1). Despus de la ltima sesin de terapia se llev a cabo una elegidos, los dos primeros en funcin principalmente de su popula-
evaluacin psicolgica postratamiento as como seguimientos psi- ridad y facilidad de clculo y el tercero por sus buenas propiedades
colgicos al mes, a los tres meses, a los seis meses y al ano y durante estadsticas (p. ej., alta potencia estadstica, buena sensibilidad,
todos ellos Nuria volvi a completar el BDI-II, el BAI y la PCL-S. etc.).
Estas medidas tomadas en el postratamiento y en los seguimientos
pasaron a formar parte de las medidas de la fase de tratamiento- Porcentaje de datos no solapados (PND)
seguimiento junto con las tomadas durante las sesiones de terapia
3, 5, 7, 9, 11, 13 y 15 (vase la fig. 1). El porcentaje de datos no solapados [percentage of nonoverlap-
ping data o PND] es uno de los ndices ms antiguos para evaluar
la magnitud del cambio teraputico en un diseno de caso nico y,
Evaluacin de la magnitud del cambio teraputico o tamano
a pesar de sus limitaciones, ha sido el ms utilizado en la litera-
del efecto del tratamiento
tura cientfica (Scruggs y Mastropieri, 2013; Scruggs, Mastropieri y
Casto, 1987). As, por ejemplo, se ha utilizado en ms de 40 meta-
En los ltimos anos se han desarrollado multitud de ndices
anlisis de estudios de diseno de caso nico (Maggin et al., 2013;
basados en el no solapamiento de los datos entre fases para eva-
Scruggs y Mastropieri, 2013), por lo que la posibilidad de comparar
luar el tamano del efecto del tratamiento en los disenos de caso
los resultados obtenidos con los de la literatura cientfica es mayor
nico. Parker et al. (2011) revisaron nueve de ellos, notando muchas
que con otros ndices. El PND se define como el porcentaje de datos
semejanzas entre los mismos, pero tambin diferencias que impli-
de la fase de tratamiento que excede al dato ms extremo de la LB,
can un perfil diferencial de ventajas y limitaciones en trminos
y se calcula contando el nmero de datos de la fase de tratamiento
de su potencia estadstica, de la posibilidad de corregir una ten-
que superan (por encima en las medidas funcionales o por debajo
dencia positiva en la LB, de su sensibilidad para discriminar los
en las medidas disfuncionales) al dato ms extremo de la LB (el ms
tratamientos ms efectivos, etc. Por esta razn, se suele recomen-
alto en las medidas funcionales o el ms bajo en las medidas dis-
dar la utilizacin de varios de ellos para determinar si se obtienen
funcionales) y dividiendo este nmero por el nmero total de datos
resultados consistentes (Maggin, Briesch y Chafouleas, 2013).
en la fase de tratamiento:
No- de datos del tratamiento que exceden al dato m s extremo de la LB
PND = 100
Total de no- de datos del tratamiento
El rango de valores del PND vara de 0 a 100% y sus creadores
En cualquier caso, la mayora de los ndices basados en el no sola- han propuesto una gua para su interpretacin en trminos de la
pamiento de los datos no deberan utilizarse o hacerlo con mucha efectividad de un tratamiento (Scruggs y Mastropieri, 1998). Esta
precaucin cuando exista: (a) una tendencia positiva en la fase de gua se recoge en la tabla 1. En la figura 2 se ilustra el clculo del
LB y (b) una tendencia fuerte tambin positiva en la fase de inter- PND en cada una de las medidas psicopatolgicas tomadas en el
vencin. Cuando se cumplen ambas condiciones podra ocurrir que caso de la vctima del terrorismo. Por ejemplo, respecto al BDI-II,
el tratamiento no tiene efecto alguno, sino que meramente per- la puntuacin ms extrema (en este caso, ms baja) durante la LB
mite continuar la tendencia positiva que ya exista en la LB, lo cual fue 27 y once de los doce puntuaciones del BDI-II durante la fase de
se vera reflejado en el grfico por una diagonal que cruza ambas tratamiento-seguimiento estaban por debajo de 27, por lo que PND
fases bien de forma ascendente o descendente (segn la direccin = (11 / 12) x 100 = 91.6%, mientras que, respecto al BAI, la puntuacin
de la funcionalidad); a pesar de ello, la mayora de los ndices indi- ms baja en la LB fue 35 y las doce puntuaciones del BAI en la fase
caran errneamente que el tratamiento muestra el mximo efecto de tratamiento-seguimiento estaban por debajo de 35, por lo que
posible (100%). Por otro lado, cuando se cumple las anteriores dos PND = (12 / 12) x 100 = 100%.
J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180 171

BDI-II Lnea base Tratamiento Seguimiento Porcentaje de datos que exceden la mediana (PEM)
n=3 n=8 n=4
50
45
44 42 El porcentaje de datos que exceden la mediana [percentage of
40 data points exceeding the median o PEM] se define como el porcen-
35 taje de datos de la fase de tratamiento que supera (por encima en
31
30 las medidas funcionales o por debajo en las medidas disfunciona-
25 les) a la mediana de los datos de la LB (Ma, 2006). El PEM asume que
27 24
20 la mediana es un buen resumen de las puntuaciones de la LB y que
15 cuando el tratamiento no tiene efecto alguno, los datos de la fase
9 9
10 7 7 7 7 de tratamiento deberan fluctuar en torno a la lnea de la mediana.
4
5
11 3 El PEM ha sido utilizado en varios metaanlisis de disenos de caso
2
0 nico como ndice de tamano del efecto (Ma, 2009; Preston y Carter,
t
ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os es ses ses ao 2009).
ni i si si si si in in in P 1m e e 1
ef
s m m Para calcular la mediana, se ordenan de forma creciente todos los
Te
l Se Se Se Se Se Ses Ses Ses 3 6
datos de la LB y si el nmero de datos de la LB es impar la mediana
es el dato que los divide en dos partes iguales, superiores e infe-
BAI Lnea base Tratamiento Seguimiento
riores a l y si el nmero de datos de la LB es par se identifican los
n=3 n=8 n=4
45 dos datos que dividen en dos partes iguales la serie ordenada de
41
40 37 datos y esos dos datos se promedian. A continuacin, para calcular
35 el PEM se dibuja desde la mediana una lnea que atraviese la fase
30 35 27 de tratamiento y se calcula el porcentaje de datos de la fase de tra-
tamiento que estn por encima de la lnea de la mediana (en las
25
medidas funcionales) o por debajo (en las medidas disfuncionales),
20 17
de manera que:
15
N-o de datos del tratamiento que exceden la mediana de la LB
14 9
8 7
10 13 6 5 5 PEM = o 100
5
3 Total de n- de datos del tratamiento
5
0 En la figura 3 se ilustra el clculo del PEM en el caso del trata-
ca re 1 3 5 7 9 1 3 5 st es es es o miento de la vctima del terrorismo (vase tambin la tabla 2). Por
ni P in in in in in n 1 n 1 n 1 Po m es es 1 a
l e f e s es es es es si si si 1 m m ejemplo, en relacin con el BAI, tras ordenar crecientemente los
Te S S S S S Se Se Se 3 6
datos de la LB (35, 37 y 41) la mediana fue 37. A partir de este dato se
dibuj una lnea que atravesaba la fase de tratamiento-seguimiento
PCL-S Lnea base Tratamiento Seguimiento
y se contabilizaron 12 datos de esa fase que estaban por debajo de
n=3 n=8 n=4
80 la lnea de la mediana, por lo que PEM = (12 / 12) x 100 = 100%.
71 70
70 65 El rango de valores del PEM oscila entre 0 y 100% y su creadora,
60
Ma (2006), ha sugerido que para su interpretacin los criterios ms
60
55 adecuados seran los propuestos por Scruggs, Mastropieri, Cook y
50
39 Escobar (1986) para el PND y que se recogen en la tabla 1.
40 46
37
32 El PEM solventa el problema del PND respecto a la existencia
28 30
30 24
28
de datos muy atpicos en la LB, pero tambin tiene algunas limi-
29 23 taciones, entre las cuales destaca que no es un ndice sensible a la
20
magnitud de los datos que estn por debajo (o por encima) de la
10 mediana, de forma que dos tratamientos pueden obtener el mismo
0 PEM (p. ej., 100%) independientemente de que uno consiga reducir
ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os
t
es es es o todas las puntuaciones de un instrumento a 0 y otro consiga redu-
ni P 1 m es es 1 a
e f e si esi esi esi esi sin sin sin m m cir todas las puntuaciones en tan solo un punto por debajo de la
el S S S S S Se Se Se 3 6
T mediana de la LB.
Figura 2. Clculo del porcentaje de datos no solapados (PND) para el Inventario de
Depresin de Beck-II (BDI-II), el Inventario de Ansiedad de Beck (BAI) y la Lista de No solapamiento de todos los pares (NAP)
Verificacin del Trastorno por Estrs Postraumtico, versin especfica (PCL-S), en
el tratamiento de una vctima del terrorismo. El ndice de no solapamiento de todos los pares [nonoverlap
of all pairs o NAP] fue desarrollado por Parker y Vannest (2009)
para superar las limitaciones de otros ndices de solapamiento de
datos entre fases como el PND o el PEM. Como estos ltimos, el
Uno de los problemas del PND es que, puesto que est basado NAP resume el no solapamiento de datos entre las fases de LB y
en un nico dato de la LB, la presencia de valores muy atpicos en la tratamiento, pero se diferencia de ellos por el hecho de que tiene
LB podra distorsionar la estimacin de la magnitud del efecto. Por en cuenta todos los solapamientos posibles entre la LB y el trata-
ejemplo, si en el grfico de la figura 2 correspondiente al BAI en lugar miento, ya que compara por pares todos los datos de la fase de la
de encontrarse en la evaluacin de pretratamiento una puntuacin LB con todos los datos de la fase de tratamiento, por lo que podra
de 35 que, aunque la ms extrema, es relativamente consistente interpretarse como el porcentaje de datos sin solapamiento entre
con los otros dos valores de la LB, se hubiera encontrado un valor las fases de LB y tratamiento o el porcentaje de datos que muestran
atpico de 5, el PND sera de tan solo 8.3% [(1 / 12) x 100], a pesar una mejora respecto a la LB.
de que, segn refleja la figura 2, el tratamiento parece mucho ms En la figura 4 se ilustra el clculo del NAP en el caso del tra-
efectivo en funcin del descenso tan inmediato y marcado en las tamiento de la vctima del terrorismo (vase tambin la tabla 2).
puntuaciones del BAI y la estabilidad del descenso a lo largo del Para calcular el NAP se compara cada dato de la LB con cada dato
tratamiento y de los seguimientos. del tratamiento-seguimiento. En la figura 4 las flechas del grfico
172 J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180

Tabla 2
Efectividad de la terapia cognitivo conductual centrada en el trauma para una vctima del terrorismo en funcin del ndice de tamano del efecto

Variable de resultado ndice de tamano de efecto

PND PEM NAP

Depresin (BDI-II) 91.6% 100% 97.2%


[tratamiento muy efectivo] (73.5% - 100%) (89.2% - 100%)
[tratamiento muy efectivo] [efecto grande]
Ansiedad (BAI) 100% 100% 100%
[tratamiento muy efectivo] (73.5% - 100%) (100% - 100%)
[tratamiento muy efectivo] [efecto grande]
Estrs postraumtico (PCL-S) 91.6% 100% 97.2%
[tratamiento muy efectivo] (73.5% - 100%) (89.2% - 100%)
[tratamiento muy efectivo] [efecto grande]

Nota. Los datos son los valores de los correspondientes ndices de tamano del efecto, con sus intervalos de confianza al 95% entre parntesis (excepto para PND, ya que no es
posible su clculo; Parker y Vannest, 2009) y su interpretacin convencional entre corchetes. PND = porcentaje de datos no solapados; PEM = porcentaje de datos que exceden
la mediana; NAP = no solapamiento de todos los pares; BDI-II = Inventario de Depresin de Beck-II; BAI = Inventario de Ansiedad de Beck; PCL-S = Lista de Verificacin del
Trastorno por Estrs Postraumtico, versin especfica.

sobre la evolucin teraputica en el BDI-II y en la PCL-S mues- la fig. 4 respecto al BDI-II y la PCL-S) se solapan o empatan con
tran, para una mayor claridad, esas comparaciones por pares y sus los datos del tratamiento, pero su clculo puede ser ms tedioso
resultados para un nico dato de la LB, el dato de la evaluacin pre- cuando los cambios teraputicos que se analizan son de menor
tratamiento en el caso del BDI-II (27) y el dato de la sesin 1 en magnitud, y por tanto hay un mayor nmero de solapamientos
el caso de la PCL-S. Un par de datos se considera no solapamiento y empates, y cuando se ha tomado un nmero mayor de datos
(N) si el dato de la fase de tratamiento-seguimiento supera (en la en la LB o en el tratamiento. Para facilitar el clculo del NAP, sus
direccin de la funcionalidad) al de la fase de LB, en este caso si autores han creado una aplicacin muy sencilla en Internet que,
el dato del tratamiento-seguimiento es menor que el dato de la adems, permite comparar distintas fases de LB y de tratamiento
LB, mientras que se considera un solapamiento (S) si el dato del en disenos de caso nico ms complejos (p. ej., disenos A-B-A-
tratamiento-seguimiento no supera (en la direccin de la funcio- B o A-B-C-B): http://www.singlecaseresearch.org/calculators/nap.
nalidad) al de la LB, en este caso si dicho dato es mayor que el de la Lamentablemente, la aplicacin asume que la funcionalidad implica
LB, y se considera un empate (E) si ambos datos son iguales. Cuando un dato en la fase de tratamiento mayor que en la LB y, por tanto,
se compar el dato del pretratamiento en el BDI-II (27) con todos no puede utilizarse con medidas en las que una puntuacin menor
los datos del tratamiento-seguimiento, se encontr 1 solapamiento implica una mayor funcionalidad o mejora, tal y como es el caso
(S), 11 no solapamientos (N) y 0 empates (E). Puesto que habitual- del BDI-II, el BAI o la PCL-S. Sin embargo, puesto que el NAP es igual
mente es ms fcil contar el nmero de solapamientos y empates al rea bajo la curva [area under the curve o AUC], multiplicado por
y restarlos al nmero total de pares para obtener as el nmero de 100, de un anlisis de la curva ROC [receiver operating characteristic]
no solapamientos (n de N = n de pares n de S n de E), en la o curva de la caracterstica operativa del receptor (curva COR), el
figura 4 se muestra el resultado de las comparaciones en trminos NAP se puede calcular con cualquier programa estadstico estndar
del nmero de solapamientos y empates del total de pares: (n de que realice un anlisis de la curva ROC como, por ejemplo, entre los
S + n de E) / n de pares. As, para la puntuacin pretratamiento comerciales el SPSS o entre los gratuitos el EPIDAT (Xunta de Gali-
en el BDI-II (27) ese resultado es (1 + 0) / 12, es decir, 1 par con cia, Organizacin Panamericana de la Salud y Universidad CES de
solapamiento y 0 pares con empate, de 12 pares que lo comparan Colombia, Santiago de Compostela, Espana; http://dxsp.sergas.es).
con los datos del tratamiento-seguimiento. En el caso de los otros El anlisis de la curva ROC es una herramienta desarrollada a par-
dos datos del BDI-II de la LB (44 y 42), no existe ningn dato del tir de la Segunda Guerra Mundial para mejorar la deteccin de las
tratamiento-seguimiento que sea igual o mayor que ellos, por lo senales de radar y se utiliza en la actualidad en un amplio abanico de
que en ambos casos el nmero de solapamientos y empates sobre contextos, en particular en el anlisis de la precisin o eficacia diag-
el total de pares es (0 + 0) / 12. Por tanto, el nmero posible de pares nstica de pruebas y tests para detectar casos positivos y negativos
de datos comparando la LB con el tratamiento-seguimiento sera 36 respecto a una determinada enfermedad o caracterstica patolgica
(12 + 12 + 12), nmero que se calcula de forma general simplemente (Swets, 1988). El rea bajo la curva ROC puede oscilar entre 0 a 1 y
multiplicando el nmero de datos de la LB por el nmero de datos en ese contexto un valor de .5 indica que la capacidad de la prueba o
del tratamiento-seguimiento (n de datos de LB x n de datos del test para diagnosticar correctamente un caso positivo o negativo es
tratamiento-seguimiento = 3 x 12 = 36), mientras que el nmero de igual a la de un diagnstico realizado al azar, mientras que un rea
pares sin solapamiento sera 35 (n de pares n de solapamientos con un valor de 1 indica que la prueba o test logra un diagnstico
n de empates = 36 1 0 = 35). Finalmente, en el clculo del NAP, perfecto del conjunto de casos analizados (Swets, 1988).
la mitad de los empates se consideran no solapamientos y la otra En trminos de su equivalencia con el rea bajo la curva ROC,
mitad solapamientos, por lo que, la frmula general para el clculo el NAP refleja la probabilidad de que un dato elegido al azar de la
del NAP es: fase de tratamiento exceda (en la direccin de la funcionalidad) a
un dato elegido al azar de la fase de LB. Por tanto, para su clculo
N-o de pares sin solapamiento + 0.5 N-o de empates
   
a partir del anlisis de la curva ROC, por ejemplo con el SPSS, la
NAP = 100
o
Total de n- de pares de datos comparando la LB y el tratamiento variable de prueba seran los datos tomados durante la LB y el
tratamiento y la variable de estado (positivo o negativo) sera la
Utilizando esta frmula para el BDI-II, NAP = ((35 + (0.5 x 0)) / fase en que se tom el dato (LB o tratamiento). Adems, habra que
36) x 100 = 97.2% (vase la tabla 2). indicar el valor de la variable estado que indica un caso positivo,
Como ocurre con el caso de la vctima del terrorismo, en muchos en este caso el valor que indica que el dato pertenece a la fase de
disenos de caso nico el NAP es muy sencillo de calcular por- tratamiento, y la direccin de la variable de prueba, es decir, si un
que visualmente es fcil apreciar que ninguno de los datos de la valor ms grande o ms pequeno indica un caso positivo o en este
LB (vase la fig. 4 respecto al BAI) o muy pocos de ellos (vase caso si un dato ms grande o ms pequeno indica funcionalidad o
J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180 173

Lnea base Tratamiento Seguimiento BDI-II


BDI-II Lnea base Tratamiento Seguimiento
n=3 n=8 n=4
50 0+0/12
50
44 44
45 42 45 0+0/12 42 S = solapamiento
N = no solapamiento
40
40 S E = empate
35
35 31 31
30 30 N
24
25 25 27
27 24 20 1+0/12
20
15 15 N
9 9 7 N
10 7 7 7 7 10 7N 9 7 7 N
11 2
4
3 N
11 9 N N4 3
5 5 N N N
2
0 0
t
t
ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os es ses ses ao ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os es es es o
ni ni P 1 m es es 1 a
i si si si si in in in P 1m e e 1 f si esi esi esi esi sin sin sin m m
l ef s
Se Se Se Se Se Ses Ses Ses 3
m m
6 el
e S e S S S S Se Se Se 3 6
Te T

BAI Lnea base Tratamiento Seguimiento


BAI Lnea base Tratamiento Seguimiento
n=3 n=8 n=4
n=3 n=8 n=4 45
45 0+0/12 41
41 40 37
40 37 0+0/12 S = solapamiento
N = no solapamiento
35 35
E = empate
35
30 35 27 30 27
0+0/12
25 25 N
N
20 17 20 17
N
15 15 14 N N
N N
14 9 8 9 7
10 8 7 10 13 N
13 6 5 5 6 N 5 5
3 N 3
5 5 5 N N 5

0 0
t t
s s s
ica Pre n 1 n 3 n 5 n 7 n 9 n 11 n 13 n 15 Pos me se se ao ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os es es es o
ni P 1 m es es 1 a
fn si esi esi esi esi si si si 1 me me 1 e f e si esi esi esi esi sin sin sin m m
le e
S S S S S Se Se Se 3 6 el S S S S S Se Se Se 3 6
Te T

Lnea base Tratamiento Seguimiento Lnea base Tratamiento Seguimiento


PCL-S PCLS n=3 n=8
n=3 n=8 n=4 n=4
0+0/12 0+0/12
80 80 S = solapamiento
71 70 71 70
N = no solapamiento
70 70 65
60 60 S E = empate
65
60 60 1+0/12
55
50 39 50 55
N N
40 37 37 N N
46 32 40 46
28 28 30 N N 39 32 N 28 30
N 28
30 24 29 24
30
N N
29 23
20 20 23
N
10 10
0 0
t s s s t
ica Pre n 1 n 3 n 5 n 7 n 9 n 11 n 13 n 15 Pos me se se ao ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os es es es o
n 1 me me 1 ni P 1 m es es 1 a
l e f e s i si si
e e e s i
e s i i
s s i s i
e f e si esi esi esi esi sin sin sin m m
Te S S S S S S e S e S e 3 6
T el S S S S S Se Se Se 3 6

Figura 3. Clculo del porcentaje de datos que exceden la mediana (PEM) para el Figura 4. Clculo del ndice de no solapamiento de todos los pares (NAP) para el
Inventario de Depresin de Beck-II (BDI-II), el Inventario de Ansiedad de Beck (BAI) Inventario de Depresin de Beck-II (BDI-II), el Inventario de Ansiedad de Beck (BAI)
y la Lista de Verificacin del Trastorno por Estrs Postraumtico, versin especfica y la Lista de Verificacin del Trastorno por Estrs Postraumtico, versin especfica
(PCL-S), en el tratamiento de una vctima del terrorismo. (PCL-S), en el tratamiento de una vctima del terrorismo.

mejora respecto a la LB. Una de las ventajas de calcular el NAP con comparacin de una proporcin con la proporcin terica de .50
al anlisis de la curva ROC es que permite obtener el intervalo de que representara la mediana (Parker y Vannest, 2009).
confianza del rea bajo la curva ROC, es decir, el intervalo en el que Para interpretar los valores del NAP, Parker y Vannest (2009) han
con un nivel de confianza de, por ejemplo, un 95% se encuentra el propuesto unos valores de referencia que pueden consultarse en la
NAP verdadero. Este intervalo de confianza permite evaluar el NAP tabla 1. Por otro lado, puesto que el NAP se calcula en una escala de
obtenido con mayor cautela, siendo consciente de sus limitaciones 50% a 100%, donde 50% es el resultado que se esperara por azar y
en funcin del nmero de datos con el que ha sido obtenido, a la vez que indicara que los datos de las dos fases no pueden diferenciarse
que permite estimar si dicho NAP difiere de forma estadsticamente (hay un 50% de probabilidades de que un dato de una fase exceda
significativa de .50 o 50%, lo cual ocurrira cuando el lmite inferior al de la otra), se puede convertir a una escala de 0 a 100% usando la
de su intervalo de confianza al 95% fuera mayor que .50 e inferir, siguiente frmula: NAP0-100 = (NAP / 0.5) 1, de manera que as se
en consecuencia, si se ha producido en la fase de tratamiento un pueden comparar mejor los resultados del NAP con los obtenidos
cambio de nivel respecto a la LB. El clculo del intervalo de confianza con otros ndices como el PND o el PEM y sus respectivos criterios
tambin es posible para el PEM mediante la prueba binomial de de interpretacin (vanse las tablas 1 y 2).
174 J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180

Finalmente, es importante senalar que, como cabra esperar, los La tercera definicin parece la menos arbitraria y, adems,
estudios indican que el NAP supera en su rendimiento estadstico al cuando las dos distribuciones se solapan, como ocurre por ejem-
PND o el PEM (Parker et al., 2011) y de hecho es una de las tcnicas plo en el BDI-II, el BAI o la PCL-S (Sanz, 2013, 2014; Reguera et al.,
para estimar el tamano del efecto en disenos de caso nico que 2014) y en muchos otros instrumentos psicopatolgicos, es la ms
mejor se comportan en presencia de dependencia serial o de un adecuada. Para su clculo se utiliza la siguiente frmula:
cambio en la variabilidad de los datos (Manolov, Solanas, Sierra y  
Evans, 2011). DTn Mp +DTp Mn
C=
DTn DTp

Evaluacin de la significacin clnica de los cambios en la que DTn y DTp representan las desviaciones tpicas del
teraputicos instrumento en la poblacin normal (o general) y en la de pacien-
tes, respectivamente, y Mn y Mp las medias del instrumento en la
En la literatura cientfica se han propuesto tres grandes poblacin normal y en la de pacientes, respectivamente.
estrategias para evaluar la significacin clnica de los cambios Obviamente, para el clculo de C segn esa tercera definicin se
teraputicos: mtodos que comparan al paciente con muestras nor- requiere contar con informacin sobre la media y desviacin tpica
mativas de personas, bien sean muestras normales o bien muestras de las puntuaciones del instrumento en muestras normativas de la
disfuncionales, mtodos basados en la evaluacin subjetiva por poblacin normal y de la poblacin de pacientes; cuando slo se
parte del entorno social del paciente o por parte de expertos y mto- tiene esa informacin de una de las poblaciones, la de pacientes o
dos basados en medidas del impacto social (Kazdin, 1992; Ogles, la normal, habra que utilizar la primera o la segunda definicin,
Lunnen y Bonesteel, 2001). Sin embargo, el mtodo que se ha utili- respectivamente. Sin embargo, hay que advertir que para muchos
zado con mayor frecuencia para evaluar si desde el punto de vista instrumentos psicopatolgicos (p. ej., BDI-II, BAI o PCL-S) el crite-
de la significacin clnica un paciente est igual, ha empeorado o ha rio de dos desviaciones tpicas por debajo (o por encima, segn
mejorado de sus problemas psicolgicos, o incluso si ya se ha recu- la direccin de la funcionalidad) de la media de la poblacin de
perado, es el mtodo comparativo propuesto por Jacobson y Truax pacientes puede dar lugar a una puntuacin extremadamente baja
(1991), que implica una aproximacin estadstica a la significacin (p. ej., 0 en el BDI-II y el BAI y 17 en la PCL-S) que se encuentra muy
clnica (Ogles et al., 2001). por debajo de la media de la poblacin normal (Sanz, 2013, 2014;
Reguera et al., 2014) y, por tanto, sera un criterio de mejora o recu-
peracin excesivamente exigente. De forma parecida, el criterio de
Aproximacin estadstica a la significacin clnica dos desviaciones tpicas por encima (o por debajo, segn la direc-
cin de la funcionalidad) de la media de la poblacin normal puede
El mtodo de Jacobson y Truax (1991) asume que un cambio dar lugar a una puntuacin extremadamente alta (p. ej., 25 en el
clnicamente significativo supondra la vuelta a una poblacin fun- BDI-II y 39 en el BAI) que indica todava niveles moderados de sin-
cional de un paciente que antes del tratamiento perteneca a una tomatologa (Sanz, 2013, 2014) y, por tanto, no puede considerarse
poblacin disfuncional, es decir, que dicho cambio supondra que un criterio de mejora o recuperacin. En estos casos, sera mejor
la puntuacin de un paciente en un instrumento psicopatolgico utilizar una desviacin tpica por encima o por debajo de la media
(p. ej., en el BDI-II, el BAI o la PCL-S) o en un instrumento que mide o bien la propia media o la mediana como valores de C (vase Sanz,
salud mental, calidad de vida, inadaptacin o cualquier otro cons- Perdign y Vzquez, 2003; para una discusin y ejemplificacin de
tructo relacionado relevante ya no pertenece a la distribucin de estas opciones para la segunda definicin de C en relacin con el
puntuaciones en dicho instrumento de una poblacin disfucional BDI-II y el BAI, respectivamente vase Magn, Sanz y Garca-Vera,
(p. ej., los pacientes espanoles con trastornos psicolgicos) sino a la 2008).
distribucin de una poblacin funcional (p. ej., la poblacin general En segundo lugar, el mtodo de Jacobson y Truax (1991) implica
espanola). estimar si el cambio que indican las puntuaciones de un instru-
Para determinar la existencia de un cambio clnicamente signi- mento no se debe a su error de medida sino que refleja un cambio
ficativo en un paciente, el mtodo de Jacobson y Truax (1991) (ver fiable, real en el nivel de sintomatologa, salud mental, calidad de
tambin McGlinchey, Atkins y Jacobson, 2002) implica, en primer vida, inadaptacin, etc. del paciente. Para ello, estos autores propo-
lugar, establecer una puntuacin de corte (C) en el instrumento de nen un ndice de cambio fiable [reliable change index; RCI] que tiene
referencia que el paciente debe alcanzar para pasar de una distribu- en cuenta el error tpico de la diferencia entre dos puntuaciones del
cin disfuncional a una funcional. Para establecer esa puntuacin instrumento (sdif ), el cual depende de su error tpico de medida (se )
de corte, los autores proponen tres definiciones operativas alterna- que, a su vez, depende de su fiabilidad (rxx ):
tivas de C:
x2 x1
RCI =
 sdif
1. La puntuacin que se corresponde con dos desviaciones tpicas   2
2(se )2 =

por debajo o por encima (en la direccin de la funcionalidad) de sdif = 2 sx (1 rxx )
la media de la distribucin disfuncional, de manera que el nivel
de funcionamiento del paciente tras la terapia estara fuera del en las que x2 sera la puntuacin en el instrumento de un
rango de la poblacin disfuncional. paciente en un momento dado (p. ej., postratamiento), x1 la
2. La puntuacin que se corresponde con dos desviaciones tpicas puntuacin en el instrumento en un momento anterior (p. ej.,
por debajo o por encima (en la direccin de la funcionalidad) de pretratamiento), sx la desviacin tpica de las puntuaciones del
la media de la distribucin funcional, de manera que el nivel de instrumento en la poblacin de pacientes y rxx la fiabilidad de
funcionamiento del paciente tras la terapia estara en el rango consistencia interna del instrumento en dicha poblacin. El error
de la poblacin funcional. tpico de la diferencia entre las dos puntuaciones (sdif ) describira
3. La puntuacin que se corresponde con el punto medio ponde- la amplitud de la distribucin de las puntuaciones de cambio que
rado entre la media de la distribucin funcional y la media de se esperara si no ocurriera ningn cambio real, de manera que un
la distribucin disfuncional, de manera que el nivel de funcio- RCI mayor que 1.96 sera muy poco probable (p < .05) que sucediera
namiento del paciente tras la terapia le situara ms cerca de la sin que ocurriera un cambio real. En consecuencia, el cambio en
poblacin funcional que de la disfuncional. las puntuaciones en el instrumento de un paciente determinado
J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180 175

Tabla 3
Aproximacin estadstica a la significacin clnica de los cambios teraputicos para las adaptaciones espanolas de tres medidas de sntomas psicolgicos

Medida e indicador Estado probable del paciente

Recuperado Mejorado Sin cambios Empeorado

Depresin (BDI-II)
- ndice de cambio fiable Disminucin en el Disminucin en el Cambio en el BDI-II Aumento en el
(RCI) BDI-II 10 puntos BDI-II 10 puntos < 10 puntos BDI-II 10 puntos
- Punto de corte (C) entre Puntuacin en el Puntuacin en el
funcional y disfuncional BDI-II < 14 BDI-II 14
Ansiedad (BAI)
- ndice de cambio fiable Disminucin en el Disminucin en el Cambio en el BAI < Aumento en el BAI
(RCI) BAI 10 puntos BAI 10 puntos 10 puntos 10 puntos
- Punto de corte (C) entre Puntuacin en el Puntuacin en el
funcional y disfuncional BAI < 14 BAI 14
Estrs postraumtico (PCL-S)
- ndice de cambio fiable Disminucin en la Disminucin en la Cambio en la PCL-S Aumento en la
(RCI) PCL-S 12 puntos PCL-S 12 puntos < 12 puntos PCL-S 12 puntos
- Punto de corte (C) entre Puntuacin en la Puntuacin en la
funcional y disfuncional PCL-S < 29 PCL-S 29

Nota. BDI-II = Inventario de Depresin de Beck-II; BAI = Inventario de Ansiedad de Beck; PCL-S = Lista de Verificacin del Trastorno por Estrs Postraumtico, versin especfica.

debera superar ese valor del RCI para asegurar que dicho cambio en: http://medhealth.leeds.ac.uk/info/618/clinical psychology
no se debe a los errores de medida del instrumento: dclinpsychol/797/leeds reliable change index.
x2 x1 Combinando los dos criterios basados en la puntuacin C y en
RCI > 1.96 > 1.96 x2 x1 > sdif 1.96 el ndice RCI, se puede evaluar la significacin clnica de los cam-
sdif
bios teraputicos en una investigacin de caso nico cuando incluso
Basndose en estos dos criterios, el mtodo de Jacobson y Truax solo se tienen en cuenta dos datos, la puntuacin pretratamiento y
(1991; McGlinchey et al., 2002) clasifica a un paciente como recu- la puntuacin postratamiento. Sin embargo, la evaluacin ser ms
perado si su puntuacin en un instrumento supone un cambio que completa y llegar a conclusiones ms slidas cuando se tienen en
excede ese valor de 1.96 del RCI y si dicha puntuacin ha superado cuenta ms datos de la fase de LB y de la fase de tratamiento. Por
la puntuacin C, mejorado si la puntuacin supone un cambio que ejemplo, para analizar la significacin clnica de los cambios tera-
excede el valor de 1.96 del RCI, pero no supera la puntuacin C, puticos encontrados en el caso de la vctima del terrorismo se ha
sin cambios si la puntuacin no supera el valor de 1.96 del RCI, y elegido, siguiendo la lgica del ndice PND, el dato ms extremo
empeorado si la puntuacin supone un cambio que supera el valor de la LB, esto es, la puntuacin ms baja en el BDI-II, en el BAI o
de 1.96 del RCI, pero en la direccin de un empeoramiento. en la PCL-S, y se han comparado con l todos los datos de la fase
Por ejemplo, Reguera et al. (2014) encontraron en una muestra de tratamiento-seguimiento, categorizando cada dato en funcin
de 589 vctimas de atentados terroristas que la media y la desvia- de los criterios de la tabla 3 como un indicador de que la vctima
cin tpica de la adaptacin espanola de la PCL-S en las vctimas sin o no haba experimentado cambios en el momento de la evalua-
ningn trastorno psicolgico (n = 314) eran 22.90 y 7.17, respecti- cin en que se tom ese dato o haba empeorado o haba mejorado
vamente, mientras que en las vctimas con trastornos psicolgicos o se podra considerar recuperada. En la figura 5 se ha recogido
(n = 275) eran 42.43 y 15.15, respectivamente; adems, en estas grficamente ese anlisis de la significacin clnica de los cam-
ltimas vctimas la PCL-S mostraba una fiabilidad de consistencia bios teraputicos y, como puede observarse en dicha figura, los
interna (alfa de Cronbach) de .92. Teniendo en cuenta estos datos, resultados indican, en general y para todas las medidas de sinto-
la puntuacin C y el cambio en las puntuaciones de la PCL-S que se matologa psicolgica, que los cambios observados tras la terapia
corresponde con un valor de 1.96 del RCI seran: cognitivo conductual centrada en el trauma fueron clnicamente
significativos, de manera que a partir de la sesin 9 de la terapia
(7.17 42.43) + (15.15 22.90) se encontraron mejoras consistentes que incluso podran conside-
C= = 29.17
(7.17 + 15.15) rarse recuperaciones en el postratamiento y en los seguimientos,
 2
todo los cual pareca indicar que la paciente se haba recuperado de

sdif = 2 15.15 (1 .92) = 6.06
sus trastornos psicolgicos al finalizar el tratamiento y que dicha
x2 x1 > 6.06 1.96 x2 x1 > 11.88
recuperacin se mantena en el seguimiento.
En consecuencia, con dicha adaptacin, un paciente cuya pun- Es ms, si se considera, siguiendo al DSM-IV (APA, 1994/1995),
tuacin en la PCL-S ha descendido 12 puntos o ms y dicha que una persona se ha recuperado de un episodio depresivo mayor
puntuacin es menor de 29 se podra considerar recuperado de su cuando durante 2 meses seguidos hay una remisin completa de
trastorno por estrs postraumtico; si su puntuacin ha descendido los sntomas depresivos, y este criterio temporal se extiende al
12 puntos o ms, pero la misma no es ms baja de 29, se podra con- trastorno por estrs postraumtico y al trastorno de angustia con
siderar mejorado; si su puntuacin no ha descendido 12 puntos, se agorafobia, los datos de la figura 5 sugieren que en la vctima del
podra considerar sin cambios y si la puntuacin refleja un aumento terrorismo se podra hablar de recuperacin del trastorno depre-
de 12 puntos o ms se podra considerar que ha empeorado (vase sivo mayor, en funcin de la evolucin teraputica en el BDI-II, a
la tabla 3). partir del postratamiento y durante todo el seguimiento, y de recu-
Los clculos de C y del RCI para las adaptaciones espanolas peracin del trastorno de angustia con agorafobia y del trastorno
del BDI-II y del BAI se pueden encontrar en Sanz (2013, 2014) por estrs postraumtico, en funcin de la evolucin en el BAI y de
y los valores resultantes se recogen en la tabla 3. Morley y la PCL-S, respectivamente, a partir del seguimiento a los 3 meses y
Dowzer (2014) han desarrollado una aplicacin para Excel de durante todo el seguimiento (excepto en el seguimiento al ano para
Windows que permite realizar fcilmente los clculos de C y la PCL-S, en el que estrictamente slo se observ un mejora).
del RCI con los datos psicomtricos de otros instrumentos y test No obstante, es importante recordar que la valoracin del estado
clnicos adaptados en Espana. Esta aplicacin se puede encontrar de un paciente en relacin con su recuperacin y la posibilidad de
176 J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180

BDI-II
Lnea base
el PND habitual, el cual parece que sobrestima la efectividad cl-
Tratamiento Seguimiento
50
nica del tratamiento (91.6%, 100% y 91.6%, respectivamente; vase
44
45 42
= sin cambios la tabla 2). De forma parecida, se podra utilizar una variante del
40 PEM o del NAP que sustituyera el clculo de los no solapamientos
35
30
31
por el clculo de los datos que indican una mejora o recuperacin
24
25
Recuperada? Recuperada segn los criterios de la aproximacin estadstica de Jacobson y
27
20 Truax (1991).
15
9 7 9 7 7 7
10 4
5 11 2 3 Evaluacin del efecto del tratamiento y validez interna en
Recuperada?
0 los disenos de caso nico
t
ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os es es es o
ni i si si si si in in in P 1 m es es 1 a
lef

e s e e e e s s s m m Las tcnicas e indicadores que se han presentado para analizar
Te S S S S S Se Se Se 3 6
los datos de los disenos de caso nico y evaluar la magnitud y signifi-
cacin clnica de los cambios teraputicos no proporcionan la clave
BAI Lnea base Tratamiento Seguimiento
necesaria para entender cul es el factor responsable de esos cam-
45 41 = sin cambios bios teraputicos. De hecho, tampoco el anlisis visual o el anlisis
40 37
Recuperada? Recuperada? Recuperada estadstico de los datos de los disenos de caso nico proporcionan
35
30 35 27 dicha clave. El anlisis estadstico slo indica si un cambio es esta-
25 dsticamente significativo, es decir, si existen prueba estadsticas
20 14 = mejorada = 17 de que hay un cambio, pero no indica qu ha causado ese cambio.
15
9 Las conclusiones sobre qu factor o factores son los responsables
10 8 5 7
13 6 3 5 5 del cambio y, en concreto, las conclusiones sobre si el tratamiento
5 Recuperada?
0
es el responsable se basan ms en las caractersticas del diseno que
t en la simple demostracin de la significacin estadstica del cambio
ca Pre n 1 n 3 n 5 n 7 n 9 11 13 15 os es es es o
ni i si si si si in in in P 1 m es es 1 a o en la obtencin de un cambio grande o clnicamente significativo.
l ef e s e e e e s s
S Se Se Se s m m
3 6
Te S S S S La extraccin de conclusiones sobre la relacin causa-efecto
entre el tratamiento y los cambios teraputicos observados implica
PCL-S Lnea base Tratamiento Seguimiento la utilizacin de un diseno adecuado de caso nico que descarte el
80
= sin cambios mayor nmero de amenazas a su validez interna y no depende en
71
70
70 65
Mejorada Mejorada Recuperada cambio de las tcnicas que se utilicen para analizar los datos. Por
60
60 tanto, el anlisis de la magnitud y significacin clnica del cambio
50 en un diseno A-B no eleva su capacidad para descartar las amenazas
55
40 46
37 39
32
a la validez interna y sacar conclusiones causales sobre los efectos
28 28 30
30 Mejorada 24 del tratamiento, ni tampoco lo hacen el anlisis visual o el an-
20 29
23
lisis estadstico. En contraposicin, los disenos experimentales de
Recuperada? Recuperada?
10 caso nico tales como los disenos de retirada A-B-A-B, los disenos
0 de LB mltiple o los disenos de tratamientos alternos comparten
t s s s una serie de caractersticas (p. ej., retirada y presentacin alterna
ica Pre n 1 n 3 n 5 n 7 n 9 n 11 n 13 n 15 Pos me se se ao
n si esi esi esi esi si si si e e 1
le
f
S e S S S S Se Se Se
1 m m
3 6 del tratamiento, de la LB o de ambas, evaluacin de la conducta
Te
de forma continua en el tiempo y bajo diferentes condiciones) que
Figura 5. Aproximacin estadstica a la significacin clnica aplicada al anlisis de combaten directamente las amenazas a la validez interna (p. ej., his-
la evolucin teraputica de una vctima del terrorismo en el Inventario de Depresin toria, maduracin, regresin a la media, administracin repetida de
de Beck-II (BDI-II), el Inventario de Ansiedad de Beck (BAI) y la Lista de Verificacin pruebas) y permiten eliminar explicaciones alternativas a la hip-
del Trastorno por Estrs Postraumtico, versin especfica (PCL-S). tesis de que ha sido el tratamiento, y nicamente el tratamiento, el
responsable del cambio observado en la conducta (Kazdin, 1992).
darlo de alta debera tener en cuenta la informacin relevante sobre No obstante, se pueden planificar las investigaciones con diseno
otros problemas del paciente, sobre su nivel de funcionamiento en A-B para que renan algunas de esas caractersticas y as aumentar
sus actividades laborales o sociales habituales o en sus relaciones el grado en el cual se pueden descartar las amenazas a la validez
con los dems, etc. interna o hacerlas poco plausibles. Para ello, se puede planear:

Magnitud del cambio teraputico clnicamente significativo 1) La obtencin de mltiples medidas del problema o conducta
clave tanto durante la LB como durante el tratamiento y des-
A partir de la aproximacin estadstica de Jacobson y Truax pus de que este haya finalizado (seguimientos), cuantas ms
(1991), se podra combinar la evaluacin de la significacin clnica mejor, de manera que se pueda establecer una LB relativamente
del cambio teraputico con alguno de los ndices de tamano del estable y se puedan apreciar tambin cambios estables durante
efecto mencionados antes para as crear un ndice de la magnitud el tratamiento y despus del mismo.
del cambio teraputico clnicamente significativo o un ndice de la 2) La replicacin o comparacin de los cambios teraputicos en el
efectividad clnicamente significativa del tratamiento. Por ejemplo, mismo paciente mediante la obtencin de mltiples indicadores
se podra utilizar una variante del PND, definida como el porcentaje del problema o de la conducta clave (p. ej., diversas medidas de
de datos de la fase de tratamiento que son mejoras o recuperacio- disfuncionalidad o de funcionalidad o de ambas).
nes clnicamente significativas respecto al dato ms extremo de 3) La replicacin o comparacin de los cambios teraputicos en
la LB. Como puede observarse en la figura 5, esta variante del PND varios pacientes, a ser posible heterogneos en cuanto a sus
resultara, en el caso del tratamiento aplicado a la vctima del terro- caractersticas sociodemogrficas y clnicas.
rismo, en ndices de efectividad clnicamente significativa de 83.3%,
91.6% y 83.3% para el BDI-II, el BAI y la PCL-S, respectivamente, ndi- Por otro lado, otras circunstancias que no estn bajo control del
ces que complementan y matizan la informacin proporcionada por clnico o investigador pueden ayudar a que una investigacin con
J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180 177

un diseno A-B pueda descartar ciertas amenazas a la validez interna estadstica o su magnitud, han podido conseguir de manera fiable
y hacer inferencias ms firmes sobre el papel causal del tratamiento que un paciente que antes del tratamiento perteneca a una pobla-
en los cambios que se observan. Por ejemplo, si los cambios terapu- cin disfuncional vuelva a la poblacin funcional. La aproximacin
ticos que finalmente se encuentran en la investigacin aparecen de estadstica de Jacobson y Truax (1991) se puede calcular tambin
forma inmediata tras la aplicacin del tratamiento y son de gran con un nmero muy pequeno de datos en la LB o en el tratamiento,
magnitud es mucho ms plausible que el responsable del cam- incluso con tan solo dos datos, pretratamiento y postratamiento
bio sea el tratamiento en lugar de otros factores (p. ej., historia, (o seguimiento), y su clculo es tambin sumamente simple y
maduracin). fcil, permitiendo considerar a un paciente como sin cambios,
En este sentido, en el caso de la vctima del terrorismo tratada empeorado, mejorado o recuperado.
con terapia cognitivo conductual centrada en el trauma se cum- La aplicacin de ambas estrategias al anlisis de los datos obteni-
pli esta ltima circunstancia (cambios inmediatos y grandes) as dos tras aplicar terapia cognitivo conductual centrada en el trauma
como dos de las caractersticas anteriormente mencionadas (1 y 2) a una vctima del terrorismo, que presentaba un trastorno por estrs
que permiten eliminar explicaciones alternativas a la hiptesis de postraumtico simultneamente con un trastorno depresivo mayor
que ha sido la terapia la responsable del cambio observado en la y un trastorno de angustia con agorafobia, ha permitido consta-
sintomatologa de depresin, ansiedad y estrs postraumtico. tar que dicho tratamiento produce cambios teraputicos grandes y
clnicamente significativos en la sintomatologa depresiva, ansiosa
y de estrs postraumtico. Estos cambios corroboran en un caso
Conclusiones con una elevada comorbilidad la eficacia y utilidad clnica que la
terapia cognitivo conductual centrada en el trauma ha demostrado
La utilizacin de disenos de caso nico en la prctica habitual previamente para el trastorno por estrs postraumtico (Garca-
de la psicologa clnica y de la salud puede aumentar la base de Vera et al., en prensa), adems de ejemplificar la utilidad de ambas
conocimientos cientficos sobre la eficacia y utilidad clnica de los tcnicas de anlisis.
tratamientos psicolgicos adems de reducir la brecha que existe
entre investigacin y prctica clnica. Uno de los obstculos para
Extended Summary
realizar ese tipo de investigaciones tiene que ver con la manera de
analizar sus datos, puesto que el anlisis visual tradicional presenta
The use of single case designs in the practice of clinical psycho-
problemas como, por ejemplo, la escasa fiabilidad entre jueces o
logy and health may increase the scientific knowledge base on the
el aumento en errores de tipo I. Para paliar estos problemas se
efficacy and clinical utility of psychological treatments and reduce
ha propuesto la utilizacin complementaria de un buen nmero
the gap between research and clinical practice. One obstacle for
de anlisis estadsticos, pero no existe acuerdo sobre cul sera el
such a research concerns how to analyze single case data, since
ms adecuado y, adems, muchos de ellos son impracticables con
the traditional visual analysis of graphed data presents problems
el tipo de disenos de caso nico que se suelen llevar a cabo en la
such as poor inter-rater reliability or an increased risk of type I
prctica clnica, ya que tales anlisis exigen un nmero demasiado
errors. To solve these problems, a variety of statistical analyses has
grande de datos en las fases de LB y de tratamiento, requieren unos
been proposed as a supplement to visual analysis, but there is no
conocimientos estadsticos y un trabajo computacional excesivos
consensus regarding the most appropriate statistical technique. In
o necesitan retrasar la puesta en marcha del tratamiento hasta el
addition, many of them are impracticable with the kind of single
momento que se decida por un procedimiento aleatorio, sin tener
case designs that are often carried out in clinical practice, since
en cuenta las razones ticas, prcticas y clnicas que dictan iniciar
such statistical techniques require large numbers of data during
el tratamiento tan pronto como sea posible.
the baseline and treatment phases, demand excessive statistical
En el presente trabajo se han presentado dos tcnicas para el
knowledge and computational work, or need to delay the start of
anlisis de los datos de un estudio con diseno de caso nico que
treatment to a time determined by a random procedure, regard-
permiten obtener dos tipos de informacin muy relevantes en
less of ethical, practical, and clinical reasons that dictate to start
la investigacin de los tratamientos basados en la evidencia: el
treatment as soon as possible.
tamano del efecto del tratamiento (o magnitud del cambio tera-
This paper presents two techniques for the data analysis of single
putico) y la significacin clnica de dicho efecto o cambio. Adems,
case designs in psychological treatment research: indices of data
dichas tcnicas son especialmente relevantes en los casos en que
overlap between phases to assess the size of treatment effect (or
esos disenos se realizan en la prctica clnica, aunque obviamente
the magnitude of therapeutic change) and a statistical approach to
tambin son tiles en otros contextos de investigacin.
assess the clinical significance of treatment effect.
La primera tcnica consiste en estimar la magnitud del cambio
teraputico o tamano del efecto del tratamiento utilizando ndices
basados en el no solapamiento de los datos entre fases como, por An Example of a Single Case Design: The Treatment of a
ejemplo, el PND, el PEM y el NAP. Estos ndices cuantifican el cambio Victim of Terrorism
teraputico y valoran su magnitud de forma ms objetiva que el
anlisis visual y, por tanto, son un perfecto complemento para este To illustrate the computation and application of the techniques
anlisis. Adems, estos ndices pueden utilizarse con todo tipo de for assessing the size and clinical significance of treatment effect,
disenos de caso nico, se pueden calcular incluso con un nmero baseline and treatment/follow-up data were obtained from the
muy pequeno de datos en la LB o en el tratamiento y su clculo treatment of a 69-year-old female victim of terrorism who suffered
es sumamente simple y fcil, permitiendo considerar si el cambio from posttraumatic stress disorder, major depressive disorder, and
teraputico tras un tratamiento ha sido dbil, moderado o grande panic disorder with agoraphobia. She received a 16-session treat-
y, por tanto, el tratamiento es cuestionable o no efectivo, bastante ment program of trauma-focused cognitive-behavioral therapy in
efectivo o muy efectivo. combination with specific therapeutic techniques for depression
La segunda tcnica, complementaria con la anterior, consiste en and panic (e. g., pleasant activity scheduling, interoceptive expo-
valorar la significacin clnica de los cambios teraputicos a travs sure) (Garca-Vera et al., in press; Moreno et al., manuscrito en
de la aproximacin estadstica a dicha significacin que proponen edicin editorial). She completed the Spanish adaptations of the
Jacobson y Truax (1991). Esta aproximacin permite estimar en Beck Depression Inventory-II (BDI-II; Beck, Steer, & Brown, 2011)
qu medida los cambios teraputicos, ms all de su significacin or a short version of the BDI-II (BDI-II-SF; Sanz, Garca-Vera, Fortn,
178 J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180

& Espinosa, 2005), the Beck Anxiety Inventory (BAI; Beck & Steer, in the victim of terrorism after a treatment program of trauma-
2011) or a short version of the BAI (BAI-PC; Beck, Steer, Ball, Ciervo, focused cognitive-behavioral therapy was large and suggest that
& Kabat, 1997; Sanz & Garca-Vera, 2012), and the PTSD Checklist, this treatment was effective.
specific version (PCL-S; Weathers, Litz, Herman, Huska, & Keane,
1993; Vzquez, Prez-Sales, & Matt, 2006), at a telephone scree-
ning assessment, a pretreatment assessment, each two therapy
sessions, a post-treatment assessment, and 1-month, 3-month, 6- Assessment of the Clinical Significance of Therapeutic
month, and 1-year follow-up assessments. BDI-II, BAI, and PCL-S Changes
data for the baseline phase were taken from the screening, pretreat-
ment, and 1st -session assessments, and BDI-II, BAI and PCL-S data The magnitude of therapeutic change (or the size of
for the treatment/follow-up phase were taken from the remaining treatment effect) is not the same as its clinical significance. Alt-
assessments (see Fig. 1). hough large effect sizes are usually clinically significant, they do not
necessarily indicate that improvements are meaningful or impor-
tant in the experience of the patient.
Assessment of the Magnitude of Therapeutic Change or the Jacobson and Truaxs (1991) statistical approach to clinical signi-
Size of Treatment Effect ficance can be used to assess the clinical significance of therapeutic
changes. This approach assumes that a clinically significant change
There are many indices of data overlap between phases to assess occurs when the score of a patient in an instrument measuring
the size of treatment effect in single case designs (Parker, Vanest, & a relevant construct (symptomatology, mental health, maladjust-
Davis, 2011). This article describes the definition, calculation, appli- ment, quality of life, etc.) no longer belong to the score distribution
cation, advantages, and limitations of three indices: percentage of of a dysfunctional population, but it returns to the score distribution
non-overlapping data (PND), percentage of data points exceeding of a functional population.
the median (PEM), and non-overlap of all pairs (NAP), since the Jacobson and Truaxs (1991) method involves, firstly, establis-
first two are widely used and ease of calculation and the third hing a cut-off point (C) for each client that must be crossed
one shows good statistical properties (e.g., good statistical power, in moving from the dysfunctional to the functional distribution.
adequate sensitivity). The reporting of multiple indices is highly Secondly, that method involves determining whether a patients
recommended to determine whether consistent results are obser- change in instrument scores (e.g., from pre- to post-test) is relia-
ved (Maggin, Briesch, & Chafouleas, 2013). Although non-overlap ble, rather than simply an artifact of measurement error. To assess
indices are more robust than indices of mean or median level chan- this, Jacobson and Truax (1991) proposed a reliable change index
ges across phases, most of them are insensitive to positive baseline (RCI) that each patient has to pass in order to demonstrate that his
trend, and they should not be used, or at least they should be used or her change in symptomatology, mental health, quality of life, or
with caution, when there is a positive trend in the baseline phase any relevant construct is not simply due to measurement error. This
and a strong positive trend in the treatment phase. RCI takes into account the standard error of the difference between
PND is defined as the percentage of treatment phase data excee- two scores that depends on the standard error of measurement
ding the single most extreme baseline data point (the lowest or that, in turn, depends on reliability and standard deviation of test
the highest data point according to the direction of the functiona- scores.
lity) (Scruggs, Mastroiperi, & Casto, 1987). PND is the most widely Applying Jacobson and Truaxs (1991) method to the data of the
published and the basis of more than 40 meta-analyses (Maggin Spanish adaptation of the PCL-S in victims with and without mental
et al., 2013; Scruggs & Mastropieri, 2013). When an outlier is pre- disorders (see Table 3 and Reguera et al., 2014), a patient could be
sent in the baseline phase, PND can distort the size of treatment classified as recovered if his or her PCL-S score shows a decrease
effect. PEM was developed by Ma (2006) to solve this problem. of 12 points or greater and is lower than 29 (i.e., passes both RCI
PEM is defined as the percentage of treatment phase data excee- and cut-off criteria), improved if his or her PCL-S score shows a
ding the median of the baseline phase. It has also been used as the decrease of 12 points or greater but is not lower than 29 (i.e., passes
effect size index in meta-analysis of single case designs. PEM assu- RCI criterion, but not the cut-off criterion), unchanged if his or her
mes that the median is a good summary for baseline data, but it is PCL-S score does not show a decrease or an increase of 10 points
not the case for the data often seen in single case design. NAP was 14 (i.e., does not pass RCI criterion in any direction), or deteriora-
developed mainly to improve upon PEM (and PND) by individually ted if his or her BAI score shows an increase of 10 points of greater
comparing all baseline and treatment phase data points (Parker & (i.e., passes RCI criteria in a worsening direction). Similar guide-
Vannest, 2009). lines have also been developed for the Spanish adaptations of the
NAP is defined as the percentage of all pairwise comparison BDI-II and BAI (Sanz, 2013, 2014). These three guidelines are displa-
across baseline and treatment phases, which show non-overlap (or yed in Table 3 and their application to the treatment of the victim
improvement) across phases. NAP equals the area under the curve of terrorism is depicted graphically in Figure 5. The results of this
(AUC) from a receiver operator characteristic curve (ROC) analy- application that the therapeutic change observed in the victim of
sis and, in this framework, is interpreted as the probability that a terrorism after a treatment program of trauma-focused cognitive-
data point drawn at random from the treatment phase will exceed behavioral therapy was clinical significant. They also suggest that
(overlap) that of a data point drawn at random from the baseline the patient had recovered from their psychological disorders at the
phase. AUC, its confidence interval, and its inference testing are cal- end of treatment and remained recovered throughout the follow-
culated by most software package used for full statistical analysis up.
(e. g., SPSS, EPIDAT). Finally, the statistical approach to clinical significance and the
PND and PEM can range from 0% to 100%, whereas NAP range non-overlap indices could be combined to assess the size of clinica-
from 50% to 100%, although it can be rescaled to 0% to 100% scale. lly significant effects of a treatment. So, it may be very informative
Interpretation guidelines for all indices are available in Table 1. The to calculate PND, PEM, or NAP as the percentage of treatment phase
calculation of PND, PEM, and NAP with the data of the victim of data showing clinically significant improvement or recovery in
terrorism is depicted graphically in figures 2, 3 and 4, respecti- comparison, respectively, with the single most extreme baseline
vely, and the resulting values and interpretations are displayed in data point, the median of baseline data points or all baseline data
Table 2. These values indicate that the therapeutic change observed points.
J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180 179

Assessment of Treatment Effect and Internal Validity in Barlow, D. H. y Hersen, M. (1988). Disenos experimentales de caso nico. Estrategias
Single Case Designs para el estudio del cambio conductual. Barcelona: Martnez Roca (orig. 1984).
Beck, A. T. y Steer, R. A. (2011). Manual. BAI. Inventario de Ansiedad de Beck (adaptacin
espanola: Sanz, J.). Madrid: Pearson Educacin.
Techniques and indicators that have been presented to analyze Beck, A. T., Steer, R. A., Ball, R., Ciervo, C. A. y Kabat, M. (1997). Use of the Beck Anxiety
data in single case designs and assess the magnitude and clinical and Beck Depression Inventories for primary care with medical outpatients.
Assessment, 4, 211219.
significance of therapeutic changes do not provide the necessary Beck, A. T., Steer, R. A. y Brown, G. K. (2011). Manual. BDI-II. Inventario de Depresin de
key to understanding the factor responsible for these therapeutic Beck-II (adaptacin espanola: Sanz, J. y Vzquez, C.). Madrid: Pearson Educacin.
changes. Causal conclusions about whether treatment is responsi- Bono Cabr, R. y Arnau Gras, J. (2014). Disenos de caso nico en ciencias sociales y de
la salud. Madrid: Sntesis.
ble for changes are based more on the design features of a single
Campbell, J. M. y Herzinger, C. V. (2010). Statistics and single subject research met-
case study than on obtaining a large or clinically significant change hodology. En D. L. Gast (Ed.), Single subject research methodology in behavioral
or even a statistically significant change. In this sense, single-case sciences (pp. 417453). New York: Routledge.
Garca-Vera, M.P., Moreno, N., Sanz, J., Gutirrez, S., Gesteira, C., Zapardiel, A. y
experimental designs such as the A-B-A-B, multiple-baseline, and
Marotta-Walters, S. (en prensa). Eficacia y utilidad clnica de los tratamien-
alternating-treatment designs provide arrangements that rule out tos para las vctimas adultas de atentados terroristas: una revisin sistemtica.
threats to internal validity and allow to draw causal conclusions Behavioral Psychology-Psicologa Conductual.
about the effects of a treatment. However, the single case design Jacobson, N. S. y Truax, P. (1991). Clinical significance: a statistical approach to defi-
ning meaningful change in psychotherapy research. Journal of Consulting and
typically carried out in the clinical practice (the A-B design, that Clinical Psychology, 59, 1219.
is, the design with only one baseline phase and only one treat- Kazdin, A.E. (1988). Anlisis estadsticos para los disenos experimentales de caso
ment phase) can be arranged to greatly increase the extent to nico. En D. H. Barlow y M. Hersen (1988), Disenos experimentales de caso
nico. Estrategias para el estudio del cambio conductual (pp. 255-285). Barcelona:
which threats to internal validity are ruled out or made implausi- Martnez Roca (orig. 1984).
ble. Some of these arrangements involve increasing the number and Kazdin, A. E. (1992). Research design in clinical psychology (2nd ed.). Needham
timing of the assessment occasions during both the baseline and Heights, MA: Allyn & Bacon.
Kazdin, A. E. (2008). Evidence-based treatment and practice. New opportunities to
treatment/follow-up phases, replicating therapeutic changes in the bridge clinical research and practice, enhance the knowledge base, and improve
same patient across multiple indicators of his or her psychological patient care. American Psychologist, 63, 146159.
problems or disorders, and replicating therapeutic changes across Kratochwill, T. R., Hitchcock, J. H., Horner, R. H., Levin, J. R., Odom, S. L., Rindskopf, D.
M. y Shadish, W. R. (2013). Single-case intervention research design standards.
multiple patients, especially with a heterogeneous set of patients. Remedial and Special Education, 34, 2638.
Kratochwill, T. R., y Levin, J. R. (Eds.). (1992). Single-case research design and analysis:
new directions for psychology and education. London: Lawrence Erlbaum Asso-
Conclusions ciates.
Labrador Encinas, F. J. y Crespo Lpez, M. (Coords.) (2012). Psicologa clnica basada
This paper has presented two techniques for the data analysis of en la evidencia. Madrid: Pirmide.
Ma, H. H. (2006). An alternative method for quantitative synthesis of single-subject
single case designs in psychological treatment research: indices of researches: percentage of data points exceeding the median. Behavior Modifica-
data overlap between phases to assess the size of treatment effect tion, 30, 598617.
(or the magnitude of therapeutic change) and a statistical approach Ma, H. H. (2009). The effectiveness of intervention on the behavior of individuals
with autism: a meta-analysis using percentage of data points exceeding the
to assess the clinical significance of treatment effect. These tech-
median of baseline phase (PEM). Behavior Modification, 3, 339359.
niques are very informative and ease to use and, therefore, can Magn, I., Sanz, J. y Garca-Vera, M. P. (2008). Psychometric properties of a Spanish
improve the visual analysis traditionally used in single case stu- version of the Beck Anxiety Inventory (BAI) in general population. The Spanish
Journal of Psychology, 11, 626640.
dies. Furthermore, they can foster the use and analysis of single
Maggin, D. M., Briesch, A. M. y Chafouleas, S. M. (2013). An application of the What
case designs in clinical practice and at doing so they can reduce the Works Clearinghouse standards for evaluating single-subject research: synthe-
gap between research and clinical practice. The usefulness of these sis of the self- management literature-base. Remedial and Special Education, 34,
two techniques has been illustrated in the case of the treatment 4458.
Manolov, R., Solanas, A., Sierra, V. y Evans, J. J. (2011). Choosing among techni-
of a victim of terrorism with posttraumatic stress disorder, major ques for quantifying single-case intervention effectiveness. Behavior Therapy,
depressive disorder, and panic disorder with agoraphobia. Their 42, 533545.
results allow us to state that trauma-focused cognitive-behavioral McGlinchey, J. B., Atkins, D. C. y Jacobson, N. S. (2002). Clinical significance methods:
which one to use and how useful are they? Behavior Therapy, 33, 529550.
therapy is followed by large and clinically significant therapeutic Moreno, N., Sanz, J., Garca-Vera, M. P., Gesteira, C., Gutirrez, S., Zapardiel, A.,
changes in depressive, anxious, and posttraumatic stress sympto- . . . Marotta-Walters, S. (manuscrito en revisin editorial). Trauma-focused
matology. The efficacy and clinical usefulness of trauma-focused cognitive-behavioral therapy in victims of terrorist attacks: an effectiveness study
with mental disorders at very long term.
cognitive-behavioral therapy have been previously shown for post- Morley, S. y Dowzer, C. N. (2014). Manual for the Leeds Reliable Change Indicator:
traumatic stress disorder (Garca-Vera et al., in press). Results found simple Excel(tm) applications for the analysis of individual patient and group data.
with the two statistical techniques presented in this paper suggest Leeds, UK: University of Leeds.
Ogles, B. M., Lunnen, K. M. y Bonesteel, K. (2001). Clinical significance: history,
that their clinical usefulness can be extended to cases with a high
application, and current practice. Clinical Psychology Review, 21, 421446.
psychopathological comorbidity. Parker, R. I. y Brossart, D. F. (2003). Evaluating single-case research data: a compa-
rison of seven statistical methods. Behavior Therapy, 34, 189211.
Parker, R. I. y Vannest, K. J. (2009). An improved effect size for single case research:
Financiacin NonOverlap of All Pairs (NAP). Behavior Therapy, 40, 357367.
Parker, R. I., Vannest, K. J. y Davis, J. L. (2011). Effect size in single-case research: a
review of nine nonoverlap techniques. Behavior Modification, 35, 303322.
Este artculo ha sido en parte posible gracias a la ayuda de inves- Preston, D. y Carter, M. (2009). A review of the efficacy of the picture exchange com-
tigacin del Ministerio de Ciencia e Innovacin (PSI2011-26450). munication system intervention. Journal of Autism and Developmental Disorders,
39, 11471486.
Reguera, B., Mnguez, A., Barranco, A., Rubert, L., Calle, A., Rodrguez, A., . . .
Conflicto de intereses Sanz, J. (2014). La Lista de Verificacin del Trastorno por Estrs Postraumtico
(PCL): propiedades psicomtricas de una versin espanola en vctimas de terro-
rismo. Comunicacin presentada en el X Congreso Internacional de la Sociedad
Los autores de este artculo declaran que no tienen ningn con- Espanola para el Estudio de la Ansiedad y el Estrs (SEAS). Valencia, 11-13 de
flicto de intereses. septiembre.
Sanz, J. (2013). 50 anos de los Inventarios de Depresin de Beck: consejos para la
utilizacin de la adaptacin espanola del BDI-II en la prctica clnica. Papeles del
Referencias Psiclogo, 34, 161168.
Sanz, J. (2014). Recomendaciones para la utilizacin de la adaptacin espanola del
American Psychiatric Association. (1995). DSM-IV. Manual diagnstico y estadstico Inventario de Ansiedad de Beck (BAI) en la prctica clnica. Clnica y Salud, 25,
de los trastornos mentales. Barcelona: Masson (orig. 1994). 3948.
180 J. Sanz y M.P. Garca-Vera / Clnica y Salud 26 (2015) 167180

Sanz, J. y Garca-Vera, M. P. (2012). Propiedades psicomtricas de una versin breve Scruggs, T. E., Mastropieri, M. A. y Casto, G. (1987). The quantitative synthesis of
espanola del Inventario de Ansiedad de Beck (BAI) (manuscrito no publicado). single subject research: methodology and validation. Remedial and Special Edu-
Facultad de Psicologa. Universidad Complutense de Madrid. cation, 8, 2433.
Sanz, J., Garca-Vera, M. P., Fortn, M. y Espinosa, R. (2005). Desarrollo y propiedades Scruggs, T. E., Mastropieri, M. A., Cook, S. B. y Escobar, C. (1986). Early interventions
psicomtricas de una versin breve espanola del Inventario para la Depresin de for children with conduct disorders: a quantitative synthesis of single-subject
Beck-II (BDI-II). Comunicacin presentada en el V Congreso Iberoamericano de research. Behavioral Disorders, 11, 260271.
Evaluacin Psicolgica. Buenos Aires (Argentina), 1-2 de julio. Swets, J. (1988). Measuring the accuracy of diagnostic systems. Science, 240,
Sanz, J., Perdign, L. A. y Vzquez, C. (2003). Adaptacin espanola del Inventario 12851293.
para la Depresin de Beck-II (BDI-II): 2. Propiedades psicomtricas en poblacin Vzquez, C., Prez-Sales, P. y Matt, G. (2006). Post-Traumatic Stress Reactions Follo-
general. Clnica y Salud, 14, 249280. wing the March 11, 2004 Terrorist Attacks in a Madrid Community Sample: A
Scruggs, T. E. y Mastropieri, M. A. (1998). Summarizing single-subject research: Cautionary Note about the Measurement of Psychological Trauma. The Spanish
issues and applications. Behavior Modification, 22, 221242. Journal of Psychology, 9, 6174.
Scruggs, T. E. y Mastropieri, M. A. (2013). PND at 25: past, present, and future trends Weathers, F. W., Litz, B. T., Herman, D. S., Huska, J. A. y Keane, T. M. (1993). The PTSD
in summarizing single-subject research. Remedial and Special Education, 34, Checklist (PCL): Reliablity, validity, and diagnostic utility. Paper presented at the
919. 9th Annual Conference of the ISTSS San Antonio.

También podría gustarte