Está en la página 1de 18

Clínica y Salud, 2007, vol. 18 n.° 3 - Págs. 287-304.

ISSN: 1135-0806

ARTÍCULOS

Algunos problemas con la utilización


de la adaptación española del
Inventario Clínico Multiaxial de Millon-II
(MCMI-II) con fines diagnósticos
Some troubles with the use of the
Spanish adaptation of Millon Clinical
Multiaxial Inventory-II (MCMI-II) for
diagnostic purposes
JESÚS SANZ*

RESUMEN

Uno de los objetivos del Inventario Clínico Multiaxial de Millon-II (MCMI-II)


es identificar el diagnóstico específico que mejor se aplica a un paciente, para
lo cual propone puntos de corte en puntuaciones tasa base (TB) que están
avalados por los resultados satisfactorios de un estudio de validación diagnós-
tica. La adaptación española del MCMI-II presenta varias inconsistencias en
los baremos que sirven para transformar las puntuaciones directas a TB (erro-
res tipográficos, altas discrepancias con los baremos americanos, cambios de
baremos entre ediciones) y propone puntos de corte TB para el diagnóstico
cuya validez no viene avalada por ningún tipo de estudio empírico. El objetivo
del presente artículo es analizar esos problemas y sus repercusiones, así como
sugerir algunas recomendaciones al respecto, la más importante de las cuales
implica no utilizar la adaptación española del MCMI-II con fines diagnósticos
hasta que se obtengan datos que sustenten su validez diagnóstica.

* Departamento de Persnalidad, Evaluación y Psicología Clínica. Universidad Complutense de


Madrid.

Clínica y Salud, 2007, vol. 18 n.º 3 287


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

ABSTRACT

One of the aims of Millon Clinical Multiaxial Inventory-II (MCMI-II) is to iden-


tify the best diagnosis for patients. In order to achieve this goal, the MCMI-II
suggests cutoff points in terms of base rate (BR) scores that are supported by
satisfactory results in a diagnostic validity study. The three editions of the Spa-
nish adaptation of the MCMI-II show a number of inconsistencies concerning
norms to translate raw scores into BR –misprints, high discrepancies with
American norms, change of norms among editions. There is also a suggestion
for diagnostic BR cutoff points which validity is not supported by any empirical
research. This paper analyzes problems and implications stemming from this
situation. Some suggestions and recommendations are also made to overco-
me those problems –the most important of which is not to use the Spanish
adaptation of the MCMI-II for diagnostic purposes until data to support diag-
nostic validity have been gathered.

PALABRAS CLAVE

Diagnóstico, Inventario Clínico Multiaxial de Millon-II, Validez, Adaptación.

KEY WORDS

Diagnosis, Millon Clinical Multiaxial Inventory-II, Validity, Adaptation.

288 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

INTRODUCCIÓN en revistas científicas 1 . En casi la


mitad de estos estudios, el MCMI-II
El Inventario Clínico Multiaxial de fue empleado como instrumento
Millon (Millon Clinical Multiaxial diagnóstico, de forma que se diag-
Inventory; MCMI), a lo largo de sus nosticó la presencia de determina-
tres versiones (MCMI-I, MCMI-II y dos trastornos psicológicos utilizan-
MCMI-III; Millon, 1983, 1987; Millon, do como único criterio puntuacio-
Millon y Davis, 1994), se ha conver- nes superiores a los puntos de corte
tido en uno de los instrumentos más en alguna de sus escalas.
prestigiosos y utilizados internacio-
nalmente para la evaluación de la Desgraciadamente, la adaptación
psicopatología tanto en ámbitos española del MCMI-II presenta algu-
profesionales como de investigación nos problemas con sus baremos y
(Butcher y Rouse, 1996; Piotrowski, con su validación diagnóstica que
1997). Así, una búsqueda en la base afectan a su utilización como instru-
de datos PsycINFO mediante las mento diagnóstico de los trastornos
palabras “MCMI” o “Millon Clinical mentales, problemas que pueden
Multiaxial Inventory” en los campos conducir a los profesionales e inves-
título y resumen para el período tigadores a realizar inferencias erró-
comprendido entre 1977, fecha de neas sobre si sus pacientes presen-
aparición de la primera versión del tan o no un trastorno clínico o un
MCMI, y enero de 2007, dio lugar a trastorno de personalidad. El objeti-
1013 referencias, de las cuales 678 vo del presente artículo es exponer
se referían a artículos de revistas en esos problemas y sus repercusio-
los cuales se había utilizado o anali- nes, así como sugerir algunas reco-
zado el MCMI. mendaciones al respecto.

En 1998 se publicó la adaptación


española del MCMI-II. Desde enton- EL MCMI-II COMO
ces, este instrumento también ha INSTRUMENTO DIAGNÓSTICO
ido ganando en popularidad entre
los investigadores y profesionales Para entender los problemas que
españoles, como lo demuestra el presenta la adaptación española del
hecho de que en 1999 se publicara MCMI-II como herramienta diagnós-
una segunda edición de dicha tica parece conveniente revisar los
adaptación y en 2002 una tercera. objetivos para los cuales se diseño
Asimismo, en los últimos años la el inventario y cuales son sus princi-
adaptación española del MCMI-II ha pales características con relación a
sido utilizada en más de una treinte- esos objetivos. En el manual del ins-
na de estudios realizados por inves- trumento se nos dice que: “el princi-
tigadores españoles y publicados pal objetivo del MCMI-II es propor-

1 Los lectores interesados pueden solicitar al autor una lista de los estudios españoles que han uti-

lizado la adaptación española del MCMI-II.

Clínica y Salud, 2007, vol. 18 n.º 3 289


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

cionar información a los clínicos (...) de los pacientes de una muestra


en tareas de evaluación y tratamien- representativa que completen el
to de personas con dificultades cuestionario y, por tanto, dicho pun-
emocionales e interpersonales. El to de corte diagnóstico reproduciría
perfil de las puntuaciones de las a la postre el 25% de pacientes con
escalas del MCMI-II puede servir diagnóstico de depresión de la
para identificar qué grupo de perso- población total de pacientes con
nas con dificultades emocionales y trastornos mentales.
personales puede requerir una eva-
luación más intensa o atención pro- Por tanto, el uso de transforma-
fesional. [...] Más específicamente, ciones de TB pretende perfeccionar
los puntos de corte individuales la eficiencia diagnóstica del MCMI-II
para cada escala del MCMI-II pue- ya que, para Millon, “el propósito
den usarse para tomar decisiones principal de un instrumento clínico
sobre trastornos comportamentales no es ubicar la posición relativa de
primarios o síndromes clínicos. De un paciente en una distribución de
igual manera, los niveles de puntua- frecuencias, sino calcular la proba-
ción de los grupos de escalas pue- bilidad que el paciente tiene de for-
den ofrecer motivos para enjuiciar el mar parte de una entidad diagnósti-
deterioro, la gravedad y cronicidad ca particular” (Millon, 1998, p. 73).
de la patología” (Millon, 1998, p. 16- En la misma dirección, Millon afir-
17). ma: “los resultados del MCMI-II
puden emplearse de distintas ma-
Para cumplir con estos objetivos neras con propósitos clínicos. El
clínicos, el MCMI-II no transforma uso principal es la interpretación de
las puntuaciones directas (PD) de perfil mediante un proceso de infe-
las distintas escalas del cuestionario rencia de los aspectos más impor-
en puntuaciones típicas, sino en tantes de la configuración de las 22
puntuaciones de tasa base (TB). escalas clínicas. Otro uso importan-
Esta transformación relaciona las te es la toma de decisiones para
PD de las escalas del MCMI-II con identificar el diagnóstico específico
las prevalencias de los trastornos en que mejor se aplica al paciente”
cuestión en una muestra clínica (Millon, 1998, p. 160).
representativa, de forma que se
pueda establecer un punto de corte En resumen, uno de los objetivos
diagnóstico para cada escala que más importante del MCMI-II es el
reproduzca el mismo porcentaje de diagnóstico clínico y, para cumplir
casos que se encontraría realmente ese objetivo, el MCMI-II utiliza pun-
en la población de pacientes psico- tuaciones TB que a priori permiten
patológicos. Así, por ejemplo, si la obtener mejores puntos de corte
prevalencia de la depresión entre diagnóstico.
los pacientes es de 25%, el punto
de corte diagnóstico para la escala Para transformar las PD a TB,
de depresión mayor sólo podría ser Millon y su grupo de investigación
alcanzado y superado por el 25% analizaron los datos de 1.292

290 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

pacientes evaluados con el MCMI-II TB 85. De forma similar, se selec-


por más de 600 clínicos. Estos clíni- cionó arbitrariamente una puntua-
cos habían asignado a sus pacien- ción TB de 60 para representar la
tes diagnósticos en el Eje I y en el mediana de las PD de todos los
Eje II según los criterios del DSM-III- pacientes de la muestra normativa
R. Los pacientes podían haber reci- clínica del MCMI-II (este valor se
bido más de un diagnóstico, pero si aplicó a todas las escalas excep-
este era el caso, los clínicos indica- tuando la escala de Hipomanía, en
ron cuál era el diagnóstico principal. la que la puntuación directa de la
A partir de estos datos, se estimó la mediana de los pacientes era
prevalencia de cada uno de los tras- menor que la puntuación directa de
tornos que pretenden medir las la mediana de una muestra no clíni-
escalas del MCMI-II, se calcularon ca o “normal” de personas), y una
las PD del MCMI-II y se selecciona- puntuación TB de 35 para repre-
ron dos números arbitrarios para sentar la mediana o puntuación del
designar los puntos de corte de TB centil 50 de una muestra no clínica
que correspondían a las PD de los de personas en todas las escalas
grupos diagnósticos. Así, en todas de personalidad patológica (“S”,
las escalas se tomó la puntuación “C”, “P”) y en las escalas de tras-
de TB 74 como la línea de corte tornos clínicos (desde “A” hasta
superior que correspondería al por- “PP”) (Millon, 1998, pp. 77-78).
centaje de pacientes que, según
sus clínicos, presentaban un tras- Como era lógico suponer, en la
torno clínico o un trastorno de per- adaptación española se siguieron
sonalidad, y la puntuación de TB esas mismas directrices: “para
de 84 como la línea de corte supe- designar las líneas de corte de las
rior que correspondería al porcen- tasas base en cada subgrupo de
taje de pacientes en los cuales, trastornos de personalidad y síndro-
según sus clínicos, dichos trastor- mes clínicos, se tomaron dichos
nos clínicos o trastornos de perso- números [los utilizados por Millon] de
nalidad eran los principales o más la siguiente manera: TB 74 designa
sobresalientes. Así, por ejemplo, si la presencia de este tipo de persona-
el 48% de las mujeres de la mues- lidad o síndrome; TB 84 indica el tipo
tra clínica sufría un trastorno distí- de personalidad o síndrome más alto
mico y en el 29% el trastorno distí- o sobresaliente; TB 60 representa la
mico era el diagnóstico principal, puntuación de la mediana de todos
entonces la PD de la escala de Dis- los pacientes; y TB 35 es la puntua-
timia (D) del MCMI-II que sólo es ción media que se correspondería
alcanzada o superada por el 48% con los sujetos no clínicos” (Millon,
de las mujeres de la muestra de 1998, pp. 174-175).
pacientes se transformaría en TB
75 y la PD de dicha escala que sólo Aunque la transformación de PD
es alcanzada o superada por el a TB puede constituir a priori una
29% de las mujeres de la muestra buena estrategia para obtener los
de pacientes se transformaría en mejores puntos de corte diagnósti-

Clínica y Salud, 2007, vol. 18 n.º 3 291


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

co, esta es una cuestión empírica satisfactoria la utilización del MCMI-


que debe confirmarse con los estu- II como instrumento diagnóstico a
dios de validación adecuados. En partir de las PD seleccionadas
este sentido, las directrices de la como TB 75 y TB 85 y, en especial,
Comisión Internacional de Tests los resultados de los análisis de la
(ITC, 2000) afirman que se deberían eficacia diagnóstica de los puntos
“utilizar puntos de corte en la inter- de corte, ya que, sin duda, estos
pretación de las puntuaciones sólo datos de validez diagnóstica son los
cuando se disponga de datos empí- que mejor pueden justificar esa utili-
ricos sobre su validez” (Directriz zación del MCMI-II. Así, por ejem-
2.7.9.; ITC, 2000). plo, en términos del valor o poder
predictivo positivo (probabilidad de
En consecuencia, la utilización de que un paciente identificado por el
la TB 75 para indicar la presencia de MCMI-II como padeciendo un
un determinado tipo de trastorno de determinado trastorno tenga real-
personalidad o de trastorno clínico, mente ese trastorno), el éxito diag-
y la utilización de la TB 85 para indi- nóstico de las TB 75 oscila entre
car el tipo de trastorno de personali- 58% y 80% para las 13 escalas de
dad o de trastorno clínico más trastornos de personalidad, con un
sobresaliente, debería contar con promedio de 69%, y entre 50% y
los datos apropiados que respalda- 92% para las 9 escalas de trastor-
ran la validez de dichas indicaciones nos clínicos, con un promedio de
o interpretaciones. Precisamente, 70% (véanse las Tablas 3.14 y 3.16
este es uno de los puntos fuertes de Millon, 1998, 1999 y 2002). De
del MCMI-II. En el manual original forma parecida, los índices de sen-
del instrumento se justifica empíri- sibilidad (capacidad del MCMI-II
camente la utilización de dichos para identificar correctamente a los
puntos de corte analizando (1) los pacientes que tienen un trastorno
perfiles en el MCMI-II de distintos en particular) y de especificidad
grupos diagnósticos, tanto en la (capacidad del MCMIII para identifi-
muestra clínica normativa como en car correctamente los pacientes que
una muestra adicional de validación no tienen un trastorno en particular)
cruzada compuesta por 703 pacien- son también satisfactorios. Para las
tes (véanse las pp. 109-137 de escalas de trastornos de personali-
Millon, 1998, 1999 y 2002) y (2) la dad, la sensibilidad de las TB 75
eficacia diagnóstica de los puntos varía entre 50% y 78%, con una
de corte de las escalas tomando media de 69%, y su especificidad
como criterio los diagnósticos reali- oscila entre 91% y 99%, con una
zados por los clínicos en esa mues- media de 95%, mientras que para
tra de validación cruzada (véanse la las escalas de trastornos clínicos, la
p. 129 y las pp. 138-143 de Millon, sensibilidad de las TB 75 fluctúa
1998, 1999 y 2002). entre 34% y 87%, con una media
de 62%, y su especificidad varía
En general, los resultados de to- entre 83% y 99%, con una media
dos estos análisis apoyan de forma de 95% (véanse las Tablas 3.14 y

292 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

3.16 de Millon, 1998, 1999 y 2002). Discrepancias entre baremos y


Es habitual considerar como bue- tablas en la 1.ª y 2.ª edición del
nos índices de sensibilidad y espe- manual: errores tipográficos?
cificidad valores de 70% o más,
como aceptables índices entre 50% Un primer problema con los bare-
y 69% y como pobres índices me- mos de la adaptación española del
nores de 50% (West y Finch, 1997), MCMI-II afecta a los usuarios de la
por lo que esos datos de eficacia 1.ª y la 2.ª edición de dicha adapta-
diagnóstica, que pueden conside- ción, y tiene que ver con una discre-
rarse entre buenos y aceptables, no pancia importante entre la informa-
sólo corroboran la utilidad del ción que aparece en una parte del
MCMI-II para la evaluación psicopa- manual (los baremos de los Anexos)
tológica, sino que son el apoyo y la información que aparece en otra
empírico más necesario y sólido parte de dicho manual (las Tabla 5.3
para emplear el MCMI-II como ins- y 5.4). En concreto, en las dos pri-
trumento diagnóstico en un contex- meras ediciones del manual español
to clínico. del MCMI-II, las PD que se corres-
ponden con las TB de 35, 60, 75 y
85 en los baremos españoles que
LOS PROBLEMAS DE LA aparecen recogidos en los Anexos 3
ADAPTACIÓN ESPAÑOLA y 4 (Millon, 1998, p. 185 y 186) no
DEL MCMI-II coinciden, respectivamente, con: (a)
la mediana en PD de la muestra de
Desgraciadamente, en su utiliza- española de personas normales que
ción como instrumento diagnóstico, se recoge en la Tabla 5.4 del manual
la adaptación española del MCMI-II (Millon, 1998, p. 174), (b) la mediana
presenta varios problemas que tie- en PD de la muestra clínica españo-
nen que ver, por un lado, con los la de baremación que también se
baremos para la transformación de recoge en la Tabla 5.4, (c) la línea de
PD a puntuaciones TB y, por otro corte en PD correspondiente a la TB
lado, con los índices de validez 75 que se recoge en la Tabla 5.3 del
sobre las bondades diagnósticas de manual (Millon, 1998, p. 173), y (c) la
los puntos de corte TB para el diag- línea de corte en PD correspondien-
nóstico. te a la TB 85 que también se recoge
en la Tabla 5.3, cuando tales valores
deberían coincidir según las directri-
Problemas con los baremos de la ces anteriormente mencionadas.
adaptación española del MCMI-II
Como muestra de esta discre-
Existen al menos cuatro proble- pancia, en la Tabla 1 se presentan
mas con los baremos de la adapta- las correspondencias para la escala
ción española del MCMI-II que, de Depresión Mayor (CC) en las
tomados en conjunto, aconsejan ser muestras normativas españolas de
cautos en su utilización con propó- mujeres, aunque el problema al que
sitos diagnósticos. se hace alusión es general y afecta

Clínica y Salud, 2007, vol. 18 n.º 3 293


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

Tabla 1. Correspondencia en cuanto a la definición de las puntuaciones


de tasa base de la escala de Depresión Mayor (CC) en las muestras
normativas de mujeres entre la información que aparece en los baremos
de los Anexos del manual de la adaptación española del MCM-II y la
información que aparece en las tablas de dicho manual

Nota.—TB = Puntuaciones tasa base. PD = Puntuaciones directas. n. e. = No se especifican estos valo-


res en el manual de la adaptación española del MCMI-II (1.ª ed., 2.ª ed. o 3-ª ed.) aMedida de los
pacientes (varones + mujeres) de la muestra de baremación estadounidense.

a todas las escalas del MCMI-II y a mujeres de los Anexos con una PD
todas las muestras de baremación. de 11, mientras que la mediana de
Por ejemplo, y como puede obser- la muestra normal española de
varse en la Tabla 1, en la versión mujeres que también se recoge en
española la TB 60 para la escala CC la Tabla 5.4 (y que debería ser la TB
se corresponde en los baremos de 35) es de 8. Obviamente, tales valo-
pacientes mujeres de los Anexos res deberían coincidir dada las defi-
con una PD de 23-31, mientras que niciones de TB 50 y TB 35 que
la mediana de la muestra normativa antes se han mencionado. De he-
de pacientes mujeres que se recoge cho, en el propio manual español se
en la Tabla 5.4 (y que debería ser la recogen baremos y tablas de la ver-
TB 60) es de 50. Por otro lado, la TB sión americana del manual, y entre
35 para la escala CC se correspon- dichos baremos y dichas tablas no
de en los baremos de pacientes hay discrepancia. Así, la TB 60 para

294 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

la escala CC en los baremos de las aunque dado los baremos estadou-


mujeres americanas que se recogen nidenses y los nuevos baremos
en los Anexos se corresponde con españoles que se presentan en la
una PD de 17, justo el valor medio2 3.ª edición de la adaptación espa-
de la muestra normativa de pacien- ñola, es muy probable que los erro-
tes que aparece en la Tabla 2.21 res estén en las tablas. Lógicamen-
también recogida en el manual te, el mayor problema para los pro-
español. fesionales e investigadores que han
utilizado o utilizan el MCMI-II sería
Curiosamente, en las dos prime- que los errores tipográficos estuvie-
ras ediciones de la adaptación ran en los baremos de los Anexos,
española, las TB 85 que aparecen dado que entonces las transforma-
en los baremos de los Anexos se ciones de PD a TB que se consi-
corresponden con las medianas guen utilizando dichos baremos, tal
correspondientes en PD de la y como dictan las normas de
muestra normativa de pacientes de corrección del manual, serían total-
la Tabla 5.4, cuando dichas media- mente incorrectas.
nas deberían ser las TB 60. Por
ejemplo, en los baremos de las
pacientes mujeres de los Anexos, la Diferencias de los baremos
TB 85 para la escala CC se corres- españoles de la 1.ª y 2.ª edición
ponde con una PD de 50, justo el del manual con los baremos
valor que aparece en la Tabla 5.4 estadounidenses
como mediana (o TB 60) de la
muestra normativa de pacientes Un segundo problema con los
mujeres para esa escala (véase la baremos españoles del MCMI-II es
Tabla 1). que, para algunas escalas, tales
baremos difieren de los baremos
En definitiva, en las dos primeras estadounidenses más de lo que
ediciones de la adaptación española cabría esperar, lo cual arrojaría nue-
del MCMI-II hay una discrepancia vas dudas sobre su validez. Por
entre los valores recogidos en los supuesto, esas diferencias podrían
baremos de los Anexos del manual deberse a las características dife-
y los valores que aparecen en las renciales de la población española
tablas que se presentan en las pági- frente a la estadounidense, caracte-
nas interiores del manual. Posible- rísticas que precisamente justificarí-
mente, estas discrepancias tienen an la necesidad de una adaptación
que ver con errores de tipo tipográ- española del MCMI-II en lugar de
fico, pero no queda claro si los erro- una simple traducción. Sin embar-
res están en las tablas, en los bare- go, tales diferencias son a veces
mos de los Anexos, o en ambos, muy grandes en magnitud y no son

2 Aunque en la directriz se habla de mediana, los datos de las medianas americanas no aparecen

recogidos en el manual, sino tan sólo las medias.

Clínica y Salud, 2007, vol. 18 n.º 3 295


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

consistentes con las diferencias que podría oscilar aproximadamente


se encuentran con otros instrumen- entre una y dos desviaciones
tos de evaluación psicopatológica. típicas3, magnitudes considerables
que no concuerdan con las diferen-
Por ejemplo, en los baremos cias que se encuentran con otros
españoles de pacientes mujeres instrumentos que evalúan sintoma-
que se encuentran en los Anexos de tología depresiva. Por ejemplo, la
la 1.ª y 2.ª edición del MCMI-II, la media obtenida en la muestra nor-
PD correspondiente a una TB 75 en mativa de pacientes españoles con
la escala de Distimia (D) es 47, 16 el Inventario para la Depresión de
puntos más que la PD que se co- Beck-II (BDI-II) es prácticamente
rresponde a una TB 75 en los bare- igual a la media obtenida en mues-
mos estadounidenses de pacientes tras de pacientes estadounidenses
mujeres (PD = 31). Esta diferencia (22,1 frente a 22,3; véase la Tabla 2),
es aún mayor si al final resulta que semejanza que es coherente con los
los baremos españoles de los Ane- resultados que se obtienen con
xos están equivocados y la PD que dicho instrumento al comparar
realmente corresponde a la TB 75 muestras españoles y estadouni-
en la muestra normativa de pacien- denses seleccionadas de la pobla-
tes españolas es la que aparece ción general o de la población de
recogida en la Tabla 5.3 de las dos estudiantes universitarios (véase la
primeras ediciones del manual. Tabla 2).
Efectivamente, en este caso, la PD
correspondiente a una TB 75 en la
escala D es 64, 33 puntos más que Nuevos baremos en la 3.ª edición
la correspondiente a la TB 75 de los del manual respecto a las dos
baremos estadounidenses. A partir ediciones anteriores
de una muestra de 73 pacientes con
diferentes trastornos mentales de la Un tercer problema tiene que ver
Clínica Universitaria de Psicología con la aparición de nuevos baremos
de la Universidad Complutense de para la población de pacientes
Madrid, se ha obtenido una desvia- españoles en los Anexos de la 3.ª
ción típica de 17,4 en PD para la edición de la adaptación española
escala D, por lo que la discrepancia (Millon, 2002) y que sustituyen a los
entre los baremos españoles y los baremos que aparecían en los Ane-
estadounidenses en dicha escala xos de las dos ediciones anteriores.

3 Con este tamaño muestral, el error que se comete al estimar la desviación típica de la escala D en

la población de pacientes españoles con trastornos mentales puede ser grande, pero dicha estima-
ción parece conservadora a la hora de considerar la magnitud de la discrepancia entre los baremos
españoles y los estadounidenses. Por ejemplo, a partir de tres muestras que totalizaban 978 pacien-
tes españoles con drogodependencias, Herrero (2004) obtuvo desviaciones típicas para la escala D
que oscilaban entre 12,4 y 13,6, lo cual indicaría que la discrepancia entre los baremos españoles y
los estadounidenses podría llegar a alcanzar más de 2,5 desviaciones típicas.

296 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

Tabla 2. Comparación entre las medias obtenidas con el Inventario para


la Depresión de Beck-II (BDI-II) en muestras estadounidenses
y en muestras españolas

Nota.— aEE.UU. = Media ponderada por el número de participantes de las 8 muestras estadouniden-
ses recogidas en Sanz et al. (2005); España = Sanz et al. (2005).
b
EE.UU. = Hunt et al. (2003); España = Sanz, Perdigón y Vázquez (2003).
c
EE.UU. = Media ponderada por el número de participantes de las 3 muestras estadounidenses recogi-
das en Sanz, Navarro y Vázquez (2003); España = Sanz, Navarro y Vázquez (2003).

Estos nuevos baremos parten de ción española del MCMI-II. Es más,


una muestra clínica mayor (710 en esta tercera edición, al contrario
pacientes frente a los 377 de los de lo que ocurría en las dos anterio-
baremos antiguos)4 lo que, en prin- res, no hay ninguna discrepancia
cipio, permitiría obtener mejores entre la información que aparece en
puntuaciones de corte y, por ende, una parte del manual (los baremos
mejorar las características diagnós- de los Anexos) y la información que
ticas de la adaptación española del aparece en otra parte de dicho
MCMI-II. Por tanto, su aparición manual (la Tabla 5.3). Así, en esta
obviamente no constituye en sí tercera edición las PD que se
mismo un problema, sino en todo corresponden con las TB 60, 75 y
caso un punto fuerte de la adapta- 85 en los baremos de los Anexos

4 Sorprende, no obstante, que en la descripción de las características demográficas y clínicas de la

nueva muestra normativa clínica (véase la Tabla 5.2 de la 3.ª edición), los porcentajes de pacientes
que se corresponden con cada una de las categorías de esas características (edad, situación/estado,
duración del episodio reciente y problemas importantes del estado de los pacientes) coincidan exac-
tamente, incluso en dos decimales, con los respectivos porcentajes de pacientes de la muestra nor-
mativa clínica de las ediciones anteriores (véase la Tabla 5.2 de la 1.ª-2.ª edición). Con la única excep-
ción de los dos porcentajes del sexo, la coincidencia exacta abarca a 24 porcentajes, circunstancia
muy poco probable por azar y que, probablemente, sea debido de nuevo a algún tipo de error tipográ-
fico.

Clínica y Salud, 2007, vol. 18 n.º 3 297


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

coinciden con las PD correspon- ñola del MCMI-II), pero se puede


dientes en la Tabla 5.3 del manual convertir en un problema si los
(véase la Tabla 1 para un ejemplo). investigadores o los profesionales
no informan sobre qué edición del
No obstante, las diferencias entre MCMI-II han aplicado y, por tanto,
ambos baremos son notables y por no es posible saber qué baremos
tanto los resultados obtenidos con han utilizado para convertir las PD
ellos pueden diferir considerable- en TB, o si los investigadores o los
mente. Por ejemplo, para la escala profesionales no son conscientes de
de Depresión Mayor (CC), la PD que la existencia de estos nuevos bare-
se corresponde con la TB 75 en las mos y, por ejemplo, comparan erró-
dos primeras ediciones es 42, mien- neamente sus resultados con los
tras que en la tercera edición es 11- obtenidos a partir de baremos dis-
10 puntos menor (31-32; véase la tintos. Me temo que, lamentable-
Tabla 1). En la muestra de pacientes mente, estas dos posibilidades pue-
de la Clínica Universitaria de Psico- den ser más frecuentes de lo que
logía anteriormente mencionada, se uno quisiera, y así lo sugiere el
obtuvo una desviación típica de hecho de que de los 8 estudios
13,1 en PD para la escala CC, por lo españoles localizados que han utili-
que la discrepancia entre los bare- zado el MCMI-II y que han sido
mos de la tercera edición y los bare- publicados al menos dos años des-
mos de las ediciones anteriores pués de la publicación de la 3.ª edi-
podría alcanzar casi una desviación ción (entre 2004 y 2006), 3 de ellos
típica5, magnitud ciertamente consi- no mencionaban la edición españo-
derable que podría suponer que con la que en concreto habían utilizado
los antiguos baremos el trastorno (tan sólo citaban la referencia al tra-
depresivo mayor no fuera diagnosti- bajo original americano).
cado en un buen número de pacien-
tes, pero sí lo fuera en esos mismos
pacientes con los nuevos baremos Diferencias de los baremos
de la 3.ª edición. españoles de la 3.ª edición del
manual con los baremos
De nuevo, el hecho de que los estadounidenses
baremos difieran no es un problema
en sí (siempre y cuando se pueda Un cuarto problema con los bare-
demostrar finalmente que los nue- mos españoles del MCMI-II es que
vos baremos mejoran la eficacia también los nuevos baremos de la
diagnóstica de la adaptación espa- 3.ª edición difieren de los baremos

5 De nuevo, esta estimación de la desviación típica de la escala CC debe tomarse con las debidas

precauciones; sin embargo, dicha estimación posiblemente sea conservadora a la hora de considerar
la magnitud de la discrepancia entre los baremos de la 3.ª edición y los baremos de la 1.ª-2.ª edición,
ya que Herrero (2004) obtuvo desviaciones típicas para la escala CC que oscilaban entre 9,8 y 10,7, lo
cual indicaría que dicha discrepancia podría sobrepasar una desviación típica.

298 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

estadounidenses. Es cierto que cobran sobre todo relevancia en el


dicha diferencia es menor que la contexto de los problemas de vali-
que presentan los baremos españo- dación diagnóstica de la propia
les de las dos ediciones anteriores, adaptación española del MCMI-II y
pero, no obstante, en algunos casos a los que me referiré a continuación.
la diferencia entre los nuevos bare-
mos españoles y los estadouniden-
ses parece mayor de lo que cabría Problemas con los índices de
esperar. Por supuesto cabe la posi- validez diagnóstica de la
bilidad, tal y como se comentaba adaptación española del MCMI-II
antes, de que esas diferencias se
deban a las características diferen- Como se comentaba líneas atrás,
ciales de la población española la utilización de puntos de corte en
frente a la estadounidense y que, la interpretación de las puntuacio-
por tanto, dichas diferencias no nes de un test requiere la existencia
sean un problema, sino una virtud de datos sobre la validez de dichos
de la adaptación. Pero, de nuevo, puntos de corte (ITC, 2000). Por
en algunas escalas las diferencias tanto, la utilización con propósitos
son notables en magnitud y no son diagnósticos de las TB 75 y TB 85
consistentes con las ausencias de obtenidas a partir de los baremos
diferencias que se encuentran con españoles de cualquiera de las edi-
otros instrumentos de evaluación ciones de la adaptación española
psicopatológica. Por ejemplo, en los del MCMI-II requeriría la existencia
baremos españoles de pacientes de estudios de validez sobre la efi-
mujeres que se encuentran en los cacia diagnóstica de dichos puntos
Anexos de la 3.ª edición del MCMI- de corte.
II, la PD correspondiente a una TB
75 en la escala de Distimia es 40- Lamentablemente, ninguna de las
41, lo que supone 9-10 puntos más ediciones de la adaptación española
que la PD que se corresponde a una del MCMI-II presenta estudios o
TB 75 en los baremos estadouni- datos de validez diagnóstica de los
denses de pacientes mujeres (PD = puntos de corte obtenidos a partir
31) y, por tanto, representaría una de los baremos españoles. De
discrepancia de más de media des- hecho, las dos primeras ediciones
viación típica entre ambos baremos de la adaptación española del
que no es consistente con la ausen- MCMI-II (Millon 1998, 1999) no
cia de diferencias entre muestras incluyen ningún dato o estudio em-
españolas y estadounidenses que pírico sobre la validez de dicha
presenta, por ejemplo, el BDI-II. adaptación en cualquiera de los
aspectos en que la validez puede
En cualquier caso, las diferencias examinarse (p. ej., validez factorial,
entre los baremos estadounidenses validez convergente, validez discri-
del MCMI-II original y los baremos minante, validez de contenido, vali-
españoles de cualquiera de las edi- dez de criterio, validez diagnóstica),
ciones españolas del MCMI-II limitándose tan sólo a presentar los

Clínica y Salud, 2007, vol. 18 n.º 3 299


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

índices de fiabilidad de consistencia encima de la TB 75 o la TB 85 en


interna de las escalas (los cuales, en alguna de las escalas de la adapta-
general, son adecuados; véase la ción española del MCMI-II.
Tabla 5.5 de Millon 1998, 1999).
Podría argumentarse, en apoyo
La 3.ª edición de la adaptación de la utilización diagnóstica de la
española amplia la información adaptación española del MCMI-II,
sobre las propiedades psicométri- que los datos de validación diag-
cas de la misma incluyendo datos nóstica que presenta el MCMI-II ori-
sobre su validez factorial y sobre su ginal en muestras de pacientes
validez convergente y discriminante estadounidenses son generalizables
respecto a las escalas de la adapta- a las muestras españolas. Sin
ción española del MMPI-2 (véanse embargo, la generalización de los
las Tablas 5.8 y 5.9 de Millon, 2002), índices de validación no se puede
pero tales índices, aunque relevan- asumir automáticamente, sino que
tes para otros propósitos del MCMI- debería confirmarse empíricamente.
II, no lo son para sustentar la utiliza- De hecho, esta asunción es más
ción del MCMI-II como instrumento problemática dado que, como se ha
diagnóstico. Para ello, la adaptación visto, los baremos y, por tanto, los
española debería incluir información puntos de corte TB 75 y TB 85 de la
parecida a la que presenta el MCMI- versión original son diferentes de los
II original, especialmente un análisis, de la adaptación española en cual-
en muestras de pacientes españo- quiera de sus tres ediciones.
les, de la eficacia diagnóstica (p. ej.,
sensibilidad, especificidad, valor Es más, la estrategia de transfor-
predictivo positivo, valor predictivo mar las PD en puntuaciones TB no
negativo) de las TB 75 o de las TB siempre tiene por qué lograr puntos
85 obtenidas a partir de los bare- de corte con índices adecuados de
mos españoles. La ausencia de este validez diagnóstica, ya que el éxito
tipo de información empírica no per- de dicha estrategia depende de fac-
mite sustentar con un mínimo de tores tales como el tamaño y repre-
seguridad la utilización del MCMI-II sentatividad de la muestra de bare-
como instrumento diagnóstico a mación y la forma y el cuidado con
partir de los puntos de corte defini- que los clínicos realizaron los diag-
dos por las TB 75 y TB 85. Quizás nósticos en dicha muestra (depen-
tales datos, de existir, apoyarían las diendo, por ejemplo, del tiempo de
bondades psicométricas de la contacto del clínico con el paciente,
adaptación española del MCMI-II en de la utilización de entrevistas
cuanto a su validez diagnóstica, libres, estructuradas o semiestruc-
pero este extremo es una cuestión turadas, del uso de listados de sín-
empírica que requiere precisamente tomas o criterios diagnósticos de
la realización de tales estudios y, en comprobación, de la verificación
su ausencia, lo más prudente es no posterior de los diagnósticos, de la
realizar ningún diagnóstico basado realización de análisis de fiabilidad
únicamente en una puntuación por interjueces, etc.). A estos factores

300 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

también habría que añadir las dife- de las curvas ROC (Receiver Opera-
rencias culturales, ya que las tasas ting Characteristic o curvas de ren-
de prevalencia de los trastornos dimiento predictivo) que permiten
suelen ser diferentes en distintos representar gráficamente la sensibi-
países, aunque estos países estén lidad y la especificidad para cada
tan cercanos culturalmente como una de las PD de las escalas y, en
los europeos. Por ejemplo, estudios consecuencia, seleccionar como
recientes indican que la prevalencia punto de corte para cada escala la
a los 12 meses de los trastornos PD que mejor rendimiento diagnós-
depresivos y de los trastornos de tico ofrece (Rossi y Sloore, 2005).
ansiedad difiere de forma significati-
va en España, Holanda, Francia, Ita-
lia, Alemania y Bélgica (Comisión CONCLUSIONES
Europea, 2004). Estos datos cues-
tionarían el procedimiento utilizado El MCMI-II fue diseñado, entre
en la adaptación española del otros objetivos, para llegar a un diag-
MCMI-II de asumir las tasas de pre- nóstico del trastorno o de los trastor-
valencia estadounidenses para deli- nos mentales que puede estar
mitar los puntos de corte TB 75 y sufriendo un paciente. En su versión
TB 856. En conjunto, estos factores, original, los puntos que corte que
pues, también apuntarían a la nece- propone el instrumento para realizar
sidad de realizar un estudio de vali- esos diagnósticos a partir de la
dación diagnóstica con muestras estrategia de transformar las PD en
españolas de los puntos de corte TB están avalados por los resulta-
TB 75 y TB 85 obtenidos a partir de dos satisfactorios de un estudio de
los baremos, en lugar de asumir la validación diagnóstica en una
generalización de los índices de muestra cruzada de pacientes esta-
validación estadounidenses. De dounidenses.
hecho, en Bélgica, la adaptación del
MCMI-III ha tenido que prescindir La adaptación española del
de la estrategia de Millon de trans- MCMI-II, en sus tres ediciones, ha
formar las PD en puntuaciones TB sido también utilizada por algunos
para obtener los puntos de corte profesionales e investigadores espa-
óptimos para el diagnóstico, ya que ñoles para la realización de diagnós-
dicha estrategia ofrecía índices ticos. Sin embargo, la adaptación
diagnósticos muy pobres en las española muestra varias inconsisten-
muestras de pacientes belgas y, en cias en los baremos para la transfor-
su lugar, se ha utilizado el análisis mación de PD a puntuaciones TB

6 El manual de las dos primeras ediciones de la adaptación española explícitamente afirma la asun-

ción de las tasas de prevalencia estadounidenses para la obtención de los puntos de corte (p. 174,
Millon, 1998, 1999). Tal afirmación ha desaparecido de la 3.ª edición de la adaptación, pero tampoco
hay ninguna información en dicha edición sobre el procedimiento finalmente utilizado para la obten-
ción de los puntos de corte.

Clínica y Salud, 2007, vol. 18 n.º 3 301


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

(errores tipográficos, altas discrepan- Sin embargo, no hay que confundir


cias con los baremos americanos, los niveles de análisis síntoma/sín-
cambios de baremos entre edicio- drome/trastorno. El diagnóstico de
nes) que hacen dudar de la adecua- un trastorno se efectúa teniendo en
ción de tales baremos, pero, sobre cuenta no sólo el tipo y número de
todo, la adaptación española propo- síntomas presentes, sino también
ne puntos de corte TB para el diag- ciertos criterios que difícilmente
nóstico cuya validez no viene avala- puede evaluar el MCMI-II a partir del
da por ningún tipo de estudio empíri- contenido de sus ítems como, por
co. Hasta que tales inconsistencias ejemplo, el grado de interferencia (p.
en los baremos hayan sido aclaradas ej., los síntomas deben provocar
y hasta que se obtengan datos que deterioro social, escolar, o laboral) y
sustenten la validez diagnóstica de la ausencia de ciertas causas posi-
los puntos de corte propuestos a bles o de ciertos diagnósticos con-
partir de esos baremos, lo más pru- currentes (p. ej., para el diagnóstico
dente es que la adaptación española de algunos trastornos, los síntomas
del MCMI-II no sea utilizada con fines no deben considerarse el efecto
diagnósticos o, en todo caso, no sea fisiológico directo de una enferme-
utilizada como criterio único para lle- dad médica o de la ingestión de
gar a un diagnóstico y que, por medicamentos o drogas, o no se
tanto, cualquier inferencia diagnósti- deben explicar mejor por la presen-
ca que se haga a partir de la presen- cia de otro trastorno mental). A
cia de una puntuación que supere el pesar de las limitaciones que el
punto de corte establecido sea pos- MCMI-II y, en general, la mayoría de
teriormente confirmada mediante los cuestionarios tienen para evaluar
algún tipo de entrevista diagnóstica esos criterios diagnósticos, las pun-
realizada por un clínico. tuaciones que ofrece el MCMI-II
podrían servir para estimar la pre-
Por supuesto, los problemas sencia de un trastorno, tal y como
señalados en este artículo no afec- Millon pretendía, siempre y cuando
tan a la utilización del MCMI-II como el MCMI-II, como cualquier otro
instrumento para detectar síntomas cuestionario, pueda demostrar su
y síndromes psicopatológicos y validez diagnóstica. Por tanto, futu-
para evaluar su gravedad. El mismo ras investigaciones con la adapta-
proceso de construcción del MCMI- ción española del MCMI-II deberían
II y el propio contenido de sus ítems, confirmar la validez diagnóstica de
en conjunción con los datos de fia- las puntuaciones de corte propues-
bilidad, validez factorial y validez tas mediante el correspondiente
convergente que presenta el manual estudio empírico, lo cual fue preci-
español, avalan ese uso de la adap- samente lo que el propio Millon rea-
tación española del MCMI-II, lo que lizó con su versión original y lo que
obviamente es muy importante para también demandan las directrices
evaluar, por ejemplo, el estado internacionales sobre el diseño y
general de los pacientes o la efecti- uso de tests psicológicos (ITC,
vidad de un proceso terapéutico. 2000).

302 Clínica y Salud, 2007, vol. 18 n.º 3


Jesús Sanz

Finalmente, la novedosa utiliza- las TB; (b) qué baremos en concreto


ción en todas las versiones del están utilizando para transformar las
MCMI de la transformación de PD PD a TB, los de la 1.ª-2.ª edición o
en puntuaciones TB y la constata- los de la 3.ª edición, ya que los
ción de un cambio en la 3.ª edición resultados pueden ser muy diferen-
española del MCMI-II en cuanto a tes, y (c) qué punto de corte en con-
los baremos que sirven para obte- creto están utilizando para realizar
ner dichas TB, sugiere que tanto los cualquier inferencia sobre la presen-
profesionales como los investigado- cia de un trastorno, la TB 75 o la TB
res que utilicen la adaptación espa- 85, inferencia que, de hacerse,
ñola del MCMI-II deberían especifi- debería por ahora verse acompaña-
car claramente en sus informes: (a) da de la oportuna confirmación
qué tipo de puntuaciones están mediante algún tipo de entrevista
informando o analizando, las PD o diagnóstica realizada por un clínico.

REFERENCIAS

Butcher, J. N., y Rouse, S. V. (1996). Per- Directrices Internacionales para el Uso de los
sonality: Individual differences and clinical Tests de la Comisión Internacional de Tests
assessment. Annual Review of Psychology, (ITC). [Traducción de la Comisión de Tests
47, 87-111. del Colegio Oficial de Psicólogos]. Docu-
mento consultado en Internet en:
European Commission (2004). The state http://www.cop.es/vernumero.asp?id=40.
of mental health in the European Union. Bru-
selas: Comisión Europea. Millon, T. (1983). Millon Clinical Multiaxial
Inventory manual (3.ª ed). Minneapolis. MN:
Herrero, J. (2004). Alteraciones de la per- National Computer Systems.
sonalidad asociadas a las conductas adicti-
vas: influencia de la duración del consumo y Millon, T. (1987). Millon Clinical Multiaxial
sus implicaciones. Psykhe, 13, 91-100. Inventory-II manual. Minneapolis. MN:
National Computer Systems.
Hunt, M., Auriemma, J., y Cashaw, A. C.
A. (2003). Self-report bias and underreport- Millon, T. (1998). MCMI-II. Inventario Clíni-
ing of depression on the BDI-II. Journal of co Multiaxial de Millon II. Manual. Madrid:
Personality Assessment, 80(1), 26-30. TEA.

International Test Commission (2000). Millon, T. (1999). MCMI-II. Inventario Clíni-

Clínica y Salud, 2007, vol. 18 n.º 3 303


Algunos problemas con la utilización de la adaptación española del Inventario Clínico Multiaxial de Millon-II (MCMI-II)...

co Multiaxial de Millon II. Manual (2.ª ed.). (2003). Adaptación española del Inventario
Madrid: TEA. para la Depresión de Beck-II (BDI-II): 1. Pro-
piedades psicométricas en estudiantes uni-
Millon, T. (2002). MCMI-II. Inventario Clíni- versitarios. Análisis y Modificación de Con-
co Multiaxial de Millon II. Manual (3.ª ed.). ducta, 29(124), 239-288.
Madrid: TEA.
Sanz, J., Perdigón, L. A., y Vázquez, C.
Millon, T., Millon, C., y Davis, R. (1994). (2003). Adaptación española del Inventario
Millon Clinical Multiaxial Inventory-III manual. para la Depresión de Beck-II (BDI-II): 2. Pro-
Minneapolis, MN: National Computer Sys- piedades psicométricas en población gene-
tems. ral. Clínica y Salud, 14(3), 249-280.

Piotrowski, C. (1997). Use of the Millon Sanz, J., García-Vera, M. P., Espinosa, R.,
Clinical Multiaxial Inventory in clinical prac- Fortún, M., y Vázquez, C. (2005). Adaptación
tice. Perceptual and Motor Skills, 84, 1185- española del Inventario para la Depresión de
1186. Beck-II (BDI-II): 3. Propiedades psicométri-
cas en pacientes con trastornos psicológi-
Rossi, G., y Sloore, H. (2005). International cos. Clínica y Salud, 16(2), 121-142.
uses of the MCMI: Does interpretation
change? En R. Craig (Ed.), New directions in West, S. G., y Finch, J. F. (1997). Personality
interpreting the Millon Clinical Inventory-III measurement: Reliability and validity issues. En
(MCMI-IIII) (pp. 144163). Hoboken, NJ: Wiley. R. Hogan, J. Johnson y S. Briggs (Eds.), Hand-
book of personality psychology (pp. 143-164).
Sanz, J., Navarro, M. E., y Vázquez, C. San Diego, CA: Academic Press.

304 Clínica y Salud, 2007, vol. 18 n.º 3

También podría gustarte