Guia de La Evaluacion Psiquiatrica 130414211917 Phpapp02

AVALADO POR
PSIQUIATRA-4
PROGRAMA DE ACTUALIZACIN CONTINUA EN PSIQUIATRA
COMIT EJECUTIVO
2002 - 2003
LIBRO 3
Dr. Marco Antonio Lpez Butrn

Presidente
Dr. Luis Enrique Rivero Almanzor
Presidente Electo
Dr. Eduardo Nez Bernal
Secretario General
Evaluacin clnica
en Psiquiatra
Dr. Omar Kawas Valle

Tesorero
VICEPRESIDENTES REGIONALES
Dr. Aarn Gamez Robles
Norte
Dr. Jaime Orozco Ibarra
Centro
AUTORA
Dra. Mara del Carmen Lara Muoz
Dr. Jess Orueta Alvarez

Sur
ESTE ES UN SERVICIO EDUCATIVO

APOYADO POR
Autor
Dra. Mara del Carmen Lara Muoz
Mdica Cirujana (Universidad Autnoma de Puebla)
Lic. En Psicologia (Universidad Autnoma de Puebla)
Especialista en Psiquiatra (UNAM)
Maestra en Ciencias Mdicas (UNAM)
Doctora en Ciencias Mdicas (UNAM)
Estancia postdoctoral en la Universidad de Yale(Anfitrin: Dr. Alvan R. Feinstein)
Profesora Investigadora. Titular de Posgrado en la Facultad de Medicina
de la Universidad Autnoma de Puebla
Profesora de Posgrado, Facultad de Medicina
de la Universidad Nacional Autnoma de Mxico
Miembro-Director del Consejo Mexicano de Psiquiatria
Expresidenta del Consejo Mexicano de Psiquiatria
Miembro de la Academia Nacional de Medicina
Una edicin de:
Intersistemas, S.A. de C.V.

Aguiar y Seijas 75
Lomas de Chapultepec
11000, Mxico, D.F.
Tel.: (5255) 55202073
Fax: (5255) 55403764
intersis@data.net.mx
www.intersistemas.com.mx
PAC PSIQUIATRA-4
Primera Edicin 2003
Copyright 2003 Intersistemas, S.A. de C.V.
Todos los derechos reservados. Este libro est protegido por los derechos de autor. Ninguna parte de esta publicacin puede ser reproducida, almacenada en algn sistema de recuperacin, o
transmitida de ninguna forma o por ningn medio, electrnico o mecnico, incluyendo fotocopia, sin autorizacin previa del editor.
PAC Es una marca registrada de Intersistemas S. A. de C. V.
ISBN 970-655-597-8 Edicin completa
ISBN 970-655-600-1 Libro 3
En funcin de los rpidos avances en las ciencias mdicas, el diagnstico, tratamiento, tipo de
frmaco, dosis, etc., deben verificarse en forma individual; por lo que el autor, editor y patrocinador no se hacen responsables de ningn efecto adverso derivado de la aplicacin de los conceptos vertidos en esta publicacin, cuya aplicacin queda a criterio exclusivo del lector.
Cuidado de la edicin: Dr. Luis Velsquez Jones
Diseo de portada: DG. Edgar Romero Escobar
Diseo y diagramacin: DCG. Dulce Ma. Lomel / DCG. Marco A. M. Nava
Impreso en Mxico
Contenido
Autoevaluacin inicial . . . . . . . . . . . . . . . . . . . . . . . . . . . .
121
Clinimetra para psiquiatras . . . . . . . . . . . . . . . . . . . . . . .
123
123
123
125
Introduccin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Definiciones fundamentales . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Caractersticas generales de los instrumentos . . . . . . . . . . . . . . . .
Sensatez en la medicin clnica . . . . . . . . . . . . . . . . . . . . .

Justificacin y propsito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Validez de apariencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Validez de contenido . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Formato . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Facilidad de uso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Consistencia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
El concepto bsico de consistencia . . . . . . . . . . . . . . . . . . . . . . . .
El papel de las instrucciones operacionales y los criterios . . . . . . .
Consistencia interna . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Expresin estadstica de la consistencia . . . . . . . . . . . . . . . . . . . .
Validez . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Validez de criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Validez de constructo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
La validez de constructo como un sustituto
de la validez de criterio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Principios generales de las escalas . . . . . . . . . . . . . . . . . .

Las categoras deben ser mutuamente excluyentes . . . . . . . . . . . .
Las categoras deben ser exhaustivas . . . . . . . . . . . . . . . . . . . . . .
Las categoras deben tener valores reales . . . . . . . . . . . . . . . . . . .
Las categoras deben tener una discriminacin adecuada . . . . . . .
Las escalas deben ser coherentes tanto biolgica
como estadsticamente . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Entrevistas diagnsticas . . . . . . . . . . . . . . . . . . . . . . . . . .
PRIME-MD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Depresin y ansiedad . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Escala de depresin de Hamilton (Ham-D) . . . . . . . . . . . . . . . . . . .
Inventario de depresin de Beck (Beck-Dep) . . . . . . . . . . . . . . . . .
Lista de los 90 sntomas de Hopkins (Symptom checklist SCL-90) . .
Otros instrumentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
131
132
132
133
135
136
137
137
138
140
143
147
148
148
149
153
153
154
154
155
157
159
162
163
165
169
170
171
Evaluacin de sntomas psicticos . . . . . . . . . . . . . . . . . . .

Escala Breve de Apreciacin Psiquitrica . . . . . . . . . . . . . . . . . . . .
Escala del Sndrome Positivo y Negativo . . . . . . . . . . . . . . . . . . . .
Escala para la evaluacin de mana . . . . . . . . . . . . . . . . . . . . . . . .
Movimientos anormales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Calidad de vida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Evaluacin de la calidad de vida y del funcionamiento . . . . . . . . .
Escala de calidad de vida de Dunbar . . . . . . . . . . . . . . . . . . . . . . .
El cuestionario de calidad de vida y satisfaccin de Endicot . . . . . .
La lista para evaluar la calidad de vida
de los enfermos esquizofrnicos . . . . . . . . . . . . . . . . . . . . . . . . . .
Entrevista para evaluar la calidad de vida . . . . . . . . . . . . . . . . . . .
La escala de calidad de vida . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Calidad de vida de los usuarios de los programas de salud mental . . .
Cuestionarios de calidad de vida
de la Organizacin Mundial de la Salud . . . . . . . . . . . . . . . . . . . .
Encuesta del estado de salud SF-36 . . . . . . . . . . . . . . . . . . . . . . .
Evaluacin de la discapacidad . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Apoyo social . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Cuestionario de apoyo social . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Cuestionario de apoyo social funcional DUKE-UNC . . . . . . . . . . . .
Evaluacin en Geriatra
..........................
175
175
176
176
177
179
179
179
180
180
183
185
187
187
189
191
193
194
195
Evaluacin en el rea cognitiva . . . . . . . . . . . . . . . . . . . . . . . . . . .

Examen mental Breve . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Examen mental abreviado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Escala de depresin geriatrica . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Evaluacin del funcionamiento . . . . . . . . . . . . . . . . . . . . . . . . . . .
197
197
197
199
199
201
Referencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
203
Respuestas de la autoevaluacin inicial . . . . . . . . . . . . . . .
205
INSTRUCCIONES PARA OBTENER PUNTAJE CON VALOR PARA

RECERTIFICACIN
La Asociacin Psiquitrica Mexicana avala el Programa de Actualizacin
Continua (PAC) Psiquiatra con puntos vlidos para la recertificacin de
mdicos psiquiatras.
Para solicitar los puntos es necesario que conteste todas las preguntas incluidas en el cuadernillo de evaluacin que acompaa al libro 10.
Anote con claridad los datos de identificacin que se le solicitan y entregue el
cuadernillo al representante de Pfizer quien lo har llegar a la Asociacin
Psiquitrica Mexicana, donde le expedirn la constancia correspondiente en
el caso de que cubra 80% o ms de aciertos.
Autoevaluacin inicial
1.
La sensatez de un instrumento puede ser obviada si su consistencia

y validez son adecuadas:
Falso
Verdadero
2.
La sensibilidad y la especificidad son indicadores de consistencia:

Falso
Verdadero
3.
La validez de un instrumento se prueba contra un estndar de oro:

Falso
Verdadero
4.
Para aplicar la Entrevista Diagnstica Internacional se requiere de

entrenamiento en centros autorizados:
Falso
Verdadero
5.
La Escala de Depresin de Hamilton es un instrumento de diagnstico:

Falso
Verdadero
6.
La escala original de Simpson-Angus permite valorar acatisia y aquinesia:

Falso
Verdadero
7.
El PANSS y el BPRS pueden ser comparados:

Falso
Verdadero
8.
La valoracin de ancianos requiere de instrumentos especialmente

adaptados:
Falso
Verdadero
9.
Actualmente, no es posible medir el apoyo social:

Falso
Verdadero
VER RESPUESTAS
EN LA PGINA 205
10. Por ser subjetiva, no se recomienda evaluar la calidad de vida:

Falso
Verdadero
121
Clinimetra para psiquiatras
INTRODUCCIN
Al iniciar la lectura de este libro es necesario hacer un comentario y dos aclaraciones. Primero el comentario; el trmino
Clinimetra se ha incluido en el ttulo
como un homenaje al Dr. A. Feinstein,
quien acu y defini el trmino.
Las dos aclaraciones: aunque en el ttulo se
menciona que el texto va dirigido a psiquiatras, es evidente que no es exclusivo para ellos.
Se pretende que sea til para cualquier persona interesada en el trabajo clnico en el rea de
la salud mental. El objetivo es fundamentalmente clnico. Por esto, los mdicos de cualquier especialidad, los psiclogos, el personal
de enfermera, trabajo social, rehabilitacin,
etc. encontrarn til este texto.
La segunda aclaracin es que no se trata de
un catlogo de instrumentos, sino de una
gua para el empleo sensato de stos. Hay
varios textos excelentes en los que se pueden encontrar listados muy completos de
instrumentos de evaluacin (American
Psychiatric Association, 2000) incluso en
espaol (Bulbena et al, 2000). En este libro
presentaremos una introduccin a la clinimetra y las caractersticas generales de algunos instrumentos. Trataremos de ubicar
el instrumento en el contexto de las investigaciones en las que se han empleado como ejemplo de un uso que suponemos
sensato. Al anotar las caractersticas generales de los instrumentos, se proporcionarn las referencias pertinentes. Aunque
muchos de los instrumentos mencionados
no tienen restricciones para su uso acadmico, no lucrativo, algunos de ellos tienen
protegidos los derechos de autor. Los contactos para solicitar las autorizaciones correspondientes, pueden encontrarse en el
texto de la Asociacin Psiquitrica Americana (2000).
En varios cursos y talleres dedicados al tema, con frecuencia hemos escuchado la

pregunta Y qu escalas tiene?. Al indagar sobre el propsito, nos enteramos que
en realidad no se tiene una idea clara de lo
que se pretende hacer con la escala sino
que ms bien en funcin de la escala a la
que se tenga acceso se pensar lo que lo se
har. Con este texto, pretendemos ubicar
el uso de instrumentos de evaluacin en el
contexto de una prctica clnica con objetivos definidos, sean de investigacin o de
intervencin clnica.
Este texto va dirigido a

cualquier persona con
actividad clnica dentro
del rea de la salud mental
y no es un simple relato
de instrumentos, sino una
gua para su empleo
Los primeros talleres de Clinimetra que

se ofrecieron en el Instituto Nacional de
Psiquiatra (entonces Instituto Mexicano
de Psiquiatra), se dirigan hacia las personas interesadas en la investigacin clnica.
Al pasar el tiempo, cada vez es ms evidente que la clinimetra es o deber ser
una parte importante de la cnica psiquitrica; la evaluacin de las intervenciones
que se realizan permitir valorar la efectividad de las mismas.
Independientemente de que se empleen o
no instrumentos (o escalas formales o con
epnimos), es evidente que la clinimetra
est presente en la clnica independientemente de que se le reconozca como tal.
Cuando decimos que un paciente ha mejorado, estamos empleando una categora de
una escala de transicin; la otras categoras
de esta hipottica escala seran: el paciente
est igual o el paciente ha empeorado.
DEFINICIONES FUNDAMENTALES
La Clinimetra es una
actividad aplicable en
cualquier actividad
relacionada con la primera
parte del vocablo: la clnica.
Aunque originalmente se
aplic al estudio de sntomas
(manifestaciones de
enfermedad) se ha extendido
ahora a herramientas y
procedimientos auxiliares
y complementarios.
Podemos medir el estado clnico de los

pacientes? Podemos medir el efecto de
los antidepresivos sobre la depresin? Si
consideramos que medir es asignar un valor a objetos, eventos o caractersticas de
acuerdo con ciertas reglas, cuando tene-
123
PAC PSIQUIATRA-4 Libro 3
mos las reglas podemos medir cualquier

objeto, evento o caracterstica, incluyendo el
estado clnico de los pacientes. Estos objetos,
eventos o caractersticas se designan como
variables.
Una variable es una clase de datos, una
propiedad observada o cualquier caracterstica que nos interese medir u observar.
En la clnica, los sntomas, los signos, los
antecedentes de los pacientes son variables. Si estamos interesados en determinar las diferencias entre hombres y
mujeres, el sexo es una variable. En un estudio sobre el pronstico de los pacientes
de acuerdo a la edad de inicio del padecimiento, tanto el pronstico como la edad
de inicio del padecimiento son variables.
Es til reconocer trminos

como escala (conjunto de
categoras que definen a una
variable) y categora que es
una de las diferentes formas
de expresin que la variable
puede adoptar.
Una escala es el conjunto de categoras que

definen a una variable. La escala de la variable sexo tiene dos categoras: femenino y
masculino. La escala de la variable edad de
inicio del padecimiento tiene un gran nmero de categoras (cualquier edad puede
estar dentro de la escala). Es frecuente que
asociemos el trmino escala con diferencias
de intensidad; as, los episodios depresivos
mayores pueden ser leves, moderados, o severos. Sin embargo, la clasificacin de la esquizofrenia en paranoide, desorganizada,
catatnica, indiferenciada o residual, tambin constituye una escala.
Una categora es una de las diferentes formas de expresin que la variable puede
adoptar. En los ejemplos mencionados,
femenino es una categora de la variable
sexo; leve es una categora de la escala
intensidad; catatnica es una categora de esquizofrenia.
Hay diferentes niveles en la expresin de
una escala y es prctica comn identificar a
las variables de acuerdo a su escala de medicin. As, tenemos escalas (o variables):
nominales, ordinales y dimensionales.
Las variables nominales o de atributo, tambin son conocidas como variables categ-
124
ricas. Las categoras que conforman la escala no tienen orden o rango. Por ejemplo, las categoras de la escala de religin
no tienen rango (cristiano, musulmn, judo, otro), ocupacin (empleado, campesino, artesano, otros), etc. Las categoras
de estas escalas se describen con frecuencias,
porcentajes, proporciones. Por ejemplo: el
70% de los pacientes eran mujeres. La Clasificacin Internacional de Enfermedades
10a. revisin, (CIE-10) es una escala nominal o categrica, constituida por un conjunto de categoras diagnsticas. En su forma
ms sencilla, las escalas categricas son dicotmicas (con dos categoras) por ejemplo,
hombre/mujer, esquizofrnico/no esquizofrnico, fumador/no fumador.
En la escala ordinal el atributo se posee con
mayor o menor magnitud, pero se desconoce la relacin exacta entre las categoras,
por ejemplo: depresin leve, moderada, o
grave. Las puntuaciones en los diferentes
instrumentos de uso frecuente en psiquiatra son escalas ordinales. Por ejemplo: si al
paciente A se le asigna una puntuacin
de 36 en la escala de Hamilton de depresin, est mas deprimido que el paciente
B, que obtuvo 18; sin embargo no se
puede asegurar que el paciente A tiene el
doble de depresin que el paciente B, solo sabemos que est mas deprimido. Las
puntuaciones en la escala de Hamilton no
tienen una relacin exacta entre s. Algunos
autores han llamado cuasidimensionales a
las escalas como la de Hamilton, ya que la
escala resultante de la suma de diferentes
reactivos parece tener caractersticas dimensionales. En este rubro tambin se incluyen las escalas anlogas visuales. Las
variables ordinales se describen con medianas o percentiles, aunque con frecuencia se
emplea el promedio para su descripcin.
En las escalas dimensionales, la relacin
entre las categoras (o valores) es constante, se pueden hacer todas las operaciones
aritmticas con ellas. Se llaman de razn
cuando tienen cero absoluto, se llaman de
intervalo cuando el cero no es absoluto si-
no arbitrario (por ejemplo la talla o la

edad ya que nadie puede tener 0 de estatura ni de edad). Una escala dimensional
es continua cuando puede tener valores
fraccionarios o discontinua o discreta si
no tiene valores fraccionarios (nmero de
hijos o nmero de ojos). La edad es una
variable dimensional ya que alguien que
tiene 40 aos tiene exactamente el doble
de edad de alguien que tiene 20 aos.
CARACTERSTICAS GENERALES
DE LOS INSTRUMENTOS
Una caracterstica de los instrumentos de
evaluacin clnica es que se conforman
con informacin que se obtiene mediante
un formato en el que se incluyen preguntas o reactivos que el sujeto que est siendo evaluado tiene que responder, o que,
basado en sus observaciones del sujeto, el
clnico responde.
Los estmulos (preguntas o reactivos) pueden ser de respuestas cerradas: s o no, opcin mltiple o pueden ser preguntas
abiertas que deben ser interpretadas por
un experto.
Como ya se mencion, una escala es un
conjunto de categoras que definen una variable. La variable puede ser individual, es
decir, es la respuesta a una sola pregunta o
reactivo. Sin embargo, es frecuente que las
variables que se emplean en el rea de la salud mental sean variables complejas. La variable depresin est compuesta por una
serie de caractersticas que llamamos signos
y sntomas. Para la exploracin de estas variables complejas es necesario construir instrumentos de evaluacin que incluyan
todas las caractersticas que define a la variable en estudio. De este modo, tenemos
escalas individuales para variables individuales e instrumentos formados por un
conjunto de variables que al agruparse conforman una variable compleja.
En clnica, las variables suelen ser caractersticas, signos o sntomas de los pacien-
tes. Estas variables pueden tener expresiones naturales o arbitrarias. Por ejemplo, la
edad en aos es una expresin natural pero si la transformamos en nio, joven y
viejo, sta es una expresin arbitraria.
En algunos casos slo se cuenta con expresiones arbitrarias como por ejemplo para
describir los reflejos neurolgicos. Siempre es preferible trabajar con expresiones
naturales y si es necesario, despus se
transforman o codifican.
Como se mencion al principio, cuando
medimos, asignamos una categora a una
condicin de acuerdo a ciertas reglas. Las
reglas son los criterios operacionales que
empleamos para definir a las variables y
sus categoras. Estas reglas en clnica son
los criterios diagnsticos. Por ejemplo, para decir que un paciente es esquizofrnico tenemos las reglas anotadas en el
DSM IV o en la CIE-10. De esta manera
podemos distinguir entre la categora de
esquizofrnico y no esquizofrnico.
Una caracterstica de los

instrumentos de evaluacin
clnica es que se conforman
con informacin que se
obtiene mediante un formato
en el que se incluyen
preguntas que el sujeto
o el clnico responden.
Para asignar la categora de mujer a una

persona, podemos elegir entre varias reglas: la apariencia exterior de la persona, la
exploracin fsica, o el sexo cromosmico.
De acuerdo a la regla que seleccionemos, se demarcan las categoras.
En algunos casos la demarcacin de categoras se deja al juicio clnico. Por ejemplo,
en la evaluacin clnica global, el mdico
debe decidir, de acuerdo a su experiencia si
la mejora del paciente ha sido mucha o
poca. En este caso, no hay criterios especficos para separar mucha mejora de
poca mejora.
Instrumentos vs variables individuales
Los datos que se emplearon en la evaluacin de los pacientes pueden ser variables
individuales o variables compuestas.
Las variables compuestas incluyen un
conjunto de variables. Estas son llamadas
125
variables componentes y se deben especificar claramente.

Las escalas llamadas globales son usadas
constantemente en la clnica y stas carecen
de variables componentes explcitas. Cuando la mejora del pacientes se determina
como mucha o poca, se est empleando
una escala global en la cual no se ha identificado qu se toma en cuenta cuando se
dice mucha o poca. En las escalas globales los componentes son implcitos.
Los elementos que componen a un instrumento son preguntas o resultados observados que ocurren espontneamente, como
reacciones del paciente a los eventos de la
vida o de la enfermedad o bien a otros estmulos especficos individuales. En otros casos, se registra la respuesta del paciente a un
estmulo; por ejemplo, la respuesta a una
prueba neuropsicolgica, o a un estmulo
del cerebro. Tanto el estmulo como la respuesta a observar deben ser claramente especificadas. Se debe prestar atencin al
grado de cooperacin del paciente.
Si un instrumento se emplea para la evaluacin de una variable compleja, en la que
se incluyen muchas variables, stas debern
combinarse para tener una expresin final.
En algunos casos se combinan un gran nmero de variables en una sola expresin
que permite la evaluacin de una condicin clnica, por ejemplo depresin.
La escala final puede expresarse de diferentes formas: como un perfil o como un
resultado nico.
La combinacin de variables puede hacerse mediante puntajes aritmticos; lo ms
frecuente en el rea de la salud mental,
mediante la adicin de variables o con algn otro arreglo aritmtico, por ejemplo,
un cociente (ndice de obesidad).
En otros casos, a unas variables se les da ms
puntuacin que a otras (pesan ms), a lo
que se llama ponderacin.
126
Otra forma de obtener el resultado de la

combinacin de variables es mediante
agrupaciones que Feinstein ha llamado
boleanas. El diagnstico en psiquiatra
se hace de esta manera: el paciente debe
reunir ciertas variables y no debe tener
otras para que se pueda decir que es esquizofrnico por ejemplo.
El perfil contiene una serie de variables
componentes citadas juntas en combinacin sin haber sido fusionadas en una expresin nueva. La expresin final es un
perfil que identifica el estado individual
de cada componente por separado y por
lo tanto no se pierde informacin pero no
es fcilmente codificado para anlisis y
comparaciones es descriptivo.
En algunos caso, antes de formar una escala final, las variables componentes son
agregadas en variables compuestas llamadas ejes o subescalas. El resultado final
puede ser el conjunto de estas subescalas o
la combinacin de estas subescalas para
dar una escala final. Por ejemplo, el SCID
de personalidad da como resultado un
conjunto de subescalas y no un resultado
final. La prueba de Wechsler para la evaluacin de inteligencia proporciona el resultado de varias subescalas que a su vez se
combinan en dos (verbal y de ejecucin),
que a su vez se combinan en una sola (CI
total). En este caso se especifica el mtodo
de agregacin de variables a ejes, el esquema de puntaje para cada eje y el mtodo
de combinarlos en la escala final.
En ocasiones se deben modificar las escalas
de las variables originales antes de integrarlas en un ndice compuesto. Se puede degradar una variable dimensional, para
eliminar las distinciones finas que afectaran
los resultados (el peso se transforma en:
obeso/no obeso, la temperatura en: fiebre/
no fiebre). Las variables ordinales tambin
se pueden transformar en dicotmicas, por
ejemplo la puntuacin en el Inventario de
Depresin de Beck se transforma en: deprimido/no deprimido. Se puede convertir
una variable nominal en una ordinal, por

ejemplo: muy deprimido, regularmente
deprimido, poco deprimido. Una variable
nominal se transforma en dicotmica: esquizofrenia simple, paranoide, catatnica y
no esquizofrenia, se transforma en: esquizofrenia/no esquizofrenia.
Este tipo de informacin adicional es muy

til para los clnicos. La informacin extra
mejora los datos que los clnicos pueden
utilizar para elegir y evaluar a las variables
candidatas.
Qu tipo de evidencia se va a incluir
en el ndice?
Antes de que se combinen las variables en

un ndice se deben tomar varias decisiones. El investigador debe tener una idea
clara del propsito del ndice y el ambiente o escenario donde se aplicar.
La evidencia es intrnseca o proximal

cuando corresponde a la descripcin directa del fenmeno observado.
El siguiente paso incluye una serie de decisiones conceptuales que preceden a la

eleccin de las variables o componentes.
La evidencia es extrnseca o distal cuando refleja una consecuencia o un efecto

indirecto del fenmeno observado. Esta
puede tener al menos 3 niveles de separacin del fenmeno proximal:
Al trmino de este proceso, las variables

candidatas son elegidas, examinadas y resumidas, conservando las variables componentes.
Revisin de antecedentes
Se puede trabajar empricamente a partir
de la informacin disponible. Si no se
dispone de datos empricos, entonces se
pueden utilizar:
a. Variables elegidas por costumbre: sin
evidencias documentales en la literatura.
b. Sabidura convencional: creencias generales de la comunidad clnica.
c. Experiencia personal del investigador
d. Reunin de grupos colegiados o autoridades: para alcanzar un consenso.
La informacin adicional se puede obtener por lo menos de 4 diferentes fuentes:
1) Observacin clnica de otros fenmenos.
2) Informacin de laboratorio
3) Familia del paciente u otros recursos
para indicar o verificar exposicin previa a agentes ocupacionales, farmacuticos entre otros.
4) Observacin clnica de la evolucin
del paciente.
1) La evidencia refleja una consecuencia

inmediata aunque indirecta del fenmeno.
2) La evidencia refleja una respuesta subjetiva del paciente o una reaccin a las
consecuencias del fenmeno.
3) La evidencia refleja la manera en que
otro responde o reacciona al fenmeno observado en el paciente.
Los clnicos con frecuencia usan directamente la evidencia intrnseca cuando es
posible, a pesar de la ausencia de valores
estandarizados. Sin embargo, no debe
omitirse la evidencia extrnseca.
Importancia de la relacin
interpersonal
La relacin interpersonal es un elemento
que debe ser tomado en cuenta cuando se
disean instrumentos de evaluacin; en la
prctica mdica, los pacientes estn acostumbrados a proporcionar informacin
muy ntima y personal. Usualmente esperan
y responden de buena forma a preguntas
respecto a evacuacin, miccin, actividad
sexual, otras funciones del cuerpo y varios
aspectos de sus hbitos y sentimientos.
Sin embargo, este intercambio de informacin entre el investigador y el sujeto,
127
difcilmente ocurre en cierto tipo de investigaciones. Para evitar invadir la privacidad

personal y para permitir respuestas libres
de miedos u oprobio moral o tico las preguntas se hacen de manera impersonal e
indirecta. Sin embargo, esto puede ser una
desventaja pues el que responde puede citar actitudes pblicas generales ms que
creencias personales. Otra desventaja del
abordaje impersonal es la evitacin del ataque directo y frontal del objetivo; as, la
respuesta que se ofrece da valores indirectos
o poco tiles.
La ventaja del enfoque mdico tan personal es que se enfoca especficamente al paciente y permite preguntar muchas cosas y
tener respuestas directas.
Identificacin del constructo
La actividad
clinimtrica implica
disecar el fenmeno
observado, para lo
cual el clnico emplea su
intuicin ilustrada.
Muchas de las variables utilizadas en la clnica se refieren a conceptos intelectuales

llamados constructos que no existen de
manera tangible. De hecho, los diagnsticos son constructos: esquizofrenia paranoide es un trmino en el que se incluyen
ciertas caractersticas de un sujeto, y es un
constructo porque esquizofrenia paranoide no es una caracterstica tangible, objetiva, como puede ser, ojos negros.
Otros constructos que emplean los clnicos se refieren a la severidad de la enfermedad, efectos de la comorbilidad o
grados de incapacidad funcional.
Muchas de las ideas expresadas como ndices tambin son constructos intangibles
(inteligencia, relacin intrafamiliar, prejuicio tnico, etc). Otros tipos de constructos no son fciles de identificar. Los
constructos se proponen como explicaciones para ciertos agregados de variables que
emergen de un anlisis matemtico. Si este es el caso, el investigador tendra que
probar que los constructos realmente existen y que se identifican apropiadamente
como entidades conceptuales. Para la mayora de los constructos que aparecen en
128
los ndices clnicos, el reto principal es

medirlo, no probar que existen.
Cmo se seleccionan las variables a incluir
en un ndice?
De acuerdo al DSM IV, un sujeto tiene

un Trastorno de ansiedad generalizada
cuando ocurren
Ansiedad y preocupacin excesivas sobre una amplia gama de acontecimientos o actividades, que se prolongan ms
de 6 meses
Le resulta difcil controlar este estado
de constante preocupacin
La ansiedad y preocupacin se asocian
a tres (o ms) de los 6 sntomas siguientes (algunos de los cuales han
persistido ms de 6 meses). En los nios slo se requiere uno de estos sntomas: inquietud o impaciencia,
fatigabilidad fcil, dificultad para concentrarse o tener la mente en blanco,
irritabilidad, tensin muscular, alteraciones del sueo.
Cmo se lleg a estos criterios? Evidentemente, por la observacin directa de los

pacientes. En clnica, las variables que se
incluyen en los ndices suelen obtenerse
mediante la observacin.
La actividad clinimtrica implica disecar el fenmeno observado, para lo cual
el clnico emplea su intuicin ilustrada.
En la actividad psicomtrica, el proceso
suele ser diferente. A partir de una teora, se
desarrolla una gran cantidad de variables en
forma de reactivos, preguntas o items individuales pertinentes para el fenmeno bajo
investigacin. Estos reactivos, preguntas o
items sern sometidos a la evaluacin de
jueces o expertos y tambin sern sometidos a procedimientos estadsticos sofisticados y finalmente darn un resultado,
En este proceso, las decisiones fundamentales dependen de los datos proporcionados
por los jueces externos y por el modelo terico particular que se utiliz al revisarlos.
Las diferencias en los enfoques empleados
en clnica y en el campo psicosocial fueron revisadas previamente (Lara y Ortega)
por lo que no se detallarn mas.
Sin embargo, vale la pena aclarar que ms
que dos enfoques diferentes tendramos
que hacer referencia al tipo de variables
que son estudiadas. Actualmente, los clnicos cada vez con mayor frecuencia tienen la necesidad de valorar constructos
psicosociales como apoyo social o calidad de vida.
Ya que la diseccin intuitiva y la seleccin
analtica no han sido deliberadamente
comparadas, ninguna de las dos estrategias puede ser considerada superior a la
otra. La seleccin analtica es apropiada al
estudio de las actitudes psicosociales
cuando no est disponible ninguna correlacin etiolgica particular, diagnstica,
pronstica o teraputica. El enfoque de
diseccin intuitiva es apropiado para estudiar los fenmenos clnicos en los que se
pueden obtener correlaciones etiolgicas,
diagnsticas, pronsticas o teraputicas.
Los clnicos a menudo seleccionan las variables a incluir en un ndice disecando sus intuiciones previas u observaciones globales.
Sin embargo, no siempre se incluyen las
variables importantes.
Si una variable elemental tiene una escala
para ser medida, seguramente ser incluida en el ndice. Si por el contrario, no se
ha desarrollado una escala para medir la
variable, o no hay consenso para la medicin de la misma, entonces no se incluir.
Qu se debe incluir en un ndice compuesto? Muchas o pocas variables en el
ndice? La decisin acerca de lo que es importante es un acto complejo. El clnico
deber incluir todas las variables conside-
radas importantes, pero stas no deben ser

excesivas ya que entonces la extensin del
instrumento har difcil su aplicacin.
Para que un ndice sea fcil de usar debe
tener pocas variables componentes; pero
para que haga su trabajo de manera efectiva ninguna variable potencialmente importante debe omitirse. Se sugiere que los
instrumentos tengan un nmero relativamente pequeo de variables entre las que
se incluyan las que son importantes.
Para decidir cules son las variables importantes se emplea el juicio clnico basado en
las costumbres, sabidura convencional, experiencia personal o por consenso de autoridades. Sin embargo, para ciertos ndices
se necesita otro tipo de juicios que requieren de la colaboracin directa de los pacientes. Cuando las variables involucran
temas como satisfaccin, capacidad funcional o calidad de vida, la mejor indicacin
de importancia se obtiene de las preferencias expresadas por los mismos pacientes,
no a partir de juicios hechos por clnicos o
paneles de autoridades.
La eleccin de las variables que van a incluirse en un ndice puede ser consecuencia de un modelo matemtico.
La eleccin de los modelos depende del tipo de variables y del tipo de escala final que
se desea. Las variables se pueden arreglar de
diferentes formas. El resultado matemtico
puede ser una calificacin aritmtica o un
agrupamiento. Cuando se aplica este enfoque, la escala final puede ser una ecuacin
de regresin lineal mltiple o logstica o
una serie de factores.
Para evitar los extremos del juicio clnico
que no tiene evidencias confirmatorias o
modelos matemticos que no tienen un
juicio clnico que los corrobore, se puede
utilizar una combinacin de ambos. Por
ejemplo, algunos ndices pronsticos se
construyeron como racimos de categoras
elegidas originalmente de acuerdo al juicio
129
clnico, pero se agruparon segn sus efectos

estadsticos en el resultado que se predijo.
Las escalas clnicas
son instrumentos
de evaluacin que se utilizan
para detectar una enfermedad
(o una condicin), confirmarla,
excluir otras, medir su
intensidad y valorar la
evolucin de la misma tras
la teraputica implementada
o cualquierintervencin
Este tipo de juicio clnico-estadstico se utiliza tambin cuando la variable candidata

para incluirse en un ndice se somete a un
panel de jueces, expertos y no expertos y
despus se realiza un anlisis estadstico.
Despus de ser elegidas las variables componentes, deben identificarse adecuadamente para ser reproducidas. Las variables
componentes podran no ser identificadas
o que no se liste su escala de evaluacin o
que las categoras de la escala se citen sin
criterios de demarcacin.
Podemos tener una buena idea de lo que se
debe cubrir si recordamos que un ndice se
crea al identificar los componentes combinndolos en ejes y combinando stos en las
escalas de resultados. Necesitaremos identificar cada una de las variables componentes
y su escala. Si se usan ejes, se necesita identificar las escalas de evaluacin para cada
130
eje y los mecanismos por los que los componentes se agregan en ellos. Finalmente,
hay que identificar la escala final y la manera en que los ejes o los componentes bsicos se agregan para formar sta.
Objetivos de las escalas
de evaluacin clnica
Las escalas clnicas son instrumentos de
evaluacin que se utilizan para
1. detectar una enfermedad o una condicin en un grupo de poblacin
2. confirmar la enfermedad o condicin,
excluir otras
3. medir la intensidad o magnitud de la
enfermedad, condicin
4. valorar la evolucin de la misma tras la
teraputica implementada o cualquier
intervencin.
Estos cuatro objetivos debern ser recordados pues sern abordados nuevamente
en la seccin de validez.
Sensatez en la medicin clnica
n contraste con los principios bien

definidos que constituyen la teora
de la medicin en psicologa, los ndices clinimtricos usualmente se desarrollan de manera intuitiva.
De acuerdo a los textos de psicometra, un
instrumento de evaluacin debe tener validez y confiabilidad.
La Psicometra cita principios y frmulas
para determinar la confiabilidad (o reproducibilidad) y la validez (o precisin) de las
pruebas psicomtricas, pero no se han dado especificaciones anlogas para determinar las caractersticas ptimas de un instrumento de evaluacin clnica. Feinstein ha
propuesto un conjunto de especificaciones
que se puedan usar tanto para construir ndices clinimtricos como para evaluarlos.
Este conjunto de especificaciones es lo que
Feinstein llama sensatez. Antes de determinar la validez y la confiabilidad de un
instrumento de medicin clnica, conviene
determinar su sensatez.
Cuando evaluamos un ndice en particular,
cmo decidimos si es bueno o malo, satisfactorio o insatisfactorio?. Estas, entre
otras, son preguntas necesarias cuando evaluamos un ndice nuevo o uno viejo y
cuando decidimos qu ndice utilizar si hay
varios disponibles para describir el mismo
fenmeno. En el trabajo de laboratorio, el
sistema de evaluacin requiere que las mediciones sean reproducibles cuando el proceso se repite y sean precisas, es decir, sean
similares a la cantidad que se obtiene cuando la substancia se mide con un procedimiento de referencia (estndar de oro).
Un atributo importante de un sistema
cientfico de medicin es su consistencia
para obtener el mismo resultado cuando
el proceso de medicin se repite con el
mismo mtodo o el mismo observador

(variabilidad intraobservador) o por otro
observador (variabilidad interobservador).
El trmino consistencia parecer ser mejor
que el trmino de confiabilidad para describir este atributo. Otro trmino alternativo es reproducibilidad y confiabilidad.
Independientemente del trmino que se
emplee es claro que la condicin imprescindible para que una medicin sea considerada cientfica debe ser consistente.
Otro atributo importante de la medicin es
la validez o exactitud. ste se evala determinando el acuerdo entre la medicin observada y el resultado obtenido con el sistema de referencia estndar. Desafortunadamente, la idea de la exactitud no siempre
puede aplicarse a los ndices clinimtricos
porque la referencia estndar inequvoca no
existe o no se puede obtener. No tenemos
una referencia estndar con la cual comparar puntuaciones de ansiedad, dolor o capacidad funcional. Entonces, se ha reemplazado el trmino exactitud por el de validez.
Para los psiclogos, un instrumento tiene
validez si mide lo que se pretende medir.
Para Feinstein, este trmino se refiere a qu
tan bien el ndice hace su trabajo. Ya que un
ndice realiza muchos trabajos, se distinguen varios tipos de validez, que a menudo
resultan confusos para el clnico.
Sensatez es, para

los fines de este captulo,
un conjunto de
especificaciones utilizables
para construir y evaluar
ndices clinimtricos.
La sensatez es sentido
comn ilustrado, que es
una mezcla de sentido
comn ms conocimientos
sobre fisiopatologa y clnica.
Para Feinstein, la sensatez es sentido

comn ilustrado, que es una mezcla de
sentido comn ms conocimientos sobre
fisiopatologa y clnica. La evaluacin de
la sensatez de los instrumentos incluye 5
puntos principales:
1.
2.
3.
4.
5.
Justificacin y propsito
Validez de apariencia
Validez de contenido
Formato
Facilidad de uso
131
JUSTIFICACIN Y PROPSITO
En este captulo
resaltan los conceptos
de validez de apariencia
y validez de contenido.
Antes de que se evale un ndice necesitamos saber qu se supone que hace. Identifica un estado, denota un cambio, predice
un resultado u ofrece una gua?. Para qu
se necesita, en qu tipo de situacin clnica
se aplica?. Las respuestas a estas preguntas
acerca de la funcin clnica, la justificacin
y la aplicabilidad se necesitan al principio y
al final de la evaluacin. Al principio, el
evaluador necesita la informacin para
orientarse acerca de lo que el ndice hace.
Al final, la informacin es necesaria para las
decidir si el ndice ha logrado su propsito.
gua. El estado descrito puede ser un sustantivo, cuando el ndice muestra la existencia de una entidad particular (deprimido/no deprimido), o un adjetivo cuando
delinea la severidad o el grado de una condicin existente (leve, moderado, grave).
Los cambios en el estado pueden notarse
despus del uso repetido de un ndice de estado o de ndices especiales de transicin.
Cuando se aade informacin conveniente,
un ndice de estado o de cambio puede producir una estimacin pronstica o una gua
de tratamiento. Un solo ndice puede usarse para una o ms de estas funciones.
Aplicabilidad clnica
Cada ndice tiene un propsito que se demuestra con su funcin clnica y la justificacin de su existencia. Cada ndice se desarrolla y se aplica dentro de una estructura particular de pacientes e instalaciones clnicas.
Justificacin clnica
El trmino validez de
apariencia (face validity) se
emplea para la evaluacin
inmediata del ndice, sin una
atencin profunda a sus
componentes; nos indica si
en apariencia (o por lo que
se percibe a primera vista)
el ndice es adecuado.
Cuando se reporta un ndice nuevo, se espera que el investigador demuestre porqu se

necesita y porqu es superior a ndices parecidos que ya existen. El investigador no
construye un ndice clinimtrico nuevo a
menos que se pretenda que haga algo diferente o que lo haga mejor que lo que ya estaba disponible. Las razones para construir
un ndice y el motivo fundamental de su
aparente superioridad constituyen la justificacin del mismo. A veces esto se demuestra
al comparar los resultados de los ndices
nuevos y antiguos, pero usualmente, la justificacin es un recuento verbal de lo que el
investigador tiene en mente. Si el ndice
ofrece una expresin completamente nueva
del fenmeno, entonces la justificacin es
evidente. Si ofrece una nueva expresin alternativa a algo ya citado, el investigador
tendr una razn especial para crearlo.
Funcin Clnica
Las 4 funciones principales de un ndice
son describir un estado, denotar un cambio, estimar un pronstico y ofrecer una
132
La evaluacin de la aplicabilidad involucra la atencin de la funcin y la estructura del ndice. En la funcin, un ndice que
fue satisfactorio para un rol no necesariamente lo ser para otro. Por ejemplo, un
ndice que fcilmente se aplica para diagnosticar la existencia de depresin podra
no ser adecuado para distinguir cambios
en la severidad de la misma. Otro ndice
que sea excelentemente aplicado para
identificar cambios en un estado podra
no ser efectivo para predecir resultados futuros. La estructura del ndice tiene particular importancia para evaluar sus variables componentes y el espectro clnico de
subgrupos en los que se puede aplicar.
Una revisin de este espectro ayudar a
demostrar si el ndice es demasiado fino o
grueso para su pertinencia clnica.
Un ndice que parezca satisfactorio en su
construccin clinimtrica puede ser insatisfactorio en la aplicacin clnica.
VALIDEZ DE APARIENCIA
Este trmino se utiliza para la evaluacin
inmediata del ndice, sin una atencin profunda a sus componentes. El trmino en ingls es face validity y nos indica si en apariencia (o por lo que se ve a primera vista)
el ndice es adecuado. Lo que se observa en
este tipo validez es, de acuerdo a Feinstein,
la naturaleza del intercambio personal, la

eleccin de evidencia bsica, la coherencia
de las variables a incluirse y la colaboracin
adecuada de la persona a quien el ndice est dirigido.
Aunque este tipo de validez se aprecia de
manera obvia recibe poca atencin directa porque no se puede medir estadsticamente y es difcil de definir. Sin embargo,
la validez de apariencia es a menudo el
atributo ms importante del ndice.
Cuando se aplica un ndice, se produce un
intercambio interpersonal entre el usuario
y el evaluador (o las preguntas). Si esto no
se toma en cuenta se hace el tipo incorrecto de preguntas o se obtiene de manera inapropiada informacin personal. Esto tambin puede ocurrir con preguntas autoaplicadas, diseadas para ser contestadas sin
ayuda, no se entienden bien y se responden
otras cosas.
Cul es la evidencia que elegimos para
incluir en un ndice? La evidencia bsica
puede ser desplazada de diferentes maneras. El fenmeno que se pretende describir puede alterarse a partir de una entidad
blanda como dolor en el pecho hasta un
dato duro como es un hallazgo en el electrocardiograma. Otro ejemplo sera la
evaluacin del funcionamiento: Qu deseamos saber? Cul es el funcionamiento
del paciente en sus actividades de la vida
diaria? o Cul es su funcionamiento en
una actividad realizada en el laboratorio?
En algunas ocasiones, estas sustituciones y
los desplazamientos pueden ser apropiados y justificados, pero inconvenientes en
otras. La decisin acerca de su conveniencia depender del fenmeno particular
descrito por el ndice y del propsito especfico del mismo. Si el propsito del ndice y la evidencia elegida estn en acuerdo,
el resultado ser conveniente. De lo contrario, el ndice podra tener un foco inapropiado. Por ejemplo una evaluacin de
ansiedad basada en la respuesta galvnica
de la piel.
La coherencia biolgica se refiere a la manera en que las variables se acomodan juntas.

El tema de la coherencia es parte importante de la validez de apariencia cuando
muchas variables se han agregado de manera arbitraria en un ndice compuesto
Los ndices derivados de la observacin clnica directa generalmente no tienen este
problema porque si se han agregado es porque previamente se han observado juntas.
Otro elemento a considerar dentro de la
validez de apariencia es la motivacin del
paciente, el esfuerzo y el apoyo durante la
realizacin de la tarea. Si esto se omite,
una calificacin puede no ser vlida ni reproducible. Sera vlido preguntar sobre
la actividad sexual en una sala de espera?
La validez de contenido
corresponde al juicio
sobre los componentes
de un ndice y se evala
la omisin de variables
importantes, la inclusin
de variables inadecuadas,
la importancia de las
variables, la conveniencia
de la escala y la cualidad
de los datos bsicos.
VALIDEZ DE CONTENIDO
El juicio sobre los componentes de un ndice se denominan a menudo, validez de contenido. Como la validez de apariencia, la de
contenido no se puede evaluar con mtodos
estadsticos porque las decisiones se refieren
a la conveniencia en la seleccin y agregacin de los componentes. Como parte de la
validez de contenido se evala la omisin de
variables importantes, la inclusin de variables inadecuadas, la importancia (el peso)
de las variables, la conveniencia de la escala
y la cualidad de los datos bsicos.
Omisiones importantes
Las cosas que se dejan fuera de un ndice
son a veces ms importantes que las que se
incluyeron. Despus de considerar las variables que parecen ser clnicamente importantes y convenientes y despus de distinguir lo que se incluy en el ndice; el
examinador puede determinar lo que se
omiti. Hay varias razones para ello:
La variable se prob y se encontr que no
era importante. En este caso, los investigadores mostrarn la evidencia.
133
La variable se prob y se encontr que se

correlacionaba cercanamente con otra variable que se utiliz en su lugar. Por ejemplo, el valor de hemoglobina pudo haberse omitido de un ndice que utiliza el valor del hematocrito.
nos complejos tales como incapacidad funcional, calidad de vida, estado de salud o satisfaccin con los servicios mdicos. Debido
a la importancia de cada una de las variables
componentes, stas pueden calificarse de
manera diferente por pacientes y clnicos.
La variable se consider y se desech sin

probarse, debido a que otra variable se escogi como un sustituto preferente.
El problema de la ponderacin es particularmente importante cuando los pesos se

escogen por modelos matemticos ms
que por mecanismos de juicio. Con modelos diferentes, los coeficientes de ciertas
variables en el mismo conjunto de datos
pueden tener diferencias notables en los
pesos o aun diferentes direcciones (en signos positivos o negativos). La evaluacin
de la sensatez de los pesos asignados a las
diferentes variables componentes es muy
importante cuando la asignacin se hizo
sin un juicio clnico.
La variable pudo haberse considerado pero no se incluy porque no tiene su propio ndice o escala de medicin clinimtrica (es decir, el investigador no supo cmo medir la variable de inters).
La importancia de la variable no se reconoci.
Inclusiones inapropiadas
Escalas elementales satisfactorias

La conveniencia de la inclusin de la variable depende del propsito del ndice. La decisin de incluir variables requiere de juicios
clnicos en los que no todos los examinadores concordarn. Por estas razones, los componentes incluidos en un ndice son probablemente mejor calificados como claramente convenientes, claramente inconvenientes
o equvocamente convenientes. El evaluador puede decidir si una variable en particular es claramente conveniente o inconveniente. Los componentes que sean equvocamente convenientes pueden calificarse
mejor si uno se basa en las justificaciones establecidas para su inclusin.
Peso de los componentes
Otro atributo distintivo es la sensatez de los
pesos relativos (o importancia) asignada a
los diferentes componentes de un ndice.
Los juicios utilizados en el proceso de ponderacin pueden realizarse de manera diferente por gente distinta, en particular con
decisiones que requieren de juicios de valor.
El peso de los componentes es importante
cuando se construyen ndices para fenme-
134
Aun si un ndice tiene todos los componentes bsicos y los pesos que hacen parecer a su
contenido como conveniente, las variables
componentes podran no ser expresadas de
manera satisfactoria. Algunas de las escalas
elementales podran adolecer de una categora neutral conveniente como incierta o indeterminada, que se necesitaran para diagnstico u otras decisiones que no siempre se
expresan en un s o no definitivo.
Otras escalas elementales puede ser demasiado gruesas (como viejo o joven, para
edad) o demasiado finas (como 1,2,3, ...
98, 99, 100 para volumen clnico de un
murmullo) para permitir la adecuada discriminacin del fenmeno descrito. Quiz
el problema ms grande de las escalas elementales es su no-existencia. La ausencia
de una escala apropiada es probablemente
la razn principal para la omisin de variables componentes en ndices clnicos.
Calidad de los datos bsicos
Finalmente, aun cuando todo parezca satisfactorio, el evaluador puede tener sus
reservas cientficas acerca del proceso de

evaluacin y reporte de los fenmenos bsicos. En este nivel de la evaluacin, el tema se refiere a la calidad cientfica de los
datos bsicos ms que a la construccin
del ndice clinimtrico.
de definir con un conjunto de reglas fijas. Sin

embargo, existen 4 principios para que la
comprensibilidad se note de las observaciones de los ndices y sea popular y til. Estos
principios son: simplicidad, pocas variables,
transparencia y connotacin biolgica.
En laboratorios ordinarios, los datos bsicos

son las mediciones directas de una sola variable como el colesterol o la glucosa. En las
actividades clinimtricas, los datos bsicos
pueden ser observaciones primarias directas
como presin diastlica (77 mm Hg) o designaciones secundarias como petequia, que
representa la interpretacin de una observacin primaria inexpresada de la piel.
La simplicidad, si es adecuada, es siempre

una virtud. Ayuda a entender, recordar y a
utilizar las variables o instrumentos que se
emplean. La simplicidad de un ndice se
observa en la expresin de la escala de resultados. Un ndice ser ms fcil de manejar si todos sus componentes se identifican
de manera clara y si las expresiones originales de los datos evitan transformaciones
esotricas o inusuales.
Tanto la validez
de apariencia como
la de contenido
no se evalan
con mtodos estadsticos
sino por consenso.
FORMATO
Independientemente de cmo se hayan escogido y acomodado los contenidos, todos
los ndices se expresan con un formato. ste puede ser una sola oracin con una sola
respuesta, o una larga lista de mltiples oraciones o preguntas. Algunas caractersticas
importantes son: la comprensibilidad, entendemos que entra y que surge despus?, la
reproducibilidad, las instrucciones de operacin estipulan claramente los ingredientes
del ndice y cmo se mezclan?. Otra caracterstica es la conveniencia de la escala de resultados, tiene un alcance adecuado, un
patrn lgico de puntuaciones, una capacidad satisfactoria de discriminacin?.
En contraste con el juicio clnico que se
necesita para evaluar la pertinencia de un
ndice para su propsito y estructura, ciertos atributos importantes pueden examinarse sin ningn conocimiento clnico especfico, por alguien que est familiarizado con los 3 principales retos que pertenecen a cualquier actividad mtrica. Estos
desafos son: comprensibilidad, reproducibilidad y conveniencia de la escala final.
Otra manera de mantener las cosas simples

es limitar el nmero de variables contenidas
en el ndice. Si el Apgar hubiera incluido diez
variables en lugar de cinco, lo atractivo del
ndice podra haberse reducido drsticamente y quizs nunca hubiera tenido su popularidad actual. Por otra parte, las ventajas de
una escala simple y con pocas variables, podran no compensar las desventajas producidas si la escala no funciona efectivamente.
Aunque Feinstein menciona que el nmero de variables debe limitarse es necesario
mantener el equilibrio entre el nmero de
variables y qu tan exhaustivo se pretende
que sea el ndice.
Comprensibilidad
La transparencia se refiere a la posibilidad

de ver a los componentes en la calificacin final. Entre menos variables, ms fcilmente el usuario ver en la escala final a los componentes de una calificacin
particular del ndice. Otro determinante
de la transparencia es el nmero de categoras en la escala de medicin utilizada
en cada variable componente. Una tercera
caracterstica es la variacin en la ponderacin de los elementos individuales en
una calificacin aditiva.
La comprensibilidad, como la belleza, est en

el ojo y la mente del espectador y no se pue-
La connotacin biolgica de un instrumento es un atributo que indica por un
135
lado lo que es posible biolgicamente y

por el otro, lo que biolgicamente es relevante.
dr variar de manera sustancial sin haberse presentado ningn cambio real.

Conveniencia de la escala final
Reproducibilidad
La reproducibilidad de un ndice depende,
en primer lugar, de la claridad y minuciosidad de las instrucciones para su uso. Cuando se utiliza por otra persona adems del
creador, pueden discernir fcilmente que
hacer y cmo hacerlo?. La reproducibilidad
se determina por un juicio cualitativo derivado de la lectura de las instrucciones operacionales que acompaan al ndice. Vemos la descripcin operacional del ndice y
preguntamos si todos los ingredientes se
han estipulado de manera adecuada. Si no
podemos determinar exactamente lo que
entra al ndice y cmo se junta, el ndice no
tendr una alta reproducibilidad a pesar de
que tan bueno parezca con las estadsticas
de los estudios cuantitativos de variabilidad. Otro problema surge cuando el ndice se expresa como una escala global, sin
criterios explcitos para demarcar las puntuaciones que se citan en la escala. En ausencia de tales criterios, una escala global
tendr la desventaja de que las puntuaciones dadas por personas diferentes podran
no estar estandarizadas.
Un problema distinto surge de los instrumentos autoaplicados. Es necesario asegurarse que el usuario entiende las instrucciones. El reto para el creador es ponerse
en el lugar de los usuarios y decidir cmo
reaccionarn a las instrucciones. Otros
puntos implican la estandarizacin para
los aparatos u otros procedimientos que
acompaan el uso del ndice.
Un aspecto ms, se refiere al papel del esfuerzo y apoyo y tambin de la eleccin
del umbral de los sntomas del paciente o
de la mxima tolerancia cuando la magnitud se cita para la ejecucin de una tarea.
Si estas distinciones no se manejan adecuadamente, la magnitud reportada po-
136
La escala debe incluir todas las categoras

posibles (exhaustividad) y stas deben ser
mutuamente excluyentes. Debe tener valores reales y debe discriminar adecuadamente entre diferentes valores.
FACILIDAD DE USO
No importa que tan bien est construido
el ndice, la medicin ser poco atractiva
si es demasiado difcil de hacer. Consecuentemente, el ltimo aspecto de la sensatez de un instrumento se refiere a la cantidad de tiempo, personal, riesgos y esfuerzos involucrados en obtener y organizar la informacin necesaria para expresar
el resultado del ndice.
Aunque citado al ltimo, la importancia de
este atributo es obvia. Se refiere a la cantidad de tiempo, los esfuerzos, los riesgos y el
tipo de personal necesario para recolectar la
informacin utilizada en el ndice. No importa que est bien construido, probado o
reportado; no puede ser satisfactorio si
consume demasiado tiempo, es riesgoso o
muy costoso el aplicarlo. Si la adquisicin
de los datos requiere instalaciones especiales como un programa de computadora
con video terminal o si necesita otras tcnicas especiales, las caractersticas y la complejidad de la tecnologa deben identificarse y reconocerse. Otra caracterstica es la
aceptacin que tenga en la gente a quien se
aplica. Si contiene preguntas sobre informacin sexual, familiar, econmica o personal, podra haber gente renuente a discutirlas con un extrao y si las preguntas no
se redactan de manera discreta el ndice
puede fallar porque no reciba adecuada
cooperacin. Finalmente otro aspecto es el
procedimiento en s mismo, como ser muy
largo, o muy complejo (por ejemplo, con
mltiples patrones de salto).
Consistencia
espus de que se ha desarrollado

un ndice, debe validarse. El proceso es algo confuso para los clnicos,
porque a menudo involucra expresiones estadsticas que no le son familiares. En el
campo psicomtrico, las principales actividades de validacin son: a) determinar la
confiabilidad del instrumento y b) determinar su validez.
Confiabilidad o consistencia se pueden

referir a dos cosas diferentes: la variabilidad externa, en la cual un ndice es usado en diferentes ocasiones o por diferentes
observadores y la consistencia interna de
los elementos del ndice.
Validez se puede referir al menos a cuatro
ideas diferentes, las cuales han sido designadas con nombres tales como validez de
apariencia, validez de contenido, validez
de criterio y validez de constructo.
En clnica, la validacin empieza cuando
se evala la sensatez del instrumento; en
esta evaluacin se incluyen la validez de
apariencia y la validez de contenido.
A continuacin, se procede a determinar
la consistencia (o confiabilidad) del ndice
y su validez de criterio y de constructo.
EL CONCEPTO BSICO
DE CONSISTENCIA
El trmino consistencia suele emplearse como sinnimo de confiabilidad. Un ndice
tiene consistencia externa si arroja resultados similares cuando se aplica repetidamente a la misma persona. Este tipo de
consistencia se prueba cuando los mismos
pacientes son evaluados nuevamente por el
mismo clnico o por otros usando el ndice. Cuando el ndice se reaplica por la misma persona se determina su variabilidad
intraobservador. Cuando es aplicado por

otra persona se determina la variabilidad
interobservador. Si las aplicaciones repetidas dan resultados similares, el ndice se
considera consistente.
Un ndice puede ser inconsistente por tres
razones:
a) El evento es variable. La entidad bajo estudio puede cambiar de un examinador
a otro. Por ejemplo: una sustancia srica
inestable, la condicin del paciente es alterada por observaciones sucesivas.
b) El procedimiento en s mismo es variable. Por ejemplo, un reactivo qumico
inestable, las instrucciones dadas en un
cuestionario o un formato vago o ambiguo acerca de lo que hay que hacer.
Se le ha llamado variabilidad del mtodo o variabilidad del instrumento.
c) Variabilidad de la persona que aplica el
procedimiento; tambin se le llama variabilidad del usuario.
El trmino confiabilidad
o consistencia se refiere tanto
a la variabilidad externa,
en la cual un ndice es usado
en diferentes ocasiones o por
diferentes observadores, como
a la consistencia interna de
los elementos del ndice.
Las variaciones en cualquiera de estos tres

elementos producirn desacuerdo en los resultados cuando el ndice se aplica de manera repetida.
Porqu es importante la consistencia?
La mayora de la gente piensa que un dato

es cientfico cuando es duro. Sin embargo, no suele definirse lo que es duro o lo
que es blando.
Un dato es considerado duro si posee
caractersticas tales como 1) precisin, 2)
objetividad, 3) dimensionalidad y 4) preservabilidad. La informacin es precisa si
la medida obtenida con un proceso en
particular concuerda con el resultado obtenido con el procedimiento estndar. Es
objetiva si la medicin est libre de prejui-
137
cios que pueden ocurrir en los observadores humanos. Es dimensional si no se expresa en categoras o puntajes arbitrarios
sino en una escala numrica de valores dimensionales (categoras equiintervalares).
Es preservable si la entidad-muestra de
suero, de tejido, imagen radiolgica- puede ser guardada para reexaminarse en una
fecha posterior.
Una medicin puede
ser inconsistente porque
el evento cambie, porque el
procedimiento de medicin sea
variable, o porque la persona
que est midiendo lo haga
de manera diferente.
Muchos de los estndares

empleados cientficamente
fueron obtenidos mediante
acuerdos arbitrarios, por
ejemplo, la duracin de una
hora, la longitud del metro,
el volumen de un litro.
La consistencia es lo que hace
que estas mediciones sean
cientficas, un metro
siempre es un metro y
un litro siempre es un litro.
Sin embargo, hay informacin considerada

cientfica que no posee estas cuatro caractersticas. Por ejemplo el estado del clima no
puede ser preservado y aun as la informacin meteorolgica es considerada cientfica; los organelos de una clula no son
descritos en escalas dimensionales. Ms aun,
a una gran cantidad de observaciones reportadas como datos cientficos no se le puede
determinar su precisin porque no existe un
estndar. Por ejemplo, la informacin dada
por un patlogo, un radilogo, etc.
Si para que un dato sea considerado duro no
es necesario que se demuestre su precisin,
objetividad, dimensionalidad o preservabilidad, entonces podemos concentramos en el
principal requerimiento de la informacin
cientfica: la consistencia. Los datos tendrn
calidad cientfica si los resultados de la medicin son consistentemente reproducidos por
el mismo u otro observador.
A menudo se olvida que muchos de los estndares empleados cientficamente fueron obtenidos mediante acuerdos que
pueden ser considerados arbitrarios, por
ejemplo, la duracin de una hora, la longitud del metro, el volumen de un litro. Lo
que las hace cientficas es la consistencia,
un metro siempre es un metro y un litro
siempre es un litro.
Es frecuente que la informacin clnica sea
considerada blanda y permanece blanda
porque no se realizan esfuerzos para endurecerla. La solucin a este problema est en
reconocer la importancia de los datos clnicos y de los ndices clinimtricos. Cuando
se reconoce que variables clnicas tales co-
138
mo el malestar del paciente, el estado funcional o la calidad de vida son a menudo

ms relevantes para el cuidado clnico que
otras variables como datos de laboratorio
y/o gabinete, y cuando se reconoce que obtener esta informacin es sensato, podremos empezar a mejorar su consistencia.
La medicin en el laboratorio implica toda
una serie de actividades como la calibracin de los equipos, la preparacin de los
reactivos, de las muestras, el registro de las
operaciones y la observacin de los resultados. De igual manera se requiere de todo
un proceso para hacer que un ndice sea
consistente.
EL PAPEL DE LAS INSTRUCCIONES
OPERACIONALES Y LOS CRITERIOS
As como un cocinero necesita una receta
para preparar algo nuevo, a una persona
que va a utilizar un ndice se le deben proporcionar un conjunto de instrucciones
adecuadas. Si hay variaciones en el producto que emerge cuando cocineros diferentes
emplean la misma receta, las diferencias
pueden deberse a los hbitos personales de
los cocineros, pero otra fuente de inconsistencia puede ser una receta poco clara. Un
grupo de cocineros cuya conducta culinaria
es suficientemente similar para producir
exactamente la misma cosa con una receta
bien especificada podra tener grandes variaciones en el producto si la receta es ambigua o confusa. Al aplicar un ndice
clinimtrico en una situacin clnica particular, el usuario cursa por un proceso en
tres fases. Primero el usuario observa la entidad (paciente, muestra histolgica, placa
radiolgica, etc). En la segunda fase el usuario convierte esas observaciones en datos
crudos. En el tercer paso los datos son convertidos en una categora de la escala final.
La primera fase es el proceso de observacin que los clnicos usan durante la elaboracin de la historia clnica o de la
exploracin fsica. Los mtodos para mejorar la calidad cientfica de estas observacio-
Consistencia
nes bsicas han sido extensamente descritos. En ocasiones, la observacin se realiza

en un expediente clnico o en otro registro
mdico. Por ejemplo, un paciente manifiesta que es el presidente de la repblica.
Las fuentes de variabilidad del procedimiento deben ser evaluadas cuidadosamente y son a menudo ms importantes que la
variabilidad del evento o la del usuario en
la variabilidad observada.
La segunda fase involucra especificaciones

operacionales para convertir los datos crudos en las variables que forman parte del ndice. Estas especificaciones hacen que el
proceso pueda reproducirse. La definicin
de ideas delirantes dice que son ideas que no
corresponden a la realidad, que no son accesibles a la razn y que no son compartidas
por el grupo. La creencia que el paciente tiene de que es presidente de la repblica (sin
serlo), cumple los criterios de idea delirante.
Si la consistencia es la caracterstica fundamental para considerar que un dato es cientfico Porqu a veces no se reporta este dato?
En la tercera fase, las variables incluidas se

combinan y convierten en una categora en
la escala final. Esta fase ser defectuosa si las
categoras de la escala final no estn claramente demarcadas o si el rango y/o la discriminacin son inadecuadas. Los criterios
del DSM IV especifican los sntomas y la
duracin, que adems de las ideas delirantes
deber tener un paciente para ser considerado esquizofrnico o no esquizofrnico.
Por ejemplo, si no se especifica qu son
ideas delirantes, habr dificultad en reproducir un diagnstico que incluya como criterio la presencia de este tipo de ideas.
Cualquiera de estos u otros defectos en las
especificaciones operacionales de las variables que componen el ndice o de los criterios que se emplean para combinarlas
pueden llevar a variabilidad en el uso del ndice porque el usuario tendr incertidumbre sobre qu hacer. Por ejemplo, si no se
especificara el tiempo de duracin de los
sntomas para asignar la categora de esquizofrnico a un paciente, habra variabilidad (como sola ocurrir) en la asignacin de
esta categora a los pacientes.
Los detalles operacionales y los criterios de un
ndice determinan que la evaluaciones que se
realicen con el mismo sean reproducibles.
En ocasiones, la consistencia se evala en un

estudio piloto que no se reporta formalmente.
En otras ocasiones, determinar la consistencia es difcil o imposible. Por ejemplo, ya
que no podemos programar el nacimiento
de los bebs y porque los recin nacidos a
menudo cambian su condicin rpidamente, no es posible realizar estudios de consistencia de la escala de Apgar, podramos
determinar la variabilidad entre observadores que estn presentes en cada nacimiento,
pero tendramos una gran dificultad en armar el mismo grupo de observadores para
una serie de nacimientos diferentes.
Los datos tendrn

calidad cientfica
si los resultados
de la medicin son
consistentemente
reproducidos por
el mismo u otro
observador.
Las pruebas completas de la variabilidad

interobservador seran imposibles para procedimientos como broncoscopa o varios
tipos de endoscopias cuya repeticin puede
implicar un gran malestar para los pacientes. Podramos hacer que los examinadores
realizaran sus observaciones despus de
que el endoscopio haya sido previamente
insertado, pero los pacientes estaran muy
molestos si cada observador repitiera el
proceso desde el principio.
Por otro lado, sera muy difcil determinar
la consistencia intraobservador en circunstancias en las cuales los clnicos pueden recordar lo que los pacientes dijeron
previamente, si la segunda prueba se realiza poco tiempo despus de la primera. Un
retraso en la segunda prueba, esperando
darle al clnico la oportunidad de olvidar lo
que anot previamente, sera pertinente slo si la condicin del paciente es estable o
permanece sin cambio en ese intervalo. A
causa de este problema a muchos ndices
139
clinimtricos se les determina la consistencia entre observadores y no intra-observador. Ambos tipos de consistencia pueden
ser evaluados si el usuario trabaja con datos
grabados ms que con un paciente vivo o
con muestras biolgicas que no cambian
entre observaciones.
En otras ocasiones, no se hace un estudio
formal para determinar la variabilidad en
el uso de un ndice debido a la tradicin
mdica de no confirmar la consistencia
de los datos subjetivos. Por ejemplo, los
epidemilogos rara vez determinan la
consistencia de la informacin acerca de
exposiciones a agentes que se sospecha
que son nocivos; los clnicos, no corroboran los datos acerca de sntomas y signos fsicos.
Sin embargo, en el campo clnico, la evaluacin de la consistencia no es totalmente
desconocida. En algunos casos, particularmente cuando se trata de una situacin de
la que depende un tratamiento radical como una ciruga, los radilogos tendern a
corroborar la interpretacin de imgenes y
los patlogos las designaciones de citologa
e histopatolgica. Antes de cualquier procedimiento radical, es prctica comn buscar una segunda opinin.
La consistencia deber evaluarse en cada
elemento del ndice y en la composicin
del mismo.
Quiz la razn ms comn para no hacer
un estudio formal de la consistencia de un
ndice es el valor de la informacin que
proporciona. Cuando este valor no es tan
aparente, el creador del ndice tender a hacer estudios en los que demuestre la confiabilidad del ndice como una de las
principales formas de atraer usuarios potenciales. La demostracin de que un ndice es consistente ser un punto importante
para su empleo en la medicin de un atributo. Por ejemplo. Es tan aparente la importancia de muchas observaciones clnicas
y de los resultados producidos por la histo-
140
patologa, radiologa, o tomografa computarizada que no se considera necesario determinar formalmente su consistencia.
En los casos en los que la informacin clnica proporcionada por un ndice es considerada inmediatamente como valiosa, el
ndice puede resultar aceptado en base a su
validez de apariencia y validez de contenido sin estudios de variabilidad entre observadores o del mismo observador. Un nuevo
ndice clnico se difunde y se emplea antes
de ser sujeto a cualquier prueba que pudiera demostrar inconsistencia.
De esta manera, a causa de las diferentes
tradiciones en los campos mdico y psicolgico, los ndices se desarrollan con algunas paradojas. Muchos ndices psicolgicos
tienen alta consistencia pero un valor dudoso y muchos ndices clnicos que tienen
alto valor tienen consistencia dudosa.
CONSISTENCIA INTERNA
Cuando un ndice est formado por la suma de puntajes de una serie de variables
individuales, por ejemplo la Escala de Depresin de Hamilton o un examen para
certificar la competencia clnica, debe evaluarse la relacin de las variables individuales (unas con otras).
El punto aqu no es la variabilidad externa
de los usuarios sino la homogeneidad interna, es decir, la coherencia de los items en su
intercorrelacin de unos con otros.
Supongan que desarrollamos un ndice de
competencia clnica con una serie de 200
preguntas. Si aleatoriamente dividimos las
200 preguntas en dos grupos de 100 preguntas cada uno, podramos esperar que el
candidato reciba puntajes similares en cada
mitad de las preguntas. Este tipo de prueba de la consistencia de un ndice es llamado consistencia de mitades. Es expresada
estadsticamente como un coeficiente de
correlacin entre los rangos de los puntajes
obtenidos en las dos mitades.
Consistencia
Otra forma es el desarrollo de formas alternativas del instrumento. En esta situacin, el

foco bsico de las preguntas individuales se
mantiene, pero las preguntas en s mismas
son alteradas para producir una segunda
evaluacin diferente. Por ejemplo, si la primera evaluacin contiene tres preguntas
acerca de farmacologa, cuatro preguntas
acerca de anatoma y cinco preguntas acerca
de criterios diagnsticos, la segunda evaluacin podra contener un nmero similar de
preguntas acerca de los mismos tpicos excepto que las preguntas se referiran a una serie diferente de farmacologa, anatoma y
criterios diagnsticos. Los mismos candidatos tomaran ambas evaluaciones y se esperara una correlacin cercana de su desempeo
en las dos evaluaciones como una buena evidencia de su confiabilidad. Las formas alternativas de la prueba de Wechsler de memoria
es un ejemplo de esto. Se recomienda tener
formas alternativas de un instrumento cuando el efecto del recuerdo puede producir resultados inconsistentes.
La intercorrelacin de variables o items
componentes es una forma til de determinar si un ndice es unidimensional. Si
las variables individuales (o items) parecen correlacionar bien, o si cada par de
componentes tiene iguales correlaciones, los
componentes pueden ser considerados como
relativamente homogneos. Entonces mediran presumiblemente la misma cosa y produciran un ndice unidimensional. Es decir,
todas las variables, aunque diferentes, miden
la misma dimensin. Por ejemplo, todos los
reactivos del Inventario de depresin de Beck
miden la dimensin depresin.
Uno de los mecanismos estadsticos utilizados para evaluar la magnitud de estas correlaciones son el clculo del alfa de Cronbach.
Cuando los items son expresados en una
forma binaria como si/no, verdadero/falso
el resultado calculado es llamado el coeficiente de Kuder-Richardson-20. El alfa de
Cronbach (o su anlogo de Kuder-Richardson) es un coeficiente de correlacin que representa el promedio ponderado de las
interrelaciones que existen entre las variables componentes del ndice. Los valores
del alfa de Cronbach pueden ir de 0 a 1.
Los valores se consideran buenos si son
>0.8 y excelentes si >0.9 (aunque para
Nunnally 0.70 es suficiente). El ejemplo citado por Feinstein ilustra claramente este
concepto: un investigador quiere desarrollar
un ndice de eritematosidad de la sangre
utilizando medidas de hemoglobina, hematocrito, conteo de clulas rojas, de reticulocitos y de clulas blancas como posibles
variables componentes del ndice. Cuando
lo aplica a un gran grupo de pacientes, los
cinco componentes podran no tener un nivel particularmente elevado de intercorrelacin mostrado por el alfa de Cronbach.
Un anlisis factorial, sin embargo, podra
mostrar que la hemoglobina, el hematocrito y el conteo de clulas rojas estn correlacionadas entre s mientras que el
conteo de reticulocitos y de clulas blancas
parecen variables separadas. El investigador
elimina estos ltimos componentes y construye el ndice de eritematosidad nicamente con las tres primeras variables. Con
estas tres variables el ndice podra tener
una alfa de Cronbach extremadamente elevada, lo que sugerira que las tres variables
son homogneas y probablemente miden
el mismo fenmeno.
En el rea de salud mental,

es recomendable la realizacin
de un estudio preliminar de
variabilidad interobservador
siempre que participen varios
observadores en un estudio.
Por supuesto que las variables contenidas

en el ndice seran redundantes ya que estos tres elementos con frecuencia se emplean como sinnimos.
Si se hubiera pensado en la sensatez de un
ndice de este tipo ms que en sus caractersticas estadsticas, antes de desarrollar el
ndice el investigador habra tenido algunas
dudas acerca del propsito y de la funcin
de un ndice de eritematosidad.
El alfa de Cronbach casi no suele calcularse para los ndices clinimtricos porque stos a menudo son construidos como el
Apgar o los estadios TNM como una
composicin deliberada de variables mltiples que tiene roles individuales diferentes;
141
sin embargo, como ya se ha mencionado,

la mayora de los ndices clinimtricos surgen de la observacin de ciertos fenmenos
en los pacientes, que el clnico diseca, por
lo tanto, es razonable esperar que cuando
se evalan ciertos atributos que el clnico
ha observado que generalmente se presentan juntos, el alpha de Cronbach sea elevado. Por ejemplo, esperaramos que los
componentes de un ndice de depresin
(Escala de depresin de Hamilton) tuviese
un alpha elevado. Por otro lado, si una variable componente hace una contribucin
distinta al ndice, los clnicos debern incluir esa variable y aceptar algunos de los
problemas subsecuentes que ocurren cuando se agregan variables diferentes.
Si el resultado compuesto es utilizado para
identificar el agregado total de una condicin particular, el clnico desear incluir todas las distinciones importantes en la
expresin compuesta. Por el otro lado, si
ciertas variables estn tan cercanamente relacionadas (como hemoglobina y hematocrito) que una puede ser substituida por
otra, una de estas variables podra ser eliminada porque no hace una contribucin distinta al ndice compuesto. La aparente
redundancia de las variables correlacionadas
a menudo se evita cuando los ndices clinimtricos son construidos con modelos matemticos ms que con un tipo de juicio
como el que llev a la escala de Hamilton.
En tales procedimientos matemticos, como la regresin lineal mltiple, las variables
sern eliminadas si no contribuyen lo suficiente al ndice total. En algunos instrumentos de evaluacin psicolgica, sin
embargo, la redundancia puede ser deliberadamente buscada como un mecanismo
para obtener un grado razonable de homogeneidad para un grupo de variables. Por
ejemplo un ndice que contiene tres variables con correlaciones de 0.3 tendrn un alfa de Cronbach de 0.56. Si el ndice tiene
20 variables con correlaciones de 0.3 el alfa
de Cronbach ser de 0.90. Debido a que un
nmero incrementado de variables interrrelacionadas eleva el alfa de Cronbach, a veces
142
se tiende a incrementar el nmero de variables de un ndice. Sin embargo, en clnica

sta no es una prctica comn ya que por
restricciones de tiempo puede ser deseable
acortar el nmero de variables eliminando
aquellas que parecen redundantes.
Otra forma de evaluar la consistencia es llamada confiabilidad prueba-contraprueba.
Dependiendo del objetivo de la medicin,
en algunos casos se puede realizar un anlisis de la consistencia prueba-contraprueba
empleando el procedimiento de mitades.
Para la primera prueba el candidato responde una muestra aleatorizada de la mitad de las preguntas. En la segunda prueba
el candidato responde el resto de las preguntas. En clnica, no se han desarrollado
estas formas alternas de los ndices. Generalmente lo que se ha incluido es la informacin que se requiere, por lo tanto la
creacin de una segunda forma, o la divisin en dos mitades no sera algo sensato;
aunque si el proceso involucr nuevas preguntas de una serie escogida al azar de las
preguntas previas, la confiabilidad pruebacontraprueba requiere una evaluacin de
dos versiones diferentes del mismo ndice.
Si en ambas ocasiones es usado el mismo
ndice el investigador no se enfrenta con el
desempeo del ndice sino con la variabilidad de los usuarios.
Para evaluar la competencia clnica rara vez
se repite la misma serie de preguntas para la
misma serie de candidatos porque probablemente recordarn las primeras respuestas. Debe construirse una versin diferente
del mismo tipo de preguntas para determinar la confiabilidad prueba-contraprueba.
Ya que no es fcil desarrollar estas versiones
diferentes, muchos de los anlisis psicomtricos determinan la consistencia dividiendo a la mitad ms que haciendo realmente
una prueba-contraprueba. Ocasionalmente algunas preguntas de evaluacin que fueron usadas en un ao podran ser repetidas
al ao siguiente. Los resultados de estas
pruebas repetidas -si los dos grupos de can-
Consistencia
didatos son razonablemente similares pueden entonces ser comparados para confiabilidad prueba-contraprueba (aunque los
sujetos sean diferentes). En clinimetra,
cuando se habla de prueba-contraprueba
no se est probando en s al ndice, lo que
se est probando es la consistencia de los
sujetos en sus respuestas.
EXPRESIN ESTADSTICA
DE LA CONSISTENCIA
A diferencia de la sensatez, la cual puede ser
evaluada cualitativamente, la consistencia es
evaluada cuantitativamente. Los estudios
que se realicen se disean de acuerdo al tipo
de consistencia (interna, intra-observador,
inter-observador) que se desea determinar.
Para los estudios de variabilidad intra-observador, cada serie de observaciones est hecha
por el mismo observador en ocasiones diferentes. Para la variabilidad inter-observador
cada grupo de observaciones es hecha por
observadores diferentes. El acuerdo entre las
diferentes observaciones puede ser expresado de maneras directas e indirectas.
En la forma directa, cada par de observaciones se compara y se anota el acuerdo o el desacuerdo entre ellas, con diferencias de
puntuacin o con proporciones o porcentajes de acuerdo. Las formas directas de expresin de la consistencia no se emplean con
frecuencia.
Por ejemplo si se evala a una persona que
obtiene una calificacin de 18 puntos en
la escala de Hamilton cuando es valorado
por el observador A y 20 por el observador B, el desacuerdo puede ser citado como un incremento de 2 (20-18) puntos.
Otro mtodo es citar la diferencia del incremento como una proporcin del valor
promedio. En el ejemplo el valor promedio de los dos observadores es 19
(20+18/2). El desacuerdo proporcional
sera 2/19=0.10. Despus de que se determinan estos valores para cada par de observaciones, se puede obtener el valor
promedio de todo el grupo como la expresin directa de la consistencia observada.

Este proceso es adecuado cuando los datos
se expresan en dimensiones o en valores
cuasi dimensionales. Para los datos expresados en grados ordinales los desacuerdos
pueden ser citados de acuerdo al nmero
de categoras de disparidad. Entonces, si
un puntaje es de 2+ y otro de 3+ estos difieren en un grado, si un puntaje es de 1+
y otro 4+ difieren en tres grados. Para datos
binarios, donde slo dos categoras estn
disponibles, pueden ocurrir cuatro tipos de
resultados para dos observadores: dos tipos
de acuerdo (S-S y NO-NO) y dos tipos
de desacuerdo (S-NO y NO-S).
Para datos ordinales, binarios o nominales
la expresin de resumen ms comnmente
utilizada es el porcentaje de acuerdo. El nmero de acuerdos exactos es dividido entre
el nmero total de observaciones pareadas.
Entonces si dos observadores estn completamente de acuerdo en 37 de 50 pares
de observaciones tendrn un porcentaje de
acuerdo del 74%. Esta expresin es satisfactoria para datos binarios, pero no refleja
la magnitud de categoras de desacuerdo en
datos nominales u ordinales.
Las expresiones que ms se emplean y se reportan cuando se describen las caractersticas de un instrumento son los mtodos
indirectos.
En los mtodos indirectos, el patrn entero de acuerdos y desacuerdos se cita con
una sola expresin estadstica.
El coeficiente expresa la relacin entre los resultados observados y los resultados esperados para un modelo matemtico particular.
El modelo matemtico ms usado para los
datos dimensionales es el coeficiente de correlacin. Un valor cercano a uno para este coeficiente indica una relacin cercana entre las
dos series de observaciones, un valor cercano
a cero indica una relacin pobre o nula.
143
Para expresar consistencia

se emplean coeficientes
de concordancia que toman
en cuenta la concordancia
esperada por azar como
kappa o kappa ponderada.
Aunque los coeficientes de correlacin se han

vuelto expresiones estadsticas estndares de
acuerdo, en realidad indican tendencias ms
que concordancias. Por ejemplo, si un procedimiento se basa en resultados que siempre
son elevados el uno con respecto al otro, 2 o
10 veces, las dos series de observaciones nunca sern concordantes pero tendrn un a
correlacin positiva de 1. Por ejemplo, un clnico siempre califica como ms graves a los
pacientes que otro clnico, sus evaluaciones
nunca sern concordantes pero la correlacin
entre sus evaluaciones ser cercana a 1.
En datos dimensionales una correlacin
cercana llevar a que el valor de una variable fcilmente sea convertida en el valor de
otra. Tales correlaciones han sido usadas en
los laboratorios qumicos como procedimientos estndares de transformaciones en
los cuales los resultados dimensionales medidos por un mtodo se convierten en los
resultados obtenidos por otro mtodo.
Cuando una correlacin es suficientemente cercana el proceso de conversin es preciso y efectivo. En circunstancias en las
cuales el investigador est especialmente
preocupado por el acuerdo ms que la tendencia de los datos dimensinales, el coeficiente de correlacin intraclase sustituye al
coeficiente de correlacin ordinario.
El acuerdo para los datos no dimensionales
se expresa estadsticamente como un coeficiente de concordancia ms que de tendencia. Los coeficientes de concordancia son
adems deseables porque toman en cuenta
la concordancia esperada por azar.
Para los datos binarios el mejor coeficiente
de concordancia es kappa y, para los datos
Cuadro 1. Valores para el nivel de concordancia

VALOR DE KAPPA
<0
0-0.20
0.210.40
0.41-0.60
0.61-0.80
0.81-1.00
144
ACUERDO
Pobre
Leve
Regular
Moderado
Sustancial
Casi perfecto
ordinales, la kappa ponderada. No se han

establecido estndares cuantitativos para el
nivel en el cual la concordancia es considerada buena, excelente, etc. Sin embargo,
Landis y Koch han sugerido los valores
anotados en el Cuadro 1.
A pesar de las grandes ventajas de cualquier
cita cuantitativa, las expresiones estadsticas
de variabilidad observada deben ser evaluadas con un juicio cualitativo cuidadoso.
Cundo es necesario hacer un estudio formal
de consistencia?
Si el ndice tiene una excelente sensatez, los

estudios piloto y su aplicacin clnica de
rutina no indican mayores discrepancias en
su uso, el organizar un estudio formal de
variabilidad nicamente serviran para satisfacer los deseos cuantitativos de un evaluador (o de su comit de revisin).
Aunque algunos estudios muestren inconsistencia entre los diferentes usuarios, generalmente los valores de coeficientes como kappa
son de alrededor de 0.6, indicando un acuerdo substancial que fue reconocido ya antes
del estudio. El estudio puede satisfacer los deseos cuantitativos de un evaluador riguroso,
pero el investigador clnico puede creer que el
estudio no es particularmente productivo para el tiempo, esfuerzo y recursos que se emplean en los estudios de consistencia.
Aunque este tipo de juicio clnico a veces
permite desechar la idea de realizar un estudio de campo de variabilidad, a menudo
esta decisin es injustificada; y es necesario
o deseable realizar estudios de campo.
Los estudios de campo son necesarios cuando el ndice requiere de un juicio ms que de
una observacin. Si el diagnstico de anemia
se establece a partir de cierto nivel de hemoglobina o de eritrocitos, no ser necesario
realizar un estudio de variabilidad; si por otro
lado lado, anemia ser identificada por palidez de tegumentos ser necesario realizar
un estudio de variabilidad interobservador.
Consistencia
En el rea de salud mental, es recomendable

la realizacin de un estudio preliminar de variabilidad interobservador siempre que participen varios observadores en un estudio. Por
ejemplo, un psiquiatra entrenado en una institucin psiquitrica de tercer nivel de la Secretara de Salud seguramente tender a
calificar a un paciente con agitacin psicomotora de manera diferente que un psiquiatra
entrenado en un servicio de psiquiatra de

una institucin privada. En este caso, ser necesario determinar que ambos psiquiatras,
cuando observen a un paciente con agitacin psicomotora, lo identifiquen de la
misma forma: leve, moderada o grave, y
esto solo ser posible determinarlo mediante un estudio de variabilidad (o con
sistencia interobservador).
145
Validez
a validez es probablemente uno de los

aspectos mas difciles de establecer en
los ndices de evaluacin clnica. Este
trmino aparece en el lenguaje comn, pero se le da especial significado cuando es
empleado en clinimetria.
A la validez se han aplicado trminos como
consistencia, exactitud, precisin, relevancia etc. La idea de exactitud o precisin es
familiar y es sencilla; por ejemplo, en las
mediciones qumicas se refiere a la cercana
con que los resultado de un procedimiento
en particular se conforma a los resultados
obtenidos con un estndar definitivo o con
otros procedimientos que estn midiendo
la misma entidad.
La exactitud es un problema mayor en la
clnica debido diferentes circunstancias. En
primer lugar cuando hay una ausencia de
un estndar definitivo y en segundo lugar
cuando este estndar no puede ser fcilmente utilizado.
En ciertos tipos de mediciones clnicas
no hay estndares definitivos y en algunos casos el ndice o el instrumento se va
a convertirse en el estndar definitivo.
Por ejemplo cuando se hace un diagnstico de cncer a travs de un Papanicolaou, podemos utilizar la biopsia como
un estndar definitivo. Por otro lado
cuando diferentes histopatlogos designan un tipo celular de tejido pero no se
tiene un estndar definitivo, uno de los
patlogos puede ser identificado como el
estndar incuestionable.
Para la mayor parte de instrumentos con
escalas ordinales no hay estndares de oro,
por ejemplo ,para la depresin, para la ansiedad, etc. En general, la mayora de los
sntomas y trastornos psiquitricos carecen
de un estndar de oro.
Hay casos en los que el ndice se convierte en

el estndar definitivo porque no hay con qu
compararse. Por ejemplo, cuando un clnico
emplea los criterios del DSM IV, o de la Clasificacin Internacional de Enfermedades los
reconoce como estndares de oro. Aunque
algunos clnicos no estn de acuerdo con los
criterios del ndice y como no hay un estndar definitivo para confirmar o refutar los
criterios diagnsticos, se emplean consensos.
Este es un mecanismo para crear un estndar de referencia y en realidad ms que validez estamos probando conformidad con
el estndar. Es decir si no tenemos un estndar de oro, lo que se prueba es la conformidad con el estndar adoptado por
consenso y aqu esto se produce mediante
un proceso que se llama validacin de consenso, un grupo de expertos deliberan sobre alguna cosa en particular y se ponen de
acuerdo o proponen un estndar.
Para los instrumentos

clinimtricos no hay
estndares para compararlos,
por lo que es difcil establecer
la validez de criterio de
instrumentos que midan
depresin, ansiedad, etc.
Los procesos consensuales pueden ser utilizados para establecer estndares para una
variedad de ndices, desde el diagnstico
definitivo de una muestra de tejido hasta la
evaluacin de la condicin clnica del paciente. Este proceso se utiliza constantemente aunque no se reconoce como tal.
Por ejemplo cuando un comit establece
las respuestas correctas para preguntas en
un examen que certifica la competencia clnica o cuando se desarrollan ndices para
evaluar la calidad de la atencin, despus
de que el estndar es establecido consensualmente se puede establecer el grado de
conformidad del que est realizando el procedimiento y entonces la actividad del que
est realizando el procedimiento puede ser
adecuada o correcta pero aqu no estamos
hablando precisamente de exactitud.
Adems, la exactitud es un rasgo permanente, mientras que lo correcto o lo que
147
implica conformidad est sujeto a cambios

de acuerdo a las autoridades que establecieron el estndar.
La idea de crear un estndar definitivo al
utilizar el consenso de autoridades puede
ser vista con desdn por los cientficos que
estn acostumbrados a exactitudes de los
datos duros.
Los tipos de validez
que se abordan en este
captulo son la validez
de criterio y la de constructo.
La estrategia de establecer estndares por

consenso est bien establecida para los datos
duros y es aplicable para el endurecimiento
de datos blandos. El mayor problema en
la estrategia no es la idea de usar un consenso sino la dificultad de establecer un
grupo de autoridades cuyas opiniones formen el consenso.
Debido a la ausencia de estndares de oro

en Psiquiatra, generalmente se emplean
otros instrumentos para comparar los nuevos. Este proceso corresponde a la validez
de constructo, aunque algunos confunden
este proceso con la validez de criterio.
Es relevante la medicin que queremos

hacer?. Generalmente, esta pregunta no
surge cuando se hacen mediciones en laboratorios. Muchas cosas se miden simplemente por que estn ah y si el proceso
de medicin es consistente y exacto , entonces se supone que se ha hecho algo
bien y a nadie le interesa qu tan til puede ser la informacin. La mayora de los
ndices sin embargo, se construyen para
servir un propsito en particular y los ndices no pueden considerarse satisfactorias a no ser que hagan exactamente lo
que se pretende que hagan.
La validez de constructo o de construccin

siempre ha sido un concepto difcil para los
clnicos ya que el trmino constructo rara
vez lo utilizan. Los constructos que generalmente utilizan los mdicos no se llaman
as y la validacin ocurre de una manera
diferente. Por ejemplo, las cosas que los
clnicos consideran enfermedad, normal,
descompensacin, exceso, deficiencia, severidad son constructos, ya que no existen
en la naturaleza de manera tangible sino
que son creaciones intelectuales para explicar fenmenos observados. Se establece un
nuevo constructo cuando los clnicos deciden alterar el concepto de una enfermedad,
por ejemplo cuando se identifican nuevas
enfermedades o se descubre un nuevo mecanismo fisiopatolgico, de esta manera los
clnicos desarrollan e incorporan nuevos
constructos en el razonamiento clnico.
Hay constructos cuya existencia es ampliamente reconocida y aceptada, por ejemplo,
educacin mdica, competencia clnica, capacidad funcional y calidad de vida . El desacuerdo surge cuando se trata de ver qu
es lo que se va a incluir en el constructo
(Qu incluye la calidad de vida? Qu incluye el apoyo social?) o en las demarcaciones de excelente, bueno, regular o malo
(Qu es una calidad de vida excelente?
Qu es un apoyo social regular?).
Esta primera evaluacin cualitativa es la

que se refiere a validez de apariencia y validez de contenido que fueron revisadas en la
seccin de Sensatez.
En esta seccin revisaremos los conceptos de
validez de criterio y validez de constructo.
VALIDEZ DE CRITERIO
La validez de criterio puede ser validez concurrente o validez predictiva. La validez
concurrente generalmente se alcanza fcilmente con estudios transversales pero la validez predictiva requiere de un estudio
longitudinal.
148
Las expresiones estadsticas van a depender

del nivel de medicin de la variable que se
est midiendo. Por ejemplo, para los instrumentos que miden variables dicotmicas, se
van a utilizar indicadores estadsticos como sensibilidad y especificidad y para variables dimensionales se van a utilizar
ndices de correlacin como el coeficiente
de correlacin de Spearman.
VALIDEZ DE CONSTRUCTO
Validez
La idea de la validez de constructo para

Feinstein se refiere a qu tan bien hace su
trabajo el ndice o el instrumento cuando
se emplea.
En el trabajo clnico la mayora de los
constructos se establecen antes de que se
desarrolle un ndice para describirlo.
Son pocos los constructos que se han desarrollado directamente del anlisis de
un instrumento. Algunos surgen de un
procedimiento matemtico como del
anlisis factorial o de algunos otros procesos multivariados. Estos anlisis se utilizan para seleccionar algunos agregados
que se definen como factores o clusters.
Esos agregados que se identifican despus de que se analizan los datos pueden
considerarse constructos por ejemplo,
un conjunto de variables agregadas representan algo que posteriormente se
identifica como el factor de ansiedad de
la interaccin madre-hijo.
Por ejemplo tambin cuando se estn analizando las caractersticas de la atencin
mdica, se puede seleccionar un conjunto
de caractersticas y llamarlo el factor humanista o el factor de competencia clnica, etc. en estas circunstancias cuando el
constructo se desarrolla despus y no antes
de que el ndice sea creado, el investigador
tiene dificultad para convencer a las personas que este constructo nuevo, arbritario,
es til y vlido (Existe un factor humanista en la atencin mdica? Existe por separado de la competencia clnica?).
Cuando un ndice nuevo es razonablemente similar a uno anterior pero hace algo de
una manera diferente la correlacin entre
ambos (o falta de correlacin) estar relacionada con la validez de constructo de
ambos instrumentos. Para demostrar que
los dos ndices son razonablemente similares, requerimos un elevado grado de asociacin pero para demostrar que los ndices
son diferentes no queremos que esta asociacin sea muy elevada. La disociacin es
la caracterstica que demostrar esta dife-
rencia. Por ejemplo si tenemos un ndice

de severidad de la enfermedad que nicamente toma en cuenta los sntomas de la
enfermedad y otro ndice que adems de la
enfermedad toma en cuenta el efecto de la
comorbilidad entonces en los pacientes
que solamente tengan la enfermedad principal, por ejemplo depresin, la correlacin
entre los dos ndices va a ser elevada, y en
los pacientes en los que adems de la depresin tienen ansiedad, la correlacin entre
los dos ndices va a ser diferente.
La validez de criterio puede

ser validez concurrente
o validez predictiva.
La validez concurrente
generalmente se alcanza
fcilmente con estudios
transversales pero la validez
predictiva requiere de un
estudio longitudinal.
A esta caracterstica que Feinstein llama

disociacin, los psiclogos llaman validez
divergente y es una forma de validez de
constructo.
En clnica, como los constructos generalmente ya existen y ya estn bien aceptados,
no hay la necesidad de probarlos y como la
calidad del ndice ha sido previamente evaluada con la sensatez, utilizando juicios
cualitativos clnicos, cuando se formula un
nuevo ndice que incluye cosas que faltaban o eran inadecuadas en el ndice viejo,
la contribucin distintiva del nuevo ndice
se evala con juicio clnico, por lo que la
mayora de los clnicos rara vez hacen evaluaciones de la validez de constructo.
LA VALIDEZ DE CONSTRUCTO
COMO UN SUSTITUTO
DE LA VALIDEZ DE CRITERIO
Este es un aspecto muy importante en la clnica particularmente en la psiquiatra, ya que
como hemos mencionado generalmente carecemos de criterios externos o estndares.
Es importante diferenciar cuando el constructo es generado mas que descrito por los
datos que se han utilizado para desarrollar
el ndice.
Se han utilizado procesos

consensuales para establecer
estndares para una variedad
de ndices, desde el diagnstico
definitivo de una muestra
de tejido hasta la evaluacin
de la condicin clnica
del paciente.
Cundo se va a establecer la validez de

constructo en lugar de la de criterio?
Cuando el criterio de referencia es imposible o poco factible de crear.
149
En algunas circunstancias
se establece la validez de
constructo en lugar de la
validez de criterio; por ejemplo,
cuando el criterio de referencia
es imposible o poco factible
de crear, o cuando existe el
criterio pero no es accesible
o existe y es accesible pero
no se utiliza mucho.
Cuando el criterio esta incluido en el

ndice.
Cuando el criterio puede lograrse pero
no se ha desarrollado
Cuando existe el criterio pero no es accesible o se ha desarrollado y es accesible pero no se utiliza mucho.
Cundo es imposible el criterio de referencia?
Cuando el paciente describe la existencia

de un sntoma como depresin no hay un
criterio de referencia, es imposible. Podemos hacer varias cosas para decidir si el
paciente est diciendo la verdad y podemos observar fenmenos asociados que
pueden ayudar a apoyar o no lo que el paciente est diciendo pero no hay un criterio de referencia.
Cundo el criterio de referencia es poco factible?
La validez de construccin
requiere del empleo de
procedimientos estadsticos
como por ejemplo mediante
el anlisis factorial o mediante
la identificacin de diferencias
entre grupos reconocidos
como diferentes. La validez
convergente y divergente
corresponden a este tipo
de validez.
Por ejemplo un grupo de expertos pueden tener poca dificultad para alcanzar
el acuerdo acerca de los estndares para
el diagnostico de infarto al miocardio,
pero el consenso puede ser difcil y algunas veces imposible para identificar los
estndares de educacin medica, calidad
de vida , satisfaccin con el cuidado a la
salud e interacciones entre la madre y el
hijo.
Cundo el criterio est incluido dentro del
ndice?
Para el diagnstico de algunos trastornos

psiquitricos y para el diagnstico de condiciones que no pueden identificarse con
evidencia patognomnica se requiere de un
conjunto de variables clnicas y paraclnicas
y este conjunto (criterios diagnsticos) toma el papel de estndar.
Criterio que no se ha desarrollado
En otras condiciones, el criterio de referencia puede lograrse pero no se ha desarrollado, porque no ha habido suficiente
inters ya que no se considera muy impor-
150
tante. Esta situacin surge cuando el ndice produce un adjetivo que describe la
magnitud relativa de una entidad o el grado mas que cuando se trata de indicar la
existencia o no de la entidad.
Con frecuencia, los ndices producen adjetivos, por ejemplo la magnitud de cierta actitud, ansiedad, depresin, apoyo familiar.
Estos ndices clnicos de intensidad a menudo se establecedn por el consenso de expertos o grupos de autoridades,.
En otras ocasiones, el criterio de referencia est desarrollado pero no est disponible fcilmente, este caso ocurre cuando
para hacer el diagnstico por ejemplo es
necesario hacer biopsias o intervenciones
quirrgicas.
Finalmente un criterio de referencia
existe y es disponible pero se le ve con
cierto desdn, a veces es porque este criterio est basado en datos blandos o en
datos posiblemente sesgados. Por ejemplo el director de un programa evala la
competencia clnica de un residente (la
evaluacin que haga el resto de los profesores, tendra que correlacionar con la
del director del programa, Qu tan
aceptable sera?.
Con mas frecuencia el criterio no es empleado porque parece inapropiado para el
ndice o porque el investigador est interesado en utilizar el nuevo ndice mas que
en hacer estudios para determinar la validez de criterio. Por ejemplo un ndice clnico que se realiza para determinar la
capacidad funcional podra validarse contra una prueba de estrs, pero al investigador eso no le interesa.
Si su prueba la va a utilizar para evaluar
una intervencin sin tener que pasar una
prueba clinimtrica, al investigador le
puede interesar la capacidad funcional del
paciente en su vida diaria ms que en una
prueba de esfuerzo. Esto es lo que Feinstein llama validacin por aplicacin.
Validez
Cules son las estrategias para la validez de

construccin?
La validez de construccin requiere de el

empleo de procedimientos estadsticos.
Como ya se mencion, una de las formas
de obtener este tipo de validez es mediante el anlisis factorial. Otra forma es la
identificacin de diferencias entre grupos

reconocidos como diferentes (por ejemplo, se esperara que la calidad de vida
fuera diferente en pacientes con diferente
severidad de esquizofrenia).
La validez convergente y divergente corresponde a este tipo de validez.
151
Principio generales de las escalas
omo ya se mencion previamente,

una escala es un conjunto de categoras. Las categoras de la escala
debern incluir todas las posibles expresiones de la variable, debern ser mutuamente excluyentes entre una y otra pero
exhaustivamente incluyentes, y debern
tener valores realistas.
Supongamos que organizamos una escala
en la cual el diagnstico de esquizofrenia se
expresa como una de dos categoras paranoide o catatnica. Tal escala no es exhaustiva, puesto que no contiene una categora
en la cual se enliste una persona que tenga
esquizofrenia hebefrnica.
En mediciones de laboratorio, la escala de
una variable dimensional puede libremente expandir su rango para cubrir las magnitudes observadas. Si un valor particular
est fuera del rango de medida sobre una
escala existente, el resultado se puede citar
como por debajo del ms bajo o por encima de la categora ms alta de la escala.
As, si no podernos medir los valores de
glucosa en suero que estn por abajo de
40 o por encima de 1000 mg/dL, siempre
podemos usar expresiones tales como < 40
> 1000 o podemos cambiar a un mecanismo ms preciso para mediciones de valores extremadamente bajos o altos.
En las categoras nominales o binarias de
una escala clinimtrica las expresiones por
arriba de o por debajo de no pueden
emplearse fcilmente. Una manera fcil de
resolver el problema del rango es incluir
siempre categoras tales como otros (utilizada cuando no existen datos) e inciertos (utilizada cuando se dispone de la
informacin pero sta no es lo suficientemente precisa como para permitir la asignacin a una de las categoras disponibles).
Aunque estos mecanismos podran resolver
el problema del rango no proporcionan

una adecuada discriminacin si quisiramos saber el diagnstico particular citado
en la categora de otros.
Un reto especial en las escalas ordinales es
decidir sobre incluir o excluir una categora
neutral. Aunque tradicionalmente los psiclogos tienden a incluir en sus escalas una
categora para neutral, ni de acuerdo ni
en desacuerdo, es conveniente mencionar
la postura de Feinstein y el ejemplo que
propone. Supongamos que queremos indicar si un paciente tiene o no nimo deprimido. Si la escala est construida con
cuatro categoras definitivamente s, probablemente s, probablemente no, definitivamente no el diagnstico ser calificado
como positivo o negativo para cada paciente, pero si la escala incluye incierto que
pueda ser si o no como una quinta categora neutral a la mitad de la escala, a muchos
pacientes les ser asignada esta calificacin.
Puesto que la inclusin u omisin de una
categora neutral puede producir cambios
cruciales en los resultados, la decisin depender de los objetivos particulares de la
investigacin, es decir, tendr que ser una
decisin sensata.
Las categoras de una

escala deben ser exhaustivas,
mutuamente excluyentes
y deben tener valores reales.
LAS CATEGORAS DEBEN

SER MUTUAMENTE EXCLUYENTES
Una escala ser ambigua si contiene dos o
ms categoras que no son mutuamente excluyentes. Por ejemplo supongamos que
una escala para calificar el sntoma principal del paciente, contiene las categoras
depresin, ansiedad, ideas obsesivas,
otros, la escala ser exhaustiva puesto que
la categora de otros se puede utilizar para cualquier queja que no sea alguna de las
tres mencionada. Sin embargo, la escala es
ambigua puesto que no sabramos que categora usar para clasificar a un paciente cu-
153
yas quejas principales sean depresin y ansiedad, los tres sntomas, o combinaciones
de uno de stos y algo ms.
Este problema que ocurre particularmente en escalas nominales se puede manejar
listando cada una de las posibles combinaciones como una categora individual;
por ejemplo; fiebre sola, fatiga sola, fiebre
y fatiga, slo dolor, fiebre y dolor, etc. Sin
embargo un mejor enfoque es convertir
las categoras nominales en variables binarias con escalas separadas. En el ejemplo
presente, el nuevo arreglo de las cuatro variables podra tener escalas de s o no para
fiebre como una variable, para fatiga como otra variable, para dolor y para otros.
Si una (o ms) de estas cuatro entidades
debe ser designada como la queja principal, se puede usar un cdigo especial para
su designacin. Pero la presencia de otros
sntomas tambin podr ser anotada adecuadamente.
Un enfoque indeseable es forzar el uso de
categoras que se traslapan en una misma
escala para seleccionar nicamente una de
ellas como la queja principal. Si la principal
molestia del paciente es la combinacin de
fiebre y fatiga, una eleccin nica guiar a
una prdida importante de informacin y a
una distorsin en los resultados. El procedimiento de exclusin, desafortunadamente se utiliza a lo largo del mundo en
agencias de salud que trabajan con certificados de defuncin. Dentro de las muchas
enfermedades que pudieron haber contribuido a la muerte de un paciente, solo se
permite listar una de ellas como causa de
muerte. Esto es una fuente de defectos en
los tabuladores nacionales e internacionales
de causa especfica de mortalidad.
LAS CATEGORAS DEBEN
SER EXHAUSTIVAS
Supongamos que un ndice tiene tres variables: A, B y C, cada una de las cuales se
califica como presente o ausente. La escala final tendr 8 posibles categoras que
154
corresponden a combinaciones de las tres

variables componentes. Si ponemos en
mayscula el atributo presente y en minscula el atributo ausente tendramos las
siguientes 8 combinaciones: ABC, aBC,
AbC, Abc, Abc, aBc, abC, abc.
Si alguna de estas combinaciones no se
incluyera en la escala final, esta sera difcil de usar y los resultados seran inconsistentes.
Este tipo de problema fue notado como
fuente de variabilidad nterevaluador en el
uso del ndice de desempeo propuesto
por Karnofsky. Los componentes del ndice dependen de las calificaciones positivas
o negativas para las tres variables: habilidad para el trabajo, para ocuparse de actividades normales sin asistencia y para
ocuparse de las necesidades personales.
Las 8 posibles combinaciones de estos factores binarios, no fueron incluidas en los
arreglos de la escala final. Por ejemplo la
escala no contiene una categora en la cual
se cite el estado de un msico parapljico
que puede trabajar satisfactoriamente pero que necesita ayuda en otras actividades.
El reconocimiento de este problema ha
hecho que cada vez con frecuencia se empleen este menor tipo de escalas. Por el
contrario se tiende a preferir enlistar y calificar cada variable por separado y mediante algn arreglo conveniente, obtener
una escala final.
LAS CATEGORAS DEBEN TENER
VALORES REALES
Una escala no tendr valor si sus componentes producen categoras que son biolgicamente imposibles. Supongamos por
ejemplo, un ndice creado por combinacin de dos variables binarias, cada una
expresada como S o No para sexo femenino y para presencia de embarazo. Cuando la primera variable se califica como No
y la segunda como S, el resultado de la escala denotar a un hombre embarazado.
Categoras de las escalas
Otro ejemplo ocurre cuando la escala es

una puntuacin aritmtica producida por
un modelo matemtico de regresin lineal
mltiple. En tal modelo expresado como
y = b0 + b1 x1 + b2 x2 + b3 x3 + ..., el resultado de la escala para Y (das de estancia en el hospital) podra ser menor de 0.
Para evitar esta peculiaridad, el modelo de
regresin lineal mltiple a menudo se reemplaza por un modelo de regresin logstica
mltiple, el cual constrie el resultado de
tal manera que los valores de Y sern
siempre una probabilidad entre 0 y 1.
LAS CATEGORAS DEBEN
TENER UNA DISCRIMINACIN
ADECUADA
En medidas dimensionales podra darse que
no siempre queramos que los resultados
sean tan precisos como sea posible. Es decir
usualmente expresamos la edad de un adulto en aos, ms que en meses, das u horas.
Sin embargo, en un recin nacido, podramos desear discriminar la edad de manera
mas precisa y podramos utilizar horas, das
o semanas como escala de medida.
La eleccin de una discriminacin adecuada, es un reto. Si la discriminacin es demasiado grande, la escala puede resultar
difcil de usar, puesto que la eleccin de las
categoras est mas all de las capacidades
humanas habituales. Si la discriminacin es
demasiado pequea, la escala puede ser fcil de usar, pero las distinciones importantes se pierden.
Cuando las mediciones cientficas se reportan convencionalmente y los porcentajes
son citados en dos dgitos, la organizacin
es la acostumbrada por dos razones: en la
mayora de las instancias de medicin, tres
dgitos (acompaados si es necesario por
exponentes adicionales, tales como 3.73 x
105 o 8.41 x 10 -3) sern suficientes para
discriminar la magnitud de los resultados.
Para la mayora de los porcentajes, la mente humana puede recordar fcilmente y
evaluar dos dgitos ms que tres.
En las mediciones clinimtricas el problema

de una discriminacin excesiva, surge cuando la escala requiere de juicios que son demasiado difciles de hacer. Supongamos que
se tiene una escala con categoras 1, 2, 3, 4,
5 o 6 para dar una puntuacin global a la
depresin de un sujeto. Sin importar qu
criterio se utilice para esta calificacin, se podra desarrollar un mecanismo razonable para decidir cuando aplicar el nmero 1 como
el valor ms bajo y 6 como el ms alto, y
cuando utilizar los valores intermedios. Si se
pide dar esta puntuacin global pero utilizando categoras del uno al diez, podra
tener dificultades para diferenciar entre
las categoras, pero eventualmente podra
desarrollar mecanismos consistentemente
razonables de discriminacin.
Supongamos ahora que se le solicita calificar la depresin usando una escala del 1 al
100. Esta escala sera imposible de aplicar
de cualquier manera prctica. Qu tan
fcilmente se podra distinguir entre 37 y
38 o 72 y 73?. La discriminacin tan fina
requerida en esta escala est mas all de
nuestra capacidad de discernimiento del fenmeno en observacin. Habra muchos
problemas de variabilidad intraobservador,
cuando usramos la escala repetidas veces
para nuestra misma calificacin e interobservador cuando busquemos acuerdo entre
diferentes observadores.
La eleccin del nivel de

discriminacin de una escala
es un reto. Si hay demasiadas
categoras, la escala puede
resultar difcil de usar puesto
que la eleccin de las
categoras est mas all de
las capacidades humanas
habituales. Por el contrario,
si hay muy pocas categoras,
la escala puede ser fcil de
usar, pero las distinciones
importantes se pierden
Este tipo de dificultad es la razn de que

muchas escalas clinimtricas globales sean
expresadas en un nmero limitado de categoras, tales como 0, l+, 2+, 3+, 4+. Un pequeo grupo de calificaciones pueden
discernirse y reproducirse mejor que una
seleccin ms grande.
Aunque un nmero pequeo de categoras
es fcil de usar, la escala podra no hacer
una buena discriminacin, particularmente cuando se emplea para detectar cambios
mas que para denotar un solo estado. Tales
calificaciones como A, B, o C, pueden ser
buenas para clasificar el estado de cada persona en un determinado punto del tiempo,
155
pero en una fecha posterior, cuando queremos discernir el cambio de cada persona,
estas tres categoras podran ser inadecuadas para mostrar transiciones.
Las estrategias para mejorar

la discriminacin dependen del
objetivo de la escala. Se puede
aumentar el nmero de
categoras, se pueden
desarrollar ndices de cambio
y se puede reducir el nmero
de variables, dejando slo
aquellas particularmente
relevantes. Otra estrategia es
no incluir a la variable ms
importante en el ndice sino
calificarla por separado.
Por ejemplo, un paciente que est confinado a la cama podra inicialmente ser calificado como C. Ms tarde el paciente podra
todava estar confinado a permanecer en
cama y recibir aun la calificacin C pero
podra tener una mejora substancial en la
continencia urinaria y en la habilidad para
alimentarse asimismo. Sin embargo, la mejora no sera detectada si calificamos los
dos estados como C.
Las estrategias que se pueden usar para incrementar la discriminacin dependen del
objetivo de la escala. Se puede aumentar el
nmero de categoras, se pueden desarrollar ndices de cambio y se puede reducir el
nmero de variables, dejando slo aquellas
particularmente relevantes.
Feinstein ha introducido el trmino de
discriminacin oscura para referirse al
hecho de que en ocasiones en una escala
final no podemos ver las caractersticas
especficas de una condicin. Por ejemplo, tenemos una calificacin en la escala
de Hamilton de 36 no podemos ver cules fueron los sntomas ms graves.
Si la escala tiene muy pocas categoras se
puede incrementar el nmero de stas. Si
una escala que tiene tres categoras se puede expandir para incluir 6, 7 o ms. Este
enfoque es particularmente atractivo y fcil
si las categoras adicionales se identifican y
delimitan fcilmente. Por otro lado. el incremento en el nmero de categoras podra hacer la escala ms difcil de usar. Un
nmero extra de categoras puede producir
un problema de discriminacin excesiva.
Para evitar la dificultad antes citada, los
investigadores clnicos han empezado a
usar un enfoque alterno el cual involucra
la construccin de un ndice de cambio.
Puesto que un ndice de estado y un ndi-
156
ce de cambio tienen diferentes funciones

y pueden incluso requerir diferentes construcciones un ndice de transicin por separado es un mtodo mejor para medir
cambio. Con esta tcnica el estado funcional del paciente podra calificarse con dos
ndices ms que con uno. El primero podra ser un ndice del estado funcional. El
segundo podra ser un ndice de transicin para mostrar los cambios en el estado funcional. El segundo ndice se expresa
en una escala de transicin, tal como mucho mejorado, un poco mejor, sin cambio, un poco peor, mucho peor. Al tener
un nmero limitado de categoras esta escala es fcil de usar y obviamente puede
discriminar cambios.
El proceso que se utiliza para construir una
escala de transicin se ilustra en la tradicional escala de calificacin de alivio del dolor,
o en el que frecuentemente se emplea en
psiquiatra, la Impresin Clnica Global de
Mejora (CGI por sus siglas en ingls).
En algunos casos de ndices compuestos, es
posible que los problemas de discriminacin de una escala se deban a la gran cantidad de variables incluidas en ella. En estos
casos es posible que la mejor alternativa sea
evaluar la variable que se considera mas importante o en la que se est mas interesado.
Si el problema de discriminacin se produce por un exceso de variables componentes, el problema se puede reducir o
eliminar al quitar las variables componentes extra. Cuando queremos saber principalmente acerca de cambios en la variable
A, el ndice utilizado para discernir el
cambio debe enfocarse principal o exclusivamente sobre la variable A sin incluir
variables B, C, D como componentes adicionales. Si la combinacin A-B-C-D es
evaluable como un ndice agregado, dicha
agregacin podr preservarse para los propsitos particulares que sirva. Un ndice
separado (o la sub-escala de la variable A)
puede ser utilizada para identificar cambios en la variable A.
Categoras de las escalas
La principal dificultad en este tipo de procedimiento es tomar la decisin sobre cul

variable se requiere un ndice por separado.
Tal decisin requiere un mecanismo para
identificar la importancia de la variable A.
La amplitud y discriminacin de la escala
puede ser fcilmente evaluada por una persona inteligente, sin un conocimiento profundo de los fenmenos cientficos o
clnicos a los que se dirigen. La persona no
necesita ser un experto en nada para determinar que las categoras son no exhaustivas, ambiguas, o inadecuadas para una
discriminacin satisfactoria. Sin embargo,
para apreciar la coherencia de una escala
normalmente se requiere de conocimientos
especficos sobre el fenmeno. Esto es particularmente relevante en el caso de los ndices compuestos.
LAS ESCALAS DEBEN SER
COHERENTES TANTO BIOLGICA
COMO ESTADSTICAMENTE
Si decidimos combinar tres variables: severidad de los sntomas, severidad de la comorbilidad, hobby favorito, en un ndice
para estado clnico del paciente con enfermedad de Alzheimer, no importa lo bien
construida que est la escala y qu tanto las
categoras producen una discriminacin
adecuada, el ndice no parece biolgicamente coherente ya que "hobby favorito"
no es un componente adecuado para un
ndice de estado clnico. Al omitir hobby
favorito las otras dos variables pueden seguir juntas de una manera plausible.
La capacidad para formar combinaciones
biolgicamente plausibles es una habilidad nicamente humana. No puede ser
hecha por un modelo matemtico o programa de computacin. No importa que
tan ingeniosa sea la estrategia matemtica
o algoritmo lgico, un sistema inanimado
no es capaz de producir un diagnstico,
hasta que los conceptos y criterios hayan
sido incorporados por un humano a un
sistema automtico.
Este juicio humano tambin debe ser aplicado para decidir cuando utilizar una puntuacin aritmtica, por ejemplo una
sumatoria, y cundo se debe hacer otro tipo de arreglo, por ejemplo una agrupacin.
As al formar su calificacin, Virginia Apgar eligi aplicar rangos numricos para las
5 variables componentes y despus sumarlas, mas que tratar de hacer conjuntos (o
clusters) de categoras. Sin embargo, en
otras circunstancias, un cluster puede ser
biolgicamente ms informativo que una
calificacin y ste es ms fcil de arreglar
cuando est formado por variables que estn citados en una calificacin categrica o
dicotmica como presente o ausente. Por
ejemplo supongamos que usamos la escala
de calificacin de presencia de edema perifrico, estertores pulmonares y venas del
cuello distendidas. Cuando la composicin
de la escala de resultados se prepara por la
suma de las tres calificaciones, la presencia
de las tres manifestaciones clnicas ser calificada como 3. Por otro lado, si pensamos
sobre la connotacin clnica de las tres variables constitutivas, un paciente que tenga
edema perifrico, estertores pulmonares y
venas del cuello distendidas podra considerarse en una categora mucho ms informativa dentro del cluster titulado falla
cardaca congestiva.
La capacidad para formar

combinaciones biolgicamente
plausibles es una habilidad
nicamente humana. No
puede ser hecha por un modelo
matemtico o programa de
computacin. Un sistema
inanimado no es capaz de
producir un diagnstico, hasta
que los conceptos y criterios
hayan sido incorporados por
un humano a un sistema
automtico.
La coherencia biolgica es relativamente

fcil de evaluar en una categora, pero es
ms difcil de observar como una calificacin. Los clnicos generalmente prefieren
expresar sus juicios con escalas que contengan categoras ms que puntuaciones
aunque stas suelen tener un enorme
atractivo cientfico, los datos dimensionales u ordinales, son convertidos regularmente en arreglos categricos tales como
anormal, normal; muy alto, muy bajo;
presencia o ausencia de enfermedad; uso o
no uso de tratamiento, etc.
La transparencia de una escala final un
problema nico de los ndices compuestos
y se refiere a la capacidad de ver a travs
del resultado lo que contiene.
157
La escala de depresin de Hamilton es una

suma de valores del 0, 1, o 2 asignados a 21
(o 17) variables diferentes; la escala final no
nos permite saber cules son las caractersticas clnicas especficas del paciente. Esta
es una dificultad ineludible al utilizar ndices
clinimtricos compuestos. Aunque stos
pueden ser satisfactorios al ofrecer una calificacin nica, los componentes particulares
no se ven. El problema no es muy importante si lo nico que nos interesa es una calificacin final. Cuando es necesario determinar
cules componentes han aportado ms para
la calificacin final, se tiene que desagregar el
valor total en sus elementos individuales.
Un aspecto bsico de la reproducibilidad
en los ndices clinimtricos es identificar
los componentes y sus demarcaciones. La
fase siguiente es la combinacin de los
componentes. Se deben especificar los mecanismos de la combinacin y las categoras resultantes que emergen.
158
El proceso ocurre secuencialmente, de

acuerdo a la eliminacin de las variables
candidatas, a la inclusin de variables componentes para formar ejes, al combinar los
ejes para formar una escala de resultado o
al combinar las variables componentes.
Si la combinacin es una calificacin aritmtica, las instrucciones son relativamente simples.
Por el contrario, cuando se trata de agrupaciones, stas pueden ser ambiguas. Para
evitar la ambigedad, en el DSMIV no
solamente se especifique lo que es necesario para hacer un diagnstico, tambin se
especifica bajo qu circunstancias el diagnstico se excluye.
Pueden ocurrir cuando la escala final es expresada en agregados con criterios de inclusin y exclusin como las categoras del
DSM IV.
Entrevistas diagnsticas
l primer de nivel de medicin en

psiquiatra es el nivel categrico y
la ms sencilla de las categoras es la
presencia o ausencia de un trastorno. Paradjicamente para llegar a este nivel se
requieren de entrevistas estructuradas que
son instrumentos muy largos, muy complicados y que con mucha frecuencia deben de ser aplicados por un psiquiatra.
Los criterios diagnsticos con los que se
cuenta para hacer estos diagnsticos son
los criterios de la Clasificacin Internacional de Enfermedades y de la Asociacin
Psiquitrica Americana en su versin IV
(DSM-IV).
Despus de que se ha hecho un tamizaje
para excluir otros diagnsticos y confirmar
el diagnostico presuntivo si el objetivo del
estudio es destacar o concluir el diagnstico se deben realizar estas entrevistas.
Las entrevistas ms empleadas son:
La entrevista clnica estructurada del

DSM-4,SCID.
La cdula para la evaluacin clnica en
neuropsiquiatra o SCA.
La cdula para los trastornos afectivos
y la esquizofrenia SADF.
La cdula de entrevista diagnstica DIS.
La entrevista diagnstica compuesta
internacional CIDI.
La evaluacin de trastornos mentales
en atencin primaria PRIME-MD.
La cdula para trastornos afectivos y esquizofrenia propona diagnsticos de

acuerdo a los criterios de investigacin
RDC, era administrado por el clnico y
tena una seccin de sntomas y otra de la
historia de los trastornos mentales. Dado
que este sistema diagnstico es poco utilizado actualmente nicamente nos referiremos a los otros instrumentos.
La entrevista clnica estructurada fue desarrollada por Spitzer e incluye informacin

demogrfica, historia laboral, motivo de la
consulta, historia del presente y de periodos
pasados de enfermedad psiquitrica, historia del tratamiento, evaluacin de funcionamiento actual y preguntas abiertas.
Hay dos tipos de entrevistas:

aquellas que son altamente
estructuradas y que pueden
ser aplicadas por un lego,
y aquellas que dependen
del juicio clnico y que deben
ser aplicadas por un clnico
con experiencia.
Incluye 9 mdulos diagnsticos:

1.
2.
3.
4.
5.
6.
7.
8.
9.
episodios afectivos,
sntomas psicticos
diferencial para sntomas psicticos
diferencial para trastornos afectivos
uso de sustancias
ansiedad
trastornos somatomorfos
trastornos de la alimentacin
trastornos de adaptacin
Hay dos versiones: una para investigacin, otra para el clnico. La que se utiliza
por el clnico incluye solamente los diagnsticos que se ven mas frecuentemente
en la prctica clnica y excluye la mayora
de los subtipos. Incluye un mdulo simplificado de trastornos del estado de nimo y de uso de sustancias.
La versin de investigacin tiene 3 presentaciones: Una, la estndar que sirve para
pacientes psiquitricos. Otra edicin para
no pacientes, por ejemplo para entrevistas
en comunidad, estudios familiares, en
atencin primaria y una ms que sirve para pacientes psiquitricos que no requieren
una evaluacin del trastorno psiquitrico
por ejemplo pacientes en psicoterapia.
La edicin de no pacientes y la que solamente evala con un tamizaje los psicticos es que no asume una queja principal y
que utiliza nicamente un screening
(tamizaje) para trastornos psicticos en
lugar de un mdulo completo.
La entrevista diagnstica
Internacional (CIDI) es una
entrevista psiquitrica
estructurada que proporciona
diagnsticos para la CIE10 y
para el DSM IV. Su objetivo
es posibilitar la realizacin
internacional de entrevistas
psiquitricas que puedan ser
empleadas en comparaciones
internacionales
159
Tambin hay un SCID para trastornos de

la personalidad. Esta entrevista debe ser
empleada por alguien con experiencia clnica suficiente y conocimientos de psicopatologa y de diagnstico psiquitrico.
Toma 1 hora o menos administrar este
instrumento en sujetos con poca o sin patologa, pero de 2 a 3 horas en aquellos
que tienen varios trastornos psiquitricos.
Debido a la ausencia de
estndares de oro en la
evaluacin clnica en
psiquiatra, los diagnsticos
obtenidos por clnicos
empleando este tipo de
entrevistas, se han empleado
como estndares de oro.
La Entrevista Clnica
Estructurada (SCID) es una
de las mejores entrevistas para
ser aplicada por el clnico y
hace diagnsticos de acuerdo a
la nomenclatura del DSM IV.
Aunque lleva mucho tiempo,
el hecho de que tenga mdulos
le permite al clnico utilizarla
selectivamente.
160
Tiene buena confiabilidad para la mayora

de los trastornos del DSM-III excepto para agorafobia sin pnico, trastorno obsesivo-compulsivo y trastorno somatomorfo.
para la CIE10 y para el DSM IIIR. Su objetivo es posibilitar la realizacin internacional de entrevistas psiquitricas que puedan
ser empleadas en comparaciones internacionales, se mantiene el formato de entrevista totalmente estructurada del DIS.
Las pruebas efectuadas hasta la fecha han
revelado que el CIDI posee una confiabilidad entre entrevistadores y de test retest
para todas las categoras diagnsticas muy
altas, con valores de kapa superiores a 0.7.
El SCAN consta de 4 componentes:
La carencia de estndares de oro en psiquiatra han conducido a pocos estudios

de validez de este instrumento. Sin embargo, la confiabilidad Inter.-observador y
prueba-contraprueba ha sido adecuada.
1. La dcima versin del PSE

2. Un glosario de definiciones diferenciales
3. El Check list
4. Cuestionario para la historia clnica.
Es una de las mejores entrevistas para ser

aplicada por el clnico y hace diagnsticos
de acuerdo a la nomenclatura del DSM
IV. Aunque lleva mucho tiempo el hecho
de que tenga mdulos le permite al clnico utilizarla selectivamente.
Elementos del SCAN: La entrevista, el

glosario de definiciones y Catego 5 que es
un programa de computadora que procesa el SCAN.
Estn desarrollados por la OMS, el propsito es evaluar , medir y clasificar la psicopatologa y la conducta asociada con los
trastornos psiquitricos mayores de la vida adulta.
El DIS es una entrevista psiquitrica estructurada desarrollada en la Universidad de
Washington es aplicada por legos y se utiliz
en el proyecto ECA. Evala psicopatologa
de adultos y puede hacer diagnsticos en tres
sistemas Sdeirmer, RCD, DSM III. Se pueden hacer hasta 43 diagnsticos. Es una entrevista muy estructurada, las respuestas son
s o no. La confiabilidad entre entrevistadores kapa 94, entre clnicos no clnicos 95.
La entrevista contiene tres componentes

que son: la evaluacin del estado actual
(PSE 10), el check list y un formato para
la historia clnica.
El PSE 10 tiene 3 partes: La primera de 14
secciones para informacin demogrfica, historia clnica, salud fsica, signos y sntomas de
trastorno somatomorfos, disociativos, ansiedad, afecto, alimentacin, alcohol y otro uso
de sustancias y un tamizaje en la parte 2.
La parte dos contiene 11 secciones, signos
y sntomas de trastornos psicticos y cognitivos, insight y manifestaciones de deterioro funcional.
El SCAN se ha utilizado en pacientes y el

de CIDI en poblacin general.
La lista de cotejo (check list) incluye 59

signos y sntomas que se evalan en base a
la informacin de la experiencia de otros
clnicos e informantes.
El CIDI es una entrevista psiquitrica estructurada que proporciona diagnsticos
En la historia clnica se describe la educacin durante la infancia, el nivel intelec-
Entrevistas diagnosticas
tual, los trastornos de la personalidad, el

deterioro social y el curso clnico.
En el programa Catego se introducen los
datos de las entrevistas del SCAN y produce perfiles de los individuos.
Este instrumento debe ser aplicado por
clnicos bien entrenados y que conozcan
las reas de definiciones diferenciales, se
requiere entrenamiento especfico. Lleva
de una y media a dos horas administrarlo,
sin embargo puede ser mucho ms tiempo si el paciente tiene mucha psicopatologa. Los estudio de confiabilidad del PSE
entre 1960 y 1970 demostraron buenos
ndices 0.71 a 0.81 pero la confiabilidad
test retest fue de 0.41 a 0.64.
La confiabilidad conjunta que es la forma
intra clase de kapa para los diagnsticos
actuales generados por el SCAN estuvieron en el rango de 0.30 a 0.76, 0.30 para
obsesivo-compulsivo, 0.76 para trastorno
de pnico. El coeficiente de correlacin
total fue de 0.67 y para los diagnsticos a
lo largo de la vida 0.60.
Una de las desventajas del SCAN es que
se requiere un estudio muy cuidadoso y
muy prolongado del paciente, que se requiere tener entrenamiento.
Una versin alternativa del CIDI se desarroll para usarse en la encuesta nacional
de comorbilidad a principios de lo noventas, comnmente conocida como CIDI
de la Universidad de Michigan, en este estudio el principal investigador fue Kessler.
Incluye varias modificaciones del CIDI
original que son de gran significado para
el estudio de la comorbilidad de los trastornos mentales.
Una de las modificaciones ms importantes
es que hay preguntas de tamizaje para todos
los trastornos que se hacen al principio de la
entrevista, de tal manera que los que responden no aprenden la respuestas positivas, llevan a que se les pregunte ms y entonces
tienden a sobreportar sntomas conforme la

entrevista progresa. Otros cambios incluyen
que se removieron ciertas reglas de salto en
el CIDI que interferan con la capacidad para estudiar comorbilidad entre trastornos
mentales y uso de sustancias. Se mejor el
detalle en el que la edad de aparicin de los
trastornos es evaluada y hay preguntas explicitas sobre episodios de comorbilidad y el
tiempo para establecer la prioridad temporal
y causal entre los sndromes.
La Cdula para la Evaluacin

Clnica Neuropsiquitrica
(SCAN) fue desarrollada por
la OMS. Consta de una
entrevista, un glosario
de definiciones y Catego 5,
que es un programa
de computadora.
Tanto el DIS como el CIDI pueden ser

completados en una sesin y no se requiere de fuentes adicionales de informacin.
Como es modular se pueden seleccionar
los mdulos para cada estudio. Se requieren de 90 a 120 minutos. Se recomienda
que la gente se entrene en centros autorizados por la OMS y el entrenamiento lleva aproximadamente 5 das.
Una versin del DIS en espaol dio Kapa
de 0.16, para disquinecia de 0.92, para
trastorno de la personalidad antisocial, el
intervalo prueba reprueba fue de 7 das.
Los ensayos de la OMS encontraron confiabilidad test retest para el CIDI con intervalos de 1 a 6 das y en estos estudios la
mayora de los acuerdos fue superior a 85%
y algunos sobre 90%, sin embargo las Kapas
correspondientes fueron de 0.52 para distimia,0.84 para pnico. La confiabilidad conjunta el acuerdo para todo los diagnsticos
fue 97% y las kapas de 0.90, slo el trastorno de somatizacin fue de 0.67.
Comparando el DIS con el acuerdo con
los diagnsticos del DSM determinados
por evaluacin clnica se obtuvieron kapas
de -0.06 a 0.60 para esquizofrenia, 0.13 a
0.84 para trastorno depresivo mayor y
0.05 a 0.90 para el trastorno obsesivo
compulsivo. La validez de las primeras
versiones del CIDI son superiores a las de
las primeras versiones del DIS.
Los clnicos utilizaron un ckeck list para
hacer diagnsticos del DSM y de la Clasi-
161
ficacin Internacional de Enfermedades y

la kapa global para la concordancia diagnstica fue de 0.78 y por grupos diagnsticos la ansiedad o los trastornos fbicos
0.70, trastornos depresivos 0.84, uso de
sustancias 0.83. Con los diagnsticos de
la ICD kapa total 0.77, ansiedad o trastornos fbicos 0.73, trastornos depresivos
0.78 y uso de sustancias 0.83.
El PRIME-MD Este es un
instrumento diseado para
que el mdico de primer nivel
pueda diagnosticar los
trastornos mentales. Tiene dos
componentes, un cuestionario
de una pgina que es
completado por el paciente
antes de ver al mdico y una
gua de evaluacin clnica de 9
pginas que es una entrevista
estructurada que el mdico
usa para evaluar los sntomas
que fueron sealados como
positivos en el cuestionario
del paciente.
Adems de identificar diagnsticos la CIDI puede determinar la progresin y los

patrones de duracin de sntomas clnicamente significativos.
PRIME MD
Para la evaluacin en primer nivel de los
trastornos mentales ste es un instrumento diseado para que el mdico de primer
nivel pueda diagnosticar adecuadamente
los trastornos mentales que se identifican
en el primer nivel de atencin. Tiene dos
componentes, un cuestionario de una pgina que es completado por el pacientes
antes de ver al mdico y una gua de evaluacin clnica de 9 pginas que es una
entrevista estructurada que el mdico usa
para evaluar los sntomas que fueron sealados como positivos en el cuestionario
del paciente.
El cuestionario del paciente es un tamizaje
para los trastornos mentales, son 25 preguntas con una escala binaria de respuestas
(si/no) sobre signos y sntomas experimentados por el paciente en el ltimo mes y un
reactivo que se refiere a la salud global. 15
reactivos cubren la mayora de las quejas
somticas y se refieren a: 1)trastornos de la
conducta alimentaria, 2)sntomas de depresin, 3) sntomas de ansiedad, 4) problemas con uso de alcohol.
La gua de evaluacin clnica consiste en 5
mdulos de diagnstico que cubren algunos trastornos del DSM, trastornos del
afecto, ansiedad, uso de alcohol, trastornos de la alimentacin y trastornos somatomorfos y una hoja de resumen.
162
Este instrumento se desarroll para ser

utilizado en el primer nivel de atencin
donde hay restricciones de tiempo. El
tiempo promedio que se emplea para su
aplicacin es de alrededor de 8 minutos;
8.4 para los pacientes que tienen un sntoma positivo. Para los pacientes a los
que se les hizo un diagnstico el tiempo
fue de 11.4 minutos. El 95% de los casos
requieren menos de 20 minutos. Puede
ser administrado en la computadora y
por telfono.
La confiabilidad se detrmin comparando
los diagnsticos realizados por un profesional de la salud mental y los diagnsticos realizados por los mdicos de primer
nivel. La kappa fue de 0.71para cualquier
diagnstico. Para los trastornos individuales fue de 0.73 para trastorno de la conducta alimentaria, a 0.15 para trastornos
depresivos menores, para depresin mayor 0.61, trastorno de pnico 0.60.
Si la evaluacin por el profesional de salud
mental se ve como un criterio estndar, la
sensibilidad del PRIME-D fue buena para detectar cualquier trastorno psiquitrico 0.83 y menos satisfactoria para detectar
los diagnsticos en mdulos particulares.
La sensibilidad fue de 0.81 para probable
abuso o dependencia de alcohol a baja
0.22 para trastorno depresivo menor. La
especificidad fue excelente de 0.92 a 0.99
para todos los mdulos y para diagnsticos especficos de 0.91 a 0.96. La exactitud diagnstica fue de buena a excelente
(0.84 a 0.96).
Dentro de sus ventajas clnicas es que
fue diseado para ser empleado por mdicos no psiquiatras, pero tambin puede ser utilizado por stos para hacer una
evaluacin rpida de pacientes con ansiedad, depresin, o sntomas somticos.
Sus limitaciones son que cubre solo
unos diagnsticos psiquitricos e ignora
ciertos aspectos de los criterios de los
trastornos como el deterioro y el diag
nstico diferencial.
Depresin y ansiedad
s posible medir la depresin? Para el

personal en el rea de salud mental,
sta no deja de ser una pregunta retrica. Para las personas ajenas a esta rea,
les puede resultar difcil aceptar que la depresin es un concepto que puede medirse de forma consistente y vlida.
La depresin se mide categrica u ordinalmente, aunque a veces esta ltima forma se
refiere como dimensional. Sin embargo,
es evidente, de los captulos anteriores, que
en la medicin de la depresin no es posible alcanzar el nivel dimensional, sino nicamente ordinal.
Cuando se diagnostica, se asigna una categora. Aunque ste es el primer nivel de
medicin, el procedimiento no es sencillo;
por el contrario, es complicado y requiere
de experiencia clnica.
La forma ms confiable para el establecimiento de un diagnstico es mediante una

entrevista estructurada. Las entrevistas diagnsticas como la Entrevista Clnica Estructurada (SCID por sus siglas en ingls,
Structured Clinical Interview, First et al.
1995) o las Entrevistas para la Evaluacin
Clnica en Neuropsiquiatra (SCAN por
sus siglas en ingls, Schedules for Clinical
Assessment in Neuropsychiatry, Wing y
cols. 1990) no pueden emplearse rutinariamente tanto por la falta de personal entrenado como por el tiempo que toma su
administracin. Con los instrumentos que
evalan dimensionalmente a la depresin
puede hacerse un diagnstico con base en
un punto de corte establecido o puede medirse la intensidad de los sntomas depresivos presentes en un sujeto. Los diagnsticos
obtenidos mediante una entrevista y aquellos obtenidos con otros instrumentos no
siempre coinciden. Se ha reportado que
los diagnsticos obtenidos por medio de
escalas dimensionales sobrediagnostican la

depresin en comparacin con los sistemas
categricos.
El uso de instrumentos de evaluacin estandarizados facilita las comparaciones entre pacientes, evaluadores, estudios y servicios.
La depresin se mide
categrica u ordinalmente.
En el cuadro 2 se presentan algunos instrumentos para la evaluacin de la depresin.

Todos los instrumentos que se mencionan
han sido sometidos a estudios de validez y
confiabilidad. Aunque no se trata de una revisin exhaustiva, estn incluidos todos los
instrumentos mencionados en el Manual de
Mediciones en Psiquiatra de la Asociacin
Psiquitrica Americana (2000), adems de
los incluidos en otros revisiones (Bulbena Vilarrasa et al. 2000). Como se observa en el
cuadro 1, a excepcin de la Escala de Depresin del Centro de Estudios Epidemiolgicos (CES-D por sus siglas en ingls) todos los
instrumentos fueron diseados para pacientes con diagnstico de depresin, la mitad de
las escalas son aplicadas por un clnico y la
mitad son autoaplicadas. El nmero de reactivos que las componen son de 3 (escala de
Raskin) a 52 (Escala de Carroll).
Otros instrumentos, que no se muestran
en el cuadro, evalan varias dimensiones de
psicopatologa, y entre ellas, evalan depresin. Las diferentes versiones del Inventario de Salud Mental, evalan sntomas
psiquitricos en general, incluyendo depresin. Una de las seis subescalas del Cuestionario del Hospital de Middlesex (Crown y
Crisp, 1966) es la de depresin. La lista de
90 sntomas (SCL-90 por sus siglas en ingls) (Derogatis, 1978) cuantifica psicopatologa en 9 dimensiones, incluyendo
depresin. El Inventario Breve de Sntomas, derivado del SCL-90, consta de 53
reactivos, es autoaplicable y evala las mismas dimensiones del SCL-90.
163
Cuadro 2. Instrumentos desarrollados para evaluar depresin

Instrumento,
Autor (ao)
Escala de Depresin
Hamilton (1960)
Mide
Poblacin
Aplicacin
Nmero de
reactivos
17
Efecto del tratamiento
Pacientes deprimidos
Clnico
Escala de Raskin (1970)
Respuesta al tratamiento
Intensidad de la depresin,
respuesta al tratamiento
hospitalizados
Clnico
Montgomery-Asberg
(1979)
Clnico
10
Bech y Rafaelsen (1980)
Respuesta al tratamiento
Personas con 11
conocimientos
clnicos
Cuestionario de Beck
(1961)
Intensidad de la depresin
Pacientes psiquitricos
Autoaplicable
21
Escala de Zung (1965)
(poco sensible a cambios
en el tiempo)
Autoaplicable
20
Escala de Depresin
del Centro de Estudios
Epidemiolgicos,CES-D
(Radloff 1977)
Identifica depresin (tamizaje), Poblacin general

sensible a los cambios
en el tiempo
Autoaplicable
20
Escala de depresin
de Carroll (1981)
Autoaplicable
52
Inventario de sntomas
de depresin
(Rush y cols, 1985)
Una
28
autoaplicable
y otra calificada
por un clnico
Cuadro 3. Instrumentos para pacientes que se atienden en unidades no psiquitricas y que

evalan depresin
164
Instrumento,
Autor (ao)
Cuestionario General
de Salud, Goldberg (1972)
Objetivo
Poblacin
Aplicacin
Nmero de
reactivos
60, 30, 28 y 2
Deteccin
Pacientes de medicina general
Autoaplicable
Escala para la evaluacin

de Ansiedad y Depresin
en el Hospital, Zigmond
y Snaith y (1983)
Evaluacin
Pacientes con
condiciones mdicas
Autoaplicable
7 para
ansiedad, 7
para depresin
PRIME-MD (Primary care

Evaluation of Mental
Disorders) Spitzer
y cols, (1994)
Deteccin
(1a. Parte)
y diagnstico
(2a. Parte)
Pacientes de primer
nivel de atencin
1. Parte:
Autoaplicable
2. Parte:
Clnico
1. Parte: 26
preguntas, 2
de depresin
2. Parte: 12 p.
Evaluacin concisa
de depresin,
Silverstone (1996)
Deteccin
Pacientes mdicamente
enfermos
Clnico
Identificador
de depresin
(Depression screener)
Kramer y Smith (2000)
Deteccin
Pacientes de primer
nivel de atencin
Autoaplicable
2-3
La escala de depresin
de Arkansas (D-ARK)
Kramer y Smith, (2000)
Diagnstico
Pacientes de primer
nivel de atencin
Aplicada por
clnico
11
Depresion y ansiedad
Aunque los instrumentos mencionados en el

cuadro originalmente fueron diseados para
evaluar la depresin en pacientes con diagnstico de depresin, tambin se han utilizado para identificar depresin en estudios en
la comunidad, y en la consulta del mdico
familiar por ejemplo Beck (1972). La escala
de Zung; aunque fue desarrollada para medir intensidad de la depresin en pacientes
deprimidos, tambin se ha empleado para
pacientes con condiciones mdicas y como
instrumento de tamizaje (Meakin, 1992).
Finalmente, otros instrumentos se han desarrollado especficamente para pacientes que
se atienden en unidades no psiquitricas, como los que se muestran en el cuadro 3.
ESCALA DE DEPRESION
DE HAMILTON (HAM-D)
El instrumento mas empleado en el rea de
salud mental, es sin duda, la Escala de Depresin de Hamilton (Ham-D).
Es utilizada para medir la severidad de la
depresin; no es un instrumento diagnstico. Sirve para medir los cambios a travs
del tiempo y la respuesta al tratamiento.
Este instrumento fue diseado para cuantificar en forma sistemtica los resultados de
una entrevista clnica con pacientes diagnosticados con un trastorno depresivo. Hamilton enfatiz que la Ham-D no debe de ser
usada como un instrumento diagnstico sino solamente como una herramienta para
ayudar a establecer la severidad de los sntomas depresivos. Seal que su valor depende enteramente de la habilidad de un
entrevistador para obtener la informacin
necesaria, recomienda una entrevista de al
menos media hora de duracin. Propone el
uso de toda la informacin disponible (incluyendo informacin de los parientes, amigos, enfermeras etc. cuando hubiera duda
de la exactitud de las respuestas del paciente, y provee sugerencias detalladas para entrevistar y evaluar a los pacientes deprimidos
en cada reactivo de la Ham-D.
Desde su publicacin inicial en 1960, la

Ham-D ha sido aceptada como el estndar
de la evaluacin para depresin clnica y ha
sido extensamente usada en la investigacin
clnica para determinar la eficacia de los medicamentos antidepresivos y otras modalidades de tratamiento. Otros investigadores
que han desarrollado otras escalas para evaluar depresin han usado la Ham-D como
el principal instrumento de validacin, y
tambin ha sido utilizada para evaluar sntomas de depresin en una amplia variedad de
enfermedades, desde alcoholismo, enfermedad de Parkinson, esquizofrenia, etc.
La escala original de Hamilton consta de
17 variables (sntomas). De stos, diez se
califican de 0 a 4 y once de 0 a 2, dando
una total que va desde 0 hasta 62 puntos.
La versin ms empleada es la de 17 variables que se listan a continuacin:
1. nimo deprimido
2. Sentimientos de culpa
3. Pensamientos suicidio
4. Insomnio inicial
5. Insomnio intermedio
6. Insomnio terminal
7. Trabajo y actividades
8. Retardo
9. Agitacin
10. Ansiedad psquica
11. Ansiedad somtica
12. Sntomas somticos gastrointestinales
13. Sntomas somticos en general
14. Sntomas genitales
15. Hipocondriasis
16. Prdida de peso
17. Introspeccin
El instrumento
ms empleado
en el rea de la salud
mental es la Escala de
Depresin de Hamilton.
Hamilton enfatiz
que la Ham-D no debe
de ser usada como un
instrumento diagnstico
sino solamente como
una herramienta para
ayudar a establecer la
severidad de los sntomas
depresivos.
Las variables que generalmente se excluyen son:

18. Variacin diurna
19. Despersonalizacin y desrealizacin
20. Sntomas paranoides
21. Sntomas obsesivos compulsivos
Una versin poco empleada incluye tres variables adicionales:
165
22. Desamparo
23. Desesperanza
24. Inutilidad
La Ham-D es un instrumento que rene
los criterios de sensatez ya mencionados.
Fue elaborado directamente a partir de la
prctica clnica, su amplia aceptacin y utilizacin prueban su validez de apariencia y
su validez de contenido se manifiesta por el
hecho de que la mayora de los investigadores emplean la versin original, sin variables suplementarias.
De acuerdo a su funcin clnica, este instrumento fue diseando para evaluar la
magnitud de la depresin (indicador de estado) aunque tambin ha sido ampliamente utilizado como parte de la arquitectura
de la investigacin ya que con frecuencia se
emplea como criterio de inclusin para ensayos farmacolgicos (por ejemplo, una calificacin de 18). Su gran sensibilidad al
cambio ha hecho que se emplee para la definicin de conceptos como "mejora" (una
disminucin de por lo menos el 50%) y
remisin (un mximo de 7 puntos) en los
estudios de intervenciones terapeticas.
Desafortunadamente pocos estudios han

utilizado este procedimiento rutinariamente.
Incluso que aquellos que aparentemente lo
hacen, con frecuencia no reportan detalles
metodolgicos importantes (nmero de
pacientes y nmero de pares de evaluadores, tipos de pacientes y momento de las
evaluaciones con respecto al curso de la enfermedad, si las entrevistas fueron conducidas juntas o separadas, la naturaleza de la
estadistica, etc.)
Varios estudios han demostrado correlaciones tan elevadas como 0.94 (coeficiente de
correlacin de Spearman) entre evaluadores (Knesevich et al. 1977).
Un coeficiente de confiabilidad de menos de
0.84 ha sido reportado para solo un par de
evaluadores clnicos en todos estos estudios.
Adems de la sensatez, la Ham-D rene los

criterios de confiabilidad y validez que se
requieren de cualquier instrumento.
La evidencia indica que se puede obtener

un buen acuerdo interevaluador con la
Ham-D, especialmente cuando se tiene experiencia clnica y entrenamiento formal
en la calificacin de la escala .
Consistencia
Validez
Se han determinado los diferentes tipos de

consistencia: interna y externa.
La Ham-D fue desarrollada como una medida sistemtica de la severidad de la depresin ms que como una herramienta
diagnstica, por lo que la principal prueba
de validez debe incluir su relacin con otras
medidas o variables que miden la severidad
de la enfermedad en pacientes deprimidos
ya diagnosticados.
La consistencia interna, medida con el alfa de

Cronbach, se ha reportado de 0.48 a 0.85,
antes y despus de tratamiento, (Gastpar y
Gilsdorf, 1990), 0.76 (Rehm y OHara,
1985) hasta 0.92 (Reynolds y Kobak, 1995).
El uso estandarizado de los 17 reactivos de
la Ham-D produce un mximo posible de
50 puntos. Hamilton recomienda que dos
evaluadores califiquen independientemente
al paciente en la misma entrevista.Al sumar
las dos puntuaciones dara un total de 100.
166
El procedimiento de evaluacin recomendado proporcionara automticamente informacin sobre la confiabilidad entre los
evaluadores.
Los tres principales tipos de estudio de validez de la Ham-D que se han empleado son:
1. Aquellos que relacionan las puntuaciones de la Ham-D con otros instrumentos calificados por el clnico
Depresin y ansiedad
2. Aquellos que relacionan estas puntuaciones con autorreportes del paciente.

3. Aquellos que demuestran que las puntuaciones de la escala se modifican con
el tratamiento (sensibilidad al cambio).
Tambin se ha reportado una correlacin de

0.77 entre la Ham-D y el Beck para pacientes admitidos en hospital general y de 0.25
entre la Ham-D y la Zung para pacientes alcohlicos desintoxicados recientemente.
En estudios de pacientes deprimidos se

han demostrado correlaciones altas (0,84
0.89 (Knesevich et al 1977) 0.90) entre
las puntuaciones de la Ham-D y evaluaciones clnicas globales de severidad al
momento de la admisin. Otro estudio
que report esta misma relacin, incluy
pacientes psiquitricos deprimidos y no
deprimidos y su correlacin fue de 0.67.
Con la escala anloga de depresin (autoaplicable) se han reportado relaciones moderadamente altas, de 0.63 y 0.79 para
pacientes deprimidos.
La Ham-D ha sido descrita como algo mejor en la diferenciacin en niveles de severidad entre pacientes deprimidos que la
escala de depresin autoaplicable de Zung
y casi igual a la escala de depresin de Beck.
Las correlaciones con severidad total y depresin alcanzaron 0.56 y 0.66 respectivamente
para valoraciones pretratamiento y 0.77 y
0.87 para valoraciones postratamiento. Las
evaluaciones de la conducta objetiva como el
habla, el sonrer y la actividad motora del paciente durante el curso de la hospitalizacin
por depresin tambin correlacion altamente con la Ham-D (0.71).
Muchos estudios han reportado la relacin
de las puntuaciones de la Ham-D con mediciones autoaplicables, particularmente con el
inventario de depresin de Beck y con la escala de depresin autoaplicable de Zung.
Los valores de la correlacin Ham-D-Beck de
estudios con pacientes deprimidos evaluados
previos al tratamiento va de 0.21 a 0.82 con
una mediana de 0.58; las correlaciones de la
Ham-D-Zung van de 0.38 a 0.62 con una
mediana 0.45. En general, estas relaciones se
incrementan algo con cambios promovidos
con el tratamiento. En otro estudio se observaron correlaciones de 0.68 y 0.71 para una
mezcla de pacientes psiquitricos y no deprimidos entre las puntuaciones de la Ham-D y
las de Beck y Zung respectivamente.
El estudio ms detallado y sistemtico de las

relaciones entre la evaluacin clnica y los
autoreportes de pacientes deprimidos utiliz una versin modificada de la Ham-D,
la entrevista clnica para depresin y un
inventario autoaplicable de 110 reactivos
.Los resultados indicaron un acuerdo moderado entre la entrevista y las evaluaciones
autoaplicables durante los episodios depresivos (reactivos comparables correlacionaron uno con el otro con valores de 0.63 y
0.11 y mediana de 0.41) las mediciones totales de severidad de la enfermedad depresiva correlacionaron a un nivel de 0.36 y estas
correlaciones se incrementaron considerablemente en evaluaciones similares despus
de la recuperacin. Los autores concluyeron
que durante los episodios agudos de depresin los mdicos usan criterios ms especficos en sus juicios de evaluacin que los
autorreportes del paciente, y que el paciente tiene menos experiencia que el psiquiatra
para juzgar como la enfermedad se ajusta al
amplio espectro de la depresin.
Como se seal anteriormente la Ham-D
y las modificaciones relacionadas se han
usado extensamente en la investigacin de
tratamientos, particularmente para monitonizar y evaluar la eficacia de varios medicamentos antidepresivos. Se ha reportado
en forma constante que la Ham-D refleja
los cambios del tratamiento observados clnicamente en los estudios farmacolgicos
con pacientes deprimidos as como los estudios con terapia electroconvulsiva.
Otra aproximacin al estudio de la validez
de un instrumento es el anlisis factorial. Se
167
han reportado muchos estudios de anlisis

factorial de la Ham-D con pacientes deprimidos. Se han obtenido de 3 a 6 factores en
cada estudio, dos factores relativamente estables. El factor A fue el inicialmente referido por Hamilton como el que reflejaba
depresin endgena o retardada y ms tarde
como factor general de la enfermedad depresiva que mide la severidad de los sntomas. Un segundo factor relativamente
estable y permanente B es una variable bipolar que aparentemente representa depresin agitada y ansiosa (reactiva) que se sita
en el polo opuesto de la depresin endgena retardada.
OBrien y Glaudin (1988) identificaron 4
factores (sntomas somticos, anorexia, alteraciones del sueo y agitacin/retardo) y
no encontraron el factor general que han
encontrado otros autores. Guy etiquet este factor como ansiedad/somatizacin.
Otros factores de la Ham-D no se han reproducido y no son interpretables.
parativo de la Ham-D y el establecimiento

de normas generalizables.
Se ha demostrado poca ventaja del uso de
las puntuaciones por factor de la Ham-D
al intentar analizar los componentes depresivos o cambios que van ms all del
puntaje total. Tambin hay poca evidencia sistemtica de su capacidad para diferencias varios grupos diagnsticos.
Aunque no fue diseada con este propsito, esta escala se ha empleado para cuantificar el grado de sntomas depresivos en
pacientes que no tienen enfermedades depresivas primarias.
A pesar de la evidencia considerable de la
superioridad en general de la Ham-D sobre
las mediciones autoaplicables, particularmente durante la etapa aguda de la enfermedad, muchos investigadores sealan que
la evaluacin clnica y las autoevaluaciones
tienen diferentes componentes y que ambos procedimientos son importantes en la
evaluacin de la depresin.
Utilidad
Ventajas
La Ham-D fue diseada para cuantificar
sistemticamente la severidad de la enfermedad por medio de una entrevista clnica.
Una revisin de la literatura deja poca duda acerca de lo bien que puede hacer su trabajo esta escala especialmente por mdicos
experimentados y bien entrenados.
Tal evaluacin clnica requiere de una buena
cantidad de tiempo, tanto para el entrenamiento para su uso estandarizado, como para la evaluacin de cada paciente deprimido.
Muchos investigadores han encontrado deseable aadir o modificar las variables de la
Ham-D e incluso cambiar el formato y o
los procedimientos en forma significativa
aunque la literatura parece indicar que tales modificaciones probablemente no han
afectado la confiabilidad o la validez de las
mediciones resultante. Dichas modificaciones ciertamente complican el uso com-
168
Un nmero de investigadores han reportado

una buena confiabilidad interevaluador y
han documentado la validez de la Ham-D
como una medida de severidad de la enfermedad depresiva. Las puntuaciones totales
de la Ham-D estn relacionadas con otros
juicios clnicos de la severidad de la depresin, estn moderadamente relacionadas
con los autorreportes, y reflejan los cambios
del paciente a travs del tratamiento.
Desde su publicacin inicial en 1960, el
Ham-D se ha aceptado como una escala de
evaluacin estndar para cuantficar sistemticamente los resultados de las entrevistas clnicas en pacientes con el diagnstico
de depresin.
Es un instrumento corto, su aplicacin no
interfiere con la entrevista clnica, ya que
la informacin requerida se obtiene a par-
Depresin y ansiedad
tir del curso de sta y puede aplicarse en el

consultorio; por lo general se recomienda
realizar una consulta de por lo menos media hora y tomar en cuenta la intensidad de
los sntomas desde diez das previos.
El principal componente de anlisis que se
obtiene, es el factor de severidad de los sntomas depresivos, aunque se han descrito
otros factores para diferenciar el tipo de depresin (Hamilton1960).
Es el instrumento usado con mayor frecuencia para validar las nuevas escalas utilizadas en depresin.
Se ha utilizado en la investigacin clnica para evaluar la eficacia de los tratamientos antidepresivos y adems se ha aplicado para
valorar la presencia de sntomas depresivos
en una gran cantidad de enfermedades, por
ejemplo en personas con cefalea migraosa,
dolor facial atpico, fobias, trastorno obsesivo-compulsivo, alcoholismo, enfermedad
de Parkinson, esquizofrenia; depresin secundaria asociada a enfermedad cerebral
vascular, mastectoma y efectos secundarios
de anticonceptivos orales (Hedlund, 1979).
INVENTARIO DE DEPRESIN
DE BECK (BECK-DEP)
El Beck-Dep deriv de las observaciones
clnicas acerca de las actitudes y sntomas
que presentaban pacientes psiquitricos
deprimidos. Las observaciones fueron reducidas a 21 sntomas y actitudes que
podan ser evaluados con una intensidad
de 0 (ausencia del sntoma) a 3 (severidad mxima del sntoma). Las variables
incluidas son:
1.
2.
3.
4.
5.
6.
7.
8.
nimo
pesimismo
sensacin de fracaso
insatisfaccin
sentimientos de culpa
sensacin de castigo
autoaceptacin
autoacusacin
9. ideacin suicida
10. llanto
11. irritabilidad
12. aislamiento
13. indecisin
14. imagen corporal
15. rendimiento laboral
16. trastornos del sueo
17. fatigabilidad
18. apetito
19. prdida de peso
20. preocupacin somtica
21. prdida de la libido
Las primeras 14 variables son sntomas
afectivo-cognoscitivos y los ltimos 7 son
sntomas somticos y vegetativos que aunque se incluyen para hacer el diagnstico
de depresin, tambin pueden ser el resultado de una enfermedad fsica.
Inicialmente fue diseado para ser administrado por entrevistadores entrenados pero se usa ms frecuentemente como una
escala autoaplicable.
El Beck-Dep es sensible a los cambios asociados con ensayos farmacolgicos, tcnicas psicoteraputicas diversas.
Aunque fue desarrollado especficamente
para evaluar depresin. en pacientes psiquitricos, el Beck-Dep se ha empleado para detectar depresin en pacientes con una
variedad de problemas mdicos y en adultos en comunidad.
Para hacer diagnstico de depresin, se requiere una puntuacin mnima o punto de
corte. Dependiendo de los autores, este vara de 11 a 21 puntos. Con un punto de
corte de 13 (Nielsen y Williams, 1980) observaron una sensibilidad de 0.79 y una especificidad de 0.77. Con 17 como punto
de corte, la sensibilidad disminuye a 0.66 y
la sensibilidad aumenta a 0.84. En el Instituto Nacional de Cardiologa (Torres-Castillo y et al. 1991) encontraron con 14
puntos el mejor equilibrio entre sensibilidad (0.86) y especificidad (0.86).
169
El SCL-90 es un cuestionario
diseado para evaluar
la presencia e intensidad
de la sintomatologa reportada
por el paciente; valora
sntomas referentes a diversas
manifestaciones subjetivas
que se experimentan durante
el estrs, la enfermedad
y la tensin emocional.
Su coeficiente de confiabilidad interna en

un estudio diseado con este propsito fue
de 0.86.
LISTA DE LOS 90 SNTOMAS

DE HOPKINS (SYMPTOM
CHECKLIST SCL-90)
La confiabilidad prueba-contraprueba del

Beck-Dep parece ser bastante alta (0.70). Torres-Castillo y cols. (1991) encontraron un
coeficiente de correlacin intraclase de 0.77.
Esta escala esta diseada para ser contestada por el propio paciente. Tambin ha sido utilizada por los clnicos para describir
el estado sintomtico del paciente.
Puntuaciones menores a 4 indican depresin leve, entre 14 y 20 indican depresin

moderada y puntuaciones severas de depresin son 21 y ms.
La SCL-90 ofrece las siguientes ventajas:

Provee un registro estandarizado detallado,permite la comparacin para evaluar
los cambios. Ofrece administracin rpida y eficiente, ayuda en la entrevista del
paciente, permite un alto grado de aceptacin del paciente y provee una evaluacin
multidimensional.
Validez
La magnitud de las correlaciones entre evaluaciones clnicas de depresin y el BeckDep reportadas van de 0.60 a 0.90.
Las relaciones del Beck-Dep con escalas de
evaluacin psiquitricas y pruebas psicolgicas han sido ampliamente estudiadas y han
conducido a correlaciones que varan entre
0.050 y 0.80 El Beck-Dep ha discriminado
entre pacientes psiquitricos que muestran
diferentes tipos de depresin y ha demostrado qe puede diferenciar entre diferentes diagnsticos psiquitricos como esquizofrenia y
depresin psictica. Sin embargo Beck-Dep
correlaciona con mediciones de ansiedad.
En un estudio de anlisis factorial, Tanaka y
Huba encontraron que el Beck-Dep presenta tres factores primarios correlacionados
actitudes negativas, suicidio y dificultad en
el desempeo estos tres factores por su parte describen un segundo factor de orden general que representa depresin en general.
En los diferentes estudios de anlisis factorial reportados la dimensin principal es la
evaluacin cognitiva.
Steerer y cols. realizaron una revisin sobre
los estudios de validez y confiabilidad del
Beck-Dep. En esta revisin qued demostrada la validez de esta escala. Reportaron
una confiabilidad prueba-reprueba de 0.70
y una consistencia interna con un coeficiente alpha de Cronbach de 0.86
170
A lo largo de la historia, las primeras escalas para medir sintomatologa fueron desarrolladas a partir del ndice mdico de
Cornell (1948). En un principio fue la escala de malestar realizada por Parloff en
1948 y revisada por Frank en 1953, que se
utiliz en investigacin para evaluar tratamientos psicoteraputicos y posteriormente el listado de sntomas de Hopkins
(HSCL), que consista en 58 preguntas y
una versin abreviada de 38 puntos. Despus de algunas revisiones a estas escalas,
finalmente se introduce la escala de sntomas de Hopkins SCL-90.
El SCL-90 es un cuestionario diseado para evaluar la presencia e intensidad de la
sintomatologa reportada por el paciente,
valora sntomas referentes a diversas manifestaciones subjetivas que se experimentan
durante el estrs, la enfermedad y la tensin emocional. Incluye 90 reactivos, que
a su vez se agrupan en 9 subescalas, cada
una con un total de 6 a 13 items. La intensidad del sntoma es medido por el paciente en una escala de severidad, en donde
0=nada y 4=severo, tomando un tiempo de
referencia de 7 das.
La SCL-90 es un instrumento autoaplicable que evala 9 dimensiones de la psicopatologa.
Depresin y ansiedad
Las variables del SCL-90 se agrupan en las

siguientes subescalas.
1.
2.
3.
4.
5.
6.
7.
8.
Somatizacin (12 variables)

Obsesivo Compulsivo (10 variables)
Sensibilidad Interpersonal (9 variables)
Depresin (13 variables)
Ansiedad (10 variables)
Hostilidad (6 variables)
Ansiedad Fbica (7 variables)
Pensamiento de contenido paranoide
(6 variables)
9. Sntomas psicticos (10 variables)
10. Sntomas aislados (7 variables)
La puntuacin mxima para cada uno de
ellos es de 4 a excepcin de los sntomas
adicionales.
Para calificar, se suma el total de los reactivos
y se divide entre el nmero de los mismos.
Para calificar el total se suma el resultado
previamente obtenido de cada una de las
dimensiones y se divide entre 90.
El instrumento ha demostrado su validez, y
una sensibilidad y especificidad entre el
80% al 90%.
manera grfica, segn lo amerite la investigacin. La estructura factorial del SCL-90

debe ser establecida de manera emprica para cada poblacin. Esta escala ha sido utilizada en varias poblaciones de consulta
externa con diagnsticos como distmia,
trastornos ansiosos y anorexia nervosa. Asimismo en pacientes hospitalizados con cuadros psicticos y neurticos. En poblaciones
de veteranos psiquitricos con cuadros de
ansiedad, depresin y esquizofrenia; en poblaciones no psiquitricas y en poblaciones
geritricas sin que se hubiera realizado un
anlisis factorial. Existen estudios en diferentes partes del mundo (Holi y Cols 1998).
Holi y cols. (1998) demostraron en un estudio en Finlandia un coeficiente alfa de
Cronbach de 0.77 a 0.90. En la muestra
comunitaria mayor de 40 aos se encontraron puntajes consistentemente superiores a los del grupo menor de 40 aos. En
relacin a la interdependencia entre las dimensiones del cuestionario y las poblaciones en su estudio encontraron que estas se
correlacionaron en un 0.67 para la poblacin en la comunidad y en un 0.57 para la
muestra de pacientes.
El Cuestionario de Salud
Mental 5 (MHI-5) es un
instrumento autoaplicable
de 5 preguntas que permite
identificar la presencia
de depresin en pacientes
que acuden a un servicio
de primer nivel de atencin.
OTROS INSTRUMENTOS
El cuestionario incluye un instructivo para
responder de manera adecuada, est escrito
en un lenguaje bsico y entendible; las preguntas estn formuladas de manera en que
se pueden leer y cuantificar en un programa de computadora; dando como resultado final un ndice sintomtico general que
es la suma de todos los puntajes de los factores y se divide entre 90, el total de sntomas positivos, que es el nmero de
sntomas que el paciente cuantifica con algn grado de severidad diferente de , el nivel de malestar que producen los sntomas
positivos, definido como el nivel promedio
de malestar provocado por los sntomas reportados como problema.
Con las medidas anteriores se puede analizar
el perfil del paciente, los resultados se pueden observar en una hoja de clculo y de
El Cuestionario de Salud Mental 5, MHI-5

por sus siglas en ingls, (Berwick y cols,
1991) es un instrumento breve (5 preguntas) y autoaplicable para identificar la presencia de depresin en pacientes que acuden
a un servicio de primer nivel de atencin;
deriva del Inventario de Salud Mental (Ware, Johnston y Davies-Avery, 1979; Veit y
Ware, 1983). Detecta trastornos que incluyen depresin mayor, trastornos afectivos
generales y trastornos de ansiedad. El MHI5 se deriva del MHI18 que a su vez se deriva del MHI de 38 reactivos. El MHI-5 es
una forma corta basada solo en los reactivos
que reproducen mejor el puntaje total basado en la versin ms larga.
Escala de Autoevaluacin de Zung, publicada en 1965 por Zung y Durham, se ha
171
utilizado en nuestro pas. Es una escala autoaplicada, tiene varios reactivos que dejan
duda no son claros, no investiga sobre inseguridad, ideas obsesivas y disminucin de
la concentracin.
Las Escala de ansiedad de

Hamilton es una de las
mediciones de ansiedad mas
utilizadas en estudios
farmacolgicos de ansiedad.
Escala de Cornell de Depresin en la Demencia (Cornell Scale for Depression in

Dementia, CSDD) valora el humor, las alteraciones de conducta, signos fsicos, funciones cclicas y alteracin de las ideas.
La escala de Depresin del Centro para Estudios Epidemiolgicos (CES-D, Center
for Epidemiologic Studies Depression Scale) fue desarrollada para medir sntomas de
depresin en sujetos en la comunidad
(Radloff, 1977).
Es un cuestionario autoadministrado que
incluye 20 variables como nimo deprimido, sentimiento de minusvala, de desesperanza, prdidad de apetito, falta de
concentracin y alteraciones del sueo.
Las variables incluidas proceden de varias
fuentes como el Zung-Dep, Beck-Dep, la
Escala de Raskin, el MMPI, entre otros.
Las variables se califican de 0 a 3, en respuesta a Durante la ltima semana, con
qu frecuencia?. La puntuacin es de 0
a 60, con un punto de corte de 16 que permite diferenciar pacientes con depresin
media de sujetos normales con una puntuacin de 23 para depresin significativa.
La principal ventaja de este instrumento es
que toma cinco minutos el contestarlo.
Escala de Cornell para depresin y demencia diseada por Alexopoulus 1988,
debe ser administrada por un mdico toma diez minutos con el paciente, tiene
19 reactivos se evala por tres puntos ausente, mediano o intermitente y sntomas severos. Una puntuacin de 8
sugiere sntomas depresivos. Es la mejor
escala para evaluar depresin en sujetos
con demencia (Burns 2002).
172
Escala de ansiedad de Hamilton

La escala de ansiedad de Hamilton proporciona una medicin de ansiedad global incluyendo sntomas cognitivos y
somticos. Inicialmente fue diseada como un indicador de severidad de la neurosis de ansiedad, sin embargo esta escala
no se enfoca a sntomas de ansiedad generalizada de acuerdo al DSM IV. Es un instrumento administrado por el clnico
tiene 14 reactivos que evalan:
1. Ansiedad
2. Tensin
3. Temor
4. Insomnio
5. Sntomas cognitivos
6. Afecto deprimido
7. Conducta durante la entrevista
8. Sntomas somticos sensoriales
9. Sntomas cardiovasculares
10. Sntomas respiratorios
11. Gastrointestinales
12. Genitourinarios
13. Autonmicos
14. Somticos
La escala de calificacin va de 0 a 4 para cada reactivo. La calificacin final va de 0 a
56. Se ha sugerido 14 como punto de corte para indicar ansiedad con significado clnico. El tiempo de administracin va de 15
a 30 minutos, se recomienda que haya entrenamiento, aunque los clnicos pueden
utilizar la escala sin entrenamiento.
Como en todos los instrumentos que son
calificados por un observador se recomienda verificar la confiabilidad entre los observadores cuando participen varios en un
estudio.
Esta escala tiene buena consistencia interna. El alfa de Cronbach de0.79 a 0.86.
Con buen entrenamiento la confiabilidad
entre evaluadores va de 0.74 a 0.96. La
confiabilidad a un da y a una semana de
test retest es de 0.96. Para adolescentes la
estabilidad a un ao a sido de 0.64.
Depresin y ansiedad
La validez se ha determinado con la correlacin con otras escalas de ansiedad. Por

ejemplo con la escala de ansiedad global
de Covi de 0.63 a 0.75 y con el Beck de
ansiedad de 0.56.
Distingue pacientes ansiosos de no ansioso.
En un estudio, se observ que sujetos no
ansiosos tienen un promedio de 2.40 y pacientes que buscaban tratamiento para
trastornos de ansiedad de 18.95.
Es la medicin de ansiedad ms utilizada
en estudios farmacolgicos de ansiedad.
Inventario de ansiedad de Beck
Este instrumento evala la ansiedad enfocndose a los sntomas somticos. Tiene 21
reactivos entre los que incluyen sntomas tpicos de ansiedad como nerviosismo, incapacidad para relajarse, mareo o sensacin de
ligereza en la cabeza. Se registra qu tanto les
ha molestado esto a los pacientes durante la
semana pasada. La puntuacin total va de 0
a 63. Cada reactivo se califica de 0 a 3.
A diferencia del anterior, ste es un instrumento autoaplicable, que es respondido directamente por el paciente. Aproximadamente
lleva 5 minutos de aplicacin.
Tienen elevada consistencia interna (alfa de
Cronbach de 0.90 a 0.94). La confiabilidad prueba reprueba de 0.67 a 0.93 con un
intervalo de1 semana y el coeficiente de correlacin 0.62 con 7 semanas de intervalo.
En cuanto a su validez se ha visto que correlaciona con otras mediciones de ansiedad en adultos, adolescentes, ancianos y en
muestras de comunidad. La correlacin
con Hamilton de 0.51, y con el Inventario
de Ansiedad Rasgo Estado de Spielberger
es de 0.47 0.58, con la sub escala de ansiedad de SCL 90 0.81. Sin embargo las correlaciones con las escalas de depresin
tambin son elevadas.
Sus ventajas son que es confiable, est validada, es corta, es autoadministrada y fcil
de calificar. Es til para monitorear cambios durante el tratamiento.

Tiene la desventaja de que no evala preocupaciones, que es un sntoma de la ansiedad generalizada.
Escala de ansiedad social de Liebowitz
Es una entrevista semi estructurada administrada por el clnico para evaluar la fobia
social de acuerdo a los criterios del DSM.
Incluye 24 variables, 13 que describen situaciones de ejecucin (performance) y
11 que describen situaciones de interaccin social. Se califica de 0 a 3.
La escala de Yale Brown fue

diseada especficamente para
medir los sntomas obsesivos
y compulsivos.
Las 24 variables se agrupan en 4 subescalas:

1.
2.
3.
4.
de temor social,
evitacin social ,
temor de ejecucin y
evitacin de ejecucin.
El temor y los reactivos de evitacin se suman en situaciones sociales y la de ejecucin para dar un total de 0 a 72. No se
requiere entrenamiento especifico, tiene
una buena consistencia interna con alfa
de Cronbach de 0.82 a 0.92.
En los estudios de validez se ha encontrado que correlaciona con las mediciones de
ansiedad social por ejemplo con el inventario de fobia social y ansiedad 0.87 y con
la escala breve de ansiedad social 0.76.
Es sensible al cambio con tratamiento farmacolgico y psicoterapetico.
Esta es administrada por el clnico y no es un
instrumento diagnstico. Es fcil de aplicar.
Escala de Yale Brown
Esta escala fue diseada especficamente
para medir los sntomas obsesivos y compulsivos, as como su severidad, tiene 10
variables, con puntuaciones de 0-4, donde 0 es la ausencia del sntoma y 4 es la
presentacin extrema, el puntaje total va
173
de 0 a 40, con subtotales separados para

la severidad de las obsesiones y las compulsiones. Posee un alto grado de consistencia interna, lo que sugiere que es un
174
instrumento confiable para la evaluacin

de la severidad de los sntomas obsesivocompulsivos (34). La validacin en Mxico fue realizada por Nicolini et al.
Evaluacin de sntomas psicticos
Los instrumentos que miden sntomas psicticos son tiles para la evaluacin de pacientes con esquizofrenia y trastornos
esquizoafectivos, esquizofreniformes, psicticos breves o delirantes. Dos son los instrumentos de este tipo que se han empleado
con ms frecuencia: la Escala Breve de Apreciacin Psiquitrica (BPTS) y la Escala de
Sntomas Positivos y Negativos (PANSS).
En este captulo tambin se har referencia a
la evaluacin de la mana y de los movimientos anormales, que generalmente son
consecuencia del tratamiento antipsictico.
ESCALA BREVE DE APRECIACIN
PSIQUITRICA
La Escala Breve de Apreciacin Psiquitrica (BPRS de la siglas en ingls para Brief
Psychiatric Ratign Scale, BPRS) desarrollada por Overall y Gorham (1962) es un
instrumento que evala varios sntomas
de los trastornos mentales, pero, principalmente sntomas psicticos.
Consta de 18 variables que son valoradas
por un clnico con experiencia en pacientes psicticos: preocupaciones somticas.
ansiedad, pobreza emocional. desorganizacin conceptual, sentimientos de culpa.
Tensin, amaneramientos y posturas extraas, grandiosidad, depresin, hostilidad, suspicacia, alucinaciones. retardo
motor, falta de cooperacin, contenido
del pensamiento raro, aplanamiento afectivo. excitacin, desorientacin
La escala de evaluacin propuesta por Overall, incluye siete categoras de severidad
(ausente, muy leve, leve, moderado, moderadamente intenso, intenso, muy intenso o
severo), aunque describe los sntomas, mas
no cmo calificar los grados de severidad
por lo que se requiere de experiencia para
la calificacin de este instrumento.
Bech y Rafaelsen propusieron una segunda versin con 5 grados de severidad en la

que superan las deficiencias de la anterior,
esto es, cuenta con un manual para su
aplicacin que incluye la definicin, clara
y concisa de cada sntoma evaluado y sus
respectivos grados de severidad.
En los estudios de consistencia entre evaluadores se han obtenido coeficientes de
correlacin de Pearson superiores a 0.80
para la calificacin total y de 0.63 a 0.83
para las variables de manera individual.
Los instrumentos que miden

sntomas psicticos son tiles
para la evaluacin de
pacientes con esquizofrenia,
trastornos esquizoafectivos,
trastornos esquizofreniformes,
trastornos psicticos breves o
trastornos delirantes.
De la versin original de Overall, hay traducciones al espaol en Mxico, aunque

hasta donde sabemos, no hay estudios de
reproducibilidad. Con respecto a la versin que emplea una escala de 5 categoras, de acuerdo a estudios preliminares
realizados en el Instituto Nacional de Psiquiatra (Ortega-Soto et al., datos no publicados) tiene una reproductibilidad
satisfactoria cuando es aplicada por psiquiatras entrenados (coeficiente de correlacin intraclase: 0.77).
Varios reportes mencionan 4 factores de la
escala: Trastorno del pensamiento, Retraimiento/retardo, Hostilidad/Suspicacia y
Ansiedad/Depresin. La forma ms sencilla
de agrupar las variables ha sido en dos factores: sntomas positivos y sntomas negativos.
La correlacin del BPRS con el PANSS ha
sido elevada tanto en la calificacin total
(0.84) como en las subescalas de sntomas
positivos (0.92) y sntomas negativos (0.82).
La Escala Breve de
Apreciacin Psiquitrica
(BPRS) un instrumento que
evala varios sntomas de los
trastornos mentales, pero,
principalmente sntomas
psicticos. Consta de 18
variables que son valoradas
por un clnico con experiencia
en pacientes psicticos.
El BPRS se ha empleado en varios cientos

de estudios (Hedlund y Vieweg, 1980) para medir el cambio en respuesta al tratamiento farmacolgico y no farmacolgico,
incluyendo los antipsicticos atpicos. La
validez concurrente se ha demostrado con
175
la correlacin elevada que se ha obtenido

con la Escala de Apreciacin Clnica Global cuando se emplean simultneamente.
ESCALA DEL SNDROME POSITIVO
Y NEGATIVO
Escala del Sndrome Positivo

y Negativo (PANSS) es una
escala que mide severidad de
los distintos sntomas
presentes en la esquizofrenia,
y permite evaluar los cambios
en respuesta al tratamiento.
Incluye 30 variables
agrupadas en 3 subescalas:
una de sntomas positivos,
una de sntomas negativos y
una de psicopatologa general.
La Escala del Sndrome Positivo y Negativo

(PANSS, de las siglas en ingles para Positive
and Negative Syndrome Scale) desarrollada
por Kay y col (1987), es una escala que mide severidad de los distintos sntomas presentes en la esquizofrenia, y permite evaluar
los cambios en respuesta al tratamiento.
Incluye 30 variables agrupadas en 3 subescalas: de sntomas positivos, de sntomas
negativos y de psicopatologa general. Tales variables son las siguientes; delirios, alucinaciones, desorganizacin conceptual,
excitacin, hostilidad, suspicacia , grandiosidad, afecto aplanado, falta de espontaneidad, retirada emocional, empata limitada,
Retirada social aptica, dificultades en el
pensamiento abstracto, pensamiento estereotipado, preocupacin, ansiedad, tensin, depresin, sentimientos de culpa,
retraso motor, manerismos, falta de atencin. evitacin social activa, falta de juicio,
alteracin de la voluntad, falta de cooperacin, contenido inusual de pensamiento,
desorientacin, deficiente control de impulsos, preocupacin somtica.
Cada variable se califica de acuerdo a la severidad desde 1 igual a ausente, hasta 7, extremadamente severo. El punto de corte es
60. La validacin en Mxico fue realizada
en 90 pacientes del IMP, por Ortega et al.
Las diferencias entre las calificaciones positivas y negativas forman una escala compuesta
que expresa el grado de predominancia de
un sndrome sobre el otro.
El PANSS tiene criterios operacionales estrictos para conducir una entrevista clnica,
definiciones especficas para cada uno de las
30 variables, criterios de calificacin ms detallados para cada nivel de psicopatologa.
176
El coeficiente alfa de Cronbach indic una

consistencia interna elevada de las subescalas: 0.73, 0.83 y 0.79 para las subescalas positiva, negativa y general respectivamente.
Los ndices de confiabilidad en la pruebacontraprueba, aplicada a pacientes que no
remitieron su sintomatologa durante un
intervalo de 3 a 6 meses, fue de 0.80,
0.68, 0.60 0 para las subescalas positiva,
negativa y de psicopatologa general respectivamente (Kay et al, 1987).
Estudios recientes han encontrado la confiabilidad interobservador del PANSS de
0.83 a 0.87. Tiene una correlacin elevada con el mtodo de Andreasen para la valoracin de sntomas positivos (r= 0.77) y
sntomas negativos (r=0.77) (Kay, Opler y
Lindermayer, 1987).
ESCALA PARA LA EVALUACIN
DE MANA
La Escala para la Evaluacin de la Mana,
de Young y cols. (1978) (MRS, de las siglas en ingls para Mana Rating Scale) es
un instrumento con 11 variables diseado
para medir la gravedad de los sntomas de
mana y para determinar el efecto del tratamiento sobre estos sntomas.
Se desarroll siguiendo el modelo de la escala de depresin de Hamilton por lo que
debe ser calificada por un clnico entrenado y con experiencia. Para calificar esta escala, se requiere una entrevista de 15 a 30
minutos.
Las 11 variables incluidas son: afecto,
energa, inters sexual, sueo, irritabilidad,
discurso, trastorno del lenguaje-pensamiento, contenido, conducta disruptivaagresiva, apariencia, insight (penetracin,
discernimiento).
Siete variables se califican con una escala
de 0 a 4 y cuatro (Irritabilidad, Discurso,
Contenido y Conducta disruptiva-agresiva) con otra de 0 a 8.
Evaluacin de sntomas psicticos
La consistencia interna, determinada por

la correlacin entre la calificacin total y
cada una de las variables fue buena, de
0.45 para apariencia a 0.85 para Trastorno del Lenguaje-pensamiento.
La confiabilidad interevaluadores fue muy
buena, 0.93 para la calificacin total, con
un rango del 0.66 para Conducta disruptiva-agresiva a un 0.95 para sueo.
Para determinar la validez concurrente se
correlacion con la Escala de Petterson, con
una evaluacin global de severidad y con la
Escala de Biegel aplicada por enfermeras.
La correlacin con la evaluacin global fue
de 0.88, con la Escala de Petterson de
0.89), y con la Escala de Biegel fue de 0.71.
Este instrumento es sensible al cambio.
MOVIMIENTOS ANORMALES
En los ltimos aos se ha incrementado el
inters por la evaluacin de los efectos secundarios de los neurolpticos, en especial
de los movimientos anormales.
Los dos instrumentos que se han empleado con ms frecuencia son la escala de
Simpson-Angus y la escala de DiMascio.
Las variables incluidas en la Escala de
Simpson-Angus comprenden: marcha,
cada del brazo, rigidez del hombro, rigidez del codo, rigidez de la mueca, rueda
dentada, balanceo de la pierna, rigidez de
la nuca, temblor, salivacin.
Las variables en la Escala de DiMascio
son: expresin facial, temblor, aquinesia,
rigidez, acatisia, distonia.
La consistencia y la validez de ambos instrumentos han sido determinados en nuestro
pas. Ortega et al (1991) modificaron la Escala de Simpson-Angus agregando a las 10
variables originales dos ms, una para la evaluacin de Acatisia y otra para la evaluacin
de Aquinesia. Encontraron una confiabilidad prueba-contraprueba de 0.70 (coeficiente de correlacin intraclase) para la
puntuacin total de la escala de DiMascio y
de 0.86 para la de Simpson-Angus. Estos
autores encontraron, como se espera en los
instrumentos que son evaluados por el clnico, que las correlaciones ms elevadas fueron
entre los evaluadores con mayor experiencia.
En los ltimos aos

se ha incrementado el inters
por la evaluacin de los
efectos secundarios de los
neurolpticos, en especial de
los movimientos anormales.
Para medirlos se emplean la
escala de Simpson-Angus
y la escala de DiMascio,
ambas validadas en Mxico.
La validez de la escala de DiMascio se determin al observarse diferencias en las

puntuaciones de pacientes tratados con
haloperidol y aquellos tratados con carbamacepina.
La correlacin entre la escala de SimpsonAngus y la de DiMascio fue 0.6.
177
Calidad de vida
EVALUACIN DE LA CALIDAD
DE VIDA Y DEL FUNCIONAMIENTO
Para algunos lectores, este captulo les parecer desproporcionado en relacin a los
otros captulos. Dos razones; por un lado,
ste ha sido nuestro campo de experiencia y
en segundo lugar, en la mayora de los trabajos se privilegia le evaluacin de los sntomas ya que se considera que desaparecer a
los sntomas es el objetivo fundamental de
la actividad clnica. Considerando que actualmente este punto de vista tiende a modificarse, este captulo servir para poner a
los clnicos e investigadores en contacto con
un rea no muy estudiada.
Actualmente, la calidad de vida es un constructo cuya utilidad se reconoce en la prctica clnica. La controversia no es acerca de
la importancia de medir la calidad de vida;
sino acerca de cmo medirla.
La historia del concepto ha sido revisada (Lara) por lo que no nos detendremos en ella.
Solo resaltaremos algunos aspectos relevantes
a la controversia sobre su medicin. Se ha
mencionado que la calidad de vida es (o debera ser) una evaluacin subjetiva, qu tan
satisfecho est el sujeto con su vida. Sin embargo, la mayora de los instrumentos, incluye varias dimensiones, las que los
investigadores y en algunos casos los usuarios
de los instrumentos, han identificado como
pertenecientes a la calidad de vida. Generalmente estas dimensiones, que tambin ya
han sido revisadas (Lara y Ponce de Len) incluyen una dimensin fsica (funcionamiento y sntomas), una dimensin psicolgica y
una dimensin social (funcionamiento y
apoyo social). Es decir, hay un traslapo importante en lo que evalan los instrumentos
de calidad de vida y aquellos que evalan
funcionamiento. Tambin ha habido controversia en relacin a conceptos como calidad
de vida relacionada a la salud y estado de

salud. Debido a este traslapo, en este captulo hemos incluido tanto los instrumentos
cuyo ttulo incluye el trmino calidad de vida como aquellos dirigidos a la evaluacin
del funcionamiento.
Calidad de vida es la
evaluacin subjetiva
sobre qu tan satisfecho
est el sujeto con su vida.
La seleccin que se haga del instrumento,

depender de los objetivos del investigador.
Uno de los catlogos mas extensos de instrumentos para la evaluacin de la calidad
de vida es el de Spilker. Nosotros revisaremos algunos de los que se han empleado
con mayor frecuencia en el rea de la salud mental.
ESCALA DE CALIDAD
DE VIDA DE DUNBAR
Es un instrumento autoaplicable que consta de dos subescalas: a) Calidad de vida actual (estado actual) y b) Calidad de vida
ideal (estado ideal). Cada una de ellas con
23 reactivos, los cuales se pueden agrupar
en 8 dimensiones:
1.
2.
3.
4.
5.
6.
7.
8.
bienestar psicolgico,
bienestar fsico,
nimo,
locus de control,
relaciones sociales,
empleo,
actividades e intereses y
aspecto econmico.
La mayora de los
instrumentos que evalan
calidad de vida incluyen
varias dimensiones,
las que los investigadores
y en algunos casos los
usuarios de los instrumentos
han identificado como
pertenecientes a la
calidad de vida.
Cada reactivo se responde con una escala

grfica, de 10 categoras, con un extremo
positivo y otro negativo.
Este instrumento fue diseado para ser empleado en pacientes psiquitricos no psicticos La validez y la confiabilidad se evaluaron
en 129 pacientes con trastorno de ansiedad
generalizada y depresin mayor.
179
Cuadro 4. Coeficientes de correlacin de Spearman con otros instrumentos.

Perfil de Impacto de la Enfermedad
Cuestionario General de Salud
Escala de Depresin de Hamilton (semana 6)
Escala de Depresin de Hamilton (semana 12)
Escala de Ansiedad de Hamilton (semana 6)
Escala de Ansiedad de Hamilton (semana 12)
Subescala de Depresin del HAD (semana 6)
Subescala de Depresin del HAD (semana 12)
Subescala de Ansiedad del HAD (semana 6)
Subescala de Ansiedad del HAD (semana 12)
Subescala de Extraversin (Eysenck)
Subescala de Neuroticismo
Se han diseado instrumentos

genricos para la evaluacin
de la calidad de vida y
especficos para la evaluacin
de pacientes con depresin
o esquizofrenia.
La confiabilidad se determin mediante la

prueba-reprueba (coeficiente de correlacin
de Spearman). El instrumento se aplic el
da 1 y el da 2 y las correlaciones obtenidas
fueron de 0.66 a 0.83.
La consistencia interna calculada a travs
del coeficiente alpha de Cronbach fue de
0.90 a 0.94.
La validez, obtenida mediante la correlacin de la calificacin total con otros instrumentos, se muestra en el cuadro 4.
Como se observa, la escala de Dunbar tiene
un traslape grande con instrumentos que
evaan ansiedad y depresin.
EL CUESTIONARIO DE CALIDAD
DE VIDA Y SATISFACCIN
DE ENDICOT
Entre los instrumentos

especficos para la evaluacin
de la calidad de vida
de pacientes con depresin
se incluyen la escala de
Dunba y la de Endicott.
Es una escala autoaplicable para explorar

el grado de satisfaccin que experimentan
los pacientes en varias reas de su funcionamiento diario. Estas reas son: salud fsica, sentimientos subjetivos, trabajo,
actividades del hogar, trabajo en la escuela, actividades en tiempo libre, relaciones
sociales y actividades generales.
Consta de 93 reactivos los cuales se califican
en una escala de 1 a 5
La confiabilidad fue evaluada mediante la
prueba-reprueba, el instrumento se aplic
180
-0.33 a -0.61
- 0.44
- 0.46 a -0.68
-0.58 a -0.71
-0.20 a -0.33
-0-51 a -0.65
-0.68 a -0.86
-0-50 a -0.81
-0.52 a -0.69
-0.60 a -0.73
0.23
-0.29
el da 1 y da 2. Se obtuvo un coeficiente de
correlacin intraclase de 0.66-0.89 en las
diferentes subescalas.
La consistencia interna fue evaluada mediante el coeficiente alpha de Cronbach.
Los resultados fueron 0.91-0.96 en las diferentes subescalas.
LA LISTA PARA EVALUAR
LA CALIDAD DE VIDA
DE LOS ENFERMOS
ESQUIZOFRNICOS (MALM, 1981)
Este fue el primer instrumento publicado
para evaluar la calidad de vida de los enfermos esquizofrnicos; y fue elaborado en un
hospital sueco (Malm y col, 1981).
Segn Malm, la calidad de vida no slo
significa tener un sentimiento general de
felicidad. Sera inconveniente definir slo
subjetivamente la calidad de vida por dos
razones: 1) se pasara por alto la anormalidad mental, asumiendo que la felicidad
y la insatisfaccin nunca son patolgicas y
2) se impedira distinguir a los privilegiados de los que estn socialmente en desventaja, proporcionando una excusa para
la inaccin.
El desafo es poder describir y evaluar las
experiencias de los enfermos. Un gran nmero de factores materiales y sociales,
junto con la experiencia subjetiva, contribuyen a la calidad de vida integral.
Calidad de vida
Son varias las reas propuestas por Malm

que deben evaluarse. Por una parte estn las
necesidades que deben ser cubiertas por el
sistema de salud y, por el otro, las que estn
cubiertas por los otros sistemas: el de rehabilitacin, el familiar y el comunitario.
1. La calidad de vida material (habitacin, ropa y lavado de ropa, alimentos,
higiene, bienes de consumo, privacidad,
belleza ambiental y sin contaminacin).
La evaluacin del lugar se hace de acuerdo
con las normas que marca la sociedad a la
que pertenece el enfermo. De acuerdo con
Malm, el enfermo debe tener un departamento propio o un cuarto amueblado con
bao y cocina; luz y calefaccin, (obviamente esto es lo normal en Suecia).
En este inciso tambin se incluyen las comunicaciones y los transportes (telfono,
carreteras, medios de transporte y correo).
Estos servicios son particularmente importantes cuando el paciente acaba de salir del hospital; debe tener un telfono
disponible para que pueda solicitar ayuda
cuando la necesite. La comunicacin debe
darse en ambas direcciones: es importante
que el paciente sienta que puede obtener
ayuda cuando la necesite, ya sea de da o
de noche.
2. Conocimientos, educacin, recreacin (peridicos, revistas, libros, radio,
televisin, deportes, teatro, cine, arte,
msica, educacin para adultos e informacin pblica). La idea fundamental es
proporcionar los estmulos, las habilidades y las oportunidades necesarias para
ampliar o preservar los horizontes y las capacidades del individuo. Esto no quiere
decir que deba someterse al pacientes a un
gran nmero de terapias.
Para evaluar primero esta rea se determina el nivel acadmico del enfermo. Se
anota la frecuencia con la que lee peridicos, revistas, libros o ve programas completos en la televisin.
3. Relaciones humanas (familia, amigos,

intimidad sexual, libertad, discriminacin y alienacin). En la evaluacin se incluyen slo las personas que viven: sus
padres, su cnyuge, sus hijos, su red social
(los amigos, los vecinos, los miembros de
una sociedad, o de un club).
4. Dependencia. Se debe evaluar tanto la
dependencia econmica como la psicolgica. Por la dependencia econmica se entiende que el enfermo viva del dinero que le
proporciona otra persona o el estado.
Por dependencia psicolgica se entiende
que el enfermo necesite de otras personas;
que no pueda vivir sola.
Para la evaluacin de
pacientes con esquizofrenia se
cuenta con la Lista de Malm,
la Entrevista para Evaluar la
Calidad de Vida de Lehman,
la escala de calidad de vida
de Heinrichs.
5. Experiencias internas (experiencias

espirituales y religiosas, armona interior, placer de vivir, autorrealizacin,
intereses, contacto emocional, motivos
para vivir, sentimiento de identidad,
paz mental).
La evaluacin de esta rea puede hacerse mediante las definiciones operacionales de las
escalas psiquitricas reconocidas. Por ejemplo el placer de vivir corresponde al reactivo incapacidad de sentir de la Escala de
Psicopatologa de Asberg (1978), El contacto emocional corresponde a alteraciones
del contacto afectivo de la misma escala, o al
reactivo capacidad de empata de Heinrichs (1984). Para los motivos para vivir
tambin puede usarse esta ltima escala; para el placer de vivir se puede emplear anhedonia y para estimulacin-inters, se
puede emplear la escala de curiosidad.
6. Atencin mdica (alivio de los sntomas, prevencin de las recadas, prevencin y alivio de las enfermedades
fsicas): Aunque parezca raro, la atencin
mdica general que se da a los enfermos
esquizofrnicos no suele ser igual a la que
se le proporciona a otros enfermos ni a los
dems miembros de la comunidad. La
atencin se enfoca principalmente a la
prevencin de las recadas.
181
7. Recreacin. Puede emplearse la Escala

de Ajuste de Katz (1963), o se puede registrar el nmero de actividades. Estas se
evalan de acuerdo con los estndares locales, por ejemplo, ir al cine una o dos
veces al mes. Los das libres se marcan
slo para las personas que estn empleadas. Los viajes se refieren a los que se hacen fuera del rea.
8. Trabajo y condiciones en las que se
trabaja (empleos de tiempo parcial o
rehabilitacin vocacional). La rehabilitacin vocacional se evala de acuerdo
con la disponibilidad para trabajar y la
manera de cumplir con el trabajo. Si es
necesario, el ajuste ocupacional puede
evaluarse con las diferentes escalas que ya
existen. Las labores del hogar se marcan
como empleo abierto.
9. Religin. No hay instrucciones especiales para evaluarla.
Otra rea que debe tomarse en cuenta es la
que se refiere a la seguridad de los enfermos
(fuego, delitos, polica, inundaciones, temblores, y seguridad en el hogar y en el trabajo). Los pacientes esquizofrnicos son presa
fcil de adictos, estafadores y otros delincuentes, por lo que es necesario fijarse en las
condiciones locales de delincuencia y proporcionar servicios especiales de proteccin
y apoyo.
Los desastres naturales se pueden mitigar si
se usan normas seguras de construccin. Es
necesario que los pacientes sepan qu hacer
en caso de desastre.
La lista de Malm se bas en una lista sobre
la calidad del ambiente. Esta lista evala el
ltimo mes. Los estndares estn adaptados
a la comunidad. Posteriormente hizo otra
versin de esta lista y la estructur con 100
variables (QLS-100) organizadas en 11
reas: 1) vivienda, incluyendo el cuidado de
la casa, 2) ambiente, incluyendo los servicios de la comunidad, 3) conocimientos y
educacin, 4) relaciones humanas, 5) de-
182
pendencia, 6) experiencias internas, 7) salud mental, 8) salud fsica, 9) recreacin,

10) trabajo, 11) religin, (Skantze y col,
1992). Con las calificaciones de estas reas
se obtiene un ndice total de la calidad de
vida. La confiabilidad prueba-reprueba de
la puntuacin total fue de 0.88.
Esta lista identifica algunas reas especficas
de intervencin terapetica.
La evaluacin la puede hacer el paciente o
un observador. En cualquier caso, la evaluacin reflejar la percepcin del evaluador. Se debe observar si hay discrepancia
entre los estndares del paciente y las de la
comunidad. Si son los mismos, la evaluacin (satisfactoria-insatisfactoria) se hace
por consenso. Si el paciente quiere algo que
est por abajo o por arriba de los estndares
ya sea algo realista, ilusorio o francamente
psictico- se anota en la parte abierta de la
lista. Por ejemplo, si un paciente que trabaja en una fbrica no est satisfecho porque
quiere ser fotgrafo, el empleo se califica
como satisfactorio, y en la parte abierta se
anota su deseo de ser fotgrafo y se califica
como insatisfactorio.
Las percepciones del paciente siempre se
anotan en relacin a estndares locales, y el
clnico decidir si ayuda al enfermo a obtener lo que quiere o lo ayuda a que sus aspiraciones sean ms realistas. Sin embargo,
consideramos que calificar de acuerdo con
los estndares de la comunidad, probablemente desvirte la esencia de la calidad de
vida, si partimos del hecho de que debera
ser una evaluacin subjetiva.
La lista puede emplearse como gua para el
tratamiento o para medir el resultado de
una intervencin.
Si se emplea como gua para el tratamiento,
la confiabilidad no ser ningn problema. El
objetivo es identificar las necesidades individuales y las metas, y proponer las intervenciones adecuadas para obtenerlas. Algunas
reas se vuelven insatisfactorias conforme au-
Calidad de vida
mentan las oportunidades y la asertividad.

Estos cambios se discuten y se evalan con el
enfermo. As, cuando un apartado se califica
como insatisfactorio, se le ponen nuevas metas al tratamiento. Excepto en el caso de las
distorsiones psicticas, la satisfaccin generalmente corresponde a la mejora clnica.
Si la lista se emplea para evaluar los resultados, los criterios deben definirse operacionalmente. Los estndares locales tambin
deben definirse.
Es comprensible que los investigadores se
preocupen por la validez y la confiabilidad
de los instrumentos. Pero esto no basta. Los
instrumentos deben medir las variables que
tengan algn significado para el paciente y
para la sociedad.
Skantze y col (1992) evaluaron la relacin
que tiene la calidad de vida con los estndares de vida de un grupo de enfermos esquizofrnicos. La calidad de vida, como ya se
mencion es una evaluacin subjetiva, en
tanto que el estndar de vida es objetivo. El
estndar de vida incluye la evaluacin objetiva de las habilidades del paciente para
cumplir las actividades de la vida diaria y
aceptar su dependencia de los dems para
vivir en la comunidad. No hubo ninguna
relacin entre el estndar de vida y la calidad
de la misma, lo que sugiere que estos dos aspectos son independientes en este grupo de
enfermos. Algunas variables demogrficas se
relacionaron con la calidad de vida: a medida que aumentaba la edad, los pacientes dijeron tener menor calidad de vida; los de
mayor nivel acadmico dijeron tener menor
calidad de vida y los que tenan empleo dijeron tener una mejor calidad de vida. El estndar de vida de estos pacientes era similar
al de la poblacin general de Suecia
1) situacin en la vida, 2) familia, 3) relaciones sociales, 4) actividades recreativas,

5) trabajo, 6) finanzas, 7) seguridad personal, y 8) salud.
Con este instrumento Lehman intent determinar cules son los factores que ms se
relacionan con la sensacin global de bienestar (calidad de vida).
La entrevista evala tres aspectos: indicadores
objetivos de calidad de vida, indicadores subjetivos y la percepcin global de bienestar.
Los indicadores objetivos de la calidad de
vida se desarrollaron a partir de varias mediciones de recursos y funciones. La validez de
construccin de estas escalas se confirm con
un anlisis factorial de componente principal
y se conservaron las escalas con consistencia
interna de alpha de Cronbach mayor a 0.5.
Los indicadores subjetivos se califican en
una escala de 7 categoras, de muy mal a
muy placentero o satisfactorio. La consistencia interna de estas escalas fue de 0.67 a
0.87 y un anlisis factorial confirm la validez de construccin de las mismas.
Para la medicin global del bienestar se
emplean tres escalas por separado:
1. Una escala de espantosa a excelente
para responder a la pregunta Cmo percibe su vida, en general? Esta pregunta se hace al principio y al final de la entrevista.
2. Una escala de bienestar formada por
reactivos como: Durante el mes pasado,
qu tanto sinti que el futuro pareca esperanzador y promisorio?
ENTREVISTA PARA EVALUAR

LA CALIDAD DE VIDA
ANTHONY F. LEHMAN (1982, 1983)
3. Escalas de diferencial semntico para el

reactivo Creo que mi vida es, (aburrida-interesante, miserable-disfrutable,
no vale la pena-vale la pena). La confiabilidad de estas escalas fue de 0.74 a 0.87.
Lehman desarroll la Entrevista para Evaluar

la Calidad de Vida, que abarca ocho reas:
La evaluacin simultnea de las condiciones

de vida (indicadores objetivos) y de los ni-
183
veles de satisfaccin (indicadores subjetivos)

permiten determinar la relacin que hay
entre ambas.
La caracterstica de los hogares que ms se
correlacion con la satisfaccin fue la privacidad: los que tenan una habitacin
propia o un lugar privado fueron los que
se sintieron ms satisfechos con las condiciones de vivienda.
La satisfaccin con las relaciones sociales se
correlacion con la frecuencia de contactos
en los lugares en los que residen, pero no
con la frecuencia de contactos fuera del rea
de su residencia; esto apoya el punto de vista de que las relaciones adentro y afuera de
la casa son dimensiones distintas. Los resultados de este estudio indican que deben
mejorarse las relaciones adentro de la casa.
La existencia de un amigo ntimo, sobre todo si reside en la misma casa fue la caracterstica de las relaciones sociales que ms se
correlacion con la satisfaccin.
En el rea laboral, las correlaciones entre
los indicadores objetivos y subjetivos fueron elevadas. Entre los que trabajaban,
trabajar ms y ganar ms se asoci con
una mayor satisfaccin; esto indica el elemento de recompensa financiera e intrnseca del trabajo.
Varios indicadores objetivos de salud durante el ao anterior se correlacionaron con
estar satisfechos con su salud. Los pacientes
que estuvieron ms enfermos y utilizaron
ms los servicios de salud estuvieron menos
satisfechos con su salud. Los que percibieron mejor acceso a los servicios de salud
estuvieron ms satisfechos. Casi todos los
pacientes percibieron que era fcil acceder
a los servicios mdicos, lo que indica que es
ms fcil acceder a los servicios mdicos
que a los servicios legales.
Al comparar las condiciones objetivas de
vida con la satisfaccin con stas, no se
observ desacuerdo en ninguna de las
reas evaluadas.
184
Se encontraron correlaciones significativas

entre la mayora de los indicadores objetivos y subjetivos, pero no en todos. Por
ejemplo, la autonoma, que se refiere a
poder tomar algunas decisiones, como las
relacionadas con los alimentos que prefieren, no se correlacion con la satisfaccin,
como si para los enfermos no fuera muy
importante tomar las decisiones diarias. Los
programas que promueven una mayor autonoma entre estos pacientes, tendran que
vencer primero su falta de motivacin.
Tampoco se correlacionaron los indicadores
objetivos y subjetivos relacionados con las
actividades recreativas. Los pacientes que
tuvieron ms actividades recreativas no estuvieron ms satisfechos. Esto indica que el
aumentar el nmero de estas actividades no
es suficiente para que los pacientes experimenten mayor satisfaccin.
El hecho de que las correlaciones entre los
indicadores objetivos y subjetivos hayan seguido la direccin esperada apoya la validez
de construccin de estas evaluaciones, que
miden cosas similares. Sin embargo, el hecho de que las correlaciones sean relativamente bajas, muestra que los indicadores
objetivos y subjetivos corresponden a aspectos diferentes de la calidad de vida.
En cuanto a indicadores objetivos, solo el
trabajo tuvo correlaciones superiores a 0.3
(esto solo se aplic a los que estaban empleados) con el bienestar global.
Los indicadores objetivos ms relacionados
con el bienestar global fueron: no haber sido
asaltadas, haber usado menos los servicios de
atencin a la salud, haber tenido contactos
sociales ms frecuentes y ms ntimos, estar
empleado y tener privacidad en el hogar.
Los indicadores subjetivos (satisfaccin
con las reas de la vida) estuvieron ms
correlacionados con el bienestar subjetivo.
Las correlaciones ms altas fueron en las
reas de salud, en las actividades recreativas y en las relaciones sociales.
Calidad de vida
En conclusin, los indicadores subjetivos

de la calidad de vida en reas especficas de
la vida fueron mejores predictores del bienestar global que los indicadores objetivos.
Tres indicadores objetivos de calidad de vida y cuatro indicadores subjetivos fueron
los que ms se relacionaron con el bienestar
global de los enfermos:
1. Haber sido asaltado el ao anterior
2. Haber acudido a los servicios mdicos
durante el ao anterior
3. La frecuencia de contactos sociales ntimos
4. La satisfaccin con su salud
5. La satisfaccin con el tiempo dedicado a la recreacin
6. La satisfaccin con sus relaciones sociales y
7. La satisfaccin con sus condiciones financieras
Ms que intentar determinar cules indicadores (objetivos o subjetivos) tienen mayor
validez, lo que importa es reconocer que estos dos tipos de indicadores miden aspectos
diferentes y complementarios de la experiencia del paciente.
Los indicadores objetivos suelen ser ms
atractivos porque son tangibles y reflejan
normas aceptadas de funcionamiento y
estilo de vida, y se refieren a condiciones
ambientales y conductas que pueden manejarse en los programas de atencin a estos
pacientes. Su principal desventaja es que dicen poco acerca de cmo sienten los pacientes que es su vida, por lo que se omite su
participacin (o sus preferencias) en la planeacin y evaluacin de programas para
ellos. A la inversa, los indicadores subjetivos, aunque nos dicen directamente en qu
reas se encuentran satisfechos los enfermos, poco dicen acerca de las condiciones
objetivas que podran mejorarse. Por lo
tanto, es necesario emplear ambos tipos de
indicadores siempre que sea posible.
Las evaluaciones subjetivas de la calidad de
vida, por otro lado, presentan problemas de
validez que deben ser tomados en cuenta.

Requieren una autoevaluacin relativamente estable de las condiciones de vida
que est influida por las expectativas, las experiencias anteriores y la percepcin de las
condiciones actuales. Para que sean vlidas,
es necesario que estas mediciones no cambien dramticamente en poco tiempo, excepto cuando ocurran cambios en las
condiciones de vida. Se ha establecido la
validez de construccin de las mediciones
globales empleadas en este estudio, sin embargo, es necesario determinar su estabilidad en el tiempo y su sensibilidad al
cambiar las condiciones objetivas de vida.
Tambin es necesario determinar el impacto
que tiene la psicopatologa en los indicadores subjetivos de calidad de vida, particularmente si se van a emplear en personas con
trastornos psiquitricos conocidos.
El impacto o carga (burden)

producida por la enfermedad
se calcula sumando la muerte
prematura y los aos vividos
con discapacidad (disability)
por lo que es necesario medir
la discapacidad
LA ESCALA DE CALIDAD DE VIDA

Evaluacin del sndrome de dficit
esquizofrnico Douglas W.Heinrichs
et al. 1984
En el caso de los esquizofrnicos hay una
continuidad en las deficiencias premrbidas, mrbidas iniciales y dficits funcionales postpsicticos. Este deterioro en el
funcionamiento se llama sintomatologa de
dficit. Aunque menos dramticos y ms
difciles de describir con precisin, los sntomas de dficit son a menudo los que ms
duran y los que ms incapacitan a los enfermos. Desafortunadamente, estos sntomas
de dficit han sido los ms resistentes a los
tratamientos convencionales.
De acuerdo con Heinrichs, los instrumentos para evaluar los sntomas negativos no
son adecuados para evaluar el estado de
dficit, porque, aunque se traslapan, no
son idnticos.
La escala de calidad de vida desarrollada por
este autor consta de 21 reactivos sobre los
sntomas y el funcionamiento durante las 4
185
semanas anteriores. Debe ser administrada

por un clnico entrenado y requiere aproximadamente de 45 minutos para ser contestada. Cada reactivo se califica con una escala
de 7 categoras y requiere del juicio del clnico para ser contestado. Cada reactivo se
compone de tres partes: 1) la descripcin de
lo que se va a evaluar (por ejemplo, las relaciones ntimas: este reactivo evala las relaciones cercanas con personas con las que se
interacta, que no sean la familia inmediata;
excluye a los trabajadores de salud mental),
2) algunas preguntas para evaluar este tema
(por ejemplo: Tiene amigos muy cercanos?
Habla de cosas personales con ellos?) y 3) la
escala de evaluacin: 0, virtualmente ausente a 6, involucramiento adecuado, y relaciones cercanas con ms de una persona.
Esta escala est diseada para evaluar los aspectos ms insidiosos de la esquizofrenia. Se
refiere, principalmente, a los sujetos que viven fuera de las instituciones, aunque puede
adaptarse a los sujetos institucionalizados.
Es apropiada para el enfoque fenomenolgico de los autores, en el que la nica fuente de informacin adecuada es el paciente.
Los reactivos se integran en 4 subescalas:
1. Estructura intrapsquica.
Evala la conacin, cognicin y afectividad

que frecuentemente estn alteradas en el sndrome de dficit del esquizofrnico. Evala
los propsitos, la motivacin, la curiosidad,
la empata, la capacidad para experimentar
placer y la interaccin emocional. Estas capacidades son la base para que se puedan
construir las relaciones interpersonales y el
rol de funcionamiento (instrumental). Las
deficiencias en esta rea provocan deficiencias en las otras.
2. Relaciones interpersonales
Evala la experiencia interpersonal y social.

Muchos de los reactivos van ms all de la
cantidad o frecuencia de los contactos so-
186
ciales; implica la evaluacin de la capacidad

para manejarse en la intimidad, contra la
participacin pasiva; la evitacin contra el
retraimiento (este es un juicio evaluativo).
3. Desempeo del rol
Evala su papel como trabajador, estudiante, ama de casa/padre. Adems de evaluar

el nivel de funcionamiento, se evala el nivel de logro, el grado del subempleo por las
caractersticas y oportunidades del paciente,
y su satisfaccin derivada de esto.
4. Posesiones y actividades
Una participacin adecuada en la comunidad se refleja en la posesin de algunos objetos y en comprometerse a llevar a cabo
algunas actividades regulares.
Es evidente que las alteraciones en las relaciones interpersonales y en el papel desempeado por el enfermo pueden tener otras
causas diferentes al sndrome deficitario del
esquizofrnico, y el evaluador debe tener esto en cuenta. Por ejemplo, la disminucin
de la actividad social como resultado de una
lesin fsica no debe atribuirse al sndrome
deficitario del esquizofrnico.
Los autores proponen esta escala como una
medida de desenlace o resultado y como
una medicin de cambio, en la evaluacin
de las intervenciones y en la descripcin del
curso de la enfermedad.
Estandarizando los juicios clnicos importantes que a menudo se dejan de lado en el
cuidado y estudio de los esquizofrnicos, el
empleo de escalas de calidad de vida mejora el entrenamiento y enriquece los datos de
las investigaciones clnicas
Las caractersticas psicomtricas-clinimtricas de esta escala son adecuadas. Se ha visto
que se correlaciona con la escala de Lehamn.
La confiabilidad interobservador de las subescalas es la siguiente: estructura intraps-
Calidad de vida
quica 0.84, relaciones interpersonales 0.87,

papel instrumental 0.94, posesiones y actividades 0.94, total .88 (Heinrichs, 1984).
Otros autores han descrito indicadores de
confiabilidad interobservador muy similares. Browne y col. (1996) encontraron
coeficientes de correlacin intraclase tanto para el total como para las subescalas de
0.92 a 0.98.
CALIDAD DE VIDA
DE LOS USUARIOS
DE LOS PROGRAMAS DE SALUD
MENTAL BIGELOW, 1991
Este instrumento se dise especficamente para evaluar los resultados de los
programas de salud mental. Consta de
263 reactivos que evalan 14 componentes de la calidad de vida.
1. Malestar psicolgico: incluye ansiedad, depresin, hostilidad y trastornos
somticos.
2. Bienestar psicolgico: incluye placer,
optimismo, tranquilidad y alegra
3. Tolerancia al estrs: habilidad para tolerar y luchar contra el estrs
4. Satisfaccin de las necesidades bsicas:
alojamiento, comida, ingresos econmicos, transporte y atencin mdica.
5. Independencia: vivir en la comunidad, tomar sus propias decisiones cada
da, contender con las contradicciones
diarias (incertidumbre), con el estrs y
las presiones.
6. Interacciones interpersonales: evala la
satisfaccin con la necesidad de afiliacin. La aceptacin y el apoyo de la comunidad dependen de que se lleven
bien con los conocidos, los amigos y los
familiares.
7. Papel como pareja (esposo): es la oportunidad para lograr la afiliacin, la estimacin y la satisfaccin de otras
necesidades.
8. Apoyo social: consiste en tener con
quien compartir los buenos momentos
y en quin apoyarse en los momentos
de dificultad. Las relaciones interpersonales requieren de un desempeo adecuado para recibir recompensas, ser
atractivo, tener intereses recprocos, etc.
9. Trabajo en casa: ir de compras, mantener la casa, preparar las comidas
10. Capacidad laboral: las habilidades requeridas para conseguir y mantener
un trabajo.
11. Trabajo: calidad del trabajo, motivacin, cooperacin con los compaeros
de trabajo, capacidad para aceptar la
supervisin.
12. Uso recreativo del tiempo libre: actividades creativas o de automejoramiento,
actividades que beneficien a otros, actividades que satisfagan las necesidades
personales.
13. Consecuencias negativas del uso de alcohol y 14. Consecuencias negativas del
uso de drogas: los problemas del estado
de nimo, de salud, de capacidad para
controlar la conducta y la capacidad para desempear el rol social relacionadas
con el uso de alcohol o drogas.
La consistencia de estas escalas fluctu entre 0.054 para las interacciones interpersonales y 0.977 para las consecuencias
negativas del uso del acohol.
La Organizacin Mundial
de la Salud ha desarrollado
instrumentos genricos que
se emplean para la evaluacin
de personas en cualquier
condicin de salud. Los
WHOQL 100 y WHOQL
breve, que permiten
evaluaciones internacionales
de la calidad de vida.
CUESTIONARIOS DE CALIDAD
DE VIDA DE LA ORGANIZACIN
MUNDIAL DE LA SALUD
En 1991 la Organizacin Mundial de la
Salud inici el proyecto para desarrollar
un instrumento de calidad de vida. El
grupo WHOQoL (World Health Organization Quality of Life) en colaboracin
con 15 centros alrededor del mundo desarrollaron en 1993 dos instrumentos para
medir la calidad de vida: WHOQL 100
(Cuadro 5) y WHOQL breve, para lograr
una evaluacin internacional de la calidad
de vida, para investigar y comparar la calidad de vida en diferentes culturas, que
fuera aplicable en diferentes enfermedades, en diversos estratos socioeconmicos,
y en todos los grupos de edad.
187
Cuadro 5. Subescalas del WHOQOL 100

Salud fsica
Energa y fatiga
Dolor y molestia
Sueo y descanso
Psicolgica
Imagen y apariencia
Sentimientos negativos
Sentimientos positivos
Autoestima
Pensamiento, aprendizaje, memoria y concentracin.
Nivel de independencia
Movilidad
Actividades de la vida diaria
Dependencia a medicamentos y ayuda mdica
Capacidad para el trabajo
Relaciones sociales
Relaciones personales
Apoyo social
Actividad sexual
Medio Ambiente
Origen del financiamiento

Libertad, seguridad fsica, social, cuidados de salud, accesibilidad y calidad
Hogar
Oportunidad para adquirir nueva informacin y habilidades
Recreacin, clima
Transporte
Creencias personales,
espirituales, religiosas
Para medir el estado de salud,

se ha empleado la forma breve
(SF-36) del instrumento del
Estudio de Resultados Mdicos
(Medical Outcome Study).
Estos instrumentos pueden ser usados en

una gran variedad de culturas, en la comunidad o con enfermos. Son sensibles a programa de intervencin, y a cambios en el
tiempo relacionados con circunstancias especficas de la vida (Bonomi 2000)
Se desarrollaron en varias etapas. Se seleccionaron 100 reactivos, que se agruparon
en 24 factores relacionados con la calidad
de vida que a su vez se incluyeron en 6 subescalas. El WHOQL breve est formado
por 4 subescalas (Harper 1996).
La validez y la confiabilidad de estos instrumentos se han probado en diferentes centros.
Puede ser utilizado en la prctica mdica, en
la investigacin y en las polticas de salud. Se
encuentra traducido a 20 idiomas.
En los estudios de validez y consistencia en
los Estados Unidos se obtuvo una consistencia interna de 0.82-0.95 y una reproducibilidad de 0.83 a 0.96. La validez de
constructo fue demostrada por su correla-
188
cin con el SF 36 y el SQLP (Francia) siendo de moderada a alta.(Bonomi 2000).

La validacin que se realiz en Gran Bretaa demostr una consistencia interna
elevada. Se explor si las caractersticas sociodemogrficas afectaban la forma de
respuesta al instrumento. En la dimensin
psicolgica se observ que los hombres reportaban mejor calidad de vida, los ancianos reportaron mejor estado psicolgico,
social, en el medio ambiente y en la salud
relacionada con la calidad de vida que en
los individuos jvenes. Los jvenes son
ms independientes que los ancianos. Se
concluy que la edad se relaciona con diversos aspectos de la calidad de vida ( Skevington 1999).
Puede medir los cambios en la calidad de
vida sobre el curso de un tratamiento. Utiliza cinco puntos en escalas tipo Likert para
todos los reactivos del instrumento, es autoaplicable con una duracin aproximada
de quince minutos. (Harper 1996).
Calidad de vida
Cuadro 6. Subescalas del WHOQOL breve

Dimensiones
reas dentro de las dimensiones
1. Salud Fsica
Actividades de la vida diaria

Dependencia a medicamentos o sustancias
Energa y fatiga
Movilidad
Dolor y descontento
Sueo y descanso
Capacidad para el trabajo
2. Psicolgica
Imagen corporal y apariencia

Sentimientos negativos
Sentimientos positivos
Autoestima
Espiritualidad, religin, creencias
Pensamientos, aprendizaje, memoria y concentracin
3. Relaciones Sociales
Relaciones personales
Apoyo social
Actividad sexual
4. Medioambiente
Fuente financiera
Libertad, seguridad
Accesibilidad y calidad de los servicios sociales y de salud
Ambiente del hogar
Oportunidades para adquirir nueva informacin
Actividades de recreacin
Medioambiente fsico
Transporte
El WHOQL 100 es muy largo para el uso

prctico, por lo que se desarroll una versin breve (Cuadro 6), con un total de 26
variables. Se incluy una pregunta de cada
una de las 24 reas del WHOQL 100 mas
dos que evalan globalmente la calidad de
vida y la percepcin de la salud.
EL WHOQL breve ha sido traducido a 19
idiomas, puede ser autoadministrado o administrado por un entrevistador. Presenta 4
dimensiones, se excluyen el nivel de independencia y las creencias.
Puede evaluar cambios en la calidad de vida

en el curso de tratamientos.
En la versin breve, las puntuaciones multiplicadas por cuatro para que resulten
comparables a las del WHOQOL 100.
Las puntuaciones elevadas indican una elevada calidad de vida.
ENCUESTA DEL ESTADO
DE SALUD SF-36
Tiene una correlacin de 0.9 con el

WHOQL 100. Tiene validez de criterio y
discriminante as como consistencia en la
prueba contra-prueba (Harper 1998).
Probablemente el instrumento mas empleado para medir el estado de salud sea la

forma breve (SF-36, Short Form) del instrumento del Estudio de Resultados Mdicos (Medical Outcome Study).
Puede utilizarse cuando una evaluacin breve de la calidad de vida es apropiada, como
en la clnica, estudios epidemiolgicos y ensayos clnicos.
Este instrumento fue construido para la

investigacin del estado de salud en el Estudio de Resultados Mdicos (Medical Outcome Study) en donde se demostr su
189
validez y confiabilidad. Fue diseada para el

uso en la prctica clnica, en investigacin,
evaluaciones de polticas de salud e investigaciones en la poblacin general.
6.
7.
8.
9.
Existen 6 versiones en castellano desarrolladas para Mxico, Argentina, Colombia, Espaa, Honduras y la poblacin Mxico
Americana de EUA.
1. Funcionamiento Fsico: Incluye esfuerzos

para levantar, traer comestibles de la tienda,
subir escaleras, ponerse de rodillas, caminar
moderadas distancias, se puede estimar la
severidad de cualquier limitacin. Detecta
la presencia y extensin de las limitaciones
fsicas.
Este instrumento ha sido ampliamente evaluado tanto psicomtrica como clnicamente.

En cuanto a su validez, distingue entre pacientes con y sin condiciones crnicas, discrimina a grupos con diferentes condiciones
mdicas y psiquitricas, detecta niveles de
gravedad en los diagnsticos mdicos y refleja cambios asociados con cambios en la severidad de la enfermedad. (Sullivan 1995)
Esta escala es autoadministrada, puede ser
administrada por telfono o tambin administrada por un entrevistador. Se aplica a
personas de 14 aos y ms. Ha sido utilizada en estudios de ancianos, con escasos recursos, escolaridad baja, enfermos crnicos
con resultados confiables (Ware 1992).
En Mxico se utiliza la versin 1.1 la cual sigui un procedimiento estandarizado de
traduccin y retraduccin por expertos as
como anlisis de grupos representativos.
(Ziga 1999)
Contiene 36 preguntas con un tiempo
promedio de aplicacin de 8 a 12 minutos. Las respuestas a cada pregunta se codifican y se recodifican y los resultados se
presentan en una escala de 0 para peor salud y de 100 para mejor salud.
190
Funcionamiento social
Rol emocional
Salud mental
Transicin de salud
2
3
5
1
2. Rol Fsico: se refiere a las limitaciones de

salud relacionadas con el trabajo, es ms
aplicable para individuos retirados y distingue de las limitaciones entre la salud fsica y mental.
3. Dolor: se refiere a la frecuencia del dolor y
malestar por el mismo, as como la extensin
e interferencia con las actividades normales.
4. Percepcin de Salud en General: utiliza
un reactivo para interrogar sobre si la salud se percibe como excelente o pobre, y
4 del cuestionario de percepciones de salud. Detecta cambios en la percepcin de
salud actual y en la del ao anterior (Ware 1992).
5. Vitalidad: mide el nivel de energa y fatiga, fue adicionado para capturar mejor las
diferencias en el bienestar subjetivo.
6. Funcionamiento Social: evala los efectos
de la salud relacionada con las actividades
sociales, la escala evala el impacto de la salud fsica o problemas emocionales en la actividad social.
Consta de las siguientes dimensiones de

salud:
7. Rol emocional : problemas con el trabajo

o con otras actividades diarias como resultado de problemas emocionales
1.
2.
3.
4.
5.
8. Salud mental: fue construida con preguntas sobre las principales reas de salud mental como son: ansiedad, depresin, prdida
de la conducta o control emocional y bienestar psicolgico.
Funcionamiento fsico
Rol fsico
Dolor
Salud general
Vitalidad
10
4
2
5
4
Calidad de vida
9. Transicin de salud: describe la transicin

de la percepcin respecto al mejoramiento
o empeoramiento del estado de salud. (Ziga 1999).
En Mxico se ha demostrado su consistencia y validez,no se encontr evidencia para
modificar los algoritmos, (Ziga 1999).
EVALUACIN
DE LA DISCAPACIDAD
La revisin de los instrumentos mencionados, tanto de calidad de vida como de
estado de salud, indica que el denominador comn a todos ellos es que evalan, el
funcionamiento de los sujetos en tres
grandes reas: el funcionamiento fsico,
psicolgico y social.
Las deficiencias en el funcionamiento es lo
que se considera discapacidad.
La evaluacin de la discapacidad durante
mucho tiempo se limit a los enfermos con
restricciones fsicas. Sin embargo, actualmente se reconoce que otras condiciones
producen aun ms discapacidad.
En 1990 la Depresin Mayor Unipolar
ocup el 4o. lugar en impacto de la enfermedad y para 2020 ocupar el segundo lugar, despus de la enfermedad
coronaria isqumica.
El impacto o carga (burden) producida
por la enfermedad se calcula sumando la
muerte prematura y los aos vividos con
discapacidad (disability).
Esto plantea la necesidad de medir la discapacidad.
En los ltimos aos han proliferado los
instrumentos para la medicin de discapacidad, algunos para la evaluacin de
condiciones especficas y otros han sido
desarrollados para ser empleados en diferentes condiciones, cada uno enfatizando
diferentes aspectos de la discapacidad.
Algunos de estos instrumentos son: el Perfil

de Moskowitz y McCann, el de Barthel, de
Katz, de autocuidado de Kenny, de Estado
Funcional de Forer, el de Impacto de la Enfermedad, el de Discapacidad de Londres,
el Perfil de Salud de Duke, el de Nottingham el de Dartmouth y probablemente los
mas empleados, los del consorcio del Proyecto Internacional para la Evaluacin de la
Calidad de Vida, SF-36, SF-20, SF-12.
Las alteraciones en el funcionamiento se
evalan en tres niveles: 1) deterioro (impairment) o reduccin en las capacidades fsicas o mentales, 2) cuando los efectos del
deterioro no se corrigen, se produce la discapacidad, y 3) la restriccin de una persona para realizar una funcin de manera
considerada normal. La discapacidad puede
o no limitar la capacidad del individuo para desarrollar normalmente su funcin social, dependiendo de la severidad de la
discapacidad y de lo que la persona desea
hacer. El tercer aspecto se refiere a lo que sola llamarse handicap, traducida como
minusvala y que alude a una desventaja social derivada de una discapacidad.
En 1990 la Depresin Mayor

Unipolar ocup el 4o. lugar
en impacto de la enfermedad
y para 2020 ocupar
el 2o. lugar, despus de la
enfermedad coronaria
isqumica.
La Clasificacin Internacional del Funcionamiento, la Discapacidad y la Salud

(CIF) es la revisin de la Clasificacin Internacional del Deterioro, Discapacidad y
Minusvala (International Classification
of Impairments, Disabilities, and Handicaps) publicada por la Organizacin
Mundial de la Salud en 1980. Fue concebida como una herramienta de comunicacin entre diferentes disciplinas y es til
para valorar la situacin clnica. Proporciona descripciones funcionales y datos
cuantificables.
Se basa en el concepto de que enfermedad
y discapacidad son constructos diferentes,
que pueden ser medidos independientemente. El nivel de discapacidad no debe
ser visto automticamente como un indicador de la severidad de la enfermedad. Se
puede tener una enfermedad con diferentes grados de severidad (diabetes, depre-
191
El Cuestionario para la
Evaluacin de Discapacidades
de la Organizacin Mundial
de la Salud (WHO-DAS)
valora el nivel y la evolucin
de la discapacidad.
sin, etc.) y las discapacidades no estar relacionadas a la severidad.
3. Capacidad para moverse en su alrededor

o entorno
Es importante sealar que aunque hay

compatibilidad conceptual entre calidad
de vida y discapacidad, la calidad de
vida alude a lo que la gente siente acerca
de su enfermedad o las consecuencias de
la misma, es una concepcin del sentirse
bien subjetivamente. Por otro lado, los
conceptos de enfermedad/discapacidad se
refieren a signos objetivos y exteriorizados
en el sujeto.
4. Cuidado personal: evala la dificultad en

su cuidado personal.
La Organizacin Mundial de la Salud tambin ha trabajado en el desarrollo del Instrumento de Evaluacin de Discapacidades
(WHO-DAS por sus siglas en ingls) por
medio del cual se evalan las consecuencias
de la enfermedad de manera estructurada y
de acuerdo a la CIF.
7. Actividades escolares o de trabajo: evala la

dificultad que hay en relacin a actividades
escolares o de trabajo.
Actualmente se cuenta con una versin en

espaol en proceso de validacin.
5. Relacin con otras personas: evala la dificultad para relacionarse con los dems
6. Actividades de la vida diaria: evala la dificultad para realizar los quehaceres de la casa, y cuidar de las personas que conviven
con el paciente o que le son cercanas.
8. Participacin en la sociedad: evala la dificultad relacionada a su participacin en

la sociedad y el impacto que el problema
de salud ha tenido sobre el paciente y su
familia.
Escala de funcionamiento psicosocial
Cuestionario del funcionamiento

y la discapacidad (WHODAS)
El Cuestionario para la Evaluacin de
Discapacidades de la Organizacin Mundial de la Salud (WHODAS) (por sus siglas en ingls, World Health Organization
Disability Assessment Scale) evala el nivel de deterioro y la evolucin del deterioro a discapacidad, dependiendo de si la
severidad limita o no la capacidad del individuo de desarrollar su funcin social.
Est constituida por 8 reas que son evaluadas por un entrevistador:
1. Total: evala la salud fsica (enfermedad
o lesin), la salud mental (desde estrs causado por problemas de la vida diaria hasta
formas especficas de trastornos mentales,
problemas relacionados con alcohol o drogas), y, la salud en general.
2. Comprensin y comunicacin: evala la dificultad en relacin a la comprensin y comunicacin del paciente con los dems.
192
Se realiza en forma de una entrevista semiestructurada. Est compuesta por 5 reas

de evaluacin:
1.
2.
3.
4.
5.
ocupacional,
social,
econmica,
sexual y
familiar.
Las preguntas incluidas en estas reas se

califican con una escala de cinco categoras: 1) muy satisfecho, 2) satisfecho, 3)
neutral o indiferente, 4) insatisfecho, 5)
muy insatisfecho. El perodo de evaluacin puede variar de acuerdo al tipo de estudio que se pretenda realizar. Se califica
cada rea y se obtiene un promedio global.
El promedio de 1, indica un adecuado
funcionamiento, mientras que el de 5
traduce un mayor deterioro del funcionamiento. La validacin de la escala, realizada por el mismo autor, report un alto
grado de confiabilidad y validez.
Apoyo social
l apoyo social se define en trminos

de la disponibilidad de personas en
las que el sujeto confa, en quienes
puede apoyarse y quienes hacen que se
sienta protegido y valorado como persona.
El concepto de apoyo social debe distinguirse de otro muy relacionado, la red social. Esta se refiere al papel que el sujeto
desempea en diferentes ambientes y a las
ligas del individuo con amigos, familiares o
conocidos. Se puede considerar que la red
social es la estructura a travs de la cual se
proporciona el apoyo social. Idealmente
uno pertenece a diversos grupos de apoyo
en el hogar, trabajo, iglesia y sitios de recreacin o distraccin. Cualquier individuo pertenece a diversas redes de apoyo
variando la intensidad del contacto.
Una de los primeros instrumentos para la
evaluacin del apoyo social fue el Indice
de Berle publicado en 1952. Por ms de
30 aos las nicas mediciones de apoyo
social fueron indirectas como el estado civil u otras variables sociodemogrficas.
El apoyo puede ser de varios tipos. Sherbourne y Stewart distinguen cinco categoras:
1. proporcionar apoyo emocional, amor
y empata
2. proporciona apoyo instrumental, tangible
3. proporcionar informacin, gua o retroalimentacin sobre la conducta
4. ofrecer apoyo para ayudar a la persona
a su propia autoevaluacin
5. proporcionar compaa en actividades
recreativas.
La medicin de la red social se basa en la
existencia y cantidad de relaciones sociales
(nmero de amigos y familiares) y en la
cercana de los miembros de la red.
La medicin del apoyo social incluye el aspecto funcional y cualitativo, ms que el

nmero de contactos sociales.
El apoyo social que se deriva de las redes
sociales, es importante para el bienestar de
los individuos, sobre todo en los momentos de estrs, transicin o crisis.
Actualmente se acepta que el apoyo social
tiene un efecto positivo en el estado de salud y sirve como un amortiguador o modificador de los efectos del estrs en la
salud mental y fsica del individuo, por lo
que el apoyo social tiene un efecto protector para numerosas enfermedades.
El apoyo social tiene un

efecto positivo en el estado
de salud y sirve como un
amortiguador o modificador
de los efectos del estrs
en la salud mental y fsica
del individuo.
Las variables que son tiles para explicar el

apoyo social son: la ocupacin, el salario, la
educacin y la residencia, las cuales reflejan
las oportunidades para pertenecer a grupos
de apoyo. Para medir la red de apoyo social
se puede utilizar la presencia de la familia,
amigos y miembros en varias organizaciones.
Tradicionalmente la familia era el mayor
apoyo, actualmente la reduccin de la fertilidad y las familias menos numerosas
han conducido a que se busque apoyo con
los amigos y vecinos.
La evaluacin del apoyo social es complejo debido a que se trata de un constructo
multidimensional y cada aspecto que lo
compone tendr efectos distintos sobre el
bienestar de los sujetos.
Existen tres formas para evaluar el apoyo
social:
1. La evaluacin de la integracin social,
que son el nmero de relaciones del
sujeto con otros individuos.
2. Anlisis de redes, se evala todo el
campo social del sujeto
193
3. Enfoque perceptual, es la evaluacin

subjetiva del apoyo percibido.
82% de la varianza de la disponibilidad y

el 72% de la puntuacin de satisfaccin.
La eleccin del tipo de evaluacin depender de los objetivos de la investigacin,

para obtener un conocimiento global se
investigar sobre las redes, si se investiga
sobre salud y bienestar, las medidas funcionales sern mejores.
La correlacin entre ambas calificaciones

ha sido de 0.21 a 0.34, lo que indica que
son dos variables independientes.
CUESTIONARIO
DE APOYO SOCIAL
La validez de los cuestionarios
de apoyo social se ha
determinado mediante la
correlacin de los mismos con
cuestionarios que evalan
constructos relacionados como
depresin, optimismo, soledad,
funcionamiento marital.
El Cuestionario de Apoyo Social de Sarason

(1983) cuantifica la disponibilidad (percepcin de que hay suficiente gente disponible
en caso de necesidad) y la satisfaccin con el
apoyo social del que se dispone.
Es un cuestionario autoaplicable de 27
preguntas con dos partes, en la primera se
pide al sujeto que enliste a las personas a
las que podra acudir en caso necesario
(disponibilidad) y en la segunda parte que
indique el grado de satisfaccin con el
apoyo disponible.
Para cada pregunta se lista un mximo de
9 personas y la satisfaccin se califica con
una escala de 6 categoras: muy satisfecho
a muy insatisfecho.
El apoyo total se obtiene promediando el nmero de personas disponibles en cada situacin y la satisfaccin con el apoyo es el
promedio de satisfaccin en las 27 preguntas.
El alfa de Cronbach (consistencia interna)
de la disponibilidad de apoyo es de 0.97 y
para la satisfaccin es de 0.94.
La consistencia prueba-contrapueba ha sido de 0.90 para la disponibilidad y de
0.83 para la satisfaccin, en pruebas aplicadas en un intervalo de 4 semanas.
La validez se ha determinado con diferentes aproximaciones. En anlisis factoriales
de las dos dimensiones por separado se
obtuvo un factor principal que explic el
194
Se han correlacionado ambas calificaciones

con variables relacionadas, lo que a juicio de
los autores apoyan la validez del instrumento. Por ejemplo, la satisfaccin ha correlacionado con medidas de depresin (-0.22 a
0.43) y con optimismo (0.57).
Sarason (1987) desarroll una versin abreviada con 6 preguntas. El alfa de Cronbach
ha sido de 0.90 y 0.93 y la correlacin con
la versin completa es de 0.95 y 0.96.
EL escrutinio de apoyo social del estudio
de resultados mdicos.
El Escrutinio de apoyo Social es un cuestionario autoadministrado que evala la
disponibilidad de apoyo social.
Est formado por 19 reactivos que cubren
5 dimensiones de apoyo:
1. Apoyo emocional
2. Apoyo informativo
3. Apoyo tangible
4. Interacciones sociales positivas
5. Afecto
Como las dos primeras dimensiones se califican juntas, se obtienen cuatro subescalas. El promedio de stas proporciona una
calificacin total de apoyo.
En este Escrutinio no se pregunta sobre
quin proporciona el apoyo sino con qu
frecuencia el apoyo est disponible.
La escala de respuestas est formada por
cinco categoras, desde nunca a todo el
tiempo.
El alfa de Cronbach (consistencia interna)
de la calificacin total es de 0.97 y de las su-
Apoyo social
bescalas es de 0.91 a 0.96. La confiabilidad

pureba-contraprueba fue de 0.78 para la calificacin total y de 0.72 a 0.76 para las subescalas en un intervalo de un ao.
Se han realizado estudios de validez de
constructo correlacionando el escrutinio
con variables relacionadas como la soledad (r= - 0.53 a 0.69), funcionamiento
marital (r=0.38 a 0.57) entre otras.
CUESTIONARIO DE APOYO
SOCIAL FUNCIONAL DUKE-UNC
Este Instrumento fue diseado por Broadhead de la Universidad Duke de Durham,
Carolina del Norte. Responde a las necesidades de evaluacin del apoyo social y toma en cuenta que ste tiene efecto positivo
directo en el estado de salud y sirve como
un amortiguador o modificador de los
efectos del estrs psicosocial y fsico en la
salud fsica y mental de los individuos.
(Broadhead 1988).
El Cuestionario Duke es autoadministrado,
las variables se responden con una escala Likert, con puntuaciones del 1 al 5. Es multidimensional e incluye mediciones cuantitativas
y funcionales, evala el apoyo percibido, es
breve y se administra en pocos minutos.
Aunque inicialmente inclua 14 variables, las que correspondan a la cantidad

de apoyo y al apoyo instrumental fueron
eliminadas por ser inconsistentes por lo
que actualmente este cuestionario est
formado por 8 variables agrupadas en
dos subescalas.
La escala de respuestas tiene 5 categoras
que van desde: tanto como me gustara
a mucho menos de lo que me gustara.
Sumando todos los reactivos se obtiene
un total, tambin pueden obtenerse calificaciones de las dos subescalas..
La escala fue validado en Espaa en 1991
por De la Revilla en la consulta de primer
nivel de atencin. Posteriormente Belln
Saameo, realiz un estudio de validez y
confiabilidad denominando al cuestionario Duke UNC-11.
La consistencia interna fue de 0.90.
La confiabilidad del cuestionario se determin mediante una prueba-contraprueba
con dos semanas de intervalo; los coeficientes de correlacin para cada uno de
los reactivos fue de 0.50 a 0.77.
Evala cuatro dimensiones de apoyo
Para la validez de constructo se contrastaron una serie de hiptesis avaladas en

la literatura: las personas mayores de 40
aos tienen un menor apoyo social, los
viudos, separados y divorciados presentan un grado menor de apoyo social que
los casados, el que vive solo percibe un
peor apoyo social. Hiptesis que fueron
confirmadas en el estudio.
1. Cantidad de apoyo
2. Apoyo confidencial (indica una relacin de confianza)
3. Apoyo afectivo (demostraciones de
amor, cario y empata)
4. Apoyo instrumental
Adems de ser adecuado desde el punto de

vista clinimtrico, este Cuestionario tiene la
ventaja de ser el ms breve de los cuestionarios de apoyo social. Esta caracterstica lo
hace adecuado para ser empleado rutinaria
mente en la prctica clnica.
Es un cuestionario diseado para el uso en

estudios de la poblacin de atencin primaria, y permite estudiar los efectos del
apoyo social en la salud y la interaccin
del apoyo social con otros determinantes
de salud. (Broadhead 1988)
El instrumento ms empleado
es el Cuestionario Duke, que
adems de ser adecuado desde
el punto de vista clinimtrico,
tiene la ventaja de ser el ms
breve de los cuestionarios de
apoyo social, por lo que puede
ser empleado rutinariamente
en la prctica cllnica.
195
Evaluacin en Geriatra
Anciano, de acuerdo al Diccionario de

la Real Academia de la Lengua Espaola
es un adjetivo que se aplica a las personas
de mucha edad. Evidentemente, la mucha edad puede ser definida de diferentes
formas. En este captulo se incluirn los
instrumentos que se han empleado en trabajos realizados con personas de por lo
menos 60 aos, que convencionalmente
se acepta para identificar a los ancianos.
Se debe tomar en cuenta que adems de
cualquier condicin que puede estar presente en las personas de cualquier edad,
con mayor frecuencia, los ancianos pueden
presentar disminuciones de la agudeza visual o auditiva, incontinencia, etc condiciones que tambin debern ser evaluadas.
Bsicamente las mediciones que se requieren en el rea de la salud mental en el anciano son: el funcionamiento cognitivo;
afecto: ansiedad y depresin; funcionamiento fsico; satisfaccin con la vida, (calidad de vida) y apoyo social.
Son muchos los instrumentos diseados
para la evaluacin de ancianos. La decisin
del instrumento a emplear deber seguir
los criterios de sensatez ya mencionados.
En el caso de los ancianos, la primera pregunta que deber responderse es, En qu
escenario se va a aplicar el instrumento?
Son ancianos institucionalizados o que viven en la comunidad?
Batera recomendada:
- Indice de Barthel: funcionamiento: no
en comunidad sino en instituciones
- Evaluacin mental abreviada (Hodkinson); hay otras mas breves
- Escala Geritrica de Depresin (Yesavage)
- Escala Moral del Centro Geritrico de
Filadelfia: satisfaccin con la vida y aspectos morales
EVALUACIN DEL REA

COGNITIVA
Cualquier estudio en el que estn incluidos ancianos, deber incluir una medicin del estado cognitivo.
Los instrumentos mas empleados son el
Examen Mental Breve (Mini-Mental State
Examination) desarrollado por Folstein y
col. (1975) y el Examen Mental Abreviado
(Abbreviated Mental Test Score) desarrollado por Hodkinson (1972) a partir del instrumento empleado por Blessed (19689.
Para el diagnstico de demencia en estudios
epidemiolgicos en comunidad y para la
evaluacin del efecto de una intervencin es
el Estado Mental Geritrico (Geriatric
Mental State) de Copeland y cols. (1976).
En el anciano debe
medirse el funcionamiento
cognitivo, el estado afectivo,
el funcionamiento fsico;
la satisfaccin con la vida,
(calidad de vida)
y el apoyo social.
EXAMEN MENTAL BREVE

Probablemente es el instrumento mas empleado para evaluar el rea cognitiva. Su
uso no se restringe a los ancianos; sin embargo, lo hemos incluido en esta seccin ya
que en cualquier evaluacin de ancianos,
generalmente se evala previamente su estado cognitivo antes de continuar con
otros instrumentos de evaluacin. Se considera que de esta manera, la informacin
obtenida podr ser consistente y vlida.
Una adaptacin al espaol de Lobo, validada en el IMSS es muy utilizada; evala
clculo, atencin y habilidad de construccin, sensible para detectar alteraciones de
la funcin cognitiva toma 10 minutos su
administracin. Necesita de adiestramiento para su aplicacin.
El Examen Mental Breve es

el instrumento ms empleado
para evaluar el rea
cognitiva. En cualquier
evaluacin de ancianos,
generalmente se evala
previamente su estado
cognitivo antes de continuar
con otros instrumentos de
evaluacin. Se considera
que de esta manera la
informacin obtenida podr
ser consistente y vlida.
En Mxico ha sido validado
en ancianos.
Esta escala de medicin del estado cognitivo fue elaborada por Marshal F. Folstein
y Susan E. Folstein en 1973; el objetivo
de su elaboracin fue reducir el tiempo de
197
aplicacin de 30 minutos que duraban algunas evaluaciones a 5 a 10 minutos, debido a que nicamente evala los aspectos
cognitivos de las funciones mentales, excluyendo la evaluacin del estado de nimo, las experiencias mentales anormales y
la forma del pensamiento.
Esta reduccin del tiempo de aplicacin
fue dirigida principalmente hacia el adulto mayor, particularmente a los que presentan delirio o sndromes de demencia,
que cooperan por periodos cortos (Folstein 1975).
Se divide en dos secciones, la primera requiere respuestas verbales, cubriendo
orientacin, memoria y atencin, el mximo puntaje es de 21 y la segunda parte
prueba habilidad para nombrar y seguir
instrucciones verbales y escritas, escribir
un enunciado espontneamente y copiar
un polgono complejo similar al empleado en el Test Gestltico Visomotor de
Bender. En esta segunda parte la puntuacin mxima es de 9, no se mide el tiempo. El puntaje mximo total es de 30.
La validez de la escala fue determinada
por sus autores en 1974 por la correlacin
de su puntuacin con la Prueba de Inteligencia de Wechsler, obteniendo un coeficiente de correlacin de Pearson de 0.776
para la prueba verbal y de 0.666 para la de
ejecucin. La confiabilidad obtuvo una
correlacin de Pearson de 0.887.
El Examen Mental Breve es una prueba
vlida y confiable para evaluar deterioro
cognitivo, separa pacientes con deterioro
y sin l, ste no remplaza un examen clnico (Folstein 1975).
Un estudio realizado por Folstein y Lobo
en 1984 en pacientes ancianos con cncer
demostr que con un punto de corte de
23-24 se obtiene una alta sensibilidad y
especificidad. Escobar J. y colaboradores
en 1986, encontraron una sensibilidad del
87% y una especificidad del 82% para de-
198
tectar demencia y delirio en pacientes

hospitalizados, se ha reportado que la especificidad es ms baja en pacientes con
menos de 8 aos de educacin y arriba de
los 65 aos de edad.
El Examen Mental Breve ha sido utilizado
por un gran nmero de investigadores para evaluar las habilidades cognitivas del
adulto mayor es estudios epidemiolgicos
y longitudinales, su uso se atribuye a la facilidad de aplicacin, puntaje objetivo, y
toda la evidencia acumulada.
Tombaugh T. et al. en 1992 realizaron
una revisin de la informacin acumulada
en los ltimos 26 aos, concluyeron que
el puntaje total se ve afectado por la edad,
el nivel de escolaridad, marco de referencia, el sexo no influy.
No debe ser utilizado como prueba diagnstica sino como una primera prueba,
siendo evaluados nuevamente los sospechosos. Los puntos de corte propuestos son los
siguientes: 24-30 sin deterioro cognitivo,
18-23 deterioro cognitivo medio y 17 o
menos deterioro cognitivo grave.
Roccaforte et al. (1992) validaron el Examen Mental Breve en su versin telefnica, resultando til y ms econmico para
detectar deterioro cognitivo.
En la versin en italiano (1993) se modific el punto de corte a 21-22.
El Examen Mental Breve ha sido traducido
y validado en diferentes idiomas aunque se
han encontrado problemas al tratar de traducirlo para poblaciones no anglosajonas.
En Mxico se realiz la traduccin, adaptacin y validacin para la poblacin de
adulto mayor en el Instituto Mexicano del
Seguro Social, en individuos de la consulta externa de psiquiatra, en un hospital
de 2 nivel de psiquiatra y en individuos
institucionalizados del Distrito Federal.
Se excluyeron a los individuos con dete-
Evaluacion en geriatra
rioro mental grave. Se obtuvo un alfa de

Cronbach de 0.89, Kappa de 0.90, En la
Curva Roc el punto de corte fue de 2324, por lo que los que tienen 23 o menos
tienen algn dao cognitivo y los que tienen 24 o ms no lo tienen. La sensibilidad
fue de 0.98, la especificidad de 0.70 y la
tasa de falsos positivos 0.29.
La consistencia interna es de 0.89.

En las pruebas de validez se ha observado
que discrimina entre pacientes psiquitricos y aquellos con trastornos orgnicos.
Hay una forma breve de 7 preguntas comparable en sus propiedades clinimtricas a
la forma de 10 preguntas.
EXAMEN MENTAL ABREVIADO

Este instrumento fue desarrollado por
Hodkinson (1972) y Qureshi y Hodkinson (1974) a partir de la prueba RothHopkins empleada por Blessed y cols.
(1968) que correlaciona con cambios encontrados en autopsias. Puede emplearse
en ambientes institucionales y en la comunidad.
Este instrumento es calificado por el entrevistador e incluye 10 preguntas; las respuestas correctas se califican con 1 y al
final se suman todas las respuestas correctas. La calificacin mxima posible es 10 y
el punto de corte para distinguir normalidad de anormalidad es variable, de menos
de 6 a menos de 10. Jitapunkul y cols
(1991) encontraron que el mejor punto
de corte era 8 para identificar pacientes de
acuerdo a los criterios del DSM-III-R.
Las 10 preguntas del Examen Mental
Abreviado indagan sobre:
1.
2.
3.
4.
5.
Memoria remota: Edad

Orientacin: Hora
Orientacin: Ao
Orientacin: Lugar
Orientacin: Reconocimiento de dos
personas
6. Memoria remota: Fecha y mes de nacimiento
7. Memoria remota: Fecha de la Primera
Guerra Mundial
8. Conocimiento general y memoria:
Nombre de la reina (presidente)
9. Atencin: Contar del 20 al 1
10. Atencin/memoria reciente: Recuerdo
a los 5 minutos de una direccin
En general, los instrumentos para la evaluacin del estado cognitivo incluyen como variables principales a la orientacin,
la atencin y la memoria. Las preguntas
que se realizan son muy similares.
rea afectiva
La evaluacin del estado afectivo es importante en los ancianos por la frecuencia
elevada de depresin y por la posibilidad
de que se presente pseudodemencia.
Aunque hay consenso sobre la necesidad
de evaluar esta rea, no lo hay sobre los
instrumentos mas apropiados.
El HAD se considera adecuado ya que no
incluye sntomas somticos. Como se sabe, en un porcentaje elevado de personas
de la tercera edad se encontrarn enfermedades mltiples.
Algunos sntomas, que suelen incluirse en
los instrumentos de depresin, como trastornos del sueo, disminucin de la energa y disminucin de la libido se observan
con frecuencia en ancianos sin depresin.
ESCALA DE DEPRESIN
GERITRICA
La escala de depresin
de Yesavage fue creada
especficamente para ser
empleada en ancianos.
Sus ventajas son que elimina
los sntomas somticos,
frecuentes en este grupo
de edad, y que el formato
es sencillo.
La Escala de Depresin Geritrica (Geriatric Depresin Scale, GDS) de Yesavaje y

Brink, (1983) es el instrumento mas empleado para evaluar la depresin en el anciano.
El objetivo de esta escala es la identificacin de ancianos con depresin.
199
Cuadro 7. Indicadores clinimtricos
Consistencia interna
Consistencia test-retest
Validez
Concurrente con Zung
Hamilton
Indicador
Valor
Alpha de Cronbach
Coeficiente de correlacin
0.94
0-85
r
r
0.84
0.83
Fue diseada para ser autoaplicable. Existen varias versiones, la original, de 30 reactivos, una breve de 15 (Sheikh y Yesavage,
1986), otra para ser aplicada mediante entrevista (Jamison y Scogin, 1992) y una
versin para ser aplicada por telfono
(Burke et al 1995).
Est constituida por preguntas relacionadas con sntomas depresivos como quejas
somticas y cognoscitivas, motivacin,
orientacin futura y pasada, prdida de la
autoestima, agitacin y humor y rasgos
obsesivos.
Diez preguntas se responden positivamente

y 20 se responden negativamente. Las respuestas depresivas se suman; la escala final va
de 0 (no hubo ninguna respuestas depresiva)
a 30 (todas las respuestas fueron depresivas.
Los indicadores clinimtricos se muestran
en el cuadro 7.
Los estudios de validez indican que la discriminacin de sujetos deprimidos es tan
buena como con el Ham-Dep y mejor
que con el Zung-Dep.
Con un punto de corte de 9 la sensibilidad fue del 85% y la especificidad del
80% (Brink et al 1982). Con un punto de
corte de 10, se observ una sensibilidad
de 84% y una especificidad de 91% (McGivney et al, 1994)
Tiene las siguientes ventajas:
200
Fue creada especficamente para ser

empleada en ancianos
Elimina los sntomas somticos que

son frecuentes en este grupo de edad
El formato es sencillo
El instrumento ha demostrado ser vlido y confiable
La sensibilidad y la especificidad son
adecuadas para la identificacin de
personas deprimidas
Se ha observado sesgo (subreporte de
sntomas): en los hombres, los ms ancianos, y aquellos con una inteligencia
verbal elevada. Sin embargo, no es claro si esto se presenta nicamente con
ste o tambin con otros instrumentos.
Puede emplearse para medir la evolucin de pacientes con tratamiento
(Burns 2002).
La depresin se acompaa frecuentemente de prdida de la memoria y deterioro cognitivo en sta poblacin, la

presencia de sntomas somticos hacen el
diagnstico en general; sin embargo son
menos tiles en el adulto mayor, lo mismo los disturbios del sueo dan diagnstico de depresin interna en personas
jvenes y no as en el adulto mayor (Yesavage 1983).
La sensibilidad y especificidad del GDS
con un punto de corte de 11 es 84% para
la sensibilidad y 95% para la especificidad, cuando el punto de corte es de 14, la
sensibilidad es 80%, especificidad 100%.
Por lo que se clasific la puntuacin de 0
a 10 como normal, 11 o ms como un posible indicador de depresin. Esta escala
no solamente puede aplicarse en personas
saludables, sino tambin en enfermos o
con deterioro cognitivo.
Evaluacion en geriatra
Es un instrumento de tamizaje que puede

distinguir entre deprimidos y no deprimidos ms no de diagnstico.
Resultados:
Envejecimiento normal de 0 a 10 puntos
Depresin, ms de 11 puntos
Depresin grave: ms de 23 puntos
EVALUACIN
DEL FUNCIONAMIENTO
La evaluacin del funcionamiento ha sido
tratada en un captulo previo por lo que
solo mencionaremos la Cdula de Evaluacin de Recursos y Servicios para Ancianos (Older Americans Resources and
Services Schedule) desarrollada en la Uni-
versidad de Duke en los 1970s. Consta de

dos secciones: el Cuestionario de Evaluaci Funcional Multidimensional, que evala el funcionamiento fsico, psicolgico y
social y el Cuestionario de Evaluacin de
Servicios, que evala el uso de servicios.
Las subescalas de salud mental evalan
funcionamiento cognitivo, estado psiquitrico y la autoevaluacin de paciente,
pero no permiten hacer diagnsticos. Estas subescalas son: satisfaccin con la vida,
autoevalaucin de la salud mental, deterioro cognitivo y estado psiquitrico.
La consistencia y validez del instrumento
se consideran adecuadas (Fillenbaum y
Smyer, 1981).
201
Lecturas recomendadas.
Referencias
American Psychiatric Association. Diagnostic and
Statistical Manual of Mental Disorders, 4th ed.
Washington, DC: APA, 1994.
Bech P, Rafaelsen O. The use of rating scales exemplified by comparison of the Hamilton and the
Bech Rafaelsen melancola scale. Acta Psychiatr Scand 62(Supl 285):128-132 1980.
Beck AT and Beck RW. Screening depressed patients
in family practice: A rapid technic. Postgraduate Medicine, 52:81-5, 1972.
Beck AT, Steer RA, and Garbin MG. Psychometric
properties of the Beck Depression Inventory:
Twenty-five years of evaluation. Clinical Psychology Review, 8:77-100, 1988.
Beck AT, Ward C, Mendelson M. et al. An inventory for measuring depression. Archives of General Psychiatry, 4:561-71, 1961.
Bergner M, Bobbitt RA, Carter WB. et al.The Sickness Impact Profile: Development and final revision of a health status measure. Medical Care, 19:787-805, 1981.
Bergner M, Bobbitt RA. Pollard, W.E. et al. The
Sickness Impact Profile: Validation of a health
status measure. Medical Care, 14:57-67, 1976.
Berwick DM, Murphy JM, Goldman PA, Ware JE,
Barsky J, Weinstein MC. Performance of a five item mental health screening test. Medical
Care 29 (2) 169:176, 1991
Biggs JT, Wylie LT and Ziegler VE. Validity of the
Zung self-rating depression scale. British Journal of Psychiatry, 132:381-5, 1978.
Blessed G, Tomkinson BE and Roth M. The association between quantitative measures of dementia and of senile change in the central grey
matter of elderly subjects. British Journal of
Psychiatry, 114:797-811, 1968.
Broadhead WE, Gehlbach SH, de Gruy FV, et al.
The Duke-UNC Functional Social Support
Questionnaire: measurement of social support
in family medicine patients. Med Care 26:
709-723, 1988
Burnam MA, Karno M, Hough RL et al. The Spanish Diagnostic Interview Schedule: Reliability and comparison with clinical diagnoses.
Archives of General Psychiatry, 40:1189-96,
1983.
Carroll BJ, Feinberg M, Smouse PE, Rawson SG,
Greden JF. The Carroll Rating Scale For Depression: I Development reliability and validation Br J Psychiatry 138:194-200 1981
Copeland JRM, Kelleher MH, Kellet JM. et al. A semi-structured clinical interview for the assessment of diagnosis and mental state in the elderly: The geriatric mental state Schedule
I:Development and reliability. Psychological
Medicine, 6:439-49, 1976.
Cronbach LJ. Coefficient alpha and the internal structure of tests. Psychometrika, 22:293-6, 1951.
Crowns S, Crisp AH. A short clinical diagnostic self
rating scale for psychoneurotic patientes: the
Middlesex Hospital Questionnnaire (MHQ).
Br J Psychiatry, 112:917-923 1966.
Derogatis LR, Lipman RS. and Covi, L. SCL-90:
An outpatient psychiatric rating scale preliminary report. Psychopharmacology Bulletin,
9:13-28, 1974.
Derogatis LR, Rickels K. and Rock A. The SCL-90
and the MMPI: A step in validation of a new
self-report scale. British Journal of Psychiatry,
128:280-9, 1976.
Derogatis LR. SCL-90r. Administration, Scoring
and Procedures: Manual 1 Clinical psychometric Research. Baltimore 1977.
Endicott J. and Spitzer RL. A diagnostic interview:
The Schedule for Affective Disorders and Schizophrenia. Archives of General Psychiatry,
35:837-44, 1978.
Feinstein AR: Clinimetrics. Yale University Press,
New Haven, 1980
Fillenbaum GG and Smyer MA. The development,
validity and reliability of the OARS Multidimensional Functional Assessment Questionnaire. Journal of Gerontology, 36:428-34, 1981.
First MB, Spitzer RL, Gibbson M et al.. Users Guide for the Structured Clinical Interview for
Axis I DSM IV Disorders (Clinical Version)
American Psychiatric Press, Washington 1995.
Folstein MF, Folstein SE. and McHugh PR. MiniMental State: A practical method for grading the
cognitive state of patients for the clinician. Journal of Psychiatric Research, 12:189-98, 1975.
Goldberg DP. The detection of Psychiatric Illness by
questionnaire. Oxford University Press,
Maudsley Monogrph No. 21 Londres 1972.
Gurland BJ, Golden RR, Teresi JA and Challop J. The
SHORT-CARE: An efficient instrument for the
assessment of depression, dementia and disability. Journal of Gerontology, 39:166-9, 1984.
Hamilton M: A rating scale for depression. J Neurol
Neurosurgery and Psychiatry, 23:56-62, 1960
Hodkinson HM. Evaluation of a mental test score
for assessment of mental impairment in the elderly. Age and Ageing, 1:233-8, 1972.
Katz MM. and Lyerly SS. Methods for measuring
adjustment and social behaviour in the community: I. Rationale, description, discriminative validity and scale development. Psychological Reports, Monograph, 13:503-35 (suppl),
1963.
Kendell RE, Everitt B, Cooper JE et al. Reliability of
the Present State Examination. Social Psychiatry, 3:123-9,1968.
203
Kramer TL and Smith GR. Tool to improve the detection and treatment of depression in primary care.
En: Maruish ME (ed). Handbook of Psychological Assesment in Primary Care Settings. Lawrence
Erlbaum Associates, Inc., 463-490 Mahwah 2000.
Lara MC, Ortega Soto H. La clnimetra o la psicometra?. Medicin en la prctica psiquitrica.
Salud Mental 1995. 18 (4):33-40
Lara MC, Ponce de Len S, de la Fuente JR. Conceptualizacin y medicin de la calidad de vida de pacientes con cncer. Rev Invest Clin
1995; 47:315-27.
Lara Muoz MC. Evolucin de las clasificaciones en
psiquiatra. Salud Mental 1996; 19 (supl 2):7-10.
Lara Muoz MC. La calidad de vida del enfermo esquizofrnico. En: Ortega-Soto H y Valencia Collazos
M. Esquizofrenia. Estado Actual y Perspectivas.
Instituto Nacional de Psiquiatra Ramn de la
Fuente, Mxico DF, 2001, 211-248.
Lara-Muoz C, Feinstein AR. How should quality
of life be measured? J Investigative Med 47(1):
17-24, 1999.
Meaking C: Screening for depression in the medically ill. Br J Psychiatry 160:212-216, 1992.
Medina-Mora ME, Tapia R, Mario MC, Juarez F, Villatoro J, Caraveo J, Gomez M: Trastornos emocionales en una poblacin urbana mexicana, resultados de un estudio nacional. Anales Instituto
Mexicano de Psiquiatra 3:48-55, 1992.
Montgomery SA, Asberg M. A new depression scale
designed to be sensitive to change. British
Journal of Psychiatry, 134:382-9, 1979.
Nunnally JC: Psychometric Theory. Segunda edicin. Mc Graw Hill, New York 1978.
Radloff LS. The CES-D Scale: a self report depression
scale for research in the general population. Applied
Psychological Measurement 1:385-401, 1977
Ortega Soto HA, Jasso A, Cecea G, Hernndez
Avila CA. La validez y la reproducibilidad de
dos escalas para evaluar los sntomas extrapiramidales inducidos por neurolpticos. Salud
Mental 14 (3): 1-5, 1991
Raskin A, Schulterbrandt JG, Reating N. Differential response to chlorpromazine, imipramine,
and placebo: a study of subgrups of hospitalized depressed patients. Arch Gen Psychiatry,
23:164-173, 1970.
Robins LN, Helzer JE, Croughan J et al. National Institute of Mental Health Diagnostic Interview Schedule. Arch Gen Psychiatry 38:381-389, 1981.
Rush AJ, Giles DE, Schelesser MA et al. The Inventory
for Depressive Symptomatology (IDS) Preliminary Findings. Psychiatry Res 18:64-87, 1985.
Sarason IG, Levine HM, Basham RB et al. Assessing
social support: the Social Support Questionnaire. J Pers Soc Psychol 44: 127-139, 1983
Sherbourne CD, Stewart AL. The MOS Social Support Survey. Soc Sci Med 32: 705-714, 1991.
Silverstone OH. Concise assesment for depresin
(CAD): A brief screening approach to depres-
204
sion in the medically ill J Psychosom Res 41

(2):161-170 1996.
Spitzer RL, Williams JBW, Gibbon M. Gua del
usuario para la entrevista clnica Estructurada
para el DSM-III R. Departamento de Psiquiatria, Investigaciones Biomdicas de la Universidad de Columbia, Instituto Psiquitrico del
Estado de Nueva York, American Psychiatric
Press, Inc. Washington 1988.
Spitzer RL, Williams JBW, Kroenke K et al. Utility
of a new procedure for diagnosing mental disorders in primary care. The PRIME-MD
1000 study Jama 272:1749-1756, 1994.
Valencia M, Rojas E, Gonzlez E, Ramos L, Villatoro J. Evaluacin del Funcionamiento Psicosocial en pacientes de un centro de salud. Salud
Publica de Mxico 31: 674-687, 1989.
Veit CT, Ware JE Jr. The structure of psychological
distress and well being in general populations J
Consult Clin Psychol, 51:730, 1983.
Ware JE, Johnston SA, Davies A et al. Conceptualization and measurement of health for adults in
the health insurance experiment Vol. III: Mental health R 1987/ e HEW. The Rand Corporation, Santa Monica, 1979.
Wing Jk, Babor T, Brugha T et al. Schedules for clinical assesment in Neuropsychiatry. Arch Gen
Psychiatry, 47:589-593, 1990.
Yesavage JA, Brink TL, Rose TL et al. Development
and validation of a geriatric depression screening scale- a preliminary report. Journal of
Psychiatric Research, 17:37-49, 1983.
Zigmond AS and Snaith RP. The Hospital Anxiety
and Depression Scale. Acta Psychiatrica Scandinavica, 67:361-70, 1983.
Zung WWK. A Self Rating Depression Scale Arch
Gen Psychiatry 12:63-70, 1965.
CATLOGOS DE INSTRUMENTOS
American Psychiatric Association. Handbook of
Psychiatric Measures. American Psychiatric Association, Washington 2000.
Bulbena VA, Berrios GE, Eds: Medicin clnica en
psiquiatra y psicologa, Masson Barcelona 2000.
Spilker B (Ed). Quality of life and Pharmacoeconomics in clinical trials.(2nd edition) Lippincott
Williams & Wilkins, 1996.
BASES DE INSTRUMENTOS
El Instituto Nacional de Psiquiatra cuenta con un
catalogo de instrumentos que han sido empleados por investigadores del propio Instituto.
HAPI (Health and Psychological Instruments). Es
una base que proporciona datos acerca de ms
de 120 000 instrumentos. Est disponible en
CD-ROM o en lnea a travs de la Tecnologa
OVID.
RESPUESTAS
A LA AUTOEVALUACION
INICIAL
1.
6.
2.
7.
3.
8.
4.
9.
5.
10. F
205

Guia de La Evaluacion Psiquiatrica 130414211917 Phpapp02

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Guia de La Evaluacion Psiquiatrica 130414211917 Phpapp02

Cargado por

Copyright:

Formatos disponibles

AVALADO POR

Dr. Marco Antonio Lpez Butrn

Dr. Omar Kawas Valle

Dr. Jess Orueta Alvarez

ESTE ES UN SERVICIO EDUCATIVO

Una edicin de:

Intersistemas, S.A. de C.V.

Clinimetra para psiquiatras . . . . . . . . . . . . . . . . . . . . . . .

Sensatez en la medicin clnica . . . . . . . . . . . . . . . . . . . . .

Principios generales de las escalas . . . . . . . . . . . . . . . . . .

Evaluacin de sntomas psicticos . . . . . . . . . . . . . . . . . . .

Evaluacin en el rea cognitiva . . . . . . . . . . . . . . . . . . . . . . . . . . .

Respuestas de la autoevaluacin inicial . . . . . . . . . . . . . . .

INSTRUCCIONES PARA OBTENER PUNTAJE CON VALOR PARA

La sensatez de un instrumento puede ser obviada si su consistencia

La sensibilidad y la especificidad son indicadores de consistencia:

La validez de un instrumento se prueba contra un estndar de oro:

Para aplicar la Entrevista Diagnstica Internacional se requiere de

La Escala de Depresin de Hamilton es un instrumento de diagnstico:

La escala original de Simpson-Angus permite valorar acatisia y aquinesia:

El PANSS y el BPRS pueden ser comparados:

La valoracin de ancianos requiere de instrumentos especialmente

Actualmente, no es posible medir el apoyo social:

10. Por ser subjetiva, no se recomienda evaluar la calidad de vida:

Clinimetra para psiquiatras

En varios cursos y talleres dedicados al tema, con frecuencia hemos escuchado la

Este texto va dirigido a

Los primeros talleres de Clinimetra que

Podemos medir el estado clnico de los

PAC PSIQUIATRA-4 Libro 3

mos las reglas podemos medir cualquier

Es til reconocer trminos

Una escala es el conjunto de categoras que

Clinimetra para psiquiatras

no arbitrario (por ejemplo la talla o la

Una caracterstica de los

Para asignar la categora de mujer a una

PAC PSIQUIATRA-4 Libro 3

variables componentes y se deben especificar claramente.

Otra forma de obtener el resultado de la

Clinimetra para psiquiatras

una variable nominal en una ordinal, por

Este tipo de informacin adicional es muy

Antes de que se combinen las variables en

La evidencia es intrnseca o proximal

El siguiente paso incluye una serie de decisiones conceptuales que preceden a la

La evidencia es extrnseca o distal cuando refleja una consecuencia o un efecto

Al trmino de este proceso, las variables

1) La evidencia refleja una consecuencia

PAC PSIQUIATRA-4 Libro 3

difcilmente ocurre en cierto tipo de investigaciones. Para evitar invadir la privacidad

Muchas de las variables utilizadas en la clnica se refieren a conceptos intelectuales

los ndices clnicos, el reto principal es

De acuerdo al DSM IV, un sujeto tiene

Cmo se lleg a estos criterios? Evidentemente, por la observacin directa de los

Clinimetra para psiquiatras

radas importantes, pero stas no deben ser

PAC PSIQUIATRA-4 Libro 3

clnico, pero se agruparon segn sus efectos

Este tipo de juicio clnico-estadstico se utiliza tambin cuando la variable candidata

Sensatez en la medicin clnica

n contraste con los principios bien

mismo mtodo o el mismo observador