Documentos de Académico
Documentos de Profesional
Documentos de Cultura
Dialnet ConceptosBasicosDeValidacionDeEscalasEnSaludMental 4804648 PDF
Dialnet ConceptosBasicosDeValidacionDeEscalasEnSaludMental 4804648 PDF
○
○
○
○
○
○
○
○
○
○
○
○
○
Conceptos Básicos de Validación de Escalas en
○
○
○
Salud Mental
○
○
○
○
○
○
○
MARÍA DE LOS ANGELES RODRÍGUEZ GAZQUEZ1
○
○
JOSEFINA LOPERA JARAMILLO2
○
○
○
○
○
preocupado por medir los procesos relacionados dial de la Salud (OMS) define la salud como el “com-
○
○
con la salud y la enfermedad, la historia cuenta pleto bienestar físico, mental y social, y no sola-
○
lizar las condiciones sociales y económicas de los bios que puedan introducirse en el medio ambien-
○
○
países a través de indicadores que cuantifican los te físico y social”; los epidemiólogos en todo el mun-
○
ral, salud y enfermedad, perfiles de morbilidad, mor- midieran estos aspectos, incluyendo el bienestar.
○
○
talidad, factores de riesgo y son el pilar fundamen- Estas definiciones han sido objeto de numerosas y
○
○
tal para la toma de decisiones y la formulación de calurosas discusiones, en el sentido de poder refle-
○
políticas de los gobiernos. Sin embargo la medi- jar satisfactoriamente su significado a través de ins-
○
○
ción de la salud ha tenido algunas dificultades, ya trumentos que permitan su medición, esto preci-
○
○
las condiciones de salud en los grupos de mayor mide lo que debe medir.1
○
○
○
○
○
1
Especialista en Epidemiología, Subespecialista en Salud Mental.
○
○
2
Magíster en Salud Pública, Subespecialista en Salud Mental, Jefe de la Dirección de Planeación y Autoevaluación. Instituto de Ciencias de
○
la Salud – CES.
○
31
La medición de los aspectos que se refieren a la te que permita un juicio subjetivo de la medición
○
○
Salud Mental difieren ampliamente de la de aspec- en salud?
○
tos orgánicos, ya que los segundos pueden tener
○
○
formas “objetivas” de evaluar la salud, en cambio En contraposición con la tradicional forma de me-
○
○
en los primeros estas mediciones pueden ser muy dir en ciencias exactas, no se puede decir que la
○
“subjetivas”.
○
evidencia que proporciona este tipo de medición
○
○
sea débil. Para introducir las bases científicas de la
○
Durante la segunda guerra mundial se creó la ne- medición en salud es necesario empezar con una
○
cesidad de evaluar la salud mental en un número
○
descripción de los procedimientos psicométricos
○
grande de soldados donde era imposible la evalua-
○
utilizados para asignar puntajes numéricos a juicios
○
ción individual; por esta razón se crearon tests o
○
subjetivos. Los argumentos que consideran estos
○
escalas, que fueron puntuados y después estanda- juicios subjetivos como válidos provienen de los es-
○
rizados para este fin.2
○
tudios de la psicofísica y de las técnicas psicomé-
○
○
tricas utilizadas para medir la salud.
○
Otra contribución del período de guerra fue la apli-
○
○
cación de escalas numéricas a los índices de salud,
1. ESTIMACION NUMERICA DE LAS MEDI-
○
debido a que estos reportes no eran exclusivamen- ○
○
CIONES EN SALUD: METODOS PARA DI-
te cuantitativos, algunos métodos fueron adquiri-
○
SEÑAR ESCALAS
○
denominados “escalas”.
○
el fin de medir actitudes y su uso permitió sistema- La escala es una herramienta que permite asignar
○
propósito de diagnóstico, pronóstico o evaluación. llevarse a cabo una búsqueda completa de la litera-
○
○
Dentro de éstos tests están las escalas para evaluar tura a través de diversas bases de datos electróni-
○
Otra clasificación muy frecuentemente utilizada es Una vez se hayan localizado una o más escalas re-
○
medición del evento a evaluar: depresión, ansie- tomar la decisión de sí es posible utilizar el instru-
○
○
dad, calidad de vida en pacientes terminales, satis- mento elegido o es necesario diseñar un nuevo ins-
○
○
facción del usuario, etc.; cada uno de ellos tendrá trumento. Esta decisión debe ser analizada con
○
Antes de revisar los procedimientos de evaluación importante tener en cuenta una valoración crítica
○
○
de la validez de las escalas de medición en salud, se adecuada de la evidencia que apoye el instrumen-
○
32
Las escalas se realizan en general con el fin de: últimos años se han utilizado abordajes cuantitati-
○
○
vos para este fin. Siendo las técnicas de mayor
• Probar hipótesis: Estas pueden ser de tipo:
○
relevancia según Willms y Johnson: 6
○
“unidimensional” refiriéndose a un solo construc-
○
○
to latente de interés o “multidimensional”más
○
2.1.1 Grupos focales: Son grupos de informan-
○
complejas en el sentido de referirse a dos o más
○
tes constituidos por seis a doce personas, guiadas
constructos.
○
por un facilitador y elegidas de acuerdo al interés
○
○
• Análisis exploratorio: Para determinar qué do- del grupo de investigación por la contribución con
○
○
minios subyacen en la escala. sus ideas y experiencia. Usualmente las sesiones
○
de grupo son grabadas y posteriormente discuti-
○
• Asignación de puntuación: Asignación de va-
○
das, resaltando que inicialmente la tarea no es ge-
○
lores o puntajes a los ítems de los dominios.
○
nerar ítems específicos, si no sugerir temas genera-
○
○
les, que el grupo de investigación pueda utilizar para
○
2. CONSIDERACIONES PARA LA ELABORA- elaborar los ítems en sí. Una vez los ítems son escri-
○
○
CION DE LOS ITEMS DE UNA ESCALA tos, los grupos focales pueden nuevamente juzgar
○
○
su relevancia, claridad y ambigüedad en términos
El primer paso para la elaboración de los ítems de ○
○
○
de la persona que va a responder la escala, y si se
una escala, es analizar lo que otros investigadores han cubierto todos los tópicos de interés.
○
○
hay que analizar si los ítems específicos que fueron Como su nombre lo indica, se realizan entrevistas a
○
○
utilizados para desarrollar tests individuales, pro- un número pequeño de personas, elegidas por su
○
○
Hay algunas razones del por qué los ítems son uti- torno, o se puede realizar también con clínicos que
○
○
lizados nuevamente en otras escalas, partiendo de han tenido una experiencia exhaustiva con este tipo
○
○
inventarios previos: Primero, ahorra trabajo ante de pacientes y que pueden explicar adecuadamen-
○
la necesidad de construir nuevas escalas. Segun- te la orientación diagnóstica. Estas entrevistas pue-
○
○
do, estos ítems usualmente han pasado por proce- den ser “no estructuradas”, las cuales le dan un
○
○
sos de validación que garantizan su capacidad psi- carácter de espontaneidad a la entrevista o “estruc-
○
○
cométrica; y por último: hay un número limitado turadas”, donde el entrevistador ha planeado cui-
○
de formas de hacer las preguntas sobre problemas dadosamente con anterioridad las preguntas.
○
○
en evaluar el estado depresivo, es difícil preguntar 2.1.3 Observación clínica: Esta técnica es qui-
○
no haya sido utilizada con anterioridad. ítems para una escala específica. Las escalas que
○
○
formación de escalas específicas, resaltando que en 2.2 METODOS DE RESPUESTA PARA ESCA-
○
Inicialmente estos procedimientos se elaboraron Una vez seleccionados los ítems con los métodos
○
33
elegir la escala de respuesta según el tipo de pre- ma razón, también procedimientos inadecuados
○
○
gunta diseñada. pueden disminuir la eficiencia hasta un 10%.
○
○
○
Es importante diferenciar qué tipo de respuestas A su vez, es importante anotar que cada vez que se
○
○
son de naturaleza categórica como la raza, religión lleve a cabo este procedimiento, es necesario incre-
○
○
y estado civil, de aquellas variables que poseen una mentar el tamaño de muestra de la siguiente ma-
○
naturaleza continua, como por ejemplo la hemoglo- nera: si se necesitan 67 pacientes para demostrar
○
○
bina, presión sanguínea, o la cantidad de dolor re- un efecto cuando el resultado es medido en forma
○
○
gistrada en milímetros utilizando una línea recta. continua, se necesitarán 100 pacientes para demos-
○
○
trar el mismo efecto al llevar a cabo una dicotomiza-
○
Otra consideración importante para analizar la res- ción de las variables.8
○
○
puesta de las escalas, es elegir apropiadamente el
○
○
nivel de medición de las variables. Si la respuesta 2.3 CATEGORIAS DE RESPUESTA PARA ME-
○
○
consiste en categorías tales como género, clasifica- DICIONES CONTINUAS
○
ción laboral o religión, la variable es nominal; si es-
○
○
tas categorías poseen un ordenamiento jerárquico Este tipo de respuestas posee dos categorías: mé-
○
○
como los estadios de un tipo específico de cáncer, ○ todos de estimación directa, en la cual se necesita
nivel educativo, su nivel de medición es ordinal. Al-
○
no refleja un “cero” real en su medición y por esta vas, en la cual los individuos eligen entre una serie
○
○
razón su clasificación es de intervalo, en contrapo- de alternativas que han sido previamente estanda-
○
medidas a nivel de razón.7 Las escalas según la forma de respuesta que permi-
○
○
• Escala de Guttman
○
En segundo lugar, si todos los individuos tienen una 2.3.1 Los métodos de la estimación directa
○
○
dificultad del individuo en encontrar una respuesta titativas acerca de la magnitud del atributo de la
○
○
apropiada, por la limitación de la escala en su nivel persona y su respuesta, la que puede ir desde “to-
○
cia del segundo y se relaciona con la dicotomización acuerdo”. En esta clasificación se encuentran las
○
○
de variables continuas y la pérdida de eficiencia del escalas Visual Análoga, la escala de Likert y la esca-
○
○
con respecto a datos continuos, dependiendo de Esta escala se usa habitualmente para cuantificar
○
34
responder el cuestionario reciben una lista de afir- deben ser opuestos: “bueno”, “malo”, unidos por
○
○
maciones o preguntas y se les indica que seleccio- siete a nueve fragmentos de línea. El encuestado
○
○
nen la respuesta que mejor represente el rango o el debe indicar su adherencia a uno de los adjetivos
○
grado de su opinión o forma de pensar. dados marcando el fragmento de línea que se acer-
○
○
que más a su opinión o concepto.11
○
○
Las opciones de respuesta de esta escala van des-
○
de “totalmente de acuerdo” a “totalmente en des-
○
La escala se puede considerar como una medición
○
acuerdo”, puntuadas numéricamente de 0 a 4, o en rangos, o sea como una medición de tipo
○
○
de 1 a 5. ordinal. Los siete o nueve rangos se deben pun-
○
○
tuar y el puntaje total es igual a la suma de los ítems.
○
El puntaje total de la escala resulta de la suma de
○
○
los valores de cada ítem. Posteriormente el autor
○
2.3.2 Los métodos de la estimación cuantita-
○
de la escala debe entrar a definir el rango para las
○
tiva
○
categorías de riesgo.
○
○
Esta clasificación comprende las técnicas compa-
○
○
Escala Visual Análoga ○
○
rativas o acumulativas de respuesta, la cual consta
en las escalas de Guttman y de Thurstone.
○
esos dos extremos mediante una línea. El sujeto También es conocida como escalograma o escala
○
○
tiene la posibilidad de marcar un punto que se acer- acumulativa. Se trata de un tipo de escalas que tie-
○
○
que al extremo que él considere pertinente. ne como propósito establecer un valor para una
○
○
dola finalmente como ”si” y ”no”, ”de acuerdo” y grupo de expertos determina qué ítems están rela-
○
○
”en desacuerdo”. Puesto que cada respuesta con- cionados con el constructo; los valores de la res-
○
nar un puntaje que indique el grado de acuerdo o va y 1 el caso contrario. El valor final de la escala
○
○
desacuerdo del encuestado, particularmente cuan- se obtiene mediante la suma de los valores de cada
○
Escala en la cual un sujeto califica cada ítem por El puntaje puede ser analizado estadísticamente y
○
medio de una lista de pares de adjetivos, los que corresponde a la suma de los ítems que se respon-
○
○
35
den en forma positiva; cada ítem tiene igual pon- lizar mediciones en salud es que las dos condicio-
○
○
deración al resto que compone la escala. nes vayan juntas. La figura 1 muestra la represen-
○
○
tación gráfica del criterio de validez y confiabilidad;
○
este último concepto será discutido más adelan-
○
Escala de Thurstone
○
te.13
○
○
El método comienza con la selección de 100 a 200
○
FIGURA 1. Representación gráfica del crite-
○
referentes teóricos relevantes del tópico a evaluar.
○
rio de validez y confiabilidad.
○
Cada referente es editado en tarjetas separadas y
○
○
un grupo de expertos los ordena desde el menos
○
acertado hasta el referente más congruente. El si-
○
○
guiente paso es obtener una mediana de cada refe-
○
○
rente y a cada uno se le asigna el valor correspon-
○
○
diente a la posición que ocupó. Finalmente se se-
○
leccionan de 20 a 25 ítems que serán incluidos.13
○
○
○
○
Es una escala de medición en la que las opciones
○
○
de respuesta son también de “si” y “no” y a dife- ○
Una vez los ítems han sido generados teniendo en medir, esta definición es muy semejante a la no-
○
○
cuenta los aspectos anteriormente mencionados, ción de sensibilidad en epidemiología. La forma tra-
○
○
debemos asegurar que tan correlacionados están dicional de evaluar la validez de una prueba es com-
○
○
con el constructo o constructos de interés, así como parándola con un gold estándar, lo cual deriva los
○
su capacidad discriminatoria, con el fin de evitar valores clásicos de sensibilidad, especificidad, valo-
○
○
incluir sesgos en la medición que lleven a conclu- res predictivos positivos y negativos.7
○
○
siones erróneas.
○
○
3. LA CALIDAD DE UNA MEDICION CON VA- validación va ir apoyado por otros criterios: validez
○
○
parar al centro, esto equivale a hablar en • Validez de contenido: Con el fin de evitar con-
○
○
Este practicante además debe hacer esfuerzos para facer adecuadamente los criterios conceptuales
○
que cada uno de sus tiros, queden cerca unos de y el alcance de los mismos para explicar un fenó-
○
○
como la confiabilidad.
○
○
El arquero puede hacer disparos repetidos y estos de los ítems que deben ser incluidos en una es-
○
○
quedar juntos pero lejos del centro. Lo ideal al rea- cala, representan la validez de contenido, la cual
○
○
36
mide el grado de correlación de las preguntas tes esquizofrénicos: la escala BDI (Beck
○
○
incluidas en la escala y es equivalente al concep- Depression Inventory) y la escala CDS (Calgary
○
Depression Scale). Los autores evaluaron vali-
○
to de sensibilidad, en donde se mide la capaci-
○
dad del test para determinar las personas real- dez de criterio debido a que el juicio diagnóstico
○
○
mente enfermas cuando este es positivo. fue llevado a cabo por clínicos entrenados para
○
identificar depresión en población general, a tra-
○
○
A su vez el concepto clásico de especificidad, vés de dos pruebas para este fin y los resultados
○
○
que en psicometría corresponde a la validez dis- fueron analizados utilizando coeficientes de co-
○
○
criminante, se refiere a la proporción de perso- rrelación producto-momento de Pearson para
○
identificar la distribución de cada escala, en ge-
○
nas que no poseen la enfermedad y están co-
○
rrectamente diagnosticados. neral y en diferentes subgrupos de pacientes
○
○
deprimidos.15
○
○
La validez de contenido se logra idealmente en
○
• Validez de constructo: Este tipo de validez
○
un estudio que aplique el gold estándar y el test
○
de comparación en toda la población seleccio- involucra procesos más complejos y es esencial
○
para todos los conceptos abstractos como cali-
○
nada. Debido a que esta situación no es nor-
○
○ dad de vida.
malmente viable, deben seleccionarse personas ○
de tratamiento.
○
la evidencia encontrada.
○
precipitantes.16
○
ellas.3
○
○
la concordancia empírica del instrumento en es- psiquiatría no existe una prueba serológica o
○
○
tudio, con otras técnicas que miden la misma inmunológica, que sirva de gold standard para la
○
validación diagnóstica.
○
Un ejemplo de la validez de criterio para trastor- mismo trastorno en sus integrantes, puede ser
○
○
nos psiquiátricos específicos, puede ser relacio- utilizado como indicador de validez del evento.
○
○
tudio de Addington y otros en 1993, presentó El cuarto criterio está relacionado con la validez
○
○
una serie de ejemplos típicos para usar técnicas de predicción de los resultados, los cuales están
○
○
37
Se asume que los individuos con el mismo diag- • Del observado, la cual hace referencia a la varia-
○
○
nóstico tendrán resultados similares. Sin embar- bilidad biológica intrínseca de los sujetos que se
○
go el uso de los resultados como criterio de vali- estudian, debida a fenómenos como los ritmos
○
○
dación es problemático porque muchos trastor- circadianos y el tiempo transcurrido en la última
○
○
nos psiquiátricos poseen resultados heterogé- toma de una medicación.
○
○
neos.
○
• Finalmente la debida al instrumento, que repre-
○
senta la variabilidad de la medición por una in-
○
• Validez factorial: La validez factorial ha sido
○
adecuada calibración del mismo, cuando este ins-
○
utilizada para describir constructos subyacentes
○
trumento es mecánico, o por falta de estandariza-
en una escala. En este tipo de validez se exami-
○
ción de los entrevistadores cuando se aplica una
○
na qué tan alejados están los ítems del constructo
○
encuesta.
○
latente, que pueden no reconocerse fácilmente
○
○
a través de los datos, es una de las formas más
○
sencillas de evaluar la validez de contenido. 3.2.1 Estimación de la confiabilidad
○
○
○
La precisión de una variable determinada se descri-
○
El análisis factorial ha sido ampliamente utilizado
○
en ciencias sociales, particularmente en la ela- be frecuentemente en estadística básica a través
○
○
de la desviación estándar o el coeficiente de varia-
boración de escalas psicométricas, permitiendo
○
tes de correlación.
○
○
○
ticamente el mismo valor cada vez que se mide, lo • Consistencia interna: Define el grado de con-
○
○
cual no significa que sea válida; esta precisión en cordancia entre dos variables que miden la mis-
○
ma característica general.
○
“Confiabilidad”.18
• Consistencia test-retest: Es el grado de con-
○
○
este fin; en este último, la oportunidad de generar que tengan un significado propio (no debidas al
○
○
valores distintos en dos ocasiones sucesivas es azar), mientras que si es muy corto es posible
○
mayor.
○
• La variabilidad del observador, lo cual se refiere a los valores obtenidos por dos observadores o
○
la persona que realiza la medición, e incluye fac- más, en una misma muestra de individuos, mien-
○
○
tores como la elección de las palabras al realizar tras que la consistencia intraobservador es la co-
○
○
una entrevista o en la elaboración de ítems de rrelación entre valores repetidos obtenidos por
○
38
BIBLIOGRAFIA 10.Scott PJ, and Huskisson EC. Measurement of
○
○
functional capacity with visual analogue scales.
○
○
Reumathology and Rehabilitation 1978; 16:
○
1. Corcoran K, Fisher J. Measures for clinical 257-9.
○
○
practice: a sourcebok. New York. Free Press.
○
1987. 11.Osgood C, Suci G, Tannenbaum P. The measu-
○
rement of feeling. University of Illinois Press:
○
○
2. Katz S, Akpon CA, et al; Measuring the health Urbana; 1957.
○
○
status of populations. En: Berg RL, editor. Health
○
12.Trochim W. Guttman scaling. Junio 2002. URL
○
Status Indexes. Chicago: Hospital Research and
disponible en: http://trochim.omni.cornell.edu/
○
Educations Trust. 1973. p. 39-52.
○
kb/scalgutt.htm.
○
○
3. McDowell I, Newell C. Measuring health: a guide
○
13.Trochim W. Introduction to validity. Junio 2002.
○
to rating scales and questionnaries. 2a edición. URL disponible en:
○
○
New York: Oxford University Press; 1996. p. 10- http://trochim.omni.cornell.edu/kb/introval.htm.
○
15.
○
○
14.Trochim W. Reliability and Validity: What’s the
4. Bombardier C, Tugwell P. A Methodological ○
○
○ difference?. Junio 2002. URL disponible en: htpp:/
framework to develop and select indices for /trochim.human.cornell.edu./tutorial/
○
○
5. Streiner DL, Norman GR. Health Measurement Rating depression in Schizophrenia: A compari-
○
○
Scales: A Practical Guide to their Development son of a self-report and an observer scale. J Nerv
○
6. Willms DG, Johnson NA. Essentials in qualitative validity in psychiatric illness: its application to
○
983-7.
○
manuscript. 1993.
○
○
1990.
○
http://trochim.omni.cornell.edu/kb/scalgen.htm.
○
○
39