Está en la página 1de 46

ESTADÍSTICA ESPAÑOLA

Vol. 50, Núm. 167, 2008, págs. 147 a 192

Aspectos estadísticos del Cuestionario


de Calidad de Vida relacionada con
salud Short Form–36 (SF-36)(*)

por
INMACULADA AROSTEGUI MADARIAGA
Departamento de Matemática Aplicada y Estadística e Investigación Operativa
Universidad del País Vasco UPV/EHU

VICENTE NÚÑEZ-ANTÓN
Departamento de Economía Aplicada III (Econometría y Estadística)
Universidad del País Vasco UPV/EHU

RESUMEN

La Calidad de Vida Relacionada con Salud (CVRS) es un paráme-


tro destacado en la medición de resultados en salud. Es un concepto
difícil de medir y su medición se realiza a través de cuestionarios. Las
propiedades psicométricas de un cuestionario, su adaptación cultural,
el diseño del estudio y el análisis de los resultados plantean cuestio-
nes estadísticas importantes que deben tratarse con cautela. El Cues-
tionario de Salud SF-36 es uno de los instrumentos más utilizados, va-

(*) Agradecemos al editor de la revista y a los dos evaluadores anónimos por sus comen-
tarios y sugerencias, que han servido de ayuda para mejorar considerablemente el trabajo
que exponemos en este artículo. Asimismo, agradecemos a los investigadores de los proyec-
tos aquí mencionados que nos han permitido utilizar los datos de CVRS recogidos de los
pacientes reclutados en sus estudios, que nos han servido para ilustrar las características del
SF-36 desde una perspectiva estadística. En particular, este agradecimiento se extiende a: J.
M. Quintana, C. Anitua, N. González, A. Padierna, A. Valdivieso, A. Escobar, M. García, J.
Pérez Izquierdo y C. Badiola. Este trabajo ha sido parcialmente financiado por el Ministerio de
Educación y Ciencia y fondos FEDER (MTM2004-00341 y MTM2007-60112) y el Departamento
de Educación del Gobierno Vasco UPV/EHU Econometrics Research Group IT-3334-07).
148 ESTADÍSTICA ESPAÑOLA

lidados y traducidos en el campo de la medición de la CVRS. Este


trabajo quiere recalcar la importancia de contrastar las hipótesis del
modelo a la hora de elegir y valorar un análisis estadístico en aquellos
estudios donde se ha utilizado el SF-36. Se presentan ejemplos de
aplicación del SF-36, así como análisis más concretos para mostrar
las diferencias obtenidas mediante distintas técnicas de análisis esta-
dístico y su repercusión en el ámbito clínico.

Palabras clave: calidad de vida, SF-36, análisis estadístico, bondad de


ajuste.

Clasificación AMS: 62J05, 62J12, 62P10.

1. INTRODUCCIÓN

La Organización Mundial de la Salud (OMS) definió hace ya varias décadas la


salud como un estado de completo bienestar físico, mental y social, y no simple-
mente la ausencia de enfermedad o discapacidad (World Health Organization
1952). El modelo “biosicosocial” en medicina enmarca aspectos referidos al bienes-
tar del paciente, como sus relaciones como persona, su comportamiento, el entorno
en el que se desenvuelve y sus relaciones sociales, en lo que se conoce con el
nombre de Calidad de Vida (CV) (Sanz 1991). Si bien el concepto de CV no es
nuevo, en la década de los 80 se produjo un creciente e inusitado interés popular y
médico por la CV, especialmente en los pacientes con cáncer. En 1973 eran úni-
camente 5 los artículos que aparecían en la base de datos Medline con la palabra
clave “quality of life”. Este número se incrementó de forma casi exponencial, siendo
durante los siguientes periodos de cinco años 195, 273, 490 y 1.252 los artículos
localizados mediante el mismo criterio.

Lo que significa CV es una cuestión personal. Así, el sentido subjetivo de bien-


estar de cada persona derivado de la experiencia diaria de su vida, se abre camino
entre la medicina y las ciencias sociales. La evaluación de la CV debe incluir todas
las áreas de la vida impactadas por la enfermedad o su tratamiento: la física, la
psicológica, la social y la espiritual. El problema para medir la CV estaba en la falta
de un instrumento único y global capaz de acomodar todas las componentes que
definen el concepto de CV. Desde mediados del siglo pasado, existen múltiples
pruebas psicométricas objetivas que incluyen las diferentes categorías funcionales
del paciente y calculan una puntuación global de CV. La más antigua es el índice
funcional de Karnofsky (Karnofsky y Burchernal 1949), que es aplicado por el
médico y sólo mide capacidad física. En 1976 Katz y Akpom describen el Activities
Daily Living (ADL) Index que mide las actividades sociobiológicas de la vida diaria:
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 149

bañarse, vestirse, alimentarse, etc. Durante la década de los años 80 se desarrolla-


ron múltiples instrumentos para medir la CV en pacientes con cáncer, buscando el
cumplimiento de las siguientes características: (i) evaluar la morbilidad subjetiva e
impacto del tratamiento sobre el enfermo en sus aspectos físicos, psíquicos y
sociales; (ii) basarse en el paciente como fuente de información, reflejando su
opinión; y (iii) ser válido, sensible, sencillo y convincente.

La CV, globalmente considerada, es algo difícil de definir, y depende en gran


medida de la escala de valores por la que cada individuo ha optado, más o menos
libremente, y de los recursos emocionales y personales de cada uno. Además, está
sometida a determinantes económicos, sociales y culturales y se modifica, con el
paso del tiempo, para un mismo individuo. Durante la década de los 90 se desarro-
lla un nuevo concepto, el de Calidad de Vida Relacionada con la Salud (CVRS) o
salud percibida. Este integra aquellos aspectos de la vida directamente relaciona-
dos con el funcionamiento físico y mental y con el estado de bienestar (Guyatt et al.
1993). La medición de la CVRS hace posible obtener información sobre la enfer-
medad y su impacto en la vida del paciente de una forma estandarizada, compara-
tiva y objetiva (Goldsmith 1972 y 1973). La mejor forma de medir la CVRS es
utilizar un enfoque multidimensional, valorando tanto el estado objetivo de salud, de
funcionalidad y de interacción del individuo con su medio, como los aspectos más
subjetivos de satisfacción del individuo y la percepción de su propia salud (Testa y
Simonson 1996). La CVRS tiene un lugar destacado en la investigación de resulta-
dos en salud (Clancy y Eisenberg 1998) como un parámetro de medición de los
estados de salud y evaluación de los resultados de los cuidados médicos, en
especial en el campo de las enfermedades crónicas. En Estados Unidos la Food
and Drug Administration obliga a incluir la CVRS como un resultado para la evalua-
ción de los nuevos tratamientos aplicables a las enfermedades crónicas. En Euro-
pa, la Agencia Europea del Medicamento no obliga aún, pero sí recomienda la
inclusión de esta medida en la evaluación de nuevos tratamientos contra el cáncer.
La evaluación de la CVRS es una disciplina joven y, por tanto, con muchas cuestio-
nes sin resolver que muestran campos de investigación en desarrollo.

El método clásico para determinar y evaluar de una forma válida el impacto de


la enfermedad en la vida diaria del individuo y en la sensación de bienestar es la
administración de cuestionarios. A través de éstos se pone de manifiesto que el
estado de salud de los pacientes no siempre se corresponde con los datos que
proporcionan las medidas biológicas habitualmente utilizadas para su evaluación
clínica, y que los índices de actividad de la enfermedad no siempre son buenos
predictores de la CVRS de los pacientes (Wilson y Kaplan 1995).

Existen muchas publicaciones que recalcan la importancia de contrastar las hi-


pótesis y las limitaciones de las medidas de CVRS y los métodos asociados al
150 ESTADÍSTICA ESPAÑOLA

diseño del estudio y al análisis de los datos antes de utilizar dichas medidas de
CVRS como variables dependientes de interés (Testa y Nackley 1994). Tanto al
diseñar un estudio, como al analizar los datos de CVRS existen cuestiones estadís-
ticas importantes que deben considerarse con suma cautela (Cox et al. 1992). Una
primera cuestión es el estudio de las propiedades psicométricas de los cuestiona-
rios existentes, así como su adaptación cultural a nuestro entorno. Una segunda
cuestión, no menos importante, es el plan de análisis estadístico de los datos
recogidos que permita presentar los resultados de forma adecuada. Es en este
punto donde el estudio de las propiedades estadísticas de las medidas de CVRS
utilizadas adquiere especial importancia. Por ejemplo, la distribución de probabili-
dad de la variable resultado CVRS. Si se utilizan técnicas de análisis estadístico
que requieren que la variable tenga una distribución normal, será necesario com-
probar el cumplimiento de esta hipótesis y, en caso de que no se cumpla, habrá
que estudiar la robustez de las técnicas utilizadas, además de las consecuencias
prácticas de este incumplimiento en los resultados obtenidos. Otro aspecto, más
específico, es la multiplicidad de la respuesta, debido a la naturaleza multivariante
de las variables de CVRS. Existe bibliografía diversa sobre el tipo de análisis
estadístico que debe utilizarse cuando se dispone de múltiples respuestas de
CVRS (O´Brien 1984 y Pocock et al. 1987). Finalmente, aquellos estudios con un
diseño longitudinal tienen un problema añadido en el tratamiento de los datos
faltantes y pérdidas de seguimiento de carácter no aleatorio. Este tema se desarro-
lla de forma detallada por Mesbah et al. (2002) y Fairclough (2002) como aspectos
importantes a tener en cuenta en el diseño y análisis de estudios de CVRS.

Este trabajo se centra en la segunda de las cuestiones anteriormente mencio-


nadas. En este sentido, es necesario recalcar la importancia de contrastar las
hipótesis del modelo al elegir y valorar un análisis estadístico en aquellos trabajos
donde la variable de estudio sea la CVRS. En la sección 2, se describen los distin-
tos tipos de instrumentos de evaluación de la CVRS y sus características genera-
les. La sección 3 se centra en uno de los cuestionarios de salud genéricos más
difundidos, el denominado Short Form - 36 (SF-36). En esta sección se describe el
cuestionario de salud SF-36, incluyendo su desarrollo, validación y adaptación
cultural. Además, se incluye una revisión detallada de trabajos publicados en los
que se ha utilizado el SF-36 como cuestionario de medición de CVRS y los méto-
dos de análisis estadístico que se han aplicado para analizar los datos recogidos en
estos estudios. También se incluye y comenta la bibliografía existente en la actuali-
dad sobre las diferentes alternativas de análisis estadístico de datos de CVRS en
general, y del cuestionario de salud SF-36 en particular. En la sección 4, se presen-
tan ejemplos de aplicación del cuestionario SF-36. Más concretamente, se profun-
diza en las características de la distribución empírica de las áreas de CVRS obteni-
das mediante el cuestionario de salud SF-36 en las diferentes muestras analizadas.
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 151

De esta forma, nos interesaremos en mostrar que, en general, los datos de CVRS
recogidos por medio del cuestionario de salud SF-36 no siguen una distribución de
probabilidad normal. Esta hipótesis se ilustrará con doce ejemplos procedentes de
diferentes campos de la medicina, incluyendo áreas médicas y quirúrgicas, así
como población sana. Asimismo, utilizaremos algunos ejemplos concretos para
mostrar las diferencias obtenidas de resultados procedentes de distintas técnicas
de análisis estadístico y su repercusión en el ámbito clínico. Finalmente, en la
sección 5, presentamos algunas conclusiones del trabajo.

2. CUESTIONARIOS DE CVRS

2.1 Conceptos básicos: tipos de cuestionarios

Un cuestionario diseñado para medir CVRS debe basarse en el paciente como


fuente de información, reflejando su opinión. Hay que tener en cuenta algunas
consideraciones prácticas cuando se pretende administrar el cuestionario en condi-
ciones habituales de la práctica clínica. Es decir, éste debe ser aceptado por los
pacientes, profesionales sanitarios y por los investigadores. Por tanto, al diseñar el
estudio y seleccionar el/los cuestionario/s de CVRS a utilizar es fundamental maxi-
mizar la información conseguida y minimizar la carga para investigadores y pacien-
tes. Como norma general, se deben seleccionar instrumentos que hayan sido
evaluados debidamente. Lohr (2002) realiza una revisión sobre los atributos para
evaluar instrumentos.

Los cuestionarios de CVRS pueden ser autoadministrados o realizarse mediante


entrevista personal o telefónica. En general un cuestionario que pueda ser comple-
tado por el paciente es más práctico (Sanz 1991). Los cuestionarios de CVRS
tienen dos partes. La primera parte contiene unas instrucciones de administración
para el usuario, o el entrevistador si los datos se recogieran mediante entrevista. El
formulario debe ir también acompañado de una declaración explícita de confiden-
cialidad y garantía de anonimato. La segunda parte es el cuestionario propiamente
dicho, que consta de unas dimensiones de la CVRS y unos ítems o preguntas que
describen los diferentes niveles de estas dimensiones. Cada pregunta es respondi-
da en forma de una escala. Al describir las respuestas obtenidas o compararlas
entre grupos de individuos, pueden utilizarse los ítems originales, las dimensiones
de salud específicas o incluso una medida global de CVRS.

Los cuestionarios de CVRS se pueden clasificar en función de si se desea ex-


plorar las distintas dimensiones o aspectos del daño que ocasiona una enfermedad,
o de si se pretende integrar las dimensiones en un único indicador que resuma y
cuantifique las consecuencias de padecer una determinada enfermedad. El primer
152 ESTADÍSTICA ESPAÑOLA

caso es un enfoque multidimensional que refleja la naturaleza de la CVRS como un


concepto tridimensional, recogiendo aspectos físicos, mentales y sociales (McDo-
well y Newell 1996). El segundo es un enfoque unidimensional donde se busca
colapsar las distintas dimensiones para buscar un único indicador que pueda servir
para medir o comparar distintas actuaciones o estados de salud. La obtención de
las dimensiones y una medida global requieren de técnicas de ponderación. En
muchas ocasiones la puntuación en una dimensión se obtiene simplemente su-
mando los resultados de los ítems correspondientes a dicha dimensión; mientras
que, en otras ocasiones, los resultados de los ítems se ponderan de forma más o
menos compleja. Sin embargo, la mayoría de los expertos coinciden en que es
preferible obtener puntuaciones de manera simple y razonablemente justificada,
realizando un análisis de sensibilidad posterior de los resultados bajo diferentes
supuestos, que conducir experimentos muy elaborados para derivar escenarios de
ponderación sofisticados (Cox et al. 1992). Una cuestión a debate a finales de la
década de los 90 ha sido la fiabilidad de técnicas estadísticas como el análisis
factorial múltiple como método de reducción de ítems y construcción de escalas de
CVRS (Juniper et al. 1997 y Fayers y Hand 1997). Como norma general, Fayers et
al. (1998), en su respuesta al trabajo de Juniper et al. (1997), sugieren que la
construcción de escalas de CVRS no debe confiar ciegamente en la psicometría,
sino que debe apoyarse más firmemente en la clinimetría.

Los instrumentos de CVRS se pueden clasificar en genéricos y específicos (Pa-


trick y Deyo 1989). Se denominan instrumentos genéricos aquellos que miden
múltiples dimensiones o categorías y están diseñados para su aplicación en una
gran variedad de pacientes. Los instrumentos específicos se centran en la medida
de aspectos concretos de una determinada enfermedad (como, por ejemplo, cáncer
o asma), de una población (como, por ejemplo, ancianos o adolescentes), una
función (como, por ejemplo, sueño o actividad sexual) o un aspecto clínico (como,
por ejemplo, dolor o disnea). En general, los instrumentos específicos tienen un
mayor poder de discriminación; es decir, son más capaces de detectar diferencias
entre tratamientos alternativos (Ferrer et al. 1997 y Torres et al. 1999). Sin embar-
go, cuando se pretende comprobar el impacto que una determinada intervención
tiene en el estado de salud, hay que tener en cuenta que ésta también influye en
las características más generales del paciente. Por tanto, al evaluar el estado de
salud será conveniente utilizar también algún instrumento genérico (Guyatt et al.
1993). Cuando se pretende dar respuesta a problemas específicos de salud, se
buscan instrumentos que sean sensibles a variaciones de CVRS en enfermedades
específicas. Sin embargo, cuando el objetivo es comparar estados de salud entre
sí, de cara al establecimiento de prioridades sanitarias o sociales, se busca un nivel
de comparación abstracto y global sobre el daño que producen las enfermedades.
Por tanto, los instrumentos deben ser generales. Como norma general, es aconse-
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 153

jable incluir en el estudio tanto instrumentos específicos como genéricos. Aunque


los investigadores deberán tener en cuenta el tiempo necesario para realizar este
trabajo en condiciones habituales de práctica clínica, siempre buscando un equili-
brio entre conseguir la máxima información a su alcance y entorpecer al mínimo la
labor de los profesionales sanitarios.

Bowling (1991) muestra con detalle los instrumentos de CVRS existentes, su


contenido, características y propósito y McHorney (1999) presenta un cronograma
del desarrollo de los diferentes instrumentos de medición de CVRS, tanto genéricos
como específicos, desde los años 40 hasta finales de la década de los 90.

2.2 Propiedades psicométricas

Las características básicas que definen a un buen instrumento de medida de la


CVRS según Donovan et al. (1989) son: a) válido, en el sentido de ser capaz de
medir aquellas características que se pretende medir y no otras; b) preciso o fiable,
es decir con un mínimo error de medida; y c) sensible, o sea, capaz de detectar
cambios tanto entre diferentes individuos como en la respuesta de un mismo
individuo a lo largo del tiempo (sensibilidad al cambio o responsiveness). Los
criterios de evaluación de un instrumento de medida de la salud se han estudiado
ampliamente en el campo de la psicometría (Streiner y Norman 1992) y han sido
también aplicados concretamente en el área de CVRS (van Knippenberg y de Haes
1988 y Hays et al. 1993). A continuación presentamos un breve resumen de estos
criterios.

De las características de un instrumento de CVRS anteriormente mencionadas,


probablemente la validez es la característica más importante que debe exigirse a un
buen cuestionario. El concepto de validez se puede desglosar en tres aspectos
diferentes: validez de criterio, validez de contenido y validez de constructo. La
validez de criterio, significa que el cuestionario es adecuado al problema que se
quiere medir. Esto se comprueba comparando el instrumento con un patrón de
referencia o gold standard. Teniendo en cuenta que los instrumentos de CVRS
miden fenómenos subjetivos o abstractos, resulta difícil valorar hasta qué punto una
medición representa el fenómeno de interés, dado que no existe tal patrón de
referencia. La validez de contenido (face validity) consiste en comprobar si los
ítems en un instrumento o una dimensión concreta cubren el área que se pretende
cubrir de forma clara y precisa. Los expertos sugieren que la validez de contenido
mejora considerablemente cuando se dispone de asesoramiento de origen diverso
en el desarrollo del instrumento de CVRS (personal médico, de enfermería, asisten-
tes sociales, pacientes, etc.) (Aaronson 1989). La validez de constructo se com-
prueba comparando el instrumento con otras medidas. Por ejemplo, se comprueba
que los resultados de CVRS difieren entre grupos de individuos con diferentes
154 ESTADÍSTICA ESPAÑOLA

estados de salud, o se comprueba su correlación con resultados clínicos, radiológi-


cos o de laboratorio que representen gravedad de la enfermedad. De manera
formal, estos conceptos pueden contrastarse con técnicas estadísticas ampliamen-
te utilizadas en la psicometría para tal fin (Campbell y Fiske, 1959 y McDowell y
Newel, 1996)

La segunda de las características de un instrumento es la fiabilidad o capacidad


para medir lo mismo en repetidas ocasiones bajo las mismas condiciones. La
opción básica para medir la fiabilidad interna de un instrumento es el coeficiente
alfa de Cronbach (Cronbach, 1951). Una alternativa es el test-retest, aunque esto
puede ser difícil de llevar a la práctica en contextos como el de los ensayos clínicos.
Cuando el cuestionario no es autoadministrado hay que tener en cuenta que el
grado de acuerdo entre entrevistadores también afecta a la fiabilidad.

La tercera característica de un instrumento de CVRS es la sensibilidad al cam-


bio o responsiveness. Un instrumento de CVRS debe ser capaz de detectar cam-
bios en la CV, cuando los haya, especialmente cuando se utiliza para medir la
efectividad de un tratamiento (Guyatt et al. 1987). Existe bibliografía reciente sobre
cómo debe medirse e interpretarse la sensibilidad al cambio de un instrumento en
cada contexto (Murawski y Miederhoff 1998 y Beaton et al. 2001).

Además de las tres características básicas mencionadas, hay una cuarta que
debemos mencionar: el grado de generalización de un instrumento. En general, un
cuestionario no debe usarse en otro contexto a aquel para el cual ha sido diseñado
(de Vet et al. 2001).

2.3 Validación de la traducción y adaptación cultural

El proceso de traducción y adaptación cultural de un cuestionario ha sido tratado


con detalle en referencias diversas (Gandek y Ware, 1998). Badía et al. (1999)
realizan una excelente recopilación de los instrumentos de evaluación de la CVRS
adecuadamente traducidos al castellano. La lista incluye versiones castellanas de
instrumentos genéricos y específicos.

3. CUESTIONARIO DE SALUD SF-36

3.1 Desarrollo, validación y adaptación cultural

El cuestionario de salud SF-36 es un instrumento genérico de medición de


CVRS, que consta de 36, preguntas diseñado por Ware et al. a principios de los
noventa (Ware y Sherbourne 1992 y Ware et al. 1993). El SF-36 proporciona un
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 155

perfil del estado de salud y es aplicable tanto a pacientes como a población sana.
El cuestionario cubre 8 dimensiones, que representan los conceptos de salud
empleados con mayor frecuencia cuando se mide CVRS, así como aspectos rela-
cionados con la enfermedad y su tratamiento. Las dimensiones evaluadas son
funcionamiento físico, rol físico, dolor corporal, salud general, vitalidad, funciona-
miento social, rol emocional y salud mental del paciente. Adicionalmente, el SF-36
incluye una pregunta de transición sobre el cambio en el estado de salud general
con respecto al año anterior. Este ítem no se utiliza para el cálculo de ninguna de
las 8 dimensiones principales. Las puntuaciones de las 8 dimensiones del SF-36
están ordenadas de forma que a mayor valor mejor es el estado de salud. Para
cada dimensión, los ítems son codificados, agregados y transformados en una
escala con un rango de 0 (el peor estado de salud) a 100 (el mejor estado de
salud). Además, el cuestionario permite el cálculo de dos puntuaciones resumen,
física y mental, mediante la suma ponderada de las puntuaciones de las ocho
dimensiones principales. Los pesos incorporados en el cálculo de las puntuaciones
resumen se obtienen a partir de una población de referencia (Ware et al. 1994). La
tabla 1 muestra las características de las ocho dimensiones principales, las dos
resumen y la pregunta de transición del cuestionario de salud SF-36. El SF-36 está
dirigido a personas de 14 o más años de edad y preferentemente debe ser auto-
administrado, aunque también es aceptable la administración mediante entrevista
personal o telefónica.
Tabla 1
CARACTERÍSTICAS PRINCIPALES DEL CUESTIONARIO DE SALUD SF-36
Nº ÍTEMS Nº NIVELES PUNTUACIÓN(1)
Funcionamiento físico 10 21 0 − 100
Rol físico 4 5 0 − 100
Dolor corporal 2 11 0 − 100
Salud general 5 21 0 − 100
Vitalidad 4 21 0 − 100
Funcionamiento social 2 9 0 − 100
Rol emocional 3 4 0 − 100
Salud mental 5 26 0 − 100
Transición 1 5 −
Resumen Físico 35 − 50 (10)
Resumen Mental 35 − 50 (10)
(1) Las puntuaciones 0 − 100 tienen ese rango y se interpretan como el peor o mejor estado
de salud, respectivamente; en las puntuaciones 50 (10) la población de referencia tiene una
media de 50 con una desviación estándar de 10, por lo que valores superiores o inferiores a
50 indican un mejor o peor estado de salud, respectivamente, que la población de referencia.
156 ESTADÍSTICA ESPAÑOLA

Ware et al. (1993) incluyen estudios de validación del SF-36 como herramienta
para medir CVRS. Además, se han publicado diversos estudios de validación del
SF-36 por otros autores, que lo comparan con otros instrumentos de medición de
salud más generales y complejos (Brazier et al. 1992 y Stansfeld et al. 1997). Otros
autores han utilizado el SF-36 en pacientes enfermos para medir su capacidad de
discriminar entre diferentes diagnósticos o niveles de gravedad, validando así el
instrumento en diferentes diagnósticos. Algunos ejemplos son: Harper et al. (1997)
para la Enfermedad Pulmonar Obstructuva Crónica (EPOC), Dawson et al. (1996)
para prótesis total de cadera y Wachtel et al. (1992) para infección por Virus de
Inmunodeficiencia Humana (VIH). McDowell y Newell (1996) realizan una exhausti-
va descripción del desarrollo del SF-36, incluyendo comentarios críticos. Ware
(2000) ofrece un resumen actualizado y bien documentado de aspectos diversos
relacionados con el cuestionario de salud SF-36. Más recientemente, el SF-36 ha
sido calificado como la medida de salud genérica basada en el paciente más eva-
luada en un estudio bibliográfico sobre el incremento de las medidas de CVRS
publicado en el British Medical Journal (Garratt et al. 2002). Sus buenas propieda-
des psicométricas, que han sido evaluadas en más de 400 artículos, y la multitud
de estudios ya realizados, lo convierten en uno de los instrumentos con mayor
potencial y aceptación en el campo de la CVRS.
El cuestionario SF-36 ha sido traducido en más de 50 países como parte del In-
ternational Quality of Life Assessment (IQOLA) Project (Aaronson et al. 1992, Ware
et al. 1995 y 1996a y Gandek y Ware 1998). Este proyecto incluye investigadores
de 14 países, incluyendo España. Las adaptaciones validadas y publicadas por el
proyecto IQOLA incluyen el castellano (Alonso et al. 1995), el francés (Perneger et
al. 1995), el alemán (Bullinger 1995), el sueco (Sullivan et al. 1995) y el italiano
(Apolone et al. 1997), así como diferentes variaciones del inglés para su uso en
Canadá, Reino Unido, Australia y Nueva Zelanda (McCallum 1995). Una década
después de su creación, Vilagut et al. (2005) realizan una revisión crítica del conte-
nido, propiedades métricas y nuevos desarrollos de la versión castellana del SF-36.
Asimismo, existe una versión en catalán, que fue desarrollada a partir de la caste-
llana. Recientemente, el SF-36 ha sido traducido al euskera y su validez contrasta-
da, a partir de la versión original inglesa, siguiendo un método similar al utilizado
para la versión castellana (González et al. 2005). Actualmente existen más de 500
publicaciones que usan traducciones o adaptaciones al inglés del SF-36.

En 1996 se desarrolló la versión 2.0 del cuestionario original SF-36 con el obje-
tivo, entre otros, de mejorar las características métricas de las escalas de rol físico
y emocional (Ware et al. 2000). Actualmente ya se ha desarrollado la versión 2.0
del cuestionario en castellano, aunque por el momento no hay datos sobre su
validación, ni estudios comparativos con la versión original (Vilagut et al. 2005).
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 157

La página web del SF-36 (http://www.sf-36.org) ofrece información detallada y


periódicamente actualizada sobre el cuestionario de salud, así como un foro de
discusión de antiguas y nuevas publicaciones e interpretación de resultados.

3.2 El SF-36 como medida de CVRS

Durante la última década, gran parte de la investigación en CVRS se ha concen-


trado en la evaluación de la CVRS como medida de resultado en ensayos clínicos
(Fairclough 2002). El análisis estadístico de datos de CVRS en el ámbito de los
ensayos clínicos está también ampliamente documentado (Olschewski y Schuma-
cher 1990, Cox et al. 1992, Fayers y Machin 2000 y Mesbah et al. 2002). Asimismo,
la información combinada sobre calidad de vida y cantidad de vida en lo que se
denomina años de vida ajustados por calidad de vida se ha utilizado ampliamente
en la evaluación económica y la toma de decisiones en la asignación de recursos
sanitarios (Torrance 1987). Sin embargo, existe mucha menos literatura publicada
en el ámbito de medición de resultados de CVRS en poblaciones tanto sanas como
enfermas. Hay muchos contextos en los cuales no es posible diseñar un experi-
mento en forma de ensayo clínico y, por tanto, donde la decisión sobre el tratamien-
to a seguir se toma basándose en estudios observacionales donde la CVRS se
mide como resultado. Los estudios observacionales donde se recoge la CVRS
tienen como objetivo, no sólo medir y comparar la CVRS entre las diferentes pobla-
ciones, sino también estudiar la relación de la CVRS y su evolución con otras
características del sujeto o la enfermedad. En este tipo de estudios no experimenta-
les hay infinidad de variables que no pueden ser controladas por el investigador en
la fase de diseño, como lo son en los ensayos clínicos. Es en este contexto donde
se centra este trabajo, utilizando como medida de la CVRS el cuestionario de salud
SF-36. El análisis de los datos obtenidos en estudios no experimentales de CVRS
se resume en tres etapas: en primer lugar se pretende identificar las variables que
influyen sobre la CVRS de los pacientes; en segundo lugar, se pretende realizar un
análisis multivariante de los diversos factores que influyen en la CVRS, incluyendo
en el modelo todos aquellos factores susceptibles de modificar la calidad de vida
detectados en el primer paso; y en tercer lugar estudiar la evolución de la CVRS
durante el periodo de seguimiento del estudio, realizando un análisis de medidas
repetidas sobre el modelo seleccionado en el paso anterior.

3.3 Análisis estadístico del SF-36 como variable dependiente

La lista de publicaciones sobre estudios no experimentales de CVRS en los cua-


les se ha utilizado el cuestionario SF-36 como variable dependiente es muy larga.
Aquí hemos revisado algunos de estos trabajos con unos objetivos similares a los
158 ESTADÍSTICA ESPAÑOLA

mencionados en la sección 3.2, resumiendo los métodos de análisis estadístico que


se han utilizado en los mismos.

Algunos autores realizan únicamente un análisis de la varianza simple. Por


ejemplo, Wilson et al. (1999) comparan la CVRS en personas con diferentes niveles
de consumo de tabaco; Laforge et al. (1999) comparan la CVRS en función del
ejercicio físico realizado; Hassan et al. (1998) comparan la CVRS en pacientes con
fatiga crónica y dos niveles de inmunología intracelular. Otros autores incluyen un
análisis múltiple de la varianza o un análisis de la covarianza y realizan un análisis
estadístico clásico. Por ejemplo, Mozes et al. (1999) analizan el SF-36 en función
de los síntomas urinarios ajustando por otras variables socio-demográficas y clíni-
cas en ancianos; Wahl et al. (1999) analizan el SF-36 en función del grado de
disfunción ajustando por variables socio-demográficas y clínicas en pacientes con
soriasis; Leidy et al. (1999) analizan el SF-36 en función de la frecuencia de las
convulsiones, tiempo transcurrido desde la última convulsión, sexo, edad y enfer-
medades asociadas en pacientes con epilepsia; Lee et al. (1997) comparan la
CVRS de pacientes con visión borrosa con pacientes con visión normal ajustando
por variables socio-demográficas y clínicas; Mahler y Mackowiak (1995) analizan el
SF-36 en función del nivel de disnea ajustando por otras variables clínicas en
pacientes con EPOC; Revicki et al. (1995) comparan la CVRS en pacientes con
dos niveles de infección por VIH ajustando por variables socio-demográficas y
clínicas; Lyons et al. (1994) comparan la CVRS de pacientes con 11 diagnósticos
comunes ajustando por edad y sexo; y Jacobson et al. (1994) comparan la CVRS
en pacientes con dos niveles de diabetes ajustando por número y gravedad de las
complicaciones debidas a la diabetes. Por último, hay una gran cantidad de traba-
jos con un diseño longitudinal, que estudian la influencia de diversos factores en la
evolución de la CVRS por medio de un análisis de la varianza de medidas repeti-
das, como, por ejemplo, Coulehan et al. (1997) estudian el efecto del tratamiento en
la evolución de la CVRS en pacientes con trastorno de depresión; Komaroff et al.
(1996) comparan la evolución de la CVRS en pacientes con síndrome de fatiga
crónica con otros seis diagnósticos; y Bubien et al. (1996) estudian la evolución de
la CVRS en pacientes con arritmias recurrentes.

Todas las técnicas estadísticas mencionadas hasta el momento son casos parti-
culares del modelo de Regresión Lineal Múltiple (RLM), el cual asume que la
distribución de la variable dependiente es normal. Algunos de los trabajos citados
mencionan en sus limitaciones el hecho de que la distribución de ninguna de las
áreas del SF-36 sea normal. Parte de los trabajos con un diseño longitudinal han
utilizado como variable dependiente el cambio en CVRS, cuya distribución se
acerca más a la normalidad exigida en las técnicas de análisis clásicas. Por ejem-
plo, Hemingway et al. (1997) han estudiado la evolución de la CVRS en una gran
cohorte de funcionarios; Anderson et al. (1998) han estudiado la evolución de la
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 159

CVRS comparando el SF-36 y el Quality of Well Being Scale (QWB), en pacientes


con enfermedades graves, SIDA y cáncer, entre otras; Ware et al. (1996b) han
comparado la evolución de la CVRS en pacientes crónicos tratados en sistemas de
salud privados y públicos; Tsevat et al. (1996) han comparado la evolución de la
CVRS en pacientes con infección por VIH asintomáticos, sintomáticos pero sin SIDA
y con SIDA; Patrick et al. (1995) han estudiado la evolución de la CVRS en pacientes
con ciática y dolor lumbar; Mangione et al. (1994) han estudiado el efecto de la
intervención de cataratas en la evolución de la CVRS; Quintana et al. (2003) han
estudiado los factores predictivos de mejoría de la CVRS en pacientes intervenidos
de colecistectomía; Padierna et al. (2002) han estudiado la evolución de la CVRS en
pacientes en tratamiento por trastornos de alimentación; y Quintana et al. (2006) han
estudiado también la relación entre la adecuación de la indicación de prótesis total de
cadera o rodilla y la mejoría de la CVRS en pacientes con osteoartrosis.
El trabajo de Cox et al. (1992) hace referencia al análisis estadístico de datos de
CVRS, recomendando técnicas de análisis simples pero robustas, y asumiendo
normalidad de la variable dependiente. Aunque este trabajo se concentra en el
ámbito de los ensayos clínicos, este tipo de recomendación es extensible a otros
contextos. Olschewski et al. (1992, p. 385), en la discusión que realizan del trabajo
de Cox et al. (1992), proponen alternativas basadas en los modelos lineales gene-
ralizados. Lall et al. (2002) publican una revisión sobre el uso de modelos de regre-
sión ordinal en el análisis de datos de CVRS. Esta alternativa exige, en muchos
casos, la categorización de la puntuación de CVRS, inicialmente diseñada como
continua. Más concretamente, Walters et al. (2001) han usado varios modelos de
regresión ordinales y los han comparado con métodos estadísticos convencionales
y también con métodos bootstrap para analizar la dimensión de rol emocional del
SF-36. Este trabajo concluye que una escala debe ser tratada como continua si el
número de categorías es mayor o igual que 7 y como discreta en otro caso. El uso
de métodos bootstrap en el análisis del SF-36 ha sido tratado con profundidad por
Walters y Campbell (2005). Desde una perspectiva clínica es importante tener
mediciones estándar de las diferentes dimensiones de la CVRS, lo cual se traduce
en un instrumento multidimensional de medición de la CVRS. Por tanto, es preferi-
ble utilizar una técnica de análisis estadístico común a todas las dimensiones del
instrumento de CVRS seleccionado, independientemente de su distribución de
probabilidad. Rose et al. (1999) han tratado los problemas estadísticos encontrados
en el análisis del SF-36, entre ellos la no normalidad de las áreas de CVRS.

Cheung et al. (2004) han utilizado la distribución beta para modelizar las pun-
tuaciones de las 8 dimensiones del SF-36 divididas por 100. El objetivo de este
trabajo es mostrar diferencias en la media y la varianza de las puntuaciones de CV
entre varios grupos, de forma que se incluye el efecto de algunas covariables en la
estimación de los parámetros de la distribución beta.
160 ESTADÍSTICA ESPAÑOLA

Más allá de los trabajos citados, no hemos encontrado en la literatura ningún


trabajo cuyo objetivo se centre en la distribución de probabilidad de las puntuacio-
nes del cuestionario de salud SF-36 o en la robustez de las técnicas utilizadas en el
análisis bajo supuestos de normalidad que no se verifican. Lo que, tal y como
ilustramos en la sección 4, es un tema relevante dentro del análisis de este tipo de
datos.

4. EJEMPLOS

Utilizaremos muestras de sujetos sanos y con diferentes patologías para ilustrar


las distintas posibles hipótesis sobre la distribución empírica de las áreas de CVRS
del cuestionario de salud SF-36. Se dispone de datos del SF-36, además de la
edad y el sexo, de un total de 8.989 individuos. Las muestras que se presentan a
continuación, en general, no provienen de estudios con un diseño aleatorio, por
tanto, las conclusiones obtenidas en ningún caso son generalizables a la población
general. Los diferentes sesgos derivados de un diseño no experimental, entre ellos
el sesgo de información y la falta de respuesta, deben ser considerados antes de
obtener conclusiones a partir de los datos que aquí se presentan. Sin embargo, el
objetivo de este trabajo, en ningún caso es sacar conclusiones clínicas de los datos
presentados, ni su generalización a la población general, ni a poblaciones específi-
cas de las cuales las muestras pudieran ser representativas. Tal y como se ha
planteado anteriormente, el objetivo de este trabajo al mostrar estos ejemplos es,
por un lado, ilustrar que las puntuaciones del cuestionario de salud SF-36 no siguen
una distribución normal y, por otro lado, destacar los posibles errores derivados de
utilizar técnicas de análisis que exigen una hipótesis de normalidad en estas cir-
cunstancias.
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 161

Tabla 2
EDAD Y SEXO DE LOS GRUPOS DE SUJETOS ANALIZADOS
GRUPO n EDAD: MEDIA (DE) SEXO: N(%) H
Población general 3.953 47,15 (18,97) 1.670 (42,2%)
Donantes de sangre 106 35,83 (13,22) 54 (50,9%)
HTA 20 62,05 (8,54) 16 (80,0%)
TA 2.98 23,10 (7,03) 6 (2,0%)
VIH 40 35,10 (4,52) 25 (62,5%)
EIIC 165 41,53 (14,88) 93 (56,4%)
Trasplante de hígado 139 54,30 (13,27) 90 (64,7%)
Colecistectomía 1.123 57,75 (14,43) 310 (27,6%)
Histerectomía 649 55,82 (13,26) 0 (0%)
PTC 1.266 67,34 (10,73) 669 (52,8%)
PTR 1.113 71,34 (7,17) 309 (27,8%)
Cáncer de pulmón 117 64,45 (10,23) 112 (95,7%)
Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hombre (H), Hiperten-
sión arterial (HTA), Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana
(VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y
Prótesis Total de Rodilla (PTR).

La tabla 2 muestra un resumen de los grupos de sujetos con los que vamos a
realizar los análisis. Los participantes se han reclutado de diversos estudios lleva-
dos a cabo en la Unidad de Investigación del hospital Galdakao perteneciente al
Sistema Vasco de Salud – Osakidetza, los cuales pasamos a detallar a continua-
ción. Los pacientes con Hipertensión Arterial (HTA) o con VIH, así como los donan-
tes de sangre son individuos que han participado en un estudio de validación del
Cuestionario de Salud SF-36 en euskera (González et al. 2005). Los pacientes con
cáncer de pulmón han participado en un estudio sobre la CV de los pacientes con
esta patología (Etxebarria et al. 2001). Los pacientes con Trastornos de Alimenta-
ción (TA) provienen de dos muestras independientes; aproximadamente dos tercios
(197) han participado en un estudio de seguimiento de la CVRS (Padierna et al.
2002), y el resto (101) han participado en el estudio de validación del Cuestionario
de Salud SF-36 en euskera anteriormente mencionado (González et al. 2005). Los
pacientes intervenidos de colecistectomía, Prótesis Total de Cadera (PTC) y Próte-
sis Total de Rodilla (PTR) son pacientes que estaban en lista de espera para
alguna de estas intervenciones quirúrgicas, reclutados para un estudio de adecua-
ción de la intervención en cuestión, en el cual se midió también la CVRS (Quintana
et al. 2005 y 2006). De la misma forma y con un objetivo similar a los anteriores se
reclutaron los pacientes intervenidos de histerectomía, aunque los resultados
obtenidos no han sido publicados hasta el momento. Los pacientes con Enferme-
dad Inflamatoria Intestinal Crónica (EIIC) fueron reclutados en un estudio de medi-
162 ESTADÍSTICA ESPAÑOLA

ción de la CV de este tipo de pacientes con distintos instrumentos de medida (datos


sin publicar). Los pacientes de trasplante de hígado se reclutaron de la lista de
espera de trasplante en un estudio con objetivos más amplios que incluía la medi-
ción de la CVRS (datos sin publicar). Los datos relativos a la población general se
han recogido de la Encuesta de Salud realizada por el Gobierno Vasco en 1996
(Anitua y Quintana 1999).

Los análisis estadísticos se han realizado con SAS System for Windows Version
8.02 (SAS Institute Inc. 1994) y las figuras se han obtenido con S-Plus 2000 (Math-
Soft Inc. 1999).

El nivel de significación elegido para la realización de los contrastes de hipótesis


es de α = 0,05.

Tabla 3
CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.
ÁREAS FÍSICAS DEL SF-36
(Continúa)
GRUPO FUNCIONAMIENTO ROL FÍSICO
FÍSICO
n Media DE Media DE
Población general 3.953 86,66 21,50 86,43 30,92
Donantes de sangre 106 92,88 13,61 91,67 20,41
HTA 20 74,63 24,17 80,88 20,78
TA 298 85,40 19,62 57,31 40,99
VIH 40 83,01 18,99 63,96 37,00
EIIC 165 84,82 19,22 66,06 42,23
Trasplante de hígado 139 59,96 26,99 30,74 40,83
Colecistectomía 1.123 72,16 24,90 52,78 43,88
Histerectomía 649 73,91 24,62 59,73 42,06
PTC 1.266 21,86 21,60 12,63 28,99
PTR 1.113 24,27 20,96 15,78 30,53
Cáncer de pulmón 117 55,21 27,25 32,69 42,23
Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hipertensión arterial
(HTA), Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana (VIH), Enferme-
dad Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y Prótesis Total de
Rodilla (PTR).
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 163

Tabla 3
CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.
ÁREAS FÍSICAS DEL SF-36
(Conclusión)
GRUPO DOLOR CORPORAL SALUD GENERAL
n Media DE Media DE
Población general 3.953 78,83 25,30 66,54 19,73
Donantes de sangre 106 88,08 18,16 77,20 15,99
HTA 20 79,05 17,50 64,98 14,36
TA 298 65,46 28,57 50,86 21,81
VIH 40 74,70 24,59 47,80 19,63
EIIC 165 67,50 28,39 50,20 22,72
Trasplante de hígado 139 68,18 32,00 36,58 18,85
Colecistectomía 1.123 53,58 28,83 53,73 20,48
Histerectomía 649 65,20 27,64 61,29 20,30
PTC 1.266 31,62 26,15 58,64 20,63
PTR 1.113 36,60 27,21 57,12 20,31
Cáncer de pulmón 117 55,82 30,94 43,28 19,59
Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hipertensión arterial
(HTA), Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad
Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y Prótesis Total de Rodilla
(PTR).
164 ESTADÍSTICA ESPAÑOLA

Tabla 4

CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


ÁREAS MENTALES DEL SF-36
GRUPO VITALIDAD FUNCIONAMIENTO
SOCIAL
n Media DE Media DE
Población general 3.953 64,51 19,38 89,47 19,02
Donantes de sangre 106 72,31 15,07 88,21 17,06
HTA 20 72,31 15,82 77,63 20,66
TA 298 47,38 21,70 56,65 28,42
VIH 40 61,67 20,22 72,81 21,35
EIIC 165 58,55 25,70 78,56 26,51
Trasplante de hígado 139 49,36 28,42 61,51 33,41
Colecistectomía 1.123 50,86 24,44 73,10 26,27
Histerectomía 649 53,20 23,65 78,27 24,04
PTC 1.266 42,69 24,18 55,21 31,83
PTR 1.113 43,44 24,08 57,83 31,05
Cáncer de pulmón 117 47,05 24,78 68,70 31,68

GRUPO ROL EMOCIONAL SALUD MENTAL


n Media DE Media DE
Población general 3.953 91,77 24,66 71,14 18,05
Donantes de sangre 106 91,03 20,37 79,69 14,45
HTA 20 84,31 23,91 74,39 14,11
TA 298 46,58 42,16 45,87 22,71
VIH 40 60,83 43,94 62,98 19,37
EIIC 165 78,59 38,60 67,10 21,61
Trasplante de hígado 139 74,63 40,91 67,23 20,77
Colecistectomía 1.123 70,16 41,89 61,53 22,91
Histerectomía 649 73,71 39,78 60,52 21,42
PTC 1.266 69,53 43,44 60,11 23,80
PTR 1.113 66,89 45,04 59,88 23,83
Cáncer de pulmón 117 66,67 42,21 60,03 24,92

Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hipertensión arterial (HTA),
Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad
Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y Prótesis Total de Rodilla
(PTR).
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 165

Las tablas 3 y 4 muestran la media y la desviación estándar de cada una de las


8 áreas del SF-36 en cada una de las muestras analizadas. Las figuras 1 a 8
muestran la distribución de las 8 áreas del SF-36 en cada una de las muestras
analizadas, así como la curva de ajuste a una distribución normal, donde los pará-
metros se han estimado utilizando los valores de las tablas 3 y 4.

Figura 1
FUNCIONAMIENTO FÍSICO DE LOS PACIENTES EN LAS MUESTRAS ANALIZA-
DAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSER-
VADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 1 00

P obl ac i ón no rm al (n=395 3) Donantes de s angre ( n=106) Hi pertens i ó n arteri al (n= 20) Tras tor nos al i m enti c i os (n=29 8)
CVRS: Fu n cio n a mie n to Físico

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 1 00

VIH (n=40 ) EIIC (n= 165) Tra s pl ante de h igado (n=1 39) Col ec i s tec to m ía (n=1123 )

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 1 00

Hi s te rec tom ía (n= 649) Prótes i s total de c adera (n=1 266) Prót es is total de ro d i l l a (n=1 113) Cánc er de pul m ón (n =117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
166 ESTADÍSTICA ESPAÑOLA

Figura 2
ROL FÍSICO DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS
BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y
LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Población normal (n=3953) Donantes de sangre (n=106) Hipertensión arterial (n=20) Trastornos alimenticios (n=298)
CVRS: Rol Físico

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

VIH (n=40) EIIC (n=165) Trasplante de higado (n=139) Colecistectomía (n=1123)

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Histerectomía (n=649) Prótesis total de cadera (n=1266) Prótesis total de rodilla (n=1113) Cáncer de pulmón (n=117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 167

Figura 3
DOLOR CORPORAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.
LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSER-
VADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Población normal (n=3953) Donantes de sangre (n=106) Hipertensión arterial (n=20) Trastornos alimenticios (n=298)
CVRS: Dolor Corporal

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


VIH(n=40) EIIC(n=165) Trasplante de higado (n=139) Colecistectomía (n=1123)

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Histerectomía (n=649) Prótesis total de cadera (n=1266) Prótesis total de rodilla (n=1113) Cáncer de pulmón (n=117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
168 ESTADÍSTICA ESPAÑOLA

Figura 4
SALUD GENERAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.
LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSER-
VADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Poblaci ón normal (n=3953) Donantes de sangre (n=106) Hipertensión arteri al (n=20) Trastornos alimenticios (n=298)
CVRS: Salud General

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


VIH(n=40) EIIC(n=165) Traspl ante de higado (n=139) Coleci stectomía (n=1123)

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Histerectomía (n=649) Prótesis total de cadera (n=1266) Prótesis total de rodi lla (n=1113) Cáncer de pulmón (n=117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 169

Figura 5
VITALIDAD DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS
BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y
LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

Población normal (n=3953) Donantes de sangre (n=106) Hipertensi ón arterial (n=20) Trastornos alimentici os (n=298)
CVRS: Vitalida d

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

VIH (n=40) EIIC(n=165) Trasplante de higado (n=139) Col eci stectomía (n=1123)

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

Histerectomía (n=649) Prótesis total de cadera (n=1266) Prótesi s total de rodill a (n=1113) Cáncer de pulmón (n=117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
170 ESTADÍSTICA ESPAÑOLA

Figura 6
FUNCIONAMIENTO SOCIAL DE LOS PACIENTES EN LAS MUESTRAS ANA-
LIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN
OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN
NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

Población normal (n=3953) Donantes de sangre (n=106) Hipertensión arterial (n=20) Trastornos alimenticios (n=298)
CVRS: Funcionamiento Social

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

VIH (n=40) EIIC (n=165) Trasplante de higado (n=139) Colecistectomía (n=1123)

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Histerectomía (n=649) Prótesis total de cadera (n=1266) Prótesis total de rodilla (n=1113) Cáncer de pulmón (n=117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 171

Figura 7
ROL EMOCIONAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.
LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSER-
VADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

Población normal (n=3953) Donantes de sangre (n=106) Hipertensi ón arterial (n=20) Trastornos alimenticios (n=298)
CVRS: Rol Emocion al

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

VIH (n=40) EIIC(n=165) Trasplante de higado (n=139) Colec istectomía (n=1123)

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100


Histerectomía (n=649) Prótesis total de cadera (n=1266) Prótesis total de rodilla (n=1113) Cáncer de pulmón (n=117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
172 ESTADÍSTICA ESPAÑOLA

Figura 8
SALUD MENTAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.
LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSER-
VADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

Poblaci ón normal (n=3953) Donantes de sangre (n=106) Hipertensi ón arterial (n=20) Trastornos alimenticios (n=298)
CVRS: Salud Mental

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

VIH (n=40) EIIC (n=165) Trasplante de higado (n=139) Col ecistectomía (n=1123)

0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 80 100

Histerectomía (n=649) Prótesis total de cadera (n=1266) Prótesi s total de rodil la (n=1113) Cáncer de pulmón (n=117)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crónica (EIIC).
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 173

En funcionamiento físico, vemos una distribución muy sesgada a la izquierda


(población general, donantes de sangre, TA, VIH, EIIC, colecistectomía e histerec-
tomía) o a la derecha (PTC y PTR), dependiendo de la patología, así como otros
grupos con una distribución muy plana (cáncer de pulmón y trasplante de hígado).
El rol físico sigue una distribución claramente discreta, con 5 categorías en la
mayoría de los grupos. Además, se observa que ninguna de estas distribuciones
tiene forma de campana, teniendo algunas de ellas justamente lo contrario, una
forma de campana invertida. En dolor corporal, se observan todo tipo de variacio-
nes de la distribución empírica, sesgadas a la izquierda (población general, donan-
tes, HTA, trasplante de hígado, EIIC y VIH), sesgadas a la derecha (PTC y PTR) y
distribuciones muy planas (cáncer de pulmón, colecistectomía y TA). En salud
general es donde se observa una mayor proporción de muestras con distribución en
forma de campana, con mayor o menor sesgo, dependiendo del impacto que la
enfermedad tiene en la salud general, pero en cualquier caso, su distribución
parece aceptablemente normal. La vitalidad es un área en la que se observan
distribuciones aceptablemente normales, con una forma acampanada en muchos
de los casos, aunque se repite el patrón observado en el dolor corporal, con algu-
nos de los grupos con una distribución muy plana (trasplante de hígado y EIIC). El
funcionamiento social muestra una distribución discreta que, tal y como se observa
en la tabla 1, consta de 9 posibles valores. Esto se refleja en el hecho de que, al
dividir la escala de 0 a 100 en 10 intervalos, ningún individuo de los 8989 que
forman la muestra total toma valores en el intervalo (50, 60). Al igual que lo que
hemos mencionado para el dolor corporal y la vitalidad, algunos grupos, como TA,
PTC y PTR, muestran una distribución muy plana. El rol emocional sigue un patrón
similar al del rol físico, una distribución discreta con 4 categorías en la mayoría de
los grupos y ninguno de ellos tiene forma acampanada. La salud mental muestra
distribuciones aceptablemente normales, con una forma acampanada en muchos
de los casos, aunque con colas mucho más pesadas de lo que se espera en una
distribución normal.
El contraste de bondad de ajuste a la distribución normal de Kolmogorov-
Smirnov (corrección de Lilliefors para el caso concreto de normalidad), rechaza la
normalidad en todas las áreas y en todas las muestras analizadas al nivel de
significación establecido de α = 0,05, excepto en el área de funcionamiento físico
(para la muestra de HTA), en el área de salud general (para las muestras de HTA,
VIH y trasplante de hígado) y en el área de vitalidad (para las muestras de VIH y
cáncer de pulmón).

El problema reside, por una parte, en el sesgo. Así, se observan distribuciones


muy sesgadas a la izquierda en general en todas las áreas, para la muestra de
174 ESTADÍSTICA ESPAÑOLA

población general o la muestra de donantes de sangre (individuos sanos); lo mismo


ocurre en áreas como el funcionamiento físico en las muestras de TA, VIH o EIIC
(pacientes jóvenes). Por otro lado, las mismas áreas muestran distribuciones muy
sesgadas a la derecha en individuos en lista de espera para PTC o PTR (pacientes
mayores). Esto muestra el poder de discriminación que tiene el instrumento en
diferentes diagnósticos. Otro de los problemas que se observa es que muchas de
las áreas muestran distribuciones muy planas en algunos, e incluso muchos de los
grupos, como el dolor corporal y la vitalidad. Además se observa un problema de
continuidad de la escala en las áreas de rol físico, rol emocional y funcionamiento
social. En las dos primeras la escala es claramente discreta, mientras que en la
tercera hay intervalos de la escala que no se cubren en ningún caso. Por último,
muchas de las escalas muestran un efecto techo y/o suelo, esto quiere decir que un
porcentaje muy alto de los individuos se sitúa en los valores más altos o más bajos
de la escala, respectivamente. Así, la distribución de las áreas rol físico y rol emo-
cional muestra, en ocasiones, un efecto techo, en otras ocasiones, un efecto suelo,
y, en algunas otras ocasiones, ambas, ofreciendo una forma de campana invertida.
Siguiendo el criterio de Walters et al. (2000) citado en la sección 3.3, una escala
debe ser tratada como continua si el número de categorías es mayor o igual que 7 y
como discreta en otro caso. Se utiliza el criterio en el análisis de muestras concre-
tas de pacientes en los que se ha medido la CVRS con el SF-36 y otras variables
susceptibles de influir en la CVRS. Vamos a mostrar casos continuos y discretos de
CVRS, y se van a analizar con técnicas de análisis distintas, adecuadas a cada
situación. Los resultados obtenidos se utilizan para ilustrar las diferentes alternati-
vas de análisis de datos del SF-36 y su interpretación, con las limitaciones mencio-
nadas previamente, en el ámbito clínico.

El dolor y la limitación física son parámetros muy importantes a tener en cuenta


en pacientes con osteoartrosis de cadera y/o rodilla, debido al impacto que ambas
tienen en la CVRS de estos pacientes (Quintana et al. 2006). Las áreas de dolor
corporal y funcionamiento físico del SF-36 miden el impacto que el dolor y la limita-
ción física tienen en la CVRS. Como podemos observar en la tabla 1, estas áreas
tienen 11 y 21 niveles, respectivamente, por tanto ambas se analizan como varia-
bles continuas. Así, se ha utilizado el modelo de regresión lineal múltiple para
estudiar la influencia de variables sociodemográficas en el dolor corporal y el
funcionamiento físico de pacientes con osteoartrosis en lista de espera para ser
intervenidos de PTC en alguno de los hospitales de la Comunidad Autónoma
Vasca. Para este análisis se han utilizado los pacientes de la muestra que aquí se
presenta, para los cuales se disponía de las siguientes variables: fecha de naci-
miento, sexo, fecha de indicación de la intervención, fecha de la intervención, nivel
de estudios, situación laboral, estado civil y situación de convivencia familiar. Estas
son las variables destacadas por los expertos en el área como factores susceptibles
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 175

de influir en la CVRS de los pacientes con osteoartrosis que van a ser intervenidos
de PTC. Tras un análisis descriptivo y univariante exhaustivo de los datos recogi-
dos, se han recodificado algunas de las variables originales hasta obtener las
versiones de las covariables que finalmente se consideran en el análisis. La edad
se ha calculado a partir de la fecha de nacimiento y se ha considerado como varia-
ble continua, medida en años y el tiempo de permanencia en lista de espera se ha
obtenido de la diferencia entre la fecha de indicación de la intervención y la fecha
de la intervención. El nivel de estudios se ha agrupado en: ninguno, primarios, y
secundarios o más. La situación laboral se ha categorizado como laboralmente
activo o inactivo, incluyendo este último grupo a las amas de casa. El estado civil y
la situación de convivencia familiar se han unido para crear una nueva variable
categorizada en tres niveles de la siguiente manera: casado o vive en pareja;
soltero, separado o viudo pero que vive acompañado o en residencia; y soltero,
separado o viudo que vive solo. Las variables nominales han sido introducidas en el
modelo mediante variables indicador. Sólamente se dispone de datos sociodemo-
gráficos completos de 784 de los 1.266 individuos que componen la muestra inicial.
El método de estimación utilizado para el modelo de regresión lineal planteado ha
sido el de máxima verosimilitud, basado en la hipótesis de distribución normal. Sin
embargo, y teniendo en cuenta que ninguna de estas dos áreas del SF-36 se ajusta
a una distribución normal, se ha utilizado también el método bootstrap (Efron y
Tibshirani 1993 y Davison y Hinkley 1997), método de distribución libre, donde esta
hipótesis no es necesaria en la estimación de los coeficientes del modelo. Basán-
donos en las hipótesis que disponemos, el método de estimación correcto sería el
bootstrap. El objetivo de utilizar ambos métodos es comprobar la influencia del
incumplimiento de la hipótesis de normalidad en los resultados obtenidos y, conse-
cuentemente, la robustez del método de estimación máximo verosímil bajo el
supuesto erróneo de normalidad. Además, tal y como puede observarse en las
figuras 1 y 3, ambas áreas se diferencian en la magnitud del sesgo, el área de dolor
corporal, aún no siendo simétrica, tiene un sesgo moderado (coeficiente de asime-
tría de 0,8757), mientras que el área de funcionamiento físico tiene un sesgo más
pronunciado (coeficiente de asimetría de 1,4582). La tabla 5 resume los resultados
obtenidos para estas dos áreas del SF-36.
176 ESTADÍSTICA ESPAÑOLA

Tabla 5
ESTIMACIONES DE LOS COEFICIENTES Y SUS INTERVALOS DE CONFIANZA AL
95% PARA UN MODELO DE REGRESIÓN LINEAL MÚLTIPLE OBTENIDOS MEDIAN-
TE MÁXIMA VEROSIMILITUD Y BOOTSTRAP PARA LAS DIMENSIONES DE
FUNCIONAMIENTO FÍSICO Y DOLOR CORPORAL DEL SF-36 EN UNA MUESTRA
DE 784 PACIENTES CON DIAGNÓSTICO DE OSTEOARTROSIS EN LISTA DE
ESPERA PARA INTERVENCIÓN DE PRÓTESIS TOTAL DE CADERA
(Continúa)
VARIABLES MÁXIMA
INDEPENDIENTES VEROSIMILITUD
Coeficiente IC 95%
Funcionamiento físico:
Intercepto 34,063 (20,196, 47,929)
Edad (años) −0,143 (−0,339, 0,052)
Tiempo de espera (días) 0,009 (−0,006, 0,024)
Mujer −5,929 (−9,177, −2,681)
Estudios:
– Ninguno −6,631 (−12,176, −1,087)
– Primarios −6,084 (−10,663, −1,505)
Trabajador inactivo 5,863 (−1,221, 12,946)
Situación familiar:
– Casado −1,867 (−7,052, 3,317)
– Soltero/vive acompañado 0,016 (−5,825, 5,857)
Dolor Corporal
Intercepto 23,770 (6,849, 40,691)
Edad (años) 0,326 (0,088, 0,565)
Tiempo de espera (días) 0,003 (−0,015, 0,022)
Mujer −7,134 (−11,097, −3,172)
Estudios:
– Ninguno −9,924 (−16,665, −3,183)
– Primarios −5,605 (−11,168, −0,041)
Trabajador inactivo −1,817 (−10,470, 6,835)
Situación familiar:
– Casado −5,242 (−11,522, 1,039)
– Soltero/vive acompañado −3,607 (−10, 581, 3,583)
Se ha utilizado la abreviatura de IC: Intervalo de Confianza
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 177

Tabla 5
ESTIMACIONES DE LOS COEFICIENTES Y SUS INTERVALOS DE CONFIANZA AL
95% PARA UN MODELO DE REGRESIÓN LINEAL MÚLTIPLE OBTENIDOS MEDIAN-
TE MÁXIMA VEROSIMILITUD Y BOOTSTRAP PARA LAS DIMENSIONES DE
FUNCIONAMIENTO FÍSICO Y DOLOR CORPORAL DEL SF-36 EN UNA MUESTRA
DE 784 PACIENTES CON DIAGNÓSTICO DE OSTEOARTROSIS EN LISTA DE
ESPERA PARA INTERVENCIÓN DE PRÓTESIS TOTAL DE CADERA
(Conclusión)
VARIABLES BOOTSTRAP
INDEPENDIENTES
Coeficiente IC 95%
Funcionamiento físico:
Intercepto 34,025 (21,579, 49,067)
Edad (años) −0,146 (−0,387, 0,034)
Tiempo de espera (días) 0,010 (−0,004, 0,025)
Mujer −5,839 (−9,048, −2,844)
Estudios:
– Ninguno −6,632 (−13,069, −1,158)
– Primarios −6,037 (−11,581, −1,650)
Trabajador inactivo 5,839 (0,231, 12,016)
Situación familiar:
– Casado −1,807 (−7,354, 2,431)
– Soltero/vive acompañado 0,074 (−5,658, 5,647)
Dolor Corporal
Intercepto 23,326 (7,362, 42,377)
Edad (años) 0,330 (0,094, 0,558)
Tiempo de espera (días) 0,004 (−0,014, 0,027)
Mujer −7,077 (−10,973, −3,575)
Estudios:
– Ninguno −9,900 (−17,480, −3,238)
– Primarios −5,610 (−12,122, −0,439)
Trabajador inactivo −1,910 (−10,480, 5,640)
Situación familiar:
– Casado −5,016 (−11,068, 0,537)
– Soltero/vive acompañado −3,385 (−11,212, 3,352)
Se ha utilizado la abreviatura de IC: Intervalo de Confianza
178 ESTADÍSTICA ESPAÑOLA

En el caso del dolor corporal, ambos métodos muestran resultados similares,


reflejando la robustez del modelo de regresión lineal múltiple para el área de dolor
corporal del SF-36. Las variables que resultan tener una influencia significativa en
el dolor corporal son la edad, el sexo y el nivel de estudios de los individuos. La
escala de dolor corporal del SF-36 se interpreta de forma inversa, es decir, que a
mayor puntuación, mejor CV en lo que respecta a dolor, es decir, menor dolor. De
esta forma, a mayor edad se espera que el nivel de dolor sea menor, por cada 10
años de incremento de la edad se espera que la CV en lo que respecta al dolor
mejore en 3,3 puntos (en una escala de 0 a 100) con un intervalo de confianza del
95% de 0,9 a 5,6, ajustando por sexo y nivel de estudios. Las mujeres tienen una
CV 7 puntos inferior a la de los hombres de su misma edad y nivel de estudios en lo
que respecta al dolor. Los individuos sin estudios o con sólo estudios primarios
tienen una CV 9,9 ó 5,6 puntos inferior a la de los individuos con estudios secunda-
rios de su misma edad y sexo, respectivamente, en lo que respecta al dolor. En el
caso del funcionamiento físico, hay diferencias considerables en los resultados
obtenidos entre ambos métodos. En la tabla 5 se puede observar que la variable
situación laboral no resulta significativa para el método de estimación de máxima
verosimilitud, mientras que sí lo es para el bootstrap. Esto se debe al hecho men-
cionado anteriormente, de que la variable funcionamiento físico tiene un sesgo
importante en pacientes que van a ser intervenidos de PTC. Tal y como se ha
mencionado anteriormente, consideramos válidos los resultados obtenidos median-
te bootstrap, por tanto, estos son los resultados que se van a interpretar. Las
variables que resultan tener una influencia significativa en el funcionamiento físico
son el sexo, el nivel de estudios y la situación laboral de los individuos. Las mujeres
tienen un funcionamiento físico 5,8 puntos inferior a la de los hombres de su mismo
nivel de estudios y situación laboral, en una escala de 0 a 100 y con un intervalo de
confianza del 95% de 2,8 a 9,0. Los individuos sin estudios o con sólo estudios
primarios tienen un funcionamiento físico aproximadamente 6 puntos inferior a los
individuos con estudios secundarios de su mismo sexo y situación laboral. Los
individuos que trabajan de forma activa tienen un funcionamiento físico 5,8 puntos
inferior a los individuos laboralmente inactivos de su mismo sexo y nivel de estu-
dios. En las dos dimensiones analizadas, debemos hacer notar que las variables
situación laboral y edad están relacionadas entre sí. Aunque la significación de la
interacción ha sido rechazada en todos los modelos mencionados, no se descarta
la existencia de colinealidad entre ambas, lo cual debiera ser tenido en cuenta a la
hora de sacar conclusiones clínicas de estos resultados. Sin embargo, nuestro
objetivo no se centra en las conclusiones clínicas, sino en la correcta elección de la
técnica de análisis.

Como hemos visto antes, el uso de modelos de regresión lineal múltiple permite
medir la influencia de determinadas características en la CVRS esperada en un
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 179

individuo. De esta forma podemos comparar, como en los ejemplos anteriores, la


diferencia de puntos esperada en la CVRS entre hombres y mujeres, y entre indivi-
duos con diferente nivel de estudios o situación laboral.

Una alternativa de análisis a la RLM para escalas ordinales es el modelo de


odds proporcionales, donde el logit de la probabilidad acumulada se representa
como una función lineal de las covariables. En este modelo se asume que Y es una
variable dependiente discreta ordinal con k, k > 2, categorías ordenadas de forma
natural. Sean y1, y2,..., yn los valores observados en una muestra aleatoria simple
de tamaño n de la variable Y. Definimos las probabilidades acumuladas como

θji = p1i + ..... + pji = P (Yi ≤ j) j = 1,2,....,k

El objetivo es encontrar un modelo para describir θji en función de una matriz de


datos correspondiente a p variables explicativas, X. La hipótesis principal del mode-
lo de odds proporcionales es que la influencia de las variables explicativas es
independiente del punto de corte de la probabilidad acumulada. El modelo general
viene dado por la expresión:

logit(θji) = β0j + β1xi1 + β2xi2 + …+ βpxip = β0j + Xβ

y j = 1, 2, …, k −1, i = 1, 2, …., n,

donde los vectores de parámetros son: β = (β1, β2, ..., βp)T, que mide la influencia de
las covariables en la probabilidad acumulada, común para las (k – 1) ecuaciones; y
el vector de los (k – 1) términos independientes, β0 = (β01, β02, ..., β0,k-1)T, específicos
para cada una de las (k – 1) ecuaciones.

La dimensión rol físico del SF-36 se trata como una escala ordinal de 5 valores,
i. e. de 0 a 4. Se ha utilizado el modelo de odds proporcionales para estudiar la
influencia de variables sociodemográficas y clínicas en el rol físico de pacientes con
TA. Para este análisis se han utilizado los pacientes con TA de la muestra ante-
riormente mencionada, para los cuales se dispone de las siguientes variables:
edad, sexo, tiempo de evolución de la enfermedad, índice de masa corporal, diag-
nós-ti-co, gravedad, nivel de ansiedad y depresión. Estas son las variables desta-
cadas por los expertos en el área como potenciales factores predictivos de la CVRS
en pacientes con TA (Padierna et al. 2000). Las variables seleccionadas como
predictores significativos del rol físico en pacientes con TA en el modelo de odds
proporcionales y la submuestra de 186 individuos en los que se tiene información
sobre todas las variables son: tiempo de evolución de la enfermedad, gravedad y
nivel de depresión. Las hipótesis de odds proporcionales no se rechazan, al nivel
180 ESTADÍSTICA ESPAÑOLA

de significación establecido, ni en general (p = 0,12), ni para ninguna de las 3


covariables en particular (p = 0,68, p = 0,18 y p = 0,41, respectivamente). La tabla 6
resume los resultados obtenidos en este análisis.

Tabla 6
ESTIMACIONES DE LOS COEFICIENTES, DESVIACIONES ESTÁNDAR Y
NIVEL DE SIGNIFICACIÓN DEL MODELO DE ODDS PROPORCIONALES
SELECCIONADO PARA LA DIMENSIÓN DE ROL FÍSICO DEL SF-36 EN UNA
MUESTRA DE 186 PACIENTES CON TRASTORNOS DE ALIMENTACIÓN
COVARIABLE ESTIMACIÓN DESVIACIÓN p-VALOR
ESTÁNDAR
Intercepto 4 1,5474 0,3543 < 0,0001
Intercepto 3 2,2843 0,3765 < 0,0001
Intercepto 2 2,7966 0,3930 < 0,0001
Intercepto 1 3,5147 0,4175 < 0,0001
Depresión −1,5381 0,3475 < 0,0001
Gravedad: Moderada −1,8039 0,4131 < 0,0001
Grave −2,0093 0,4051 < 0,0001
Tiempo de evolución −0,0613 0,0222 0,0057

La interpretación del coeficiente de la variable depresión en este modelo ( β̂ =


−1,5381, por tanto una tasa de odds estimada de e-1,5381 = 0,215, con un intervalo
de confianza del 95% de 0,109 a 0,424), es que un paciente con depresión reduce
a una cuarta parte la probabilidad de mejorar en un punto su rol físico con respecto
a otro sin depresión (en una escala de 0 a 4), en igualdad de condiciones de grave-
dad y tiempo de evolución de la enfermedad, siendo esta reducción estadística-
mente significativa. Igualmente, los coeficientes de la variable gravedad en este
modelo ( β̂ MOD = −1,8039 y β̂GRAV = −2,0093, por tanto una tasa de odds estimada
de e-1,8039 = 0,165, con un intervalo de confianza del 95% de 0,073 a 0,370 para
pacientes con gravedad moderada versus pacientes leves y e-2,0093 = 0,134, con un
intervalo de confianza del 95% de 0,061 a 0,297 para pacientes graves versus
pacientes leves), indican que un paciente con una gravedad moderada reduce a
una sexta parte y un paciente grave a una séptima parte la probabilidad de mejorar
en un punto su rol físico con respecto a un paciente leve (en una escala de 0 a 4),
en igualdad de condiciones de depresión y tiempo de evolución de la enfermedad,
siendo esta reducción estadísticamente significativa en ambos casos. Por último, en
el caso del tiempo de evolución de la enfermedad, β̂ = −0,0613, correspondiente a
una tasa de odds estimada de e-0,0613 = 0,941, con un intervalo de confianza del
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 181

95% de 0,900 a 0,982, indica que cada año de más con la enfermedad reduce de 1
a 0,94 la probabilidad de mejorar en un punto su rol físico (en una escala de 0 a 4),
en igualdad de condiciones de gravedad y depresión, siendo esta reducción esta-
dísticamente significativa.

El uso de métodos ordinales como el modelo de odds proporcionales permite


obtener resultados sobre la influencia de determinadas características en la CVRS,
y medir esta influencia por medio de la tasa de odds, que como estimador del
riesgo relativo es un parámetro con muy buena aceptación en el ámbito clínico.

CONCLUSIONES

Los métodos de análisis clásicos basados en la distribución normal, como la re-


gresión lineal múltiple, son bastante robustos. Sin embargo, un incumplimiento de la
normalidad tan claro y sistemático en casi todas las áreas del SF-36, puede hacer
que los resultados obtenidos de un análisis a otro varíen de forma sustancial,
afectando esto de forma significativa a las conclusiones clínicas derivadas del
análisis de datos. Por este motivo, se sugiere suma cautela en la utilización de la
regresión lineal múltiple y otras técnicas basadas en la distribución normal en el
análisis de datos de CVRS recogidos mediante el cuestionario SF-36.

Este trabajo pone de manifiesto la importancia de comprobar las hipótesis de las


técnicas de análisis estadístico utilizadas en el análisis de datos de CVRS, más
concretamente en el análisis de datos procedentes del cuestionario de salud SF-36.
En caso de incumplimiento de alguna de las hipótesis es necesario comprobar la
robustez de los métodos utilizados.

El método seleccionado para el análisis de los datos tiene una importancia clara
en la interpretación de los resultados obtenidos y, por tanto, en las conclusiones
obtenidas en los mismos. Es decir, mientras que los modelos de regresión lineal
múltiple, que utilizan una variable dependiente continua, ofrecen resultados en
términos de diferencia esperada en la CV medida en una escala continua (habi-
tualmente de 0 a 100) entre determinados grupos de individuos; los modelos de
regresión ordinal, que utilizan una variable dependiente ordinal ofrecen resultados
en términos de tasa de odds o incremento/reducción de la probabilidad de tener
mejor o peor CVRS para determinados grupos de individuos con respecto de otros.
Diferentes técnicas de análisis nos llevan a obtener diferentes resultados y conclu-
siones. Por tanto, el método de análisis a utilizar debe ser seleccionado basándo-
nos, entre otras cosas, en los objetivos planteados y el tipo de conclusiones que se
desean obtener.
182 ESTADÍSTICA ESPAÑOLA

Por último, en muchos casos se desea realizar un estudio sobre los factores de
influencia en la CVRS, considerando todas las dimensiones del cuestionario SF-36,
de forma independiente. En este caso, es preferible utilizar la misma técnica de
análisis para todas las dimensiones, puesto que de esta forma se podrán comparar
los resultados obtenidos en las 8 dimensiones conjuntamente. Resulta difícil cumplir
este cometido basándonos en las recomendaciones de Walters et al. (2001), puesto
que los niveles de las dimensiones del SF-36 varían de 4 a 26 (ver tabla 1). Por un
lado, se recomienda especial cautela al utilizar técnicas de variables continuas para
el análisis de dimensiones con 4 ó 5 modalidades (como el rol emocional y el rol
físico), comprobando, en la medida de nuestro alcance, la robustez de las técnicas
utilizadas. Por otro lado, el utilizar alternativamente técnicas de variables ordinales
exige una categorización de la dimensión, con los problemas que esto conlleva de
pérdida de información y criterios subjetivos de puntos de corte. Además, las
hipótesis de las técnicas de modelos ordinales también deben ser comprobadas
previamente. Por ejemplo, en el modelo de odds proporcionales utilizado en uno de
los ejemplos que se muestra en este trabajo, la hipótesis principal es que la influen-
cia de las variables explicativas sea independiente del punto de corte de la probabi-
lidad acumulada. En muchas ocasiones esta hipótesis no se verifica para alguna de
las covariables de interés que se desea incluir en el modelo. Por tanto, se debería
pensar en otras alternativas como un modelo de odds parcialmente proporcionales.
Nosotros proponemos una alternativa de análisis de las áreas del SF-36 basada en
la distribución beta-binomial. En una publicación reciente (Arostegui et al. 2007) se
muestra la adaptación de los datos del SF-36 a la distribución beta-binomial, con el
cumplimiento de las hipótesis necesarias para la aplicación del método de regresión
beta-binomial, y los resultados obtenidos mediante la regresión beta-binomial son
muy similares a los obtenidos mediante la regresión lineal múltiple en aquellas
áreas del SF-36 aceptablemente continuas y con un sesgo moderado, y similares a
los obtenidos mediante el modelo de odds proporcionales o parcialmente propor-
cionales en las áreas ordinales del SF-36, con la ventaja añadida de que todas las
áreas se analizan con la misma técnica. Además, el método de regresión beta-
binomial permite obtener resultados en términos de la tasa de odds, que como
hemos indicado anteriormente, es un parámetro con muy buena aceptación en el
ámbito clínico.

Finalmente, los autores debemos mencionar que el objetivo de este trabajo, en


ningún caso es sacar conclusiones clínicas de los datos aquí presentados, ni su
generalización a la población general, ni a poblaciones específicas de las cuales las
muestras pudieran ser representativas; dado que, tal y como hemos indicado
anteriormente, esta labor es propia de los especialistas clínicos respectivos. Si se
han interpretado resultados concretos, ha sido con el objeto de mostrar al lector
poco familiarizado con este tipo de análisis de datos, las diferentes formas de
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 183

obtener conclusiones de diversas técnicas de análisis de datos en el ámbito de la


epidemiología clínica.

REFERENCIAS

AARONSON, N.K. (1989). «Quality of life assessments in clinical trials: Methodological


issues». Controlled Clinical Trials 10 (Suppl.), 195S-208S.

AARONSON, N.K., ACQUADRO, C., ALONSO, J., APOLONE, G., BUCQUET, D., BULLINGER,
M., BUNGAY, K., FUKUHARA, S., GANDEK, B., KELLER, S., RAZAVI, R., SANSON-
FISHER, M., SULLIVAN, S., WOOD-DAUPHINEE, S., WAGNER, A. Y WARE, J.E. (1992).
«International quality of life assessment (IQOLA) project». Quality of Life Re-
search 1(5), 349-351.
ALONSO, J., PRIETO, L. Y ANTÓ, J.M. (1995). «La versión española del SF-36 Health
Survey (Cuestionario de Salud SF-36): Un instrumento para la medida de los
resultados clínicos». Medicina Clínica 104(20), 771-776.
ANDERSON, J.P., KAPLAN, R.M., COONS, S.J. Y SCHNEIDERMAN, L.J. (1998). «Compari-
son of the Quality of Well Being Scale and the SF-36 results among two sam-
ples of ill adults: AIDS and other illnesses». Journal of Clinical Epidemiology
51(9), 755-762.

ANITUA, C. Y QUINTANA, J.M. (1999). «Valores poblacionales del índice de salud SF-
36 en el País Vasco: Importancia y aplicación en la práctica clínica». Osasunka-
ria 17, 10-17.

APOLONE, G., CIFANI, S., LIBERATI, M.C. Y MOSCÓN, P. (1997). «Questionario sullo
stato di salute SF-36. Traduzione e validazione della versione italiana: Risultati
del progetto IQOLA». Metodologia e Didattica Clinica 5, 86-94.

AROSTEGUI, I., NÚÑEZ-ANTÓN, V. Y QUINTANA, J.M. (2007). «Analysis of the Short


Form – 36 (SF-36): The beta-binomial distribution approach». Statistics in Medi-
cine 26(6) 1318-1342.

BADÍA, X., SALAMERO, M. Y ALONSO, J. (1999). «La Medida de la Salud.» Guía de


Escalas de Medición en Español (2ª edición). Edimac: Barcelona.

BEATON, D.E., BOMBARDIER, C., KATZ, J.N. Y WRIGHT, J.G. (2001). «A taxonomy for
responsiveness». Journal of Clinical Epidemiology 54(12), 1204-1217.

BOWLING, A. (1991). «Measuring Health: A Review of Quality of Life Measurements


Scales». Open University Press: Philadelphia.
184 ESTADÍSTICA ESPAÑOLA

BRAZIER, J.E., HARPER, R., JONES, N.M.B., O´CATHAIN, A., THOMAS, K.J., USHERWOOD,
T. Y WESTLAKE, L. (1992). «Validating the SF-36 Health Survey questionnaire:
New outcome measure for primary care». British Medical Journal 305(6846),
160-164.

BUBIEN, R.S., KNOTTS-DOLSON, S.M., PLUMB, V.J. Y KAY, G.N. (1996). «Effect of
radiofrequency catheter ablation on health-related quality of life and activities of
daily living in patients with recurrent arrhythmias». Circulation 94(7), 1585-1591.
BULLINGER, M. (1995). «German translation and psychometric testing of the SF-36
Health Survey: Preliminary results from the IQOLA project, international quality
of life assessment». Social Science and Medicine 41(10), 1359-1366.
CAMPBELL, D. Y FISKE, D. (1959). «Convergent and discriminant validation by the
multitrait-multimethod matrix». Psychological Bulletin 56(2), 81-105.

CHEUNG, Y. -B., THUMBOO, J., MACHIN, D., FENG, P.-H., BOEY, M.L., THIO, S.T. Y FONG,
K.-Y. (2004). «Modelling variability of quality of life scores: A study of question-
naire version and bilingualism». Quality of Life Research 13(5), 897-906.

CLANCY, C.M. Y EISENBERG, J.M. (1998). «Outcomes research: Measuring the end
results of health care» Science 282(5387), 245-246.

COULEHAN, J.L., SCHULBERG, H.C., BLOCK, M.R., MADONIA, M.J. Y RODRIGUEZ, E.


(1997). «Treating depressed primary care patients improves their physical,
mental and social functioning». Archives of Internal Medicine 157(10), 1113-
1120.

COX, D.R., FITZPATRICK, R., FLETCHER, A.E., GORE, S.M., SPIEGELHALTER, D.J. Y
JONES, D.R. (1992). «Quality-of-life assessment: Can we make it simple?». Jour-
nal of the Royal Statistical Society: Series A 155(3), 353-393 (with discussion).

CRONBACH, L.J. (1951). «Coefficient alpha and the internal structure of tests».
Psychometrika 16(2), 297-334.

DAVISON, A.C. Y HINKLEY, D.V. (1997). «Bootstrap Methods and Their Applications».
Cambridge University Press: Cambridge.
DAWSON, J., FITZPATRICK, R., CARR, A. Y MURRAY, D. (1996). «Questionnaire on the
perceptions of patients about total hip replacement» The Journal of Bone and
Joint Surgery. British volume 78(2), 185-190.

DE VET, H.C., BOUTER, L.M., BEZEMER, P.D. Y BEURSKENS, A.J. (2001). «Reproducibil-
ity and responsiveness of evaluative outcome measures». International Journal
of Technology Assessment in Health Care 17(4), 479-487.
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 185

DONOVAN, K., SANSON-FISHER, R.W. Y REDMAN, S. (1989). «Measuring quality of life


in cancer patients». Journal of Clinical Oncology 7(7), 959-968.

EFRON, B. Y TIBSHIRANI, R.J. (1993). «An Introduction to the Bootstrap». Chapman &
Hall: New York.

ETXEBARRIA, Y., PÉREZ-IZQUIERDO, J., BADIOLA, C., QUINTANA, J.M., PADIERNA, A.,
AROSTEGUI, I. Y CAPELASTEGUI, A. (2001). «Evaluación de la calidad de vida en
pacientes con cáncer de pulmón». Gaceta Sanitaria 15 (1), 25-31.
FAIRCLOUGH, D. (2002). «Design and Analysis of Quality of Life Studies in Clinical
Trials». Chapman and Hall: London.

FAYERS, P.M. Y HAND, D.J. (1997). «Factor analysis, causal indicators, and quality of
life». Quality of Life Research 6(2), 139-150.

FAYERS, P.M. Y MACHIN, D. (2000). «Quality of Life. Assessment, Analysis and


Interpretation» Wiley: London.
FAYERS, P.M., GROENVOLD, M., HAND, D.J. Y BJORDAL, K. (1998). «Clinical impact
versus factor analysis for quality of life questionnaire construction». Journal of
Clinical Epidemiology 651(3), 285-286.
FERRER, M., ALONSO, J., MORERA, J., MARRADES, R.M., KHALAF, A., AGUAR, M.C.,
PLAZA, V., PRIETO, L. Y ANTÓ, J.M. (1997). «Chronic obstructive pulmonary dis-
ease stage and health-related quality of life. The quality of life of chronic ob-
structive pulmonary disease study group». Annals of Internal Medicine 127(12),
1072-1079.

GANDEK, B. Y WARE, J.E. (1998). «Methods for validating and norming translations of
health status questionnaires: The IQOLA project approach». Journal of Clinical
Epidemiology 51(11), 953-959.

GARRATT, A.M., SCHMIDT, L., MACKINTOSH, A. Y FITZPATRICK, R. (2002). «Quality of life


measurement: Bibliographic study of patient assessed health outcome meas-
ures» British Medical Journal 324(7351), 1417-1421.

GOLDSMITH, S.B. (1972). «The status of health status indicators» Health Services
Reports 87(3), 212-220.

GOLDSMITH, S.B. (1973). «A reevaluation of health status indicator». Health Services


Reports 88(10), 937-941.

GONZÁLEZ, N., QUINTANA, J.M., AROSTEGUI, I., PADIERNA, A., MARTÍNEZ E., CRESPO, I. Y
VESGA, M.A. (2005). «Translation and psychometric testing of the Basque ver-
sion of the SF-36 health survey». Quality of Life Research 14(2), 549-554.
186 ESTADÍSTICA ESPAÑOLA

GUYATT, G.H., WALTER, S.D. Y NORMAN, G.R. (1987). «Measuring change over time:
Assessing the usefulness of evaluative instruments». Journal of Chronic Dis-
eases 40(2), 171-178.

GUYATT, G.H., FEENY, D.H. Y PATRICK, D.L. (1993). «Measuring health-related quality
of life». Annals of Internal Medicine 118(8), 622-629.

HARPER, R., BRAZIER, J.E., WATERHOUSE, J.C., WALTERS, S.J., JONES, N.M.B. Y
HOWARD, P. (1997). «Comparison of outcome measures for patients with
Chronic Obstructive Pulmonary Disease (COPD) in an outpatient setting». Tho-
rax 52(10), 879-887.

HASSAN, I.S., BANNISTER, B.A., AKBAR, A., WEIR, W. Y BOFILL, M. (1998). «A study of
the immunology of the chronic fatigue syndrome: Correlation of immunologic pa-
rameters to health dysfunction». Clinical Immunology and Immunopathology
87(1), 60-67.
HAYS, R.D., ANDERSON, R. Y REVICKI, D. (1993). «Psychometric considerations in
evaluating health-related quality of life measures». Quality of Life Research
2(6), 441-449.
HEMINGWAY, H., STAFFORD, M., STANSFELD, S., SHIPLEY, M. Y MARMOT, M. (1997). «Is
the SF-36 a valid measure of change in population health? Results from the
Whitehall II study». British Medical Journal 315(7118), 1273-1279.
JACOBSON, A.M., DE GROOT, M. Y SAMSON, J.A. (1994). «The evaluation of two meas-
ures of quality of life in patients with type I and type II diabetes». Diabetes Care
17(4), 267-274.
JUNIPER, E.F., GUYATT, G.H., STREINER, D.L. Y KING, D.R. (1997). «Clinical impact
versus factor analysis for quality of life questionnaire construction». Journal of
Clinical Epidemiology 50(3), 233-238.
KARNOFSKY, D.A. Y BURCHERNAL, J.H. (1949). «The clinical evaluation of chemo-
therapeutic agents in cancer». En: Evaluation of Chemotherapeutic Agents
(C.M. McLeod ed.). Columbia University Press: New York, 191-205.
KATZ, S. Y AKPOM, C.A. (1976). «A measure of primary sociobiological functions».
International Journal of Health Services 6(3), 493-507.

KOMAROFF, A.L., FAGIOLI, L.R., DOOLITTLE, T.H., GANDEK, B., GLEIT, M.A., GUERREIRO,
R.T., KORNISH, J., WARE, N.C., WARE, J.E. Y BATES, D.W. (1996). «Health status
in patients with chronic fatigue syndrome and in general population and disease
comparison groups». American Journal of Medicine 101(3), 281-290.
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 187

LAFORGE, R.G., ROSSI, J.S., PROCHASKA, J.O., VELICER, W.F., LEVESQUE, D.A. Y
MCHORNEY, C.A. (1999). «Stage of regular exercise and health-related quality-
of-life». Preventive Medicine 28(4), 349-360.

LALL, R., CAMPBELL, M.J., WALTERS, S.J., MORGAN, K. Y MRC CFAS (2002). «A review
of ordinal regression models applied on health-related quality of life assess-
ments» Statistical Methods in Medical Research 11(1), 49-67.

LEE, P.P., SPRITZER, K. Y HAYS, R.D. (1997). «The impact of blurred vision on func-
tioning and well-being» Ophthalmology 104(3), 390-396.

LEIDY, N.K., ELIXHAUSER, A., VICKREY, B., MEANS, E. Y WILLIAN, M.K. (1999). «Seizure
frequency and the health-related quality of life of adults with epilepsy». Neurol-
ogy 53(1), 162-166.

LOHR, K.N. (2002). «Assessing health status and quality-of-life instruments: Attrib-
utes and review criteria». Quality of Life Research 11(3), 193-205.
LYONS, R.A., LO, S.V. Y LITTLEPAGE, B.N.C. (1994). «Comparative health status of
patients with 11 common illnesses in Wales». Journal of Epidemiology and
Community Health 48(4), 388-390.
MAHLER, D.A. Y MACKOWIAK, J.I. (1995). «Evaluation of the Short-Form 36-item
questionnaire to measure health-related quality of life in patients with COPD»
Chest 107(6), 1585-1589.
MANGIONE, C.M., PHILLIPS, R.S., LAWRENCE, M.G., SEDDON, J.M., ORAV, E.J. Y GOLD-
MAN, L. (1994). «Improved visual function and attenuation of declines in health-
related quality of life cataract extraction». Archives of Ophthalmology 112(11),
1419-1425.

MATHSOFT INC. (1999). «S-PLUS 2000 User´s Guide». MathSoft, Data Analysis
Products Division: Seattle, WA.
MCCALLUM, J. (1995). «The SF-36 in an Australian sample: Validating a new generic
health status measure». Australian Journal of Public Health 19(2), 160-166.

MCDOWELL, I. Y NEWELL, C. (1996). «Measuring Health: A Guide to Rating Scales


and Questionnaires» (2nd edition). Oxford University Press: New York.

MCHORNEY, C.A. (1999). «Health status assessment methods for adults: Past ac-
complishments and future challenges». Annual Review of Public Health 20,
309-335.

MESBAH, M.F., COLE, B. Y TING LEE, M. (2002). «Statistical Methods for Quality of Life
Studies. Design, Measurements and Analysis». Kluwer Academic Publishers:
Boston, MA.
188 ESTADÍSTICA ESPAÑOLA

MOZES, B., MAOR, Y SHMUELI, A. (1999). «The competing effects of disease states on
quality of life of the elderly: The case of urinary symptoms in men». Quality of
Life Research 8(1-2), 93-99.

MURAWSKI, M.M. Y MIEDERHOFF, P.A. (1998). «On the generalizibility of statistical


expressions of the health related quality of life instrument responsiveness: A
data synthesis». Quality of Life Research 7(1), 11-22.

O´BRIEN, P.C. (1984). «Procedures for comparing samples with multiple endpoints».
Biometrics 40(4), 1079-1087.

OLSCHEWSKI, M. Y SCHUMACHER, M. (1990). «Statistical analysis of quality of life data


in cancer clinical trials». Statistics in Medicine 9(7), 749-763.
PADIERNA, A., QUINTANA, J.M., AROSTEGUI, I., GONZÁLEZ, N. Y HORCAJO, M.J. (2000).
«The health-related quality of life in eating disorders». Quality of Life Research
9(6), 667-674
PADIERNA, A., QUINTANA, J.M., AROSTEGUI, I., GONZÁLEZ, N. Y HORCAJO, M.J. (2002).
«Changes in health related quality of life among patients treated for eating dis-
orders». Quality of Life Research 11(6), 545-552.
PATRICK, D.L. Y DEYO, R.A. (1989). «Generic and disease-specific measures in
assessing health status and quality of life». Medical Care 27(3 Suppl.), S217-
S232.
PATRICK, D.L., DEYO, R.A., ATLAS, S.J., SINGER, D.E., CHAPIN, A. Y KELLER, R.B.
(1995). «Assessing health-related quality of life in patients with sciatica». Spine
20(17), 1899-1909.
PERNEGER, T.V., LEPLEGE, A., ETTER, J.F. Y ROUGEMONT, A. (1995). «Validation of a
French language version of the MOS 36 item short form health survey (SF-36)
in young healthy adults» Journal of Clinical Epidemiology 48(8), 1051-1060.
POCOCK, S.J., GELLER, N.L. Y TSIATIS, A. (1987). «The analysis of multiple endpoints
in clinical trials». Biometrics 43(3), 487-498.

QUINTANA, J.M., AROSTEGUI, I., CABRIADA, J., LÓPEZ DE TEJADA, I. Y PÉRDIGO, L.


(2003). «Predictors of health-related quality of life improvement among patients
undergoing cholecystectomy». British Journal of Surgery 90(12), 1549-1555.

QUINTANA, J.M., AROSTEGUI, I., ORIBE, V., LÓPEZ DE TEJADA, I., BARRIOS, B. Y GARAI, I.
(2005). «Influence of age and gender on quality of life outcomes after cholecys-
tectomy». Quality of Life Research 14(3), 815-825.
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 189

QUINTANA, J.M., ESCOBAR, A., AROSTEGUI, I., BILBAO, A., AZKARATE, J., GOENAGA, J.I. Y
ARENAZA, J.C. (2006). «Health-related quality of life and appropriateness of knee
or hip joint replacement». Archives of Internal Medicine 166(2), 220-226.

REVICKI, D.A., WU, A.W. Y MURRIA, M.I. (1995). «Change in clinical status, health
status, and health utility outcomes in HIV-infected patients». Medical Care
33(4), 173-182.

ROSE, M.S., KOSHMAN, M.L., SPRENG, S. Y SHELDOM, R. (1999). «Statistical issues


encountered in the comparison of health-related quality of life in disease pa-
tients to published general population norms: Problems and solutions». Journal
of Clinical Epidemiology 52(5), 405-412.
SANZ, J. (1991). «Valor y cuantificación de la calidad de vida en medicina». Medici-
na Clínica 96, 66-69.

SAS INSTITUTE INC. (1994). «SAS Procedures Guide, Version 6». SAS Institute: Cary, NC.

STANSFELD, S.A., ROBERTS, R. Y FOOT, S.P. (1997). «Assessing the validity of the
SF-36 general Health Survey». Quality of Life Research 6(3), 217-224.

STREINER, D.L. Y NORMAN, G.R. (1992). «Health Measurement Scales». Oxford


University Press: New York.

SULLIVAN, M., KARLSSON. J. Y WARE, J.E. (1995). «The Swedish SF-36 Health Sur-
vey. I. Evaluation of data quality, scaling assumptions, reliability and construct
validity across general population in Sweden». Social Science and Medicine
41(10), 1349-1358.

TESTA, M.A. Y NACKLEY, J.F. (1994). «Methods for quality of life studies». Annual
Review of Public Health 15, 535-559.

TESTA, M.A. Y SIMONSON, D.C. (1996). «Assessment of quality of life outcomes».


New England Journal of Medicine 334(13), 835-840.
TORRANCE, G.W. (1987). «Utility approach to measuring health-related quality-of-
life». Journal of Chronic Diseases 40(6), 593-600.

TORRES, X., ARROYO, S., ARAYA, S. Y DE PABLO, J. (1999). «The Spanish version of
the Quality of Life in Epilepsy Inventory (QOLIE-31): Translation, validity and re-
liability». Epilepsia 40(9), 1299-1304.

TSEVAT, J., SOLZAN, J.G., KUNTZ, K.M., RAGLAND, J., CURRIER, J.S., SELL, R.L. Y
WEINSTEIN, M.C. (1996). «Health values of patients infected with human immu-
nodeficiency virus. Relationship to mental health and physical functioning». Me-
dical Care 34(1), 44-57.
190 ESTADÍSTICA ESPAÑOLA

VAN KNIPPENBERG, F.C. Y DE HAES, J.C. (1988). «Measuring quality of life of cancer
patients: Psychometric properties of instruments». Journal of Clinical Epidemi-
ology 41(11), 1043-1055.

VILAGUT, G., FERRER, M., RAJMIL, L., REBOLLO, P., PERMANYER-MIRALDA, G., QUINTA-
NA, J.M., SANTED, R., VALDERAS, J.M., RIBERA, A., DOMINGO-SALVANY, A. Y ALON-
SO, J. (2005). «El cuestionario de salud SF-36 español: Una década de expe-
riencia y nuevos desarrollos». Gaceta Sanitaria 19(2), 135:150.
WACHTEL, T., PIETTE, J., MOR, V., STEIN, M., FLEISHMAN, J. Y CARPENTER, C. (1992).
«Quality of life in persons with human immunodeficiency virus infection: Meas-
urement by the Medical Outcomes Study instrument». Annals of Internal Medi-
cine 116(2), 129-137.

WAHL, A., MOUM, T., HANESTAD, B.R. Y WIKLUND, I. (1999). «The relationship between
demographic and clinical variables, and quality of life aspects in patients with
psoriasis». Quality of Life Research 8(4), 319-326.

WALTERS, S.J. Y CAMPBELL, M.J. (2005). «The use of bootstrap methods for estimat-
ing sample sizes and analyzing health related quality of life outcomes». Statis-
tics in Medicine 24(7), 1075-1102.

WALTERS, S.J., CAMPBELL, M.J., Y LALL, R. (2001). «Design and analysis of trials with
quality of life as an outcome: A practical guide». Journal of Biopharmaceutical
Statistics 11(3), 155-176.

WARE, J.E. (2000). «SF-36 Health Survey update». Spine 25(24), 3130-3139.

WARE, J.E. Y SHERBOURNE, C.D. (1992). «The MOS 36-item Short Form Health
Survey (SF-36): I. Conceptual framework and item selection». Medical Care
30(6), 473-483.

WARE, J.E., KOSINSKI, M.A. Y KELLER, S.K. (1994). «Physical and Mental Health»
Summary Scales: A User´s Manual. The Health Institute, New England Medical
Center: Boston, MA.

WARE, J.E., KOSINSKI, M.A. Y DEWEY, J.E. (2000). «How to score version 2 of the SF-
36 Health Survey» Quality Metric Incorporated: Lincoln, RI.

WARE, J.E., SNOW, K.K., KOSINSKI, M.A. Y GANDEK, B. (1993). «SF-36 Health Survey,
Manual and Interpretation Guides». The Health Institute, New England Medical
Center: Boston, MA.
ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD … 191

WARE, J.E., GANDEK, B., KELLER, S.D. Y THE IQOLA Project Group. (1996a). «Evaluat-
ing instruments used cross-nationally: Methods from the IQOLA» project. En:
«Quality of Life and Pharmacoeconomics in Clinical Trials» (2nd edition) (B.
Spilker ed.). Raven Press: New York, 681-692.

WARE, J.E., BAYLISS, M.S., ROGERS, W.H., KOSINSKI, M. Y TARLOV, A.R. (1996b).
«Differences in 4-year health outcomes for elderly and poor, chronically ill pa-
tients treated in HMO and fee-for-service systems. Results from the MOS»
Journal of the American Medical Association 276(13), 1039-1047.

WARE, J.E., KELLER, S.D., GANDEK, B., BRAZIER, J.E., SULLIVAN, M. Y THE IQOLA Pro-
ject Group (1995). «Evaluating translations of health status questionnaires:
Methods from the IQOLA project». International Journal of Technology Assess-
ment in Health Care 11(3), 525-551.

WILSON, I.B. Y KAPLAN, S. (1995). «Clinical practice and patients´ health status: How
are the two related?». Medical Care 33 (4 Suppl.), AS209-AS214.

WILSON, D., PARSONS, J. Y WAKEFIELD, M. (1999). «The health-related quality-of-life


of never smokers, ex-smokers and light, moderate and heavy smokers». Pre-
ventive Medicine 29(3), 139-144.

WORLD HEALTH ORGANIZATION (1952). En: «World Health Organization». Handbook


of Basic Documents. (5th edition). Palais des Nations: Ginebra, 3-20.
192 ESTADÍSTICA ESPAÑOLA

STATISTICAL ASPECTS OF THE HEALTH RELATED QUALITY OF


LIFE QUESTIONNAIRE SHORT FORM- 36 ( SF-36)

ABSTRACT

Health Related Quality of Life (HRQoL) is an important parameter


to measure health outcomes. It is a difficult concept to measure and
questionnaires are used to measured it. The psychometric properties
of a questionnaire, its cultural adaptation, the design of the study and
the analysis of the results are relevant statistical issues that must be
treated with caution. The Health Survey SF-36 is one of the most
widely used, validated and translated instrument in the field of HRQoL
measurements. This work intends to highlight the importance of testing
the hypothesis of a model before choosing and evaluating a given sta-
tistical analysis in those studies where the SF-36 has been used. Ex-
amples of application of the SF-36 are provided, as well as more spe-
cific analysis to show that, depending on the statistical analysis used,
results can be different and, in addition, they can also have different
clinical relevance in the context of the application.

Key words: quality of life, SF-36, statistical analysis, goodness of fit.

AMS Classification: 62J05, 62J12, 62P10.

También podría gustarte