Está en la página 1de 5

Investigaciones Andina

ISSN: 0124-8146
investigaciones@funandi.edu.co
Fundación Universitaria del Área Andina
Colombia

Grisales Romero, Hugo


USOS Y LIMITACIONES DE LOS MÉTODOS DE ANÁLISIS MULTIVARIADOS EN LA
INVESTIGACIÓN EPIDEMIOLÓGICA
Investigaciones Andina, vol. 8, núm. 13, 2006, pp. 81-84
Fundación Universitaria del Área Andina
Pereira, Colombia

Disponible en: http://www.redalyc.org/articulo.oa?id=239017515007

Cómo citar el artículo


Número completo
Sistema de Información Científica
Más información del artículo Red de Revistas Científicas de América Latina, el Caribe, España y Portugal
Página de la revista en redalyc.org Proyecto académico sin fines de lucro, desarrollado bajo la iniciativa de acceso abierto
FUNDACIÓN UNIVERSITARIA DEL ÁREA ANDINA

USOS Y LIMITACIONES DE LOS MÉTODOS


DE ANÁLISIS MULTIVARIADOS EN
LA INVESTIGACIÓN EPIDEMIOLÓGICA1
Hugo Grisales Romero*

Fecha de recibo: Marzo/06


Fecha aprobación: Julio/06

El análisis multivariado comprende un de la segunda guerra mundial se amplió


grupo de técnicas estadísticas, en las cua- el horizonte aplicativo a diversas discipli-
les se analiza la aleatoriedad de múltiples nas, entre ellas la epidemiología donde
variables al mismo tiempo. Un concepto Cornfield, Truett y Kleinbaum contribuye-
unificador que subyace en las diferentes ron en la aplicación de las técnicas
técnicas y facilita el análisis multivariado, multivariadas en sus estudios sobre facto-
es el uso de modelos matemáticos que res de riesgo para enfermedad coronaria3.
responden de la interrelación entre las va-
riables del análisis1. La planificación de
una gran parte de la investigación en sa- Usos
lud pública en general y en epidemiología
en particular, requiere cada vez más la Los métodos estadísticos multivariados
aplicación de las técnicas que provee el pueden agruparse en dos conjuntos: los
análisis multivariado, las cuales contribu- que permiten extraer la información acer-
yen a la comprensión del(los) evento(s) ca de la interdependencia entre las varia-
de interés desde una perspectiva bles que caracterizan cada uno de los in-
multifactorial2. dividuos, y los que permiten extraer in-
formación acerca de la dependencia en-
Los fundamentos teóricos del análisis tre una (o varias) variable(s) con otra (u
multivariado se desarrollaron durante los otras)4. Del primer grupo referido hacen
tres primeros decenios del siglo XX por parte el análisis factorial, de clusters, de
Fisher y Pearson y su primera disciplina correlación canónica, de ordenamiento
de aplicabilidad fue en la agricultura, multidimensional y de correspondencias;
siendo el análisis discriminante la técni- en el segundo grupo se encuentran las
ca más utilizada, la cual, a través de los técnicas de regresión, los análisis de con-
años ha dado paso a otras técnicas me- tingencia múltiple, el análisis de la
nos exigentes en supuestos. Sólo a partir covarianza y el análisis discriminante.
* Profesor Facultad Nacional de Salud Pública. Universidad de Antioquia
1
Algunos autores como Kleinbaum no hablan de métodos multivariados si no de métodos multivariables, donde enfatiza es en la
evaluación simultánea del efecto de varias variables independientes sobre una variable respuesta (análisis de dependencia). 81
En los últimos tiempos, en la investiga- les. Por ejemplo, mediante la construc-
ción epidemiológica de tipo analítico, el ción de un modelo de Cox se puede con-
análisis factorial, como técnica de inter- trastar la hipótesis sobre los efectos del
dependencia y los modelos de regresión consumo de alcohol y el sexo hasta el
logística, de Cox y de Poisson como he- momento del comienzo de la cirrosis
rramientas de dependencia, han tenido hepática. En esta línea, se podría res-
un papel protagónico como métodos de ponder: ¿tienen los hombres y las muje-
análisis, lo cual podría explicarse por la res diferentes riesgos de desarrollar
tecnología informática que ha proporcio- cirrosis hepática a causa del consumo de
nado el software para facilitar las elabo- alcohol?5
raciones. Lo claro es que las técnicas
antes indicadas han robustecido el arse- La regresión logística es quizás la técni-
nal de herramientas que tiene el ca de dependencia más utilizada en la
epidemiólogo para abordar los objetivos investigación epidemiológica de tipo
de sus investigaciones. analítico, para predecir o ajustar el com-
portamiento de una variable dependien-
El análisis factorial es un método de in- te dicotómica, por lo general la enferme-
terdependencia, que sirve para determi- dad o algún otro evento recurrente en
nar el número y la naturaleza de un gru- función de otras variables llamadas
po de constructos-atributos para expli- covariables. Por ejemplo, mediante esta
car un fenómeno que está subyacente en técnica es factible predecir las variables
un conjunto de variables. Por ejemplo, que explican mejor el bajo peso al nacer
un epidemiólogo podría estar interesa- en un estudio analítico.
do en establecer los factores que inciden
en la satisfacción laboral en los trabaja- La regresión de Poisson es una técnica
dores sanitarios de un municipio o tam- de dependencia donde la variable de-
bién de establecer los dominios que per- pendiente hace referencia a años-perso-
mitan determinar las condiciones de na-riesgo-exposición como es el caso de
vida de los adolescentes de una región. las tasas de incidencia, y que correspon-
En estos ejemplos, el análisis factorial den a un evento que se considera de baja
desempeñaría un papel fundamental frecuencia o ‘raro’. Por ejemplo, un
para resolver los interrogantes en cada epidemiólogo podría estar interesado en
caso. comparar la incidencia de cáncer de piel
en dos ciudades, considerando que las
La regresión de riesgos proporcionales diferencias en las incidencias puedan ser
de Cox es un método de dependencia, debidas a que ambas ciudades tengan
utilizado en estudios longitudinales so- una distinta pirámide de población o
bre datos de supervivencia y donde la quizás, y sería una hipótesis más intere-
función de riesgo da la probabilidad que sante a investigar, la presencia de algún
un paciente muera durante un interva- otro factor.
lo de tiempo específico, dado que el pa-
ciente vivió hasta el principio del mis- Finalmente, si se conoce la distribución
mo; en este modelo, las covariables tie- de las poblaciones para los distintos gru-
nen un efecto multiplicativo o propor- pos de edad, así como el grupo al que
cional en la probabilidad de morir; de pertenece cada enfermo, se puede plan-
82 aquí el nombre de riesgos proporciona- tear un modelo de Poisson.
FUNDACIÓN UNIVERSITARIA DEL ÁREA ANDINA

En el último decenio en investigación pensar que se han controlado todas las


epidemiológica, se ha pretendido incor- variables que conforman el diagrama
porar el contexto en el cual suceden los causal.
eventos y las exposiciones y se conoce
como eco epidemiología. Quizás la he- La confusión residual o ajuste incomple-
rramienta de dependencia más potente es to se presenta cuando éste no elimina
el análisis multinivel, que como técnica completamente el efecto de confusión
permite diferenciar entre efectos indivi- debido a una variable dada o a un con-
duales y los efectos de contexto. Por ejem- junto de variables. Ocurre cuando al-
plo un epidemiólogo podría estar intere- gunas categorías del confusor controla-
sado en estudiar a nivel regional las con- do son tan amplias que se obtiene un
diciones de vida de los adolescentes jóve- ajuste imperfecto o cuando algunas va-
nes y plantear en alguno de sus objetivos riables de confusión no se controlan.
una comparación de dichas condiciones, Entre las principales causas de esta
según características individuales y de limitante en las técnicas de dependen-
contexto. En este caso se puede establecer cia se destacan: la definición inadecua-
una estructura jerárquica de 3 niveles, don- da de las categorías de la(s) variable(s)
de los adolescentes jóvenes se sitúan en el de confusión, la variable empleada para
nivel 1, la familia en el nivel 2 y la comuna el ajuste como un sucedáneo imperfecto
en el nivel 3. Otras aplicaciones de esta de la condición o de la característica por
técnica en epidemiología se centran en la la cual se desea ajustar, otros importan-
evaluación de indicadores de salud que tes confusores no fueron incluidos en el
se distribuyen por áreas; en la satisfacción modelo o errores de clasificación en las
de los usuarios con relación a especialis- variable de confusión7.
tas que los asisten y el centro de salud don-
de se atienden; en pruebas clínicas donde El sobreajuste, el cual ocurre cuando se
se aplican diferentes tratamientos, y en la ajusta erróneamente para una variable
evolución de la salud de un paciente en que o está en el camino causal que vin-
el tiempo, entre otros. cula la exposición con el desenlace-cau-
sa intermedia, o tiene una relación tan
La necesidad de aplicar metodologías fuerte con la exposición o con el desen-
más allá de las puramente individualis- lace, que la verdadera relación se
tas ha sido reconocida por diferentes distorsiona, es otra limitante del mode-
autores,y se refleja en las recientes pu- lo de dependencia, el cual exige la nece-
blicaciones de textos sobre análisis sidad de considerar los determinantes
multinivel en salud6. biológicos de la relación que se valora,
evaluar las relaciones entre las variables
Limitaciones de confusión postuladas por una parte
y la exposición y las variables de desen-
La eficiencia estadística de los modelos lace por otra.
multivariados tiene un precio, que es la
suposición que una forma matemática El problema de qué variables indepen-
dada describa perfectamente la relación dientes confusoras han de ser incluidas
de las variables del estudio. Esta supo- en el modelo, está en el centro de discu-
sición es peligrosa ya que en el paradig- sión sobre el tópico de confusión y de
ma de la multicausalidad, es una utopía confusión residual8 83
Se obvia, cuando se construyen mode- No se deben utilizar las técnicas multiva-ria-
los de dependencia en la realización del das por moda sino que su uso debe estar en
análisis de sensibilidad del modelo, esto consonancia directa con los objetivos traza-
es examinar si se obtienen resultados si- dos; por lo tanto, si los objetivos no exigen el
milares cuando se han empleado diferen- uso de la técnica, es un exabrupto utilizarla
tes modelos o se han hecho diferentes su- por el mero hecho de darle formalidad teó-
puestos para el análisis. rica y sofisticación al estudio.

Es aconsejable no utilizar mecánicamen- ¿Cuál de los modelos a elegir es el más


te los procedimientos de selección paso a apropiado? Al respecto, tal como lo su-
paso, cuando se construyen modelos de re- giere Kleinbaum9, hay varios aspectos
gresión. Éstos son automáticos, tienen una que el investigador debe atender previa-
alta probabilidad de generar hallazgos es- mente antes de elegir el ‘mejor’ modelo:
purios y en muchas ocasiones las variables ¿Cómo identificar los roles que juegan los
que son retenidas en el modelo, clínica- diferentes predictores? ¿Qué estrategias de
mente no son importantes, en contraposi- modelación se seguirán? ¿Cómo se consi-
ción con aquellas que se excluyeron. derarán varias exposiciones y varias varia-
bles de control? ¿Cómo estimar la confusión
Una advertencia importante es no ser in- si la interacción está presente? ¿Cómo esti-
formal en la aplicación de las técnicas, sin mar colinealidad y mejor aún, cómo contro-
revisión del cumplimiento de los supues- larla? Definitivamente es un contrasentido,
tos que las sustentan. De hecho, técnicas aunque común, la construcción automática
como la regresión múltiple exige el cum- de modelos multivariados en los cuales no
plimiento de algunos supuestos que en se tiene claridad del propósito que se persi-
la mayoría de las situaciones se omiten, gue con el análisis o se desconocen aspectos
lo cual induce a decisiones derivadas de importantes del método. Este es el abrebocas
modelos mal ajustados. para cometer serias equivocaciones.

REFERENCIAS BIBLIOGRÁFICAS
1 Rothman K.J. Epidemiología Moderna. Ediciones Díaz de Santos. 1986. p. 318.
2 Johnson RA, Wichern DW. Applied multivariate statistical analysis. Prentice Hall, 1982; 461-
517.
3 Londoño, J.L. Metodología de la investigación epidemiológica. 3ª edición. Manual Moderno.
2004. p. 178
4 Pla, Laura E. Análisis Multivariado: Método de componentes principales. Monografía prepa-
rada para su publicación en el Departamento de Asuntos Científicos y Tecnológicos de la
Secretaria General de la OEA. Editora: Eva V. Chesneau. Washington, 1986. p. 5.
5 Beth Dawson-Saunders, Robert G. Trapp. Bioestadística Médica. Editorial el manual Mo-
derno, S.A. de C.V. México, D.F. p. 240.
6 Catalán-Reyes MJ, et al. Utilización de los modelos multinivel en investigación sanitaria .Gace-
ta Sanitaria 2003; 17(Supl 3):35-52.
7 Szklo M., Nieto J. Epidemiología Intermedia. Conceptos y Aplicaciones. Ediciones Díaz de
Santos. 2003. p. 285 a 293
8 Greenland S. Modeling and variable selection in epidemioogic analysis. Am J Public Health
1989; 79: 340-349
9 Kleinbaum DG. Epidemiologic methods: the «art» in the state of the art. Journal of Clinical
Epidemiology. 55 (2002) 1196-1200. p. 1198.

84