Documentos de Académico
Documentos de Profesional
Documentos de Cultura
en medicina
Bases tericas y prcticas
Elementos de Bioestadstica
La investigacin
en medicina
Bases tericas y prcticas
Elementos de Bioestadstica
Ricardo J. Esper
Rogelio A. Machado
Profesor Titular de Medicina, Universidad de Buenos Aires. Profesor Titular de Cardiologa, Universidad del Salvador, Buenos Aires. Consultor
en Cardiologa, Hospital Militar Central, Buenos
Aires. Ex-Presidente, Sociedad Argentina de Cardiologa. Ex-Presidente, Fundacin Cardiolgica
Argentina. Ex-Presidente, InterAmerican Heart
Foundation, Dallas, Texas, USA. Ex-InterAmerica
Representative, Executive Board, World Heart
Federation, Ginebra, Suiza. Fellow, American
College of Cardiology. Fellow, American Heart
Association
Esper, Ricardo
La investigacin en medicina: bases tericas y prcticas. Elementos de bioestadstica /
Ricardo Esper y Rogelio Machado. - 1 ed. - Buenos Aires: La Prensa Mdica Argentina, 2008. 360 p.; 25 x 18 cm.
ISBN 978-950-9250-25-3
ndice
11
13
15
19
Captulo 1. El conocimiento. Conocimiento humano e investigacin. El mtodo cientfico. Fuentes del conocimiento: observacin y experimentacin. Induccin y deduccin. Teoras e hiptesis. Prueba de una hiptesis. Los mtodos en las ciencias de la naturaleza.
Patricio F. Jacovella, Ral A. Borracci, Rodolfo J. Giuliano
Captulo 2. Leyes Cientficas. Extensiones y lmites del conocimiento cientfico
Rodolfo J. Giuliano
30
37
Metaanlisis
Luis Alcocer
Qu es la cardiologa basada en la evidencia?
Salim Yusuf y Rafael Daz
[ 9 ]
21
39
45
51
58
75
89
91
105
[ 10 ]
121
123
143
155
165
167
175
181
182
185
187
201
209
226
232
250
257
268
284
294
304
313
321
336
344
Prlogo
Investigar y comunicar: habilidades esenciales del mdico
existente sobre un determinado problema como paso previo a la elaboracin de nuevas hiptesis a ser investigadas. La lectura crtica de las publicaciones cientficas, requisito imprescindible para quien intenta realizar un nuevo aporte al conocimiento, es motivo de especial
anlisis.
Uno de los rasgos fundamentales de este libro reside en la completa y gil descripcin de
los elementos bsicos de la bioestadstica, cuyo dominio resulta imprescindible ya que en sus
tcnicas se basa cualquier anlisis serio de los hallazgos de la investigacin cientfica.
En lo que respecta a la comunicacin de los resultados, se describe la manera de encarar
la redaccin de un manuscrito para ser publicado as como las expectativas de los editores de
las revistas en las que se realizar esa publicacin. Tambin se analizan los procedimientos
apropiados para redactar una monografa o enfrentar la nada sencilla tarea de planear, llevar
a cabo y presentar una tesis de doctorado. No se descuida tampoco el importante aspecto
de la exposicin oral de los resultados y se describe el aporte que a su difusin realizan las
nuevas tecnologas de la comunicacin y la informacin.
Especial atencin se presta en el libro a la naturaleza de los distintos tipos de ensayos clnicos as como a las tcnicas empleadas para su evaluacin individual y de conjunto, como es
el caso de los meta-anlisis, atendiendo tambin a la presentacin del importante movimiento
conceptual generado en la medicina contempornea a partir de los resultados de los estudios
clnicos: la medicina basada en la evidencia.
El hecho de que la actividad del mdico est ntimamente ligada a su vocacin de compartir con los dems sus conocimientos, hace que la labor docente resulte inseparable de la
tarea asistencial o de investigacin. Por este motivo, se ha incluido un captulo dedicado al
estudio de las tcnicas que permiten realizar investigaciones en el campo de la educacin
mdica y compartirlas con los colegas luego de someter a un anlisis riguroso los resultados
obtenidos mediante las innovaciones educativas. Asimismo, puesto que la interaccin del
mdico con la sociedad ha adquirido una creciente importancia en las ltimas dcadas, se justifica ampliamente la inclusin de un captulo sobre el periodismo mdico ya que esa relacin
con la prensa masiva no har sino incrementarse en el futuro, cimentando as un vnculo que
es hoy esencial para la medicina en sus actividades de prevencin, diagnstico, tratamiento y
rehabilitacin.
En sntesis, es esta una obra oportuna que brindar una eficaz compaa a los profesionales que aspiren a realizar tareas de investigacin y comunicar sus resultados de manera
apropiada. Por la trascendencia de los temas que aborda as como por los conocimientos y
experiencia de quienes los desarrollan, este manual sobre la investigacin en medicina, est
llamado a convertirse en una herramienta indispensable para los mdicos y otros profesionales de la salud que quieran internarse por el apasionante sendero que siempre representa la
bsqueda de nuevos conocimientos.
Guillermo Jaim Etcheverry
Profesor Titular de Biologa Celular e Histologa, Facultad de Medicina, Universidad de Buenos Aires.
Ex-Decano, Facultad de Medicina, Universidad de Buenos Aires.
Rector, Universidad de Buenos Aires, 2002 - 2006
[ 12 ]
Prefacio
Tu verdad? No, la Verdad,
y ven conmigo a buscarla
Antonio Machado.
Proverbios y Cantares
tacin y la solidez de las propuestas que la medicina le ofrece a sus integrantes. Hemos podido
comprobar que, junto con el nmero, ha aumentado tambin la complejidad de las preguntas
dirigidas al mdico con mayor experiencia. Esto es particularmente evidente cuando las consultas se orientan hacia aspectos particulares como, por ejemplo, la interpretacin del diseo
de estudios clnicos de cierta complejidad, las posibilidades y limitaciones de los distintos
modelos de anlisis estadstico aplicado, y la lacitud de extender las conclusiones a distintas
poblaciones. Esta mayor necesidad de acceder a los niveles en los que se funda la obtencin
del conocimiento en medicina, muy ostensible en los mdicos jvenes, es probablemente un
fenmeno de validez general que abarca a toda la comunidad de los integrantes de las ciencias
mdicas. Los grandes avances de la medicina, facilitados por los avances tecnolgicos y fundados en importantes desarrollos tericos, no hacen ms que reforzar el inters general por
los aspectos bsicos de la investigacin mdica.
Para el presente texto, los editores han solicitado y han tenido el privilegio de obtener, la
colaboracin de un conjunto de personalidades de las ciencias mdicas internacionalmente
reconocidas, que han permitido iluminar desde varios ngulos las ilimitadas facetas de ese
todo que es la investigacin cientfica en el campo de la medicina. De ellos es el mrito de la
obra, y a ellos se dirige el agradecimiento de los editores, a quienes por su parte, les ha tocado organizar los captulos de manera de permitir desplegar en forma sucesiva los diferentes
escenarios propuestos por los autores. Llegue tambin nuestro agradecimiento a los colegas
y amigos que, de una u otra forma, nos ayudaron en la concrecin del trabajo, y a los Dres.
Juan Carlos y Sebastin Bag, cuyo apoyo result esencial para su llegada a buen puerto.
Los elementos de bioestadstica compilados al final de la obra hallan su justificacin en el
deseo de los editores de invitar al lector ajeno a la materia, a transponer los umbrales de una
disciplina tan imprescindible como en general poco familiar para el mdico que no ha tenido
un acercamiento previo a sus ideas y mtodos.
Los editores esperan que el producto de su trabajo pueda ser de alguna utilidad para
aquellos que se hallan comprometidos con la investigacin en medicina, y que la lectura del
libro les proporcione al menos una parte del placer que ellos han tenido en elaborarlo. Y recuerde el lector que para ser exitoso no tiene que hacer cosas extraordinarias, simplemente
hacer cosas ordinarias, pero extraordinariamente bien.
Ricardo J. Esper
Rogelio A. Machado
[ 14 ]
Co-autores
Luis Alcocer
Jefe del Servicio de Cardiologa del Hospital General de Mxico. Profesor Titular de Medicina (Cardiologa) y del
Curso de Especializacin en Cardiologa, Facultad de Medicina, Universidad Nacional Autnoma de Mxico.
Investigador Titular de los Hospitales de Referencia e Institutos Nacionales de Salud de Mxico.
Nora Br
Periodista cientfica. Editora de la Seccin Ciencia y Salud del diario La Nacin. Miembro de la Academia Nacional de Periodismo.
[ 15 ]
Rafael Daz
Instituto Cardiovascular de Rosario. ECLA Argentina
Daniel Fernndez-Bergs
Doctor en Medicina, Universidad Complutense de Madrid, Espaa. Mdico Cardilogo Universitario, Universidad del Salvador, Buenos Aires, Argentina. Mdico Cardilogo Adjunto, Seccin de Cardiologa, Departamento
de Medicina Interna, Hospital Don Benito Villanueva, Badajoz, Espaa. Presidente, Comisin de Investigacin
de la Sociedad Extremea de Hipertensin Arterial y Otros Factores de Riesgo Cardiovascular. Miembro, Grupo
Tcnico de Cardiopata Isqumica del Plan Integral de Enfermedades Cardiovasculares de Extremadura.
Enrique Fisman
Profesor de Cardiologa, Facultad de Medicina Sackler, Universidad de Tel-Aviv, Tel-Aviv, Israel. Profesor Honorario de Cardiologa, Facultad de Medicina, Universidad del Salvador, Buenos Aires, Argentina. Presidente,
Fundacin de Investigacin en Diabetologa Cardiovascular, Holon, Israel. Editor en Jefe, Cardiovascular Diabetology, Londres, Gran Bretaa
Rubn F. Iannantuono
Vicepresidente 1, Comit Independiente de Etica para Ensayos en Farmacologa Clnica de la Fundacin de
Estudios Farmacolgicos y de Medicamentos (FEFyM). Docente Adscripto de Farmacologa, Facultad de Medicina, Universidad de Buenos Aires. Ex Subdirector, Carrera de Mdico Especialista en Farmacologa, Facultad
de Medicina, Universidad de Buenos Aires.
[ 16 ]
Antonio Paragano
Cardilogo Universitario, Universidad de Buenos Aires. Mdico, Internacin y Unidad Coronaria, Departamento Cardiovascular, Servicio de Cardiologa, Hospital Militar Central, Buenos Aires. Instructor de Residencia
en Cardiologa, Departamento Cardiovascular, Servicio de Cardiologa, Hospital Militar Central, Buenos Aires.
Miembro, Comit Institucional de Revisin de Ensayos Clnicos (CIREC), Hospital Militar Central, Buenos Aires.
Docente, Carrera de Cardiologa, Universidad del Salvador, Buenos Aires. Docente, Facultad de Medicina, Universidad de Buenos Aires. Miembro Adherente, Sociedad Argentina de Cardiologa.
Alexander Tenenbaum
Profesor Asociado de Cardiologa, Facultad de Medicina Sackler, Universidad de Tel-Aviv, Tel-Aviv, Israel. Secretario General, Fundacin de Investigacin en Diabetologa Cardiovascular, Holon, Israel. Editor en Jefe, Cardiovascular Diabetology, Londres, Gran Bretaa. Director de Investigacin, Instituto de Rehabilitacin Cardaca,
Centro Mdico Sheba, Tel-Hashomer, Israel.
Andreas Wielgosz
MSc, MD, PhD. Professor of Medicine and Community Medicine & Epidemiology. University of Ottawa, Ontario,
Cnada. Editor-in-Chief, Prevention and Control. Official Journal of the World Heart Federation, Ginebra, Suiza.
Salim Yusuf
Heart and Stroke Foundation of Ontario Research Chair, Ontario, Canada. Senior Scientist of the Canadian
Institute of Health Research. Director of Cardiology and Professor of Medicine, McMaster University, Hamilton
Health Sciences, Hamilton, Canada.
[ 17 ]
El conocimiento
Captulo 1
Patricio F. Jacovella,
Ral A. Borracci,
Rodolfo J. Giuliano
1. El conocimiento
Es importante diferenciar los conceptos de conocimiento e informacin. Conocimiento
es lo que se sabe. Cuando el conocimiento permite tomar decisiones se transforma en informacin. Para resolver problemas en medicina es necesario tener acceso a la informacin y
procesarla adecuadamente.1,2
La epistemologa es un rama de la filosofa que se encarga de los problemas que rodean a
la teora del conocimiento. Sus principales problemas son la posibilidad del conocimiento, su
origen o fundamento, su esencia o trascendencia y el criterio de verdad. 3
Todo conocimiento es una relacin entre el sujeto que conoce y el objeto que es conocido.
La relacin de un determinado conocimiento no puede estudiarse dejando de lado al sujeto y
al objeto. La epistemologa como ciencia, estudia la relacin entre el sujeto y el objeto y todos
los problemas que esa relacin plantea.
2. La ciencia
La ciencia es el conocimiento ordenado y mediato de los seres y sus propiedades por
medio de sus causas.
El saber cientfico no aspira a conocer las cosas superficialmente, sino que pretende entender sus causas, porque de esa manera se comprenden mejor sus efectos. Se distingue del
conocimiento espontneo por su orden metdico, su sistema y su carcter mediato.
Para conocer las cosas a fondo es necesario utilizar la razn y observar ms detenidamente los procesos. Las caractersticas de dedicacin ordenada, constante y metdica diferencian
al conocimiento cientfico del comn.
La ciencia es descriptiva, explicativa, definitoria, etc., investiga qu son las cosas, como
actan, cmo se relacionan, cundo, cmo, dnde, por qu. La ciencia es un conjunto de
[ 21 ]
3. El conocimiento cientfico
El conocimiento cientfico es un saber crtico, fundamentado, metdico, verificable, sistemtico, unificado, ordenado, universal, objetivo, comunicable (por medio del lenguaje cientfico), racional, provisorio y que explica y predice hechos por medio de leyes.2-4
El conocimiento cientfico es crtico porque intenta distinguir lo verdadero de lo fa1so. Se
distingue por justificar sus conocimientos y dar pruebas de sus verdades. Al demostrar que
es cierto, queda fundamentado.
El investigador sigue procedimientos planificados segn un orden y un mtodo. Fundamenta sus conocimientos mediante observacin, investigacin y prueba. De esta manera la
investigacin cientfica es planificada.
Se considera verificable ya que siguiendo los pasos descriptos en un trabajo cientfico,
otro investigador puede reproducir la experiencia.
Es sistemtico porque en cada etapa, los nuevos conocimientos se integran al sistema,
relacionndose con los que ya existan.
Es un saber unificado porque no busca un conocimiento de lo singular y concreto, sino el
conocimiento de lo general y abstracto, o sea aquello que las cosas tienen de idntico y permanente.
Es universal porque es vlido para todas las personas sin reconocer fronteras ni determinaciones de ningn tipo, no vara con las diferentes culturas.
Es objetivo porque es vlido para todos los individuos y no solamente para uno determinado. Es de valor general y no de valor singular o individual. Pretende conocer la realidad
tal como es, y la garanta de esta objetividad son sus tcnicas y sus mtodos de investigacin
y prueba.
Es comunicable mediante el lenguaje cientfico, que es preciso, comprensible para cualquier sujeto capacitado, quien podr obtener los elementos necesarios para comprobar la
validez de las teoras en sus aspectos lgicos y verificables.
Es racional porque la ciencia conoce las cosas mediante el uso de la inteligencia, de la razn.
El conocimiento cientfico es provisorio porque la tarea de la ciencia no se detiene, prosigue sus investigaciones con el fin de comprender mejor la realidad. La bsqueda de la verdad
es una tarea abierta.
La ciencia explica la realidad mediante leyes, que son las relaciones constantes y necesa[ 22 ]
rias entre los hechos. Son proposiciones universales que establecen en qu condiciones sucede
determinado hecho, por medio de ellas se comprenden hechos particulares. Tambin permiten adelantarse a los sucesos, predecirlos. Las explicaciones de los hechos son racionales,
obtenidas por medio de la observacin y la experimentacin.
En sntesis se pude decir que la ciencia busca explicar la realidad mediante leyes que permiten predicciones y aplicaciones prcticas mediante tecnologa.
El conocimiento cientfico es un saber objetivo que se estructura en sistemas verificables,
obtenidos mediante mtodos especficos (mtodo cientfico) y comunicados en un lenguaje
propio con reglas precisas.
4. El mtodo cientfico
Se puede definir investigacin como un sistema de actividades intelectuales y manuales
destinado a la produccin de informacin, con el fin de resolver problemas.
En las ciencias, se aceptan informaciones que han sido producidas bajo un conjunto de
normas mundialmente aceptadas. Al conjunto de normas se lo conoce como mtodo cientfico.
La metodologa de investigacin es una disciplina derivada de la lgica y tiene como
objeto de estudio el sistema de normas llamado mtodo cientfico.4
Se puede concluir que mtodo o proceso cientfico es un conjunto de prcticas utilizadas
y ratificadas por la comunidad cientfica como vlidas a la hora de proceder con el fin de exponer y confirmar sus teoras. Las teoras cientficas, destinadas a explicar de alguna manera
los fenmenos que observamos, pueden apoyarse o no en experimentos que certifiquen su
validez.
4.1. Etapas del mtodo cientfico:
1) Observacin: es la aplicacin de los sentidos a un objeto o fenmeno, para estudiarlos
tal como se presentan en la realidad.
El primer paso del mtodo cientfico tiene lugar cuando se hace una observacin a propsito de algn evento o caracterstica del mundo. Esta observacin puede inducir una pregunta
sobre el evento o caracterstica. 3 Por ejemplo, un da un observador puede dejar caer un vaso
de agua y observar como se hace aicos en el piso cerca de sus pies. Esta observacin puede
inducirle la pregunta, Porqu se cay el vaso?
2) Induccin: es la accin de extraer el principio particular a partir de determinadas
observaciones.
3) Hiptesis: es el planteo a resolver
Tratando de contestar la pregunta, un cientfico formular una hiptesis o conjetura a
propsito de la respuesta a la pregunta. En el ejemplo del vaso hay varias posibles hiptesis,
pero una de ellas podra ser que una fuerza invisible (gravedad) tir el vaso al suelo. 3
4) Experimentacin: es la prueba de la hiptesis
De todos los pasos en el mtodo cientfico, es el que verdaderamente separa la ciencia
de otras disciplinas. Para comprobar o refutar una hiptesis, el cientfico disear un ex[ 23 ]
perimento para probar esa hiptesis. A travs de los siglos, muchos experimentos han sido
diseados para estudiar la naturaleza de la gravedad.
5) Demostracin de la hiptesis: refutacin de la hiptesis
6) Tesis: conclusiones
Una comn percepcin sobre la ciencia, aunque errada, es que la ciencia define la verdad. La ciencia no define la verdad, ms bien define una manera de pensar. Es un proceso
en el cual se usan experimentos para contestar preguntas. A este proceso se lo denomina el
mtodo cientfico y comprende los pasos citados. 3
6. Teoras e hiptesis
Desde el punto de vista cientfico, si se acepta que un sistema es un conjunto de partes que
interactan entre s, una teora es un sistema de hiptesis. 2
Hiptesis es un planteamiento o supuesto que debe ser comprobado o refutado siguiendo
las normas establecidas por el mtodo cientfico Tiene, como condicin imprescindible, que
debe ponerse a prueba.
En general, en un trabajo de investigacin cientfica se plantean dos hiptesis mutuamente excluyentes: la primera es llamada hiptesis nula (H0) y la otra usualmente se conoce como
hiptesis alterna (H1). El procesamiento de los datos, segn la metodologa de investigacin
diseada, mostrar cul de las dos hiptesis se comprueba como cierta, de manera que slo
sta se incorporar al conocimiento que la investigacin aporta a la ciencia.1,2,4
[ 24 ]
experimentacin, el anlisis, la sntesis y la conceptualizacin. Esta parfrasis de una definicin de ciencia nos induce a pensar que la medicina est hecha de ciencias, y en consecuencia
comparte los mismos mtodos cientficos. Pero la verdad es que la definicin de ciencia ms
amplia que podamos hallar, con seguridad dejar afuera gran parte de lo que es la medicina.
El filsofo y matemtico Gottfried W. Leibniz, nacido en Leipzig en 1648 (cincuenta aos
despus de Descartes) concibi a la ciencia como un cuerpo doctrinal que poda ser conocido sistemticamente y con un alto grado de certeza, y la contrapona o bien a la opinin,
que slo implica un grado de certeza menor, o bien al arte, que involucra una prctica ms
que una doctrina. Atenerse a sta ltima definicin obliga en consecuencia a separar de la
ciencia mdica los aspectos prcticos y tcnicos vinculados con su arte. Despus de sta aclaracin podra escudriarse en los mtodos de la ciencia que la medicina utiliza. En primer
lugar se debera analizar si existe un nico mtodo cientfico, ya que a la biologa (y de all
la medicina) puede considerrsela una disciplina con autonoma cientfica y acreedora a su
propio mtodo, o bien una ciencia que comparte las reglas y metodologa de la fsica.
La corriente denominada fisicalismo comprime a la biologa en el marco conceptual
de la fsica. Su origen formal podra remontarse a Galileo (1564-1642) en cuya poca nicamente exista la mecnica como ciencia y la matemtica como su necesaria aliada. Para
su poca hasta 350 aos despus, el libro de la naturaleza estaba escrito en el lenguaje de la
matemtica, y este modelo de ciencia sobrevive an para muchos. El papel dominante de la
fsica y la matemtica en la ciencia obtuvo el apoyo de figuras como Isaac Newton (16421727) e Immanuel Kant (1724-1804) quien lleg a afirmar que solo hay ciencia genuina,
en la medida que contenga matemtica, a pesar que su Crtica del juicio (1790) tuvo un
xito limitado para intentar explicar la naturaleza en base a los principios newtonianos. En
los ltimos 100 aos ha habido cierta liberalizacin de esta corriente llamada fisicalismo, y
a pesar de su incontrovertible aporte, muchos autores modernos consideran que el mtodo
cientfico de la fsica no es el ms adecuado para una disciplina como la biologa, de la cual
depende la medicina.
Ernest Mayr (1904-2005) fue mdico y bilogo, evolucionista, y ha sido reconocido
como el Darwin del siglo XX. Este cientfico y filsofo postul que cualquier enfoque
de una filosofa de la biologa basado fundamentalmente en la lgica y la matemtica
ms que los conceptos especficos y particulares de la biologa resultar insatisfactorio,
y plante una serie de consideraciones sobre la autonoma cientfica de la biologa (2004).
En particular, demostr que algunas ideas fisicalistas (de la fsica) no eran aplicables a la
biologa. Por ejemplo desde los pitagricos y Platn, el concepto tradicional de diversidad
del mundo se planteaba con la existencia de una cantidad limitada de eide o esencias,
que consistan en clases o tipos netamente delimitados (tipologa o esencialismo). Bajo
esta concepcin, los miembros de una misma clase eran idnticos, constantes y separados
con precisin de los miembros de otro tipo o esencia. La idea central del racismo se basa
en estas diferencias de grupos tnicos humanos que se hallaran netamente separados en
clases distintas. Darwin fue quien rechaz este pensamiento tipolgico propio de la fsica
y emple en consecuencia un concepto completamente diferente denominado actualmente
poblacional, que admite las variaciones dentro de las clases, como ocurre ciertamente en
las poblaciones de seres vivos.
[ 27 ]
Otra idea de la fsica no aplicable enteramente al estudio de los seres vivos es el llamado
determinismo, que no deja espacio para la variacin o los hechos fortuitos. El matemtico
y fsico francs Pierre Laplace (1749-1827) se ufanaba de que el conocimiento completo del
mundo actual permitira predecir el futuro sin limitacin en el tiempo. Este concepto claramente determinista, no puede sostenerse actualmente ante la perspectiva de la nueva teora
de los sistemas dinmicos o del caos en el que una mnima variacin en las condiciones
iniciales hacen impredecible el desenvolvimiento futuro de una variable. La refutacin del
determinismo estricto y de la posibilidad de prediccin absoluta permite la aceptacin de la
variacin y de los fenmenos aleatorios tan comunes en la biologa.
Finalmente, otras de las clsicas ideas fisicalistas se refiere al denominado reduccionismo.
Este explica que la resolucin de un problema se obtiene a partir de la particin y reduccin del
sistema a sus componentes ms pequeos. Esta divisin, junto con la determinacin de la funcin de cada elemento, permitira explicar el problema. La realidad es que a partir de la teora
de los sistemas, el estudio de los seres vivos admite que stos estn compuestos por elementos y
relaciones que se pierden si se reduce el sistema a sus partes, y que en consecuencia el todo pasa
a ser mucho ms que la suma individual de las partes que lo componen. El estudio ms moderno
de los denominados autmatas celulares permite demostrar que no es posible inferir el comportamiento de unidades simples en cuanto al desarrollo de propiedades emergentes a partir de la
interaccin de estas unidades. Es as que la estructura de los tejido vivos no puede explicarse
enteramente si se los reduce a sus componentes celulares; la interaccin de estas ltimas generan
caractersticas emergentes no inferibles a partir del estudio celular individual.
Hasta aqu se pueden resumir una serie de conclusiones sobre los mtodos de las ciencias
de la naturaleza. Por un lado la tipologa que asume la invariabilidad de los tipos o clases se
reemplaza por el pensamiento poblacional que admite pequeas variaciones entre los elementos o seres de la misma clase. En segundo lugar el estudio de la naturaleza admite el uso del
caos determinista y el azar en lugar de un determinismo rgido. Y por ltimo se complementa
el reduccionismo o anlisis individual de las partes con el pensamiento sistmico o de anlisis
sinttico para la comprensin de los sistemas vivientes en conjunto y de las propiedades emergentes a partir de elementos constitutivos simples.
Tanto la rama de la biologa que estudia la evolucin como la medicina clnica asistencial
que indaga la historia de la enfermedad, requieren de otro mtodo que podra llamarse narrativa histrica. La biologa evolucionista debe recrear la historia pasada con los datos del
presente, o con aqullos que pueda recoger en la actualidad, y as construir una narracin que
explique el fenmeno de la evolucin. De la misma forma, el oficio de un mdico consiste en
escuchar, narrar y construir historias a partir del relato de los hechos mdicos referidos por
el paciente. De la misma forma, los signos que recoge el mdico, reflejan una foto del estado
actual que necesita ser reconstruido hacia atrs a la manera de un detective.
Referencias
1. Arribalzaga EB, Borracci RA, Giuliano RJ, Jacovella PF: El artculo cientfico: del papiro
al formato electrnico. Buenos Aires, Magster Eos, 2005
[ 28 ]
[ 29 ]
Captulo 2
Leyes cientficas
nica, por que tena sentido de identidad en todos los hombres y todos disponan de
ella en igual medida
[ 30 ]
Las ideas bsicas del racionalismo crtico y de la epistemologa evolucionista se fundieron ampliamente en la mentalidad de nuestros das, aunque muchas alarmas suenan con el
objeto de despertar ese conocimiento aletargado, que afrontara nuevas instancias difciles
de resolver.
Segn P. W. Atkins, profesor de fsica y qumica de la Universidad de Oxford, somos meros productos del mundo fsico. La fsica est a punto de explicarlo todo, incluso la creacin
del universo a partir de la nada, sin necesidad de recurrir a un Dios creador.
Atkins no es el nico ser que anticipa el final de la fsica fundamental. Otros tericos ya
describen un presunto final de la ciencia. Seguramente nada de ello ocurrir porque la ciencia
experimental contina marchando por la ruta que los genios, como Newton, trazaron lejos
de cualquier extravagancia.
El siglo XX adems produjo, sobre el fin de su primera mitad, una de las grandes conmociones del saber mundial con el advenimiento de la informtica.
La concepcin de la informtica gener una revolucin tal, que la filsofa Esther Diaz la
equipar con el impacto histrico que produjo la enunciacin heliocntrica de Coprnico.
Ese itinerario histrico, que an transcurrimos, se inici con la telemtica cuando el gobierno de Estados Unidos convoc a una serie de distinguidos investigadores de lite, para que
indagaran en tecnologas apropiadas que mantuvieran comunicaciones rpidas y eficientes.
La preocupacin del gobierno central era ms que apremiante. La Unin transitaba simultneamente por dos guerras entre Oriente y Occidente y necesitaba mantener contactos
instantneos entre las metrpolis americanas y los remotos campos de batalla.
Esa conjuncin explosiva entre tecnociencia y poltica exterior dio vida a una de las criaturas artificiales mas inquietantes de la historia de la humanidad, la computacin, y con ella
un nuevo paradigma de la ciencia: la globalizacin cientfica.
Actualmente, la robustez digital posibilit que se liberaran las frmulas de la fisin del
tomo y comenzaran las prcticas atmicas, las nuevas ecuaciones fsicas que concibieron
los viajes interplanetarios y las investigaciones biolgico-digitales que culminaron con la
ingeniera gentica, entre otros.
Fedoseev y Pjaro en nuestros das, plantean que el proceso del conocimiento transcurre
por tres etapas:
Psicobiofsicas
Sociobiofsicas
Sociopsicofsicas
Sociopsicobiolgicas
Sociopsicobiofsicas
Si un mtodo es un procedimiento que sirve para tratar un conjunto de problemas, el mtodo cientfico es en consecuencia una sistematizacin u orden que define el conocimiento
del saber y lo diferencia de otros tipos de conocimientos.
La filosofa de la ciencia lo delinea como todo fenmeno que es aceptado por el sentido
comn y por ende por la comunidad cientfica y la sociedad toda. Por su naturaleza debe
carecer de subjetividad. En consecuencia, cada mtodo especial es relevante para algn estadio particular de la investigacin cientfica, y si el mtodo general de la ciencia es un procedimiento que se aplica al ciclo entero de la investigacin en el marco de cada problema, la
finalidad del mtodo cientfico ser establecer la diferencia que existe entre la ciencia y la no
ciencia.
Aunque se lo asocia ecumnicamente con todas ellas, bsicamente suele aplicarse en las
llamadas ciencias naturales (biologa, fsica, qumica,...) en contraposicin con las ciencias
humanas (economa, poltica,...) que se rigen por la dialctica, el funcionalismo, el estructuralismo, la hermenutica y el mtodo fenomenolgico entre otros.
Los tres procedimientos esenciales que reciben genricamente la denominacin de mtodo cientfico son: inductivo, deductivo e hipottico-deductivo o de contrastacin de hiptesis.
El primero crea leyes desde la observacin de los hechos, mediante la generalizacin del
comportamiento observado. Dira que es ms representativo de las ciencias empricas.
El segundo aspira a obtener conclusiones a partir de premisas mediante el uso de la lgica
pura. Es el mtodo axiomtico propuesto por Aristteles como el mtodo cientfico ideal y es
propio de las ciencias formales.
Ambos encierran elementos filosficos subyacentes, se valen de la lgica y marchan en
ambos sentidos: de lo particular a lo general y viceversa.
Por ltimo el hipottico-deductivo o experimental, que generalmente no plantea problemas porque su validez surge de los resultados obtenidos del contraste de las propias pruebas.
Sin embargo se destaca su carcter predominantemente intuitivo ya que necesita contrastar sus conclusiones tanto para ser validado como rechazado.
Como se puede observar la metodologa de la ciencia est llena de matices segn la corriente filosfica perseguida.
Para Mara Jos Molina el rbol del conocimiento cientfico respondera al siguiente
algoritmo.
[ 34 ]
METODOLOGA DE LA CIENCIA
- ETAPAS I.- PASOS DEL MTODO CIENTFICO.
Planteamiento
Argumentacin
Lgica
Intuicin
Comunidad cientfica
Sociedad en su conjunto
Referencias
1. Artigas M. Los lmites del lenguaje cientfico. En: Ortz JM (ed). Veinte claves para la
nueva era. Madrid, Rialp 1992; pp 113-131
2. Bunge M. La investigacin cientfica. Mxico, Siglo veintiuno editores 2000; pp: 7, 265,
283-289, 299, 315.
3. Daz E. El desafo de las investigaciones disciplinarias e interdisciplinarias, articuladas
con una pedagoga del orden y del caos-2005. www.estherdiaz.com.ar
4. Daz Narvez VP, Calzadilla Nez A., Lpez Salinas H. Una aproximacin al concepto
del hecho cientfico. Cinta de Moebio- Facultad de Ciencias Sociales. Chile, Universidad
de Chile 2005, n 22
5. Espinosa Padierna LE. Tecnologa y educacin. Integracin del conocimiento o fragmentacin cultural? . www.redespecialweb.org/congreso6.htm
6. Hartmann N. Metafsica del conocimiento. Buenos Aires, Editorial Losada 1957; pp:
208
7. Ibez JJ. Las teoras cientficas segn Karl Popper: La falsabilidad. weblogs.madrimasd.org/universo/archive/2007/02/1059009.aspx
8. Lan Entralgo P. Conocimiento cientfico del hombre Seccin II. In Historia de la Medicina. Barcelona, Salvat 1979 pp: 418-463
[ 35 ]
9. Magnus D. Down the primrose path competing epistemologies in early XX century biology. In: Creath R, Mainchistein J (eds). Biology & epistemology. Cambridge, Cambridge University Press 2000
10. Molina MJT. Globalizacin cientfica. Nuevos paradigmas de la ciencia. www.molwick.
com/es/mtodos-cientficos
11. Pjaro D. La formulacin de la hiptesis. Cinta de Moebio- Facultad de Ciencias Sociales. Universidad de Chile. 2002 n 15.
[ 36 ]
Captulo 3
Andreas Wielgosz
scribir un artculo mdico que sea considerado adecuado para su publicacin luego de
su revisin o arbitraje por pares (peer review) requiere una estrategia clara y efectiva.
Tambin requiere una cuidadosa atencin a los detalles. Las exigencias cada vez mayores
y la gran competencia por publicar, en particular en las revistas ms calificadas, hacen de
lograr la aceptacin un verdadero desafo. Generalmente, la tasa de aceptacin suele ser
menor del 50%, con un 20 a 25% de trabajos rechazados an sin haber ingresado en la
fase de arbitraje por pares. Los autores exitosos tienen una forma sistemtica de encarar
la tarea y este captulo delinea los pasos que deberan darse, juntamente con indicaciones
tiles, para facilitar el procedimiento. Tambin da una visin de algunos de los errores
ms comunes en que se suele incurrir y de cmo evitarlos. La satisfaccin no solo debera
provenir de la contemplacin del trabajo en prensa, sino tambin del esfuerzo realizado en
su elaboracin.
Hay varios tipos de comunicaciones que pueden aparecer en un peridico mdico, incluyendo trabajos originales de investigacin, artculos de revisin o puesta al da de distintos
temas, comentarios editoriales, comunicaciones breves, casustica, comentarios de libros y
cartas al editor. La mayora de los comentarios que siguen se referir al artculo original de
investigacin, aunque los mismos principios se aplican a otros tipos de trabajo en general.
Aunque pueden existir beneficios secundarios en publicar, tales como elaborar una lista de
publicaciones para promover o facilitar la obtencin de fondos para la investigacin, etc.,
la ms importante de las motivaciones debera ser el poder comunicar hallazgos, conceptos
e ideas. En este sentido, es til considerar el manuscrito como un medio de comunicacin,
como si se refiriera una historia.
La clase de audiencia y la facilidad con la cual dicha audiencia podr ser alcanzada, estn determinadas en gran parte por la eleccin de la revista. Generalmente, el mayor alcance
se obtiene publicando en ingls en una revista Norteamericana o Britnica. Si el objetivo es
llegar a colegas que se hallen trabajando en el mismo campo, entonces quizs lo ms apropiado sea un peridico de la subespecialidad. Desde ya, el tema del trabajo debe estar en
consonancia con las metas y objetivos de la revista elegida. Si quedara alguna duda respecto
de la eleccin, lo mejor es contactar al editor. Esto puede tener el beneficio adicional de interesar al editor en el artculo propuesto y lograr que aguarde ansiosamente su envo. En caso
[ 39 ]
contrario, el editor podr ahorrarle un tiempo valioso dirigiendo el envo a una revista ms
acorde con el mismo.
Muchos autores eligen una publicacin en base al factor impacto, el cual depende de que
la revista se halle indexada. El factor impacto es una medida de la frecuencia con la cual los
artculos de una revista en particular son citados por autores que escriben en las dems revistas indexadas. Esto es llevado a cabo por el Instituto para la Informacin Cientfica (Institute
for Scientific Information), que sigue las citas por un perodo de tres aos. Aunque existe un
consenso general en que las citaciones frecuentes de un artculo son indicativas de su calidad
e importancia, este no es siempre el caso. De esta forma, cierta controversia rodea la significacin atribuda a los factores de impacto.1
La eleccin de una publicacin especfica debera surgir tempranamente en el proceso
de escritura porque determinar el formato y el estilo que debern adoptarse. Los requerimientos de estilo son publicados por las revistas al menos una vez al ao, aunque en algunos
casos pueden encontrarse en todos los nmeros y tambin se pueden conseguir en Internet.
Luego, el primer paso crtico es delinear la estructura del artculo en ciernes de acuerdo a los
requerimientos de la revista en la cual se intenta publicarlo.
La mayora de las publicaciones tienen requerimientos similares, con artculos originales
limitados a alrededor de 3.000 a 4.000 palabras, ms un resumen de alrededor de 250 palabras. La primera pgina es la del Ttulo, que tambin incluye un ttulo breve de alrededor
de 40 a 90 caracteres, que puede ser utilizado para bsquedas computarizadas. Los autores
estn listados en esta pgina, en ciertos casos con sus correspondientes grados y afiliaciones acadmicas. Un autor, tpicamente el primero, es identificado como corresponsal y la
informacin para su contacto es provista tanto para correspondencia durante el proceso de
arbitraje como para la publicacin definitiva del artculo. Nadie ms debera mantener la
comunicacin con la oficina editorial. Finalmente, en la primera pgina deberan inclurse
varias palabras clave (key words) destinadas a facilitar las bsquedas computarizadas que
podrn conducir a la identificacin del artculo. La terminacin de la primera pgina puede
ser pospuesta hasta el final, aunque el acuerdo acerca de la autora y orden de los autores es
mejor que sea abordado tempranamente.
El siguiente item es el Resumen. Muchas, aunque no todas las revistas, requieren un
resumen estructurado. 2 Este requisito debera estar includo en las instrucciones para los autores. Algunas revistas no lo especifican, dejando la cuestin a la discrecin de los autores. Un
resumen estructurado es ms probable que sea advertido y examinado, lo cual favorece que el
artculo sea ledo. En 1987, los Annals of Internal Medicine introdujeron como un requisito
los resmenes estructurados, con los siguientes sub-enacabezamientos: Objetivo, Diseo,
Campo (Setting), Pacientes, Intervencin, Mediciones, Resultados Principales y Conlusiones.
En 1996 fue agregado a la lista Antecedentes (Background) y en 2004, Limitaciones.
Algunos autores escriben primero el resumen, con el fin de servir como un bosquejo para
el resto del trabajo. Esto puede llegar a perturbar la escritura y causar mucha frustracin en
la medida en que el autor intenta resumir el artculo antes de que est concluida su redaccin.
Lo mejor es dejar el resumen para el final, lo que a su vez permite que las mejores frases o
enunciados para resumir el trabajo sean copiados y pegados directamente desde el artculo
terminado.
[ 40 ]
acelera la revisin del manuscrito y permite a los autores seguir el progreso de su envo. Un
sistema tal, hecho accesible por la Editorial Elsevier, es utilizado para los artculos enviados
a Prevention and Control, publicacin oficial de la Federacin Mundial del Corazn (World
Heart Federation). Todo el proceso de remisin electrnica requiere atencin a los detalles y
es recompensado por la confirmacin del recibo, que es enviada por e-mail al autor corresponsal. Sea que el envo del manuscrito tenga lugar electrnicamente o bien tradicionalmente, por correo postal, puede ser aadida una carta o mensaje para el editor. Esta es una buena
prctica, particularmente para sealar los mritos especiales que el artculo pueda tener, sean
stos lo novedoso de la investigacin o sus hallazgos significativos. Si hubiera existido una
comunicacin previa con el editor, debera ser mencionada.
En este punto, el destino del artculo est en manos de la oficina editorial. El editor decidir si el artculo es relevante y si merece la revisin o arbitraje por pares. El rechazo en esta
instancia puede ser cuestionable, en particular si no se da ninguna explicacin, como no sea
el apresurado comentario de que se reciben muchos artculos y solamente unos pocos pasan
por el proceso de arbitraje. A veces el editor puede ser persuadido si se sealan cualidades
nicas, que seran de gran inters para los lectores y que an podran aumentar el prestigio
de la revista, un argumento irresistible para muchos editores.
Si el manuscrito atraviesa la revisin por pares y los revisores recomiendan el rechazo, es
importante estudiar cuidadosamente las crticas. Los revisores tienden a enfocar tres aspectos de los manuscritos: legibilidad, relevancia y metodologa. En tanto la carta de rechazo
puede sonar como un repique fnebre para el trabajo enviado, todava puede ser emprendido
un nuevo envo, puntualizando al editor en el mensaje que acompaa, porqu es importante
ver el artculo publicado en esa revista en particular y qu pasos se han dado para mejorarlo.
Lo peor que puede ocurrir es otro rechazo, en tanto que es posible una reconsideracin. Si se
entiende que el arbitraje no ha sido imparcial, quiz llevado a cabo por un colega rival, tales
preocupaciones deberan ser comunicadas al editor. Solo unos pocos peridicos identifican a
el/los revisores con completa transparencia. Aunque pueden haber sido propuestos algunos
revisores, no hay garantas de que hayan aceptado la solicitud de revisar el manuscrito, ni an
de que el editor los haya contactado. Solicitar otra revisin no est fuera del caso. Es lo mejor
evitar reaccionar ante un rechazo con cargos emocionales de incompetencia y declaraciones
de nunca ms remitir artculos a esa revista. Despus de un rechazo definitivo, la alternativa
a un reenvo es la remisin del manuscrito a otra revista, pero solo despus de que los comentarios de los revisores hayan sido tomados en consideracin y las mejoras necesarias hayan
sido realizadas. La perspectiva del revisor siempre debera ser considerada. 3 La experiencia
de ser uno mismo un revisor, es muy til para escribir buenos artculos. Ofrecerse para actuar
como revisor es altamente recomendable.
Una vez que los comentarios de los revisores hayan sido atendidos, es de esperar que el
editor deje la puerta abierta para el reenvo del manuscrito. Esto debera realizarse tan rpido
como sea posible. La mayora de las revistas tienen un lmite de tiempo tal que luego de 6 o
12 meses, un artculo reenviado es tratado como un nuevo envo y atraviesa una nueva revisin independiente. An un reenvo en tiempo no es necesariamente devuelto a los rbitros
originales. El editor tiene la potestad de solicitar a los rbitros originales o a nuevos rbitros,
la revisin del manuscrito ya revisado.
[ 43 ]
El reenvo debera ser acompaado por una carta. Cada punto debera ser tratado por separado, elegante y claramente. Si existiera un desacuerdo con uno o ms de los comentarios realizados por los rbitros, las razones deberan ser explicadas. Por otra parte, las crticas vlidas
deberan ser aceptadas con reconocimiento y atendidas, sealndose los cambios realizados.
Una vez que el artculo es aceptado, el paso final implica la revisin de las pruebas de
galera previas a la publicacin. Las pruebas de galera estn compuestas en su aspecto final.
Los encargados de la publicacin slo permiten correcciones menores, en general para salvar
errores en el deletreo o la puntuacin. El agregado de frases o los cambios mayores resultan
engorrosos para el proceso y estn fuertemente desaconsejados, cuando no prohibidos. Una
respuesta rpida a este punto es tambin mandatoria porque el artculo se halla en camino a
una prxima publicacin, con tiempos estrictos, de modo que los retrasos no son tolerados.
Tambin en esta instancia, al autor le es tpicamente requerido firmar la transferencia de los
derechos de autor (copyright) a favor del editor, y decidir si ordena reimpresiones (reprints)
adicionales del artculo. La mayora de los peridicos ofrecen un nmero limitado de reprints
en forma gratuita. Pueden haber costos por el agregado de fotografas en color, aunque esto
tambin vara segn los editores.
Finalmente el artculo aparece impreso y es tiempo de celebrar. Quiz entonces pueda considerarse el escribir otro artculo. Las preparaciones para el prximo artculo deberan comenzar
tempranamente, mientras la investigacin est an en marcha. La introduccin y la seccin mtodos pueden ser redactadas an antes que los resultados estn disponibles. En tanto la mayor
parte de la redaccin es realizada por un solo individuo, algunos manuscritos son preparados por
varios redactores, cada uno contribuyendo con una seccin. Esto requiere de un autor principal
que ser responsable de asegurar cierta uniformidad de estilo. Indudablemente, la experiencia de
haber escrito varios artculos facilita todo el proceso. Como ha sido mencionado anteriormente,
la experiencia de ser rbitro resulta una ayuda. Hay tambin talleres y cursos accesibles para
principiantes y para aqullos que desean mejorar sus capacidades para la redaccin de artculos.
Es de esperar que el lector haya sido estimulado y alentado por este captulo a involucrarse en la
escritura mdica y que sea recompensado por la satisfaccin que proviene de ver su trabajo en
forma impresa para beneficio de los colegas, en el presente y en el futuro.
Referencias
1. Seglen PO. Why the impact factor of journals should not be used for evaluating research.
BMJ 1997; 314: 497-502.
2. Nakayama T, Hirai N, Yamazaki S, Naito M. Adoption of structured abstracts by general medical journals and format for a structured abstract. J Med Libr Assoc. 2005; 93(2):
237242.
3. Provenzale JM, Stanley RJ. A systematic guide to reviewing a manuscript. Am J Roentgenol. 2005; 185(4): 848-854.
[ 44 ]
Captulo 4
Enrique Fisman
Alexander Tenenbaum
a historia de los criterios editoriales para la evaluacin cientfica de las publicaciones mdicas se remonta a una reunin que tuvo lugar en Canad, unas tres dcadas
atrs. Un pequeo grupo de editores de revistas mdicas generales se reunieron de manera informal en Vancouver, Columbia Britnica, en 1978, para establecer guas para el
formato de los manuscritos enviados a sus revistas. El grupo lleg a ser conocido como el
Grupo de Vancouver. Sus requisitos para los manuscritos, incluyendo los formatos de las
referencias bibliogrficas, desarrollados y adaptados mas tarde por la Biblioteca Nacional de Medicina de los Estados Unidos, fueron publicados por primera vez en 1979.1 El
Grupo de Vancouver se ampli y evolucion hasta convertirse en el Comit Internacional
de Editores de Revistas Mdicas (International Committee of Medical Journals Editors
- ICMJE). Con el transcurso del tiempo el ICMJE ha ampliado gradualmente sus atribuciones y mbito de incumbencia. El mismo dej de ser meramente tcnico, incluyendo y
centrndose en la actualidad en los principios ticos relacionados con la publicacin en
revistas biomdicas.
Aunque las primeras revistas cientficas datan de la primera mitad del siglo XVII, el
comienzo oficial del proceso de arbitraje se dio inici mas de un siglo despus, cuando en
1753 la Royal Society of London tom la responsabilidad formal de evaluar los textos recibidos para publicacin. 2 La necesidad de organizar y seleccionar el material que luego sera
publicado, conllev el surgimiento de los dos actores principales en el proceso de evaluacin:
el editor cientfico, representado por el Secretario de la Sociedad encargado de organizar la
revista, y los evaluadores, representados por el Consejo de la Sociedad. La difusin masiva
de esta prctica se produjo a partir de la segunda mitad siglo XX, despus de la II Guerra
Mundial, debido al enorme crecimiento del nmero de investigaciones, a la fragmentacin de
la ciencia en subdisciplinas y al desarrollo de terminologas especficas. 3
As surgi el embrin del sistema de evaluacin de la produccin cientfica por los miembros de la comunidad profesional especfica, identificado como sistema de arbitraje o de revisin por pares. El mismo implica el uso sistemtico de rbitros para determinar la aceptacin
o el rechazo de los manuscritos que aspiran ser publicados. Este sistema no surgi de forma
pronta y acabada. Como parte institucional integrante de la ciencia, ha ido evolucionando
como respuesta a los problemas concretos con que se enfrentan los cientficos en el proceso
[ 45 ]
de desarrollo de la investigacin y como subproducto de la emergente organizacin societaria de los cientficos. La transformacin del manuscrito original, es decir el texto redactado
pero sin la competente evaluacin de los pares, en una publicacin, o sea en un manuscrito
legitimado por el resguardo de la valoracin crtica de los pares mediante la evaluacin institucionalizada y firmada por revisores competentes, se convierte as en una parte inseparable
del proceso cientfico.4,5
Nuestra modesta experiencia personal como editores comienza en el ao 2002. Como
cardilogos clnicos, nuestro inters se haba centrado en aos anteriores en investigar diversos aspectos de la interfaz entre diabetes y enfermedades cardiovasculares. La creciente relevancia del tema nos llev a pensar que sera importante fundar una revista especficamente
dedicada al mismo, y as naci Cardiovascular Diabetology.6
En cuanto a nosotros, nos vimos sbitamente ubicados del otro lado de la barricada.
De nuestro rol de autores, obvia y naturalmente ansiosos de ver publicados nuestros trabajos
(y preferentemente con rapidez y en revistas de buen nivel), pasamos al rol de editores, encargados de decidir que trabajos de nuestros colegas nos veremos obligados a rechazar, y cuales
sern publicados y en que condiciones. Describiremos a continuacin nuestra experiencia al
respecto. La misma comprende la concepcin acerca de la esencia de una revista cientfica y
los criterios que hemos adoptado o elaborado para cumplir nuestra tarea de editores.
La revista cientfica
Que es una revista cientfica? La UNESCO entiende a la revista como una publicacin
peridica que presenta especialmente artculos cientficos, escritos por autores diferentes, e
informacin de actualidad sobre investigacin y desarrollo de cualquier rea de la ciencia.
Tiene un nombre distintivo, se publica a intervalos regulares, por lo general varias veces al
ao, y cada entrega est numerada o fechada consecutivamente. Su componente bsico, el
artculo cientfico, es un escrito en prosa, de regular extensin, publicado como una contribucin al progreso de una determinada ciencia o arte.7 Bsicamente, la definicin de una
revista cientfica en general, y mdica en particular, est dada por su funcin y puede basarse
en los dos criterios estipulados por Greene,8 que establecen que las funciones de una revista
pueden resumirse como el doble propsito de servir de memoria de la ciencia y constituir, al
mismo tiempo, un medio de divulgacin de los resultados de la investigacin para la comunidad cientfica y para la sociedad. En ciertos casos, cuando se trata de revistas sumanente
prestigiosas, las mismas pueden establecer parmetros para la evaluacin de la produccin
cientfica de los investigadores y sus instituciones. En otros trminos, implementan criterios
de calidad para la programacin, realizacin y divulgacin de la investigacin.
Los autores, revisores y editores constituyen el tro imprescindible para el funcionamiento
adecuado de una revista cientfica. El editor es el responsable de mantener la calidad de la revista. Su obligacin principal es garantizar que los manuscritos que aspiran a ser publicados sean
evaluados de la forma correcta, es decir con total objetividad, sin interferencias y sin ningn
tipo de prejuicio a favor o en contra de la aceptacin de determinado artculo. El editor no debe
escoger a los revisores para obtener resultados preconcebidos. Adems de su responsabilidad
[ 46 ]
final en la toma de decisin, el editor debe ser una especie de mediador entre los autores y los
revisores fomentando as una mayor comunicacin e interaccin entre los mismos.
Actualmente, en el aspecto prctico, una revista cientfica moderna debe cumplir con
una serie de requerimientos profesionales y tcnicos para poder ser considerada como tal.
1. Poseer un ISSN (International Standard Serial Number- Nmero Internacional Normalizado de Publicaciones Seriadas), que es el cdigo internacional de identificacin de las
publicaciones seriadas (revistas, peridicos, boletines, anuarios, series de monografas, etc.).
El ISSN est constituido por los caracteres ISSN seguidos de dos grupos de cuatro cifras
cada uno separados por un guin. Son asignadas secuencialmente, independientemente del
pas de origen y del idioma empleado por la revista. El nmero es otorgado por el International Centre for the Registration of Serial Publications, con sede en Pars, que acta bajo
los auspicios de la Organizacin de las Naciones Unidas para la Educacin, la Ciencia y la
Cultura (UNESCO).
2. Tener un Comit Editorial. El mismo debe estar integrado por personalidades de trayectoria cientfica reconocida, una especie de herederos de los miembros del Consejo de la Royal
Society of London. Es importante que todos los miembros del Comit Editorial sean investigadores activos, pues queda implcito que slo los mismos estn capacitados para evaluar, hacer
indicaciones, emitir opiniones y sugerir correcciones sobre el trabajo de sus colegas. La funcin
de este comit es crucial, porque, an en el caso de revistas altamente especializadas, los editores no necesariamente estn siempre en condiciones de poder establecer claramente y sin riesgo
de equivocacin, la naturaleza del aporte cientfico de un trabajo dado. Los miembros del comit que actan como revisores generan, en franca colaboracin con los editores, un proceso
dinmico de intercambio de ideas, un fructfero dilogo con autores.
3. Tener un editor o grupo de editores. Continuando la comparacin hecha en el punto
anterior, ellos seran los herederos del Secretario de la Royal Society of London. En consecuencia, se ocupan de los aspectos acadmicos y usualmente estn asociados a Universidades
y Centros de Investigacin. Los editores no deberan ejercer actividades relacionadas con la
administracin, produccin o distribucin de la revista.
4. Tener una entidad editora (publisher) de ndole acadmica o comercial, encargada
de las cuestiones administrativas y financieras destinadas a procurar los recursos econmicos
para garantizar la publicacin regular de la revista.
5. Poseer un sitio en Internet (URL Uniform Resource Location) que permita el acceso
al texto completo de los artculos publicados, en caso de que la revista opte por la poltica
de acceso abierto a la informacin o, en caso contrario, al menos a los resmenes de dichos
artculos.
6. Tener direccin postal y electrnica e instalaciones que permitan rpida comunicacin
telefnica o va fax entre los editores por una parte y los autores, miembros del Comit Editorial y revisores externos por la otra.
7. La cobertura temtica de la revista y sus especficas reas de inters deben estar claramente mencionadas.
8. Tener tabla de contenido que permita localizar a un autor o tema especficos y leer los
resmenes de todos los artculos.
[ 47 ]
El proceso de decisin
Cual es el proceso de decisin que lleva a la publicacin de un artculo cientfico? Para
efectuar la evaluacin del mismo utilizamos un modelo que contiene preguntas especficas
que sirven de base para determinar su posible aceptacin. Deben considerarse dos aspectos:
el contenido y la estructura. En cuanto al contenido, las preguntas del modelo esencialmente
se refieren a: a) originalidad de la contribucin; b) la importancia del artculo en su rea; c)
empleo de la metodologa adecuada; d) validez de los mtodos estadsticos utilizados. En
cuanto a la estructura, debe examinarse: e) la precisin idiomtica; f) el respeto a la forma
de presentacin clsica de un artculo mdico (introduccin, material y mtodo, resultados,
discusin); g) la claridad de las tablas y figuras; h) la relevancia y actualizacin de las referencias bibliogrficas.
Si se utiliza una metodologa inapropiada no se est haciendo ciencia; los resultados carecern de todo valor. Por otra parte, presentan los datos reportados la calidad suficiente para
[ 48 ]
ser interpretados en contextos objetivos? Los resultados justifican las conclusiones obtenidas por los autores? Estas son preguntas que debemos formularnos frente a cada artculo.
Como norma practicamos la mencionada evaluacin dos veces. La primera, antes de
enviar el manuscrito a miembros del Comit Editorial y/o revisores externos (decidiendo en
la misma oportunidad a quienes solicitar la evaluacin externa del manuscrito, conforme a la
respectiva subespecialidad de los revisores), y la segunda, luego de haber recibido la opinin
de los mismos.
Luego de balancear todos los elementos implicados, se arriba a la decisin que puede ser:
a) rechazar el trabajo; b) publicarlo slo despus de revisiones mayores; c) publicarlo despus
de revisiones menores; d) publicarlo sin revisin. La decisin, una vez tomada, se comunica
inmediatamente a los autores, acompaada de los comentarios pertinentes de revisores y
editores.
Con respecto a este sistema de revisin por pares, debemos hacer algunas salvedades.
A pesar de su amplia difusin y aceptacin, que evidencian sus grandes ventajas, el sistema
sufri una serie de crticas, motivadas por las distorsiones de su uso. 3 Se ha destacado: a)
la propensin positiva o negativa a ciertos temas por parte de los revisores o editores que
puede introducir distorsiones adicionales a la publicacin, debido a conflictos de intereses
y/o enfrentamientos personales, intereses comerciales, etc; b) la evaluacin aumenta innecesariamente el tiempo entre la presentacin del manuscrito y su publicacin; c) es posible que
en la decisin intervengan elementos prejuiciados relativos a autores pertenecientes o supuestamente identificados con minoras tnicas, sexuales, ideolgicas, religiosas o nacionales.
Para hacer frente a estas posibles distorsiones, se han introducido diferentes mecanismos
y procedimientos a fin de evitarlas o minimizarlas. Se acostumbra solicitar declaraciones de
compromiso de los revisores; enviar cuestionarios con criterios orientadores para el anlisis;
utilizar un mayor nmero de rbitros; efectuar anlisis cruzados entre las recomendaciones
de los mismos a fin de posibilitar el control de unos sobre otros; garantizar a los autores la
posibilidad de responder o refutar los comentarios de los revisores por intermedio del editor,
quien debe as propiciar un dilogo respetuoso y profesional entre el autor y el evaluador.
Adems de estos requisitos, consideramos que es importante garantizar el carcter confidencial del proceso. Los grados de confidencialidad del sistema de arbitraje varan en las
diversas revistas desde los muy hermticos a los muy abiertos. En este ltimo caso, autores
y evaluadores se conocen; en el otro los rbitros son annimos y tambin desconocidos los
nombres de los autores. En la mayora de las ocasiones los evaluadores conocen a los evaluados, y es muy poco frecuente que ocurra lo contrario.4, 12 En nuestra revista6 hemos optado
por un sistema semicerrado, que suministra a los revisores el privilegio de no revelar su identidad, a menos que ellos mismos opten por hacerla pblica.
Finalmente, quisiramos mencionar uno de los problemas clsicos que suelen presentarse
en las revistas cientficas impresas. Se da el caso de un manuscrito que a pesar de su originalidad y de estar bien redactado, de sus objetivos claros y relevantes, de los mtodos adecuados,
del anlisis de los datos correcto, etc., no pueda ser aceptado para publicacin. Ello sucede por
haber sido clasificado por alguno de los revisores como de escasa prioridad. Este problema se
refiere al elevado costo de las pginas publicadas y existe en casi todas las revistas prestigiosas
internacionales. Sus consecuencias son frustrantes para los autores, para quienes entonces re[ 49 ]
sulta difcil o incluso imposible publicar trabajos meritorios. Estas dificultades y otras similares
irn desapareciendo a medida que los avances tecnolgicos induzcan a la mayora de las revistas a adoptar el modelo electrnico como vehculo principal de publicacin.
Referencias
1. The Vancouver style. Lancet 1979; 1(8113): 428-431.
2. Frederiksson BK (ed.). A century of science publishing. IOS Press, Omaha, Nebraska,
USA, 2001.
3. Spinak E. Diccionario enciclopdico de bibliometra, cienciometra e informetra. Caracas, Venezuela, UNESCO, 1996.
4. Pessanha C. Editorial criteria for the evaluation of scientific literature. Seminario sobre
Evaluacin de la Produccin Cientfica. Proyecto SciELO, So Paulo, Brasil, marzo 4-6,
1998.
5. Zuckerman HQ, Merton RK. Patterns of evaluation in science: institutionalization,
structure and functions of the referee system. Minerva 1971; 9(1): 66-100.
6. http://www.cardiab.com/
7. http://portal.unesco.org/
8. Greene JL. El dilema del editor de una revista biomdica: aceptar o no aceptar. Seminario sobre Evaluacin de la Produccin Cientfica. Proyecto SciELO, So Paulo, Brasil,
marzo 4-6, 1998.
9. http://www.garfield.library.upenn.edu/
10. Amin M, Mabe M. Impact factors: use and abuse. Perspectives in Publishing (Elsevier)
2000, 1: 1-6.
11. Benavent RA, Valderrama Zurin JC, Gonzlez de Dios J, de Granda Orive JI, MiguelDasit A. El factor de Impacto: Un polmico indicador de calidad cientfica. Rev Esp Econ
Salud 2004; 3: 5.
12. Jones AH, McLellan F (eds.). Ethical Issues in Biomedical Publication. The Johns Hopkins University Press; Baltimore, Maryland, USA, 2000.
[ 50 ]
Captulo 5
Quidquid discis, tibi discos (Aquello que aprendes, lo aprendes para ti)
Gaius o Titus Petronius Arbiter, Satyricon 46.8 (c. 27 d.C. - 66 d.C.)
se puede hacer una tesis digna, an hallndose en una situacin difcil, causada por
discriminaciones recientes o remotas. Se puede aprovechar la ocasin de la tesis (.) para
recuperar el sentido positivo y progresivo del estudio, no entendido como una cosecha de
nociones, sino como una elaboracin crtica de una experiencia, como adquisicin de una
capacidad buena para la vida futura para localizar los problemas, para afrontarlos con
mtodo, para exponerlos siguiendo ciertas tcnicas de comunicacin
Humberto Eco.
Cmo se hace una tesis. Tcnicas y procedimientos de estudio,
investigacin y escritura. Gedisa, Barcelona, 2001.
a elaboracin de una monografa cientfica es una tcnica pedaggica dentro del proceso de
aprendizaje en el rea cognoscitiva, que tiene por objeto estimular el pensamiento crtico.
Este trabajo intelectual requiere el empleo de un sistema cientficamente organizado (mtodo),
de desarrollo progresivo, que permite al alumno profundizar un tema y ejercitar una tcnica,
que ofrece un resultado concreto (el informe) y que facilita una evaluacin objetiva.
Definicin
Una monografa (mono: uno; grapho: escribir) es un trabajo cientfico escrito, producto
de la investigacin bibliogrfica, que estudia en forma exhaustiva un tema (problema) claramente delimitado, que lo desarrolla en forma lgica, y cuyo objetivo final es transmitir el
resultado de la citada investigacin. El informe constituye un documento, resultado de esa
investigacin exploratoria, seria y amplia, que emplea como fuente la bibliografa y como
mtodo la bsqueda y el anlisis bibliogrfico.
Bsqueda bibliogrfica
Tcnica de la bsqueda
Evaluacin, anlisis, interpretacin y sntesis de la bibliografa
Nueva bsqueda bibliogrfica
Redaccin del informe
1. Eleccin del tema
Para la eleccin del tema es aconsejable que ste responda a las preguntas que se efectan
a continuacin, con el fin de que quede indicado:
El tema es un problema cientfico?
Para qu realizar el trabajo? Porqu elegir ese tema y no otro?
Qu se espera obtener?
El tema es de inters prctico o terico para el autor y para la comunidad cardiolgica?
(Criterio de inters)
Se puede acceder a la informacin para la realizacin de la monografa? (Criterio de
viabilidad).
2. Planificacin
Cunto tiempo se emplear aproximadamente para ejecutar cada uno de los pasos de la
ejecucin de la monografa?
De qu bibliografa provisoria se dispone?
Cules sern los subtemas o epgrafes en que se va a dividir la monografa?
Planifique su trabajo con tiempo, slo esto le permitir hacer una lectura crtica de
la bibliografa y presentar un informe que muestre su capacidad de anlisis. Sea flexible
en la asignacin de los plazos para cumplir las diferentes etapas. Considere la posibilidad
de demoras o imprevistos. Se sugiere dividir el tiempo de la siguiente manera: bsqueda
bibliogrfica 20%, anlisis bibliogrfico 40%, elaboracin del informe 30%, ajustes
10%.
3. Bsqueda bibliogrfica
Proceso durante el cual se busca una respuesta al problema (tema) en trabajos cientficos
publicados en relacin con el mismo, accesibles al investigador.
Se consideran dos tipos de trabajo cientficos:
Tipo I, de verificacin indirecta (libros, manuales, normas, publicaciones peridicas de
revisin, revisiones, monografas).
Tipo II, artculos originales.
4. Tcnica de la bsqueda
En caso de revistas cientficas:
Listar todos lo autores, pero si el nmero excede los seis (6) escribir los seis seguidos de
et al. (sin comillas). Apellido de los autores seguidos por las iniciales de sus nombres sin necesidad de poner puntos. Los autores separados por coma, y punto despus del ltimo autor.
Nombre del trabajo cientfico y punto. Revista abreviada de acuerdo al Index Mdico Inter[ 52 ]
nacional, y seguido el ao, punto y coma, volumen, dos puntos, y nmero de pgina inicial y
final separados por un guin. Ejemplo:
Esper RJ, Nordaby RA, Vilarino JO, Paragano A, Cacharron JL, Machado RA. Endothelial dysfunction: a comprehensive appraisal. Cardiovasc Diabetol. 2006; 5:4-23.
En caso de libro, manual, norma o monografa:
Listar todos los autores, pero si el nmero excede los seis (6) escribir los seis seguidos de
et al. (sin comillas). Apellido del o los autores seguidos por las iniciales de sus nombres sin
poner puntos. Los autores separados por coma, y punto despus del ltimo autor. Ttulo del
captulo del libro y punto. La preposicin inglsa In y dos puntos, nombre del editor/es seguido por las iniciales del/los nombres, entre parntesis (Ed o Eds, segn corresponda), punto.
Ttulo del libro y punto. Ciudad de publicacin y coma, editorial y coma, ao de edicin y
coma, nmero de edicin si corresponde (ej: 5ta Ed) y dos puntos, pgina inicial y final del
captulo separados por guiones. Ejemplo:
Esper RJ, Vilario JO. La disfuncin endotelial. In: Esper RJ (Ed). Aterotrombosis en
el tercer milenio. Barcelona, Prous Science 2004: 49-83
Se accede a la informacin en forma directa o indirecta, mediante la solicitud de copias,
separatas u otros mtodos electrnicos (modem). Se clasifica provisionalmente el material
bibliogrfico consignado el tema, subtema al que corresponda de acuerdo a la organizacin
de la monografa proyectada en la planificacin.
Consulte con un bibliotecario, quien es un profesional especialmente dedicado al manejo
de la informacin bibliogrfica. Considere que la informacin generalmente est en una base
de datos. Recuerde que la cita que no se encuentra en una biblioteca puede encontrarse en
otra. Su bibliotecario puede indicarle en que biblioteca encontrar cada revista. Durante la
bsqueda, no distraiga su atencin con artculos que pueden ser de su inters pero que no se
relacionan con el tema de la monografa. Tenga presente que los artculos originales tienen
un valor cientfico mayor que los trabajos de verificacin indirecta. Dado que son escasas las
publicaciones nacionales que estn citadas en el Index Mdico o en las bases de datos comunes, consulte la bibliografa nacional, en particular la Revista Argentina de Cardiologa (Rev
Argent Cardiol).
5. Evaluacin, anlisis, interpretacin y sntesis de la bibliografa
Se lee el material de corrido y luego, en forma detenida, analizando y subrayando las
ideas principales y las secundarias, para lo que se aconseja usar colores distintos.
Se deben dividir los artculos con que se cuenta segn la importancia que tienen para la
redaccin de cada captulo de la monografa. Se evalan los aspectos formales y metodolgicos del trabajo. Se registra la informacin pertinente a la monografa en una ficha, mediante
un resumen. Se ordena en forma definitiva el material bibliogrfico, consignando tema y
subtema al que corresponda, de acuerdo a la organizacin de la monografa proyectada en
la planificacin.
[ 53 ]
Se analizan, evalan e interpretan las coincidencias y discordancias del material analizado, formulan opiniones propias, nuevas hiptesis y desarrollos futuros posibles y deseables.
Esta etapa de la realizacin de la monografa es la ms trascendente y creativa. Quizs usted
perciba que sus conocimientos sobre metodologa de la investigacin no son suficientes para
encarar con xito la tarea, probablemente sea el momento adecuado para estudiar alguno de
los textos, para consultar a los tutores de la monografa o para realizar algunos de los cursos
dedicados a esta disciplina.
6. Nueva bsqueda bibliogrfica
La realizacin de una segunda bsqueda bibliogrfica, luego de haber analizado toda
la informacin obtenida al comienzo del trabajo, permite un conocimiento ms profundo y
una actualizacin del tema elegido, teniendo en cuenta que para este momento ha pasado la
mayor parte del tiempo de la elaboracin de la monografa.
7. Redaccin del informe
Se redacta el informe como un documento cientfico, teniendo en cuenta el contenido y
la forma (Presentacin, ortografa, semntica, y sintaxis).
Las partes del informe son:
Portada
Introduccin
Material y mtodos
Resultados (en uno o ms captulos)
Discusin
Conclusiones
Bibliografa
Tablas, figuras
Agradecimiento
Cada una de las partes comienza en hoja aparte. Las pginas se numeran en forma correlativa en el ngulo superior o inferior derecho.
El trabajo se presenta redactado con espacio simple, aunque puede hacerse a doble espacio o 1 espacios, segn el deseo del redactor, con letras nmero 10-12, en papel blanco,
tamao carta; 219 x 279 mm, u 8 1/2x11, con mrgenes de por lo menos 30 mm en los
mrgenes superior e izquierdo, y 20 mm en el inferior y derecho, empleando una sola cara
del papel.
La portada consta de un encabezamiento con Ttulo, autor/es, ttulos cientficos de los
autores, centro/s en donde se realiz la monografa o donde se desempea/n el/los autores,
la universidad que avala el curso, direccin postal, incluidos telfonos y e-mail (si lo tuviere),
ao de realizacin.
La introduccin consiste en el planteo del tema elegido, los fundamentos para su eleccin, objetivos, inters y viabilidad del mismo, consideraciones sobre trabajos anteriores y
plan de la monografa.
En el material y mtodo se consigna la tcnica de la bsqueda y el anlisis bibliogrfico.
[ 54 ]
[ 55 ]
Referencias
1. Qu es una monografa? http://www.sagg.org.ar/docs/monografia.doc. (consulta: 23
de junio de 2007)
2. Aramburu EJ. Gua para la confeccin de la monografa. http://www.geocities.com/enriquearamburu/ETE/guia.html (consulta: 23 de junio de 2007)
3. Cassany D. La cocina de la escritura, Barcelona, Anagrama, 1995.
4. Cichanowski E. Pautas para la monografa. http://www.mailxmail.com/curso/vida/pautasmonografia. (consulta: 23 de junio de 2007)
5. Cmo realizar una monografa. http://www.exactas.unlpam.edu.ar/academica/carreras/
enfermeria/documentacion/comorealizarunaMONOGRAF%CDAII.PDF. (consulta: 23
de junio de 2007)
6. Diccionario de la Lengua Espaola de la Real Academia Espaola 22. Edicin. http://
www.rae.es (consulta: 23 de junio de 2007)
7. Eco U. Cmo se hace una tesis. Tcnicas y procedimientos de estudio, investigacin y
escritura, Barcelona, Gedisa, 2001.
8. Entrez PubMed. http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed. (consulta: 23 de
junio de 2007).
9. Harvey G. Cmo se citan las fuentes. Madrid, Nuer, 2001.
10. http://en.wikipedia.org/wiki/Monograph. (consulta: 23 de junio de 2007)
11. International Committee of Medical Journal Editors Uniform Requirements for Manuscripts Submitted to Biomedical Journals: Sample References. http://www.nlm.nih.gov/
bsd/uniform_requirements.html. (consulta: 23 de junio de 2007).
12. International Committee of Medical Journal Editors. Uniform Requirements for Manuscripts Submitted to Biomedical Journals: Writing and Editing for Biomedical Publication
(Updated February 2006). http://www.icmje.org/. (consulta: 23 de junio de 2007)
13. La Monografa. http://www.bibliotecasvirtuales.com/biblioteca/Articulos/monografia.
asp .(consulta: 23 de junio de 2007)
14. Le Systme international dunits (SI). http://www.bipm.fr/fr/si/. (consulta: 23 de junio
de 2007)
15. Nubiola J El taller de la filosofa. Una introduccin a la escritura filosfica. Pamplona,
Eunsa, 1999.
16. Pieiro D. Qu es y cmo se elabora una monografa cientfica? SAC Informa. Diciembre 1994 - Enero 1995:18-20.
17. Requisitos de Uniformidad para Manuscritos Presentados a Revistas Biomdicas. (Estilo
Vancouver). http://www.um.es/eglobal/normas/vancouver.pdf (consulta: 23 de junio de
2007).
18. Roldn AF. Cmo hacer una monografa. http://www.fiet.com.ar/articulo/monografia_
roldan.doc (consulta: 23 de junio de 2007)
19. Sistema internacional de unidades. Versin en castellano para Espaa. http://edison.upc.
edu/units/SIcas.html. (consulta: 23 de junio de 2007)
20. The NIST Reference on Contstants, Units, and Uncertainty. http://physics.nist.gov/cuu/
Units/. (consulta: 23 de junio de 2007)
[ 56 ]
[ 57 ]
Captulo 6
Introduccin
Escribir un captulo en el que pretendo decir qu es un trabajo de tesis de doctorado, cmo
se lo enfoca y cmo se lo lleva adelante no es una tarea sencilla para alguien que est familiarizado con solo una muy pequea parte del conocimiento, como es mi caso. Es ello una limitante
de importancia, puesto que una tesis de doctorado puede versar sobre cualquier aspecto del
saber. Las diversas formas del conocimiento hacen que existan particularidades para cada una
de ellas que condicionan, al menos parcialmente, la modalidad que adoptar el trabajo.
Sin duda, una tesis que versara sobre un momento dado de la historia argentina, por ejemplo
el estudio de las razones que hicieron que San Martn regresase al Ro de la Plata, diferir en su
elaboracin de otra que trate, digamos, el efecto del RNA de interferencia sobre el RNA mensajero que induce la elaboracin de la protena huntingtina. La primera ser una labor de investigacin retrospectiva que se basar en el anlisis de los documentos que puedan existir en relacin
a aquel episodio, en tanto que la segunda se constituir en un estudio prospectivo que emplear
una tcnica establecida y que necesitar del anlisis matemtico-estadstico para la valoracin
de sus resultados. Igual podra decirse de otros temas, como, por ejemplo, las causas ambientales
que llevaron a la aparicin de la msica barroca o cul ser la variacin de la rbita de la tierra
dentro de diez mil aos, prediccin que, tal vez, pueda hacerse sabiendo del comportamiento
de ese fenmeno hasta donde hoy se lo conoce; para resolver lo dicho con respecto a la msica
barroca ser necesario estudiar las costumbres, hbitos y cultura en general de la poblacin
europea, en particular la italiana, del siglo XVII sin olvidar la extravagancia de otras muestras
artsticas que pudieron influir tambin y cuyas primeras manifestaciones aparecieron en Bizancio. Para lo segundo, ser imprescindible la confeccin de un clculo matemtico complejo lo
suficientemente convincente y abarcativo de todas las variables geofsicas, enmarcadas dentro
del sistema planetario en el que se inserta la tierra y en el que tambin se ponderen eventuales
fenmenos accidentales, tal como el impacto de un gran meteorito sobre su superficie.
De todas maneras, y aceptando las limitaciones que acabo de comentar, tratar de escribir las siguientes pginas de forma que puedan ser aplicables a la elaboracin de diferentes
tipos de tesis de doctorado, aunque, indudablemente, los prrafos que siguen estarn teidos
de mi impresin personal que, necesariamente, est condicionada por mi formacin en el rea
restringida del conocimiento que poseo.
[ 58 ]
Cul es la razn o cules las razones que hacen que un graduado decida elaborar
un proyecto de tesis de doctorado?
La decisin de llevar adelante un proyecto de tesis de doctorado aparece en cualquier
graduado cuando convergen una serie de razones y circunstancias que naturalmente llevan a
adoptar esa actitud.
Las razones son de ndole variada, la que posiblemente tenga mayor valor es la conviccin del futuro doctorando de haber adquirido conocimiento profundo en relacin a un
aspecto determinado del saber y la suficiente madurez intelectual que le permite suponer que
est en condiciones de incrementar ese conocimiento dentro del rea de inters mediante el
desarrollo de una idea, diferente a todas las anteriores.
Esa idea puede, si su desarrollo resulta exitoso, tener dos efectos, uno de ellos es simplemente agregar nuevas nociones a las ya establecidas y la segunda modificar las concepciones
existentes, reorientando la investigacin.
Ambas actitudes son totalmente aceptables y, segn mi parecer, simtricas en cuanto a
su importancia.
La primera incrementa el saber en un aspecto determinado, en tanto que la segunda cambia el concepto existente hasta entonces; en los dos casos se produce una modificacin de la
realidad objetiva que pasa a ser parte del patrimonio cultural de la especie.
La adquisicin de una idea novedosa en un campo determinado no es casual habitualmente, aunque s es cierto que una circunstancia fortuita puede hacerla evidente en un momento
[ 59 ]
dado; sin embargo quien advierte la novedad debe poseer un caudal suficiente de conocimientos
que le posibiliten verla como tal. Esto es as puesto que no es posible reconocer como diferente
e indito a un fenmeno determinado si no se conoce todo lo previamente hecho en relacin a l
y si no se concluye que el nuevo concepto resulta el corolario actual de ese conocimiento.
La nueva idea puede aparecer como fruto de la meditacin y ser la consecuencia lgica
del razonamiento impuesto al fenmeno en estudio, es esta una actitud deductiva que fluye
armoniosamente en la mente del investigador y lo conduce a la obtencin de una nueva verdad que puede o no estar en acuerdo con lo sabido previamente.
Otra posibilidad es que el azar enfrente al investigador con una conducta insospechada
del fenmeno en estudio. En estas circunstancias, a igual que en la anterior, quien descubre
esa actitud del fenmeno necesariamente debe saber todo lo concerniente a l, puesto que de
otra manera no podra reconocer lo inadecuado de aquella conducta. Esa observacin induce
al investigador hacia la obtencin de una respuesta lgica a aquello que no lo parece y puede,
s, transformarse en la clave que le permita obtener una nocin diferente. Es esta una actitud
inductiva que obliga al observador a modificar todas o parte de sus concepciones previas en
relacin al fenmeno en cuestin en aras de hallar la explicacin que corresponde a la modificacin inesperada de la conducta de ese fenmeno, conducta que le esta sealando una
realidad previamente no sospechada pero, indudablemente, existente.
La segunda razn para llevar adelante un proyecto de tesis de doctorado es, habitualmente, la necesidad de crecimiento acadmico. En la obtencin de posiciones, dentro del mbito
universitario, el ttulo de Doctor adquiere trascendencia puesto que es el de mayor jerarqua
que otorga la Universidad.
Cuando se concibe a la Universidad como a la Institucin que alberga el conocimiento y
que es fuente de conocimiento, la adjudicacin del ttulo de Doctor de la Universidad seala
que ella reconoce en esa persona a alguien que posee la mayor informacin en una parcela
dada de ese conocimiento y que ha sido capaz de ampliarlo o modificarlo.
En ltima instancia reconoce en el Doctor a un exponente mayor de la Cultura, en tanto
se entienda por Cultura el atesoramiento del saber.
Por ello la Universidad supone que quien es Doctor est en las mejores condiciones
para transmitir conocimiento a las generaciones que le siguen y cumplir, de esa manera,
con una de las condiciones bsicas de la especie y que es la transferencia generacional del
saber.
Por esas razones es que quien completa el Doctorado posee ms posibilidades para acceder a cargos docentes jerarquizados y a posiciones de conduccin acadmica.
Cunto debe ser el tiempo de graduado para que quien est interesado presente el
proyecto de tesis?
El tema del proyecto de tesis de doctorado no aparece de manera casual, sino que es el resultado de la maduracin de una concepcin particular e individual que le permite a alguien
explicar un fenmeno dado. Logrado este propsito, quien interpreta podr suponer que el
[ 61 ]
conocimiento de ese fenmeno es incompleto o no resulta del todo claro, o que la concepcin
corriente que de l se tiene es errada. En cualquiera de estas tres situaciones es aceptable y
lcito que pretenda ya sea incrementar su conocimiento, ponerlo mas en claro o re-orientar
su concepcin; si esto es as le surgir una idea nueva que supondr que llevando adelante
una determinada accin el conocimiento del fenmeno adquirir caractersticas distintas a
las que tiene en ese momento; esta actitud lo conducir a la elaboracin de una hiptesis de
trabajo que se transformar en la base de su futura tesis.
Ahora bien, para que ello suceda, el futuro doctorando deber haber obtenido una larga
experiencia en el rea que le preocupa, adquisicin que, habitualmente, demanda varios aos
de labor en el tema, aos que conducen a que el fenmeno de inters se transforme en una de
sus vivencias. Por ello no es posible suponer que un proyecto de tesis de doctorado sea presentado por alguien recientemente graduado. El tiempo medio que transcurre usualmente entre
la graduacin y la presentacin del proyecto de tesis es de unos diez aos.
Ello implica, tambin, una edad determinada del doctorando que, idealmente, debera
estar entre los 35 y los 45 aos, poca de la vida en la que la maduracin, en todos sus aspectos, se ha completado y en la que la pujanza y persecucin de un objetivo dado tienen la mayor
fuerza.
Sin embargo, pueden existir excepciones a lo comentado en los prrafos precedentes. Puede
suceder que quien se transformar en doctorando sea parte de un equipo de investigacin al
que se haya integrado poco tiempo atrs y en el que cumpla, por ejemplo, el papel de becario,
trabajando sobre un tema que ha sido elegido por otros, habitualmente por su Director de Beca
o por el Jefe de la estructura en la que se desempea, y que ese tema se transforme en el su tesis
de doctorado.
Tambin puede suceder que alguien, con muchos ms de 10 aos de graduado se vea en la
necesidad de doctorarse para poder seguir adelante en su carrera, en este caso es probable que
seleccione un tema en el que ya haya trabajado y del que ya tenga resultados para construir su
tesis; esta ltima opcin transformar a la tesis en un trabajo retrospectivo y no prospectivo
como resultan todas las otras opciones.
Ninguna de las dos posibilidades que suponen los dos prrafos anteriores son las mejores, la primera porque la eleccin del tema puede no tener mayor relacin con la vocacin del
tesista y la segunda porque surge de la necesidad y no de la conviccin de que la tesis significa
una jerarquizacin acadmica que voluntariamente se quiere alcanzar.
Informacin bibliogrfica
Quien haya encontrado el tema que le servir para la confeccin de su tesis de doctorado,
luego de haber sorteado la etapa de elaboracin de la hiptesis, no deber suponer que la
informacin que posee de l es la totalidad de la existente.
La actitud mas razonable del futuro doctorando es creer que su conocimiento es parcial
y que pudo haber habido otro autor que, en circunstancias iguales a las suyas, haya podido
desarrollar ideas similares a las que l ahora tiene.
Esta ltima posibilidad, y la necesidad de conocer todo lo sabido con respecto a la materia
[ 62 ]
Idiomas
En muchos casos la literatura relacionada con el tema en cuestin est escrita en un idioma
que no es el materno del estudiante. Hoy, el idioma de las Ciencias es el Ingls, as como lo fue el
Latn, centurias atrs, para prcticamente todo el conocimiento. Mas an, el Ingls es el idioma
de intercambio epistolar entre quienes desarrollan una misma actividad y hablan lenguas diferentes, y lo mismo sucede en todas las reuniones internacionales de cualquier ndole en las que
las presentaciones orales o escritas, a igual que su discusin, se hacen en esa lengua.
Por ello es imprescindible que el doctorando tenga un adecuado manejo del Ingls de
forma que le permita acceder a toda la literatura escrita en ese idioma. Si bien lo ideal sera
que lo hablase y leyese fluidamente, para la finalidad de su trabajo de tesis es, habitualmente,
suficiente poseer capacidad para su lectura. No resultara as si el estudiante decidiera visitar
laboratorios extranjeros, ubicados en cualquier pas en el que su idioma materno no se hable,
puesto que lo usual es que la comunicacin entre los integrantes de esos laboratorios y sus
visitantes se haga en Ingls.
Es cierto que existen trabajos de valor escritos en otros idiomas; entre ellos el Castellano,
el Alemn, el Japons, el Portugus y el Francs. Sin embargo, todos ellos, casi sin excepcin,
poseen un resumen en Ingls que le permitir al doctorando entender su importancia. Si ese
valor fuese maysculo para la mejor concrecin de la labor en la que est empeado, no le
quedar otro camino que pedir su traduccin a alguien que sepa hacerlo.
con, tal vez, mas experiencia que la de l; podr hacer preguntas a esos investigadores, cuyas
respuestas pueden volver mas claras sus ideas; tendr, en oportunidades, ocasin de observar
prcticas de laboratorio, clnicas, semiolgicas u otras cuyo aprendizaje puede serle de ayuda,
y tendr la posibilidad, hablando con otros, de conocer las dificultades e inconvenientes que
pueda tener la puesta en marcha y desarrollo de un mtodo o de una tcnica dada.
En relacin a lo dicho al final del prrafo anterior es, sin duda, de la mayor utilidad que el
doctorando concurra a otros lugares en los que se trabaje en conexin con su tema de inters.
Estadas cortas, de entre uno y tres meses, en esos otros centros seguramente ampliarn la vivencia que tenga de su proyecto y, posiblemente, lo instruirn acerca de los detalles prcticos
del manejo del mtodo, o de los mtodos, que l mismo debe, o deber, emplear.
Es, tambin, valioso que acepte dar conferencias, participar en ateneos o llevar a delante
seminarios en los que hable del tema que lo ocupa. Ello contribuir a que mantenga actualizada su bibliografa. Puede suceder, tambin, que al preparar una disertacin o participar en
una discusin aparezcan nuevas ideas hasta entonces no previstas.
Importancia de la redaccin
La redaccin del trabajo de tesis de doctorado debe ser hecha en el mejor idioma posible.
Para el caso nuestro, el Castellano que se emplee debe ser absolutamente correcto.
El doctorando cuidar que los tiempos de verbo sean los adecuados al prrafo que est
escribiendo.
Tambin debe ser precisa la puntuacin.
Es conveniente utilizar prrafos cortos.
Es importante el uso de sinnimos que eviten la repeticin de sustantivos y verbos, ello
hace que la lectura sea ms amena.
No debe ser redundante en sus dichos y no debe insistir en una nocin determinada ms
all de lo necesario.
Puede emplear abreviaturas. Cuando lo haga por primera vez, y ellas no sean de uso cotidiano, es menester que las preceda por las palabras completas que esa sigla supone; en esta
primera introduccin la abreviatura ir entre parntesis, por ejemplo Organizacin Mundial
de la Salud (OMS), luego, en lo que sigue del texto, podr usarla sin enmarcarla por parntesis.
En mi criterio resulta prctico que el doctorando exhiba en una pgina, que est situada
al comienzo del escrito principal, todas las abreviaturas que emplear en el texto junto a su
significado. Por supuesto que esto no es necesario para aquellas de uso universal como, por
ejemplo, las relacionadas con el sistema mtrico decimal.
Es conveniente insistir en la redaccin correcta del manuscrito, puesto que cuando no es
as se hace incomprensible, laboriosa, tediosa y frustrante su lectura.
Si bien la tesis de doctorado, en el caso de las Ciencias, es un trabajo cientfico, su desarrollo es algo mas suelto, por decirlo de alguna manera, que el que corresponde a un escrito
enviado a una revista. Es conveniente que la construccin de la tesis de doctorado tenga
algn parecido con una novela, de forma que quien la redacte pueda hacer que el lector
[ 65 ]
transcurra por ella siguiendo los pasos y el razonamiento que conducen a la conclusin de
manera distendida, hacer que el escrito evolucione de un concepto al otro naturalmente,
que no encuentre razonamientos forzados, que no resulte imprescindible volver atrs con
frecuencia para poder entender el prrafo bajo anlisis, que fcilmente pueda acceder a
la comprensin de una abreviatura; en sntesis, que su lectura resulte agradable, fluida y
placentera.
Es experiencia corriente hoy para muchos de quienes juzgan los trabajos de tesis de doctorado que, lamentablemente, existe una buena proporcin de tesistas que emplean un pobre
Espaol, a pesar de que nuestro idioma es el segundo en riqueza de vocablos despus del Alemn. Creo que esto no es anecdtico, sino un defecto grave, sobretodo si se tiene en cuenta
que la falta de recursos idiomticos condiciona la falta o mezquindad de ideas. La razn para
que esto ocurra est en el bajo apetito, que tiene gran parte de los jvenes de hoy dedicados a
las Ciencias, para la lectura de literatura no tcnica. Este defecto nace en la escuela primaria,
no es atendido adecuadamente en la secundaria, y pierde toda posibilidad de solucin en
la Universidad o, al menos, en las facultades ligadas a la enseanza tcnico-cientfica. Probablemente lo que sucede es que la imagen est reemplazando a la palabra, acontecimiento
til cuando se trata de aprender hechos concretos, pero un obstculo para cuando tratan de
relacionarse fenmenos entre si, para lo que es indispensable emplear palabras, emplear la
capacidad de abstraccin y crear ideas.
Otro aspecto que merece ser citado es la abundancia de anglicismos en los textos de las
tesis de doctorado cientfico-tcnicas. Ello es consecuencia del uso de palabras inglsas en el
lenguaje comn de la Ciencia; esto explica su empleo, pero no lo justifica ya que para cada
uno de los vocablos inglses que se utilicen existe una traduccin acorde en Castellano.
Lo dicho arriba hace aconsejable que quien decida embarcarse en un trabajo de tesis de
doctorado posea un lenguaje lo suficientemente rico que le permita expresar sus conceptos
con precisin y claridad. Para ello deber tener una formacin cultural ms extendida que la
que provee el mero asunto tcnico-cientfico en el que trabaja.
Esa observacin deber ser seguida por la sntesis del conocimiento del tema que llevar,
a quien sea el interesado, a concluir en que estado se encuentra el saber relacionado con ese
fenmeno o acontecimiento en ese momento. Llegado aqu, surgir la pregunta que inquirir
qu sucedera con el fenmeno o acontecimiento visto si tal o cual circunstancia se modificara. Es esta pregunta el embrin de la futura tesis.
b) Eleccin del Director
Logrado esto, el futuro tesista buscar a la persona que, con la mayor autoridad posible,
pueda orientar su investigacin. Seleccionar a su Director.
Esta persona, naturalmente, debe ser un idneo en el tema pero, adems de ello, debe
tener vocacin por la enseanza, amplitud de pensamiento, ser receptor de ideas novedosas,
apreciar su posibilidad de verosimilitud y alentar decididamente al investigador cuando ello
suceda o convencerlo de su error cuando ello ocurra.
Fuera de las caractersticas anteriores, quien dirija una tesis debe establecer con el doctorando una relacin de familiaridad que permita a este ltimo acercarse a l cada vez que
necesite de su consejo y ayuda.
El Director debe estar dispuesto a leer crticamente el manuscrito todas las veces que
fuere necesario hasta llegar a su redaccin final.
Debe, igualmente, analizar grficos, tablas y figuras sometindolas, igualmente, a la
crtica hasta que resulten convincentes.
Finalmente, debe cuidar que la bibliografa citada sea la correcta, que no se hayan soslayado trabajos que, eventualmente, pudieran contradecir las conclusiones de la tesis, sino
que hayan sido discutidos y refutados convenientemente. Debe asegurarse que toda cita que
est en el texto figure en la lista bibliogrfica y que en sta no haya citas que no hubiesen sido
incluidas en el texto.
c) Formulacin de la hiptesis
Discutida y aceptada, entre el tesista y el Director, la nueva idea, llega el tiempo de formular la hiptesis.
En prrafos anteriores he tratado de conceptualizar el trmino. Para decirlo de otra manera, bsicamente es entender que es posible introducir una idea diferente que incremente o
modifique el conocimiento de un fenmeno dado, de un hecho acaecido o de una construccin intelectual cualquiera.
Es claro, entonces, que la hiptesis es la consecuencia de la meditacin.
Volviendo a Aristteles, tres razonamientos son posibles; el analgico, que va de lo particular a lo particular; el inductivo, que va de lo particular a lo general y el deductivo, que va
de lo general a lo particular.
De los tres, el habitualmente empleado en Ciencia es el deductivo; es usual que a partir de
todo el saber que se posee acerca de un fenmeno dado sea posible obtener una informacin
novedosa, particular, ms cercanamente relacionada con el ser y el comportamiento de aquel
fenmeno.
[ 67 ]
Sin embargo, el mtodo inductivo es, tambin, aplicable a la Ciencia. No lo es usualmente en el trabajo cotidiano, aunque existen algunos ejemplos que muestran que ello es
factible; Mendeleiev, al elaborar la tabla peridica de los elementos dej espacios en blanco
sugiriendo que all encontraran lugar otros no conocidos entonces, es hoy realidad que
la tabla se ha completado llenando las expectativas de aquel fsico que supuso, o intuy,
la existencia de todos los elementos que componen la Naturaleza. En realidad, si por un
momento se atiende a como han surgido las leyes que gobiernan los fenmenos naturales, necesariamente se arriba a la conclusin de que se lo ha hecho de manera inductiva,
analizando fenmenos particulares que posibilitaron la universalizacin del concepto, es
decir que permitieron la generalizacin de ese conocimiento; vase, por ejemplo, la nocin
de gravedad, aplicable a la manzana que cay sobre la cabeza de Newton y, tambin, al
desplazamiento de sistemas estelares dentro de una galaxia. Es, en definitiva, el sueo de
matemticos y fsicos adquirir, en algn momento, y a partir de los conocimientos parciales
obtenidos, una ley general de la Naturaleza que permita explicar todos y cada uno de los
fenmenos que en Ella se dan; quizs resulte posible algn da; realizable o no, la idea es
muy atractiva.
Habitualmente la hiptesis es el corolario de una deduccin que emplea, como base del
razonamiento, al silogismo. Aceptando que es este el mecanismo de pensamiento que conduce a una determinada conclusin, que es la hiptesis, resulta absolutamente necesario que las
premisas sean verdaderas, para evitar construir una falacia.
El estudiante enunciar su hiptesis de forma que ella sea comprensible por otros idneos
en el tema y tendr que dar las razones que lo llevaron a la elaboracin de la propuesta.
d) Presentacin de los objetivos
Sin duda que el objetivo mayor del trabajo de tesis de doctorado es la demostracin de la
hiptesis.
Sin embargo, pueden, en el camino, fijarse otros objetivos menores en relacin a la magnitud del primero. Esos otros objetivos, que constituyen pasos necesarios en la consecucin
del de mayor valor, pueden ser nombrados en este aparte del proyecto y, llegada la ocasin,
descriptos con la extensin necesaria en el trabajo final.
La enumeracin de los objetivos menores o secundarios en el proyecto primero no invalida
la posibilidad de que el tesista encuentre otros datos novedosos, capaces de aparecer en el decurso de su labor, y que con ellos haga igual que con los que hubiere previsto inicialmente.
e) Materiales y Mtodos
Es este un captulo de la tesis de doctorado, tanto en el proyecto inaugural como en el
trabajo ltimo, que requiere la mayor atencin del estudiante y de su Director.
El material debe ser cuidadosamente seleccionado. En los trabajos en los que se utilicen
seres vivos, cualquiera sea la especie, el investigador deber individualizar pormenorizadamente las caractersticas que identifican al animal o al humano que emplear en sus experimentos, deber describir los controles que utilizar y propondr el nmero de sujetos que
[ 68 ]
integrar cada una de las muestras en las que se dividir el material. En relacin a este ltimo
aspecto ver que el total de individuos que forme cada muestra sea tal que permita efectuar
un clculo estadstico cuyos resultados sean convincentes.
Tanto en el empleo de animales de laboratorio como de humanos, el investigador deber
cuidar que el trato dado a ellos se ajuste a los postulados ticos vigentes, incluyendo el eventual sacrificio de los animales de laboratorio, si ello fuese pertinente a los fines de la investigacin. Por ello resultar imprescindible que cada proyecto posea el aval del Comit de tica
de la Institucin en la que la labor ser llevada a cabo.
En el caso en el que se convocaren humanos para la investigacin, cualquiera fuere el
procedimiento al que se les sometiere, el investigador deber obtener del interesado o de su
responsable mas cercano, cuando el directamente involucrado no estuviere en condiciones de
juzgar su participacin, el consentimiento expreso, firmado, en el que el sujeto de la experiencia, o su responsable, acepta ser parte del estudio. Para ello el investigador les informar
detalladamente el propsito de la experiencia, las eventuales incomodidades a las que puede
enfrentarse y los efectos indeseables que el estudio podra acarrearle. Tambin dejar taxativamente dicho que estar dispuesto a interrumpir la investigacin y liberar al participante si
ste lo solicitare; de igual manera, se comprometer a no dar a publicidad la identificacin de
las personas que accedieran al estudio.
Resulta respetuoso y recomendable que, cuando se tratare de humanos y una vez finalizada la investigacin, el responsable de ella informe a cada uno de los participantes, de manera individual, los resultados y conclusiones obtenidos en el estudio, empleando un lxico
que resulte comprensible para el interlocutor.
En lo que se refiere a los mtodos, tendrn que ser enunciados en el proyecto inicial y
exhaustivamente descriptos en el trabajo final; para cada uno de ellos se establecer su finalidad.
De esta forma, quien lea y juzgue el manuscrito de la tesis, podr hacerse una idea cabal
de los objetivos que ha perseguido el investigador al usar tal o cual procedimiento tcnico.
f) Tratamiento de los resultados
Este aspecto es clave en el desarrollo del trabajo. Resulta conveniente que el estudiante
conforme una base de datos con sus resultados; idealmente la disposicin que se les de a ellos
debera permitir el clculo en cualquier momento del desarrollo y, naturalmente, al concluir
la labor.
Existen hoy, comercialmente, muy diferentes esquemas de base de datos, para distintos
propsitos, que posibilitan el clculo y la graficacin de los resultados obtenidos; el tesista
debe seleccionar aquella que mejor se acomode a sus requerimientos. Tambin es posible que
el estudiante disee una base que abarque todas sus necesidades; para ello sus conocimientos
de programacin y computacin deben ser los adecuados.
Ordenados de la mejor manera que cupiere a los objetivos del estudio, el tesista elegir
el tipo de tratamiento matemtico-estadstico que les dar. Es por ello que su versacin en
Estadstica debe ser alta. Ello le posibilitar seleccionar el clculo que mejor muestre lo que
ha obtenido.
[ 69 ]
El tipo de tratamiento que se le dar a los resultados puede ser esbozado en la presentacin del proyecto inaugural y debe ser ampliamente justificado en el escrito final. No necesariamente la sugerencia hecha inicialmente debe coincidir exactamente con el tipo de clculo
que, en definitiva, se usar; es aceptable que el devenir de la investigacin modifique la concepcin previa y sea otro el clculo necesario que mejor se ajuste a los resultados.
Distinta es la actitud cuando el investigador trabaja de manera ciega, sin conocer si est o
no modificando las circunstancias con su intervencin y cul es el resultado que eso provoca.
Sucede esto en trabajos en los que se ensaya, por ejemplo, el efecto de un frmaco sobre una
patologa determinada, partiendo de la hiptesis que supone que la composicin molecular
de la droga en ensayo es capaz de interferir alguno de los pasos metablicos que llevan a la
instalacin de determinada dolencia. En estas circunstancias, el investigador se reunir con sus
resultados recin al finalizar la totalidad de la experiencia. Es ms, en este tipo de diseo experimental es conveniente que otra persona, ajena a la investigacin, sea quien haga el tratamiento
de lo observado.
g) Resultados
Es este el eje y el captulo mas importante del trabajo. Lo es porque los resultados son
tal como se muestran, no pueden modificarse a voluntad, son independientes de las ideas,
razonamientos, interpretaciones que de ellos se haga y sensaciones que ellos provoquen en
quien los ha logrado.
Los resultados son hechos permanentes, son parte de la realidad y parte de la verdad.
Las discusiones y conclusiones que induzcan pueden o no ser ciertas; sin embargo, nada de
ello los cambia.
Es la experiencia de todos que una observacin dada puede ser vista de una manera en un
momento determinado y de otra en alguna oportunidad siguiente. En Neurologa, una rama de
la Medicina Clnica, un ejemplo es el de la enfermedad denominada Miastenia Gravis, en ella
la reduccin de la amplitud del potencial de accin muscular evocado por el estmulo elctrico,
repetido a alta frecuencia, del nervio dirigido a un msculo determinado, fue tomado como
argumento para sostener el origen pre-sinptico de la dolencia, es decir de ubicacin en la terminal axnica de la fibra nerviosa que alcanza a las clulas musculares, concepto que se mantuvo
hasta los aos 60 y que sostena que aquella cada de amplitud era debida a disminucin o
alteracin molecular de la acetilcolina, que es el intermediario sinptico en la transmisin neuromuscular, y que se aloja en el nervio; en esa dcada se demostr cabalmente que la falla en la
transmisin neuromuscular era de origen post-sinptico, localizado en la clula muscular y no
en la terminal nerviosa, entendiendo, entonces, que el comportamiento referido del potencial
muscular era la consecuencia de la disminucin de receptores a la acetilcolina en el msculo; a
pesar de estos vaivenes en la interpretacin, la conducta del potencial muscular frente al estmulo elctrico repetido a frecuencia elevada permaneci inmutable.
Por ello los resultados deben exhibirse prolija y detalladamente, de manera objetiva
y clara, aceptando que si bien han logrado su existencia gracias al investigador, unas vez
aparecidos se independizan de l para pasar a formar parte del conocimiento, parte de la
Cultura.
[ 70 ]
tro saber y se transforma en Cultura. De esto debe tener conciencia el autor y si su conviccin
es que su interpretacin puede no ser lo suficientemente slida, debe dejar espacio como para
que ingresen visiones diferentes de sus resultados.
Dado que la discusin tiene cierta proporcin de subjetividad, es del todo aconsejable
que el tesista la someta al anlisis crtico de su Director antes de introducirla definitivamente en el texto. La crtica del Director deber ser frrea, tratando de poner en claro las
eventuales debilidades y contradicciones que pudieran tener los dichos del tesista. No es de
mala prctica pedir a otro investigador, fuera del Director, que lea el escrito y obtener de l
su impresin. Todo ello har que el autor redacte nuevamente la discusin; la nueva versin
deber seguir los pasos de la precedente y, as, hasta que tanto el autor como el Director
estn convencidos de haber obtenido un relato en el que los argumentos hayan logrado la
suficiente solidez que les permita ser aceptados por la comunidad universitaria en cuyo
mbito ser presentado.
Es, de todas formas, inteligente suponer que, con el avance de las ideas, la interpretacin dada a los resultados por el autor puede ser modificada por otros en el futuro; de
all que la propuesta que se haga deba ser presentada como una verdad relativa y, tal vez,
provisoria.
i) Conclusiones
Este aparte es, habitualmente, de corta extensin. Consiste en unos pocos prrafos en los
que se hace claro y preciso el nuevo hallazgo y su eventual valor en el desarrollo de las ideas
relacionadas con el tema en estudio.
El autor tendr presente que aunque lo encontrado sea del mayor aprecio, nunca es la
respuesta final al problema en el que esa observacin se inserta, solo un paso ms en la dilucidacin de su conocimiento.
j) Resumen
Esta pieza del escrito es de importancia y apela a la capacidad de sntesis del autor. En el
resumen deber decir, en pocas lneas, lo que resulta conceptual de todo lo dicho. La estructura del resumen deber ser idntica a la del manuscrito principal.
Su objetivo es dar al lector la idea central de la investigacin hecha, como fue concebida,
que herramientas se usaron para explorarla, cules fueron los resultados de mayor vala y a
qu conclusiones ellos condujeron.
No necesariamente este aparte debe ir al final del texto mayor, puede precederlo. Yo creo
que es mejor esto ltimo, puesto que quien lo lee sabr, anticipadamente, que es lo que le
aguarda en el resto del manuscrito.
k) Bibliografa
Es absolutamente imprescindible que toda la bibliografa citada integre la lista bibliogrfica.
[ 72 ]
Esa lista puede confeccionarse por abecedario, tomando el apellido del primer autor del
trabajo o captulo de libro o libro. Tambin puede hacrsela por orden de aparicin en el texto. Es preferible esta ltima modalidad, ya que hace ms suelta la lectura.
Es conveniente que, en el texto principal, la cita figure como el nmero que tiene en la
lista bibliogrfica. Ello es preferible a la insercin dentro del manuscrito mayor, entre parntesis, del nombre de los autores, ao, etc; esta forma de individualizacin bibliogrfica
entorpece la lectura, acta como un distractor y la vuelve laboriosa.
La forma de citacin seguir las normas internacionales para las publicaciones peridicas. El modelo de ficha sugerido arriba se ajusta a ello.
No deben incluirse en la lista citas que no hayan sido referidas en el texto principal.
l) Apndices
Hay autores que crean apndices para mostrar hechos que, usualmente, se conectan con
la idea central de manera tangencial. En general no agregan demasiado al pensamiento gua
del trabajo y lo que puedan aportar puede ser incluido en el escrito mayor.
En mi concepto, la mayor parte de las veces ellos son innecesarios. Ms aun, yo creo que
desvalorizan el trabajo. Resultan un esfuerzo adicional para el lector y pueden desviar la lnea
de pensamiento que sigue el escrito principal.
Creo que no es recomendable su introduccin en un trabajo de tesis de doctorado.
m) ndice
Es conveniente introducir un ndice en el que se detalle la ubicacin de cada uno de los
apartes o captulos de los que consta el escrito. Es aconsejable que sea lo mas analtico posible, de forma que en cada captulo figuren los distintos puntos que lo integran.
Es tambin conveniente que se lo exhiba en el comienzo del manuscrito; su lectura, a
igual que lo que sucede con el resumen, podr dar al lector una apreciacin general de las
pretensiones del autor.
Colofn
He tratado de dar las ideas y herramientas generales de lo que, creo, debe ser un trabajo
de tesis de doctorado.
Es cierto que mi experiencia est limitada a los escritos mdicos y biolgicos y que ello
constituye una restriccin de ideas de la que, lamentablemente, no puedo escapar.
Sin embargo, quizs, lo dicho a lo largo de este captulo pueda ser de utilidad, al menos
parcial, para cualquier estudiante dispuesto a emprender la denodada labor que implica llevar adelante un proyecto de tesis de doctorado.
Tal vez, quien lea estas pginas pueda adoptar algunos de los conceptos dados en beneficio de su tarea. Si me enterase de ello estara muy complacido.
[ 73 ]
Lecturas sugeridas
1. Alonso M. Ciencia del lenguaje y arte del estilo. 1953. Editorial Aguilar. 3 Edicin.
Madrid.
2. Eco U. Cmo se hace una tesis. 2006. Editorial Gedisa. 8 Edicin. Barcelona.
3. Fishbein M. Medical writing. 1957. Editorial McGraw-Hill Company. Nueva York.
4. Lasso de la Vega J. Cmo se hace una tesis doctoral. 1958. Editorial Mayfe. 2 Edicin.
Madrid.
5. Lejarraga H. Cmo confeccionar un proyecto de tesis. 2006. Curso Virtual. Facultad de
Medicina Virtual. Facultad de Medicina. UBA.
6. Moroney MJ. Facts from figures. 1960. Editorial Penguin Books. 3 Edicin. Londres.
7. Wikinski JA, Usubiaga JE, Hernndez HH. El trabajo cientfico. 1977. Editorial Diafrag. Buenos Aires
[ 74 ]
Captulo 7
Ricardo J. Esper
Antonio Paragano
La efectividad de una presentacin oral depende de la habilidad del orador para comunicarse con la audiencia. Cada aspecto de la presentacin debe orientarse a captar la atencin del espectador y facilitar la comprensin de la informacin expuesta. Este captulo se
enfocar en el proceso que conlleva la presentacin de los resultados de un trabajo o informe
cientfico, y en la forma de comunicarse eficazmente con la audiencia. Son pautas o consejos
para evitar caer en excesos o actitudes inadecuadas, intentado que las presentaciones tengan
cierta atmsfera de homogeneidad, facilitando el entendimiento y forjando el ambiente para
la discusin provechosa.
y vinculados con el objetivo de la investigacin. Exponga fielmente la informacin que responde a la hiptesis y a los objetivos planteados o que ser utilizada en las conclusiones, y
debe hacerlo an cuando obrara en contra de la tesis inicial o no se obtuvieran valores con
significacin estadstica.
Finalmente, la conclusin debe ser concisa, reflexiva y respaldada por los resultados del
estudio. Comentar el o los elementos ms notables y sugerir recomendaciones. No aada
conclusiones que no se ajustan a los resultados, tampoco extenderlos a otras situaciones que
no son estrictamente las del estudio.
Atae al presentador establecer los puntos cruciales correctos, ya que las personas no
retendrn ms de unos pocos datos significativos, comunquelos eficazmente y lograr que
los oyentes consigan recordarlos. No pretenda que la audiencia decida qu es lo importante,
asegrese que ellos consideraran relevantes los mismos conceptos que usted. Una forma de
lograrlo es comenzar comentando las conclusiones de la ltima diapositiva, y enfatizar los
puntos esenciales para facilitar la presentacin. Cada palabra hablada, y cada palabra escrita
en las diapositivas debe ser importante y relacionada con los objetivos.
2. Medios visuales y material grfico
Un viejo dicho expresa que una imagen puede ms que mil palabras, y es una verdad
indiscutible. Para que la presentacin se desarrolle de manera didctica y prominente es
absolutamente vlido recurrir a los recursos tcnicos disponibles, como la proyeccin de
diapositivas, videos, pelculas u otro tipo de material, siempre y cuando se amolden a normas
de prudencia. En diversas encuestas se observ que una conferencia sin proyecciones habitualmente capta la atencin del 20% al 30% del auditorio, y asciende hasta un 75% cuando
se acompaa de material grfico o visual. Asimismo, el proyectar imgenes borrosas, con inadecuada combinacin de colores, desorganizadas e inclusive excesivas, conducen al fracaso
de la exposicin y hasta cuestionan la profesionalidad del presentador.
Rutinariamente las presentaciones actuales se almacenan en un CD o en una memoria
removible con terminal USB (llamados habitualmente pen-drive, memory-drive, thumbdrive, flash-drive, etc.) y simplifican el traslado del material al sitio de exposicin. Lo ideal,
cuando es posible, es copiar los datos en el disco duro, lo cual agiliza considerablemente
la presentacin. En muchas convenciones se pide que los archivos de clips sean enviados
electrnicamente antes de la reunin, en este caso asegrese llevar una copia de respaldo,
con un formato de medios de comunicacin que la computadora aceptar (CD, disquete,
USB flash drive, etc.). El manejo de los medios visuales puede realzar la calidad de una
presentacin, aunque la efectividad de cualquier presentacin no depende exclusivamente
de la calidad del material visual. La proyeccin de imgenes, cifras, frases o procedimientos
fija los conceptos con mayor claridad y refuerza e ilustra la informacin transmitida por
el orador.
La conferencia debe mantener el foco en la comunicacin de los objetivos y no desviarse especialmente hacia los efectos tecnolgicos. La habilidad del presentador para comunicarse con la audiencia puede conducir a presentaciones muy efectivas, a veces sin
disponer de medios visuales. Lo contrario no es verdadero, no importa cun sofisticados
son estos recursos, si un presentador hace un pobre trabajo al comunicarse con la audien[ 77 ]
mente de imgenes sin lectura. Pero evite dar demasiada informacin, el espectador
no podr captarla.
Tamao y tipo de las letras. No demasiado pequeas que no se puedan leer desde una distancia considerable, segn las dimensiones del local y de la pantalla de
proyeccin, ni demasiado grandes que haga incmoda o hasta molesta su lectura.
En cuanto al tipo de letras, las computadoras ofrecen una infinidad de ellos, y se
aconseja utilizar los de lectura fcil y clara, aunque en algunos casos y para destacar
conceptos se recomienda emplear tipos diferentes al del texto principal.
Prefiera las proyecciones horizontales a las verticales. Estas ltimas por lo general
dejan parte de las mismas fuera de la pantalla.
Considere los contrastes. El contraste entre el color de las letras y el fondo de la diapositiva es un elemento de suma importancia, porque facilita o dificulta la lectura.
Existe una escala de contrastes de colores que optimizan este hecho, y que de mayor
a menor son los siguientes:
Letras negras sobre fondo blanco
Letras blancas sobre fondo azul.
Letras negras sobre fondo amarillo.
Letras blancas sobre fondo negro.
Letras rojas sobre fondo blanco.
Letras verdes sobre fondo blanco.
Letras blancas sobre fondo rojo.
Letras amarillas sobre fondo azul obscuro, etc.
El presentador seleccionar el contraste que permita la mayor legibilidad segn su parecer. No es aconsejable un fondo con texturas complejas u policrmicas, ya que atenta contra
la concentracin en lo esencial y puede resultar tedioso.
Hoy da, con los recursos de los programas de computacin, estas reglas han perdido
parte de su vigencia, especialmente con la superposicin de leyendas, las imgenes animadas,
la sumatoria de imgenes, rtulos, etc., a medida que la exposicin con diapositivas avanza.
Es aconsejable emplearlos, pero siempre con la premisa de no generar una exposicin donde
es ms importante la imagen que el mensaje.
Diapositivas de grficas
Los grficos cobran singular importancia en la presentacin de los resultados y existen
mltiples opciones y combinaciones posibles de los mismos. Los clsicos son los de barras, de
torta, de lnea, etc. Cada uno se utiliza segn lo que se quiera expresar, pero es aconsejable
no manejar ms de 7 barras o 7 divisiones de la torta, y deben rotularse en unidades o porcentajes muy claros y contrastantes.
Es aconsejable que en las grficas figuren los valores de las coordenadas y/o de las barras
o partes de la torta, para evitar al expositor tener que especificarlos. El tiempo de atencin del
auditorio en una grfica raramente sobrepasa los 30 segundos, a partir de los cuales la curva
de atencin comienza a decrecer. Por lo general la atencin en una grfica de mala calidad,
complicada o de difcil comprensin no pasa de unos pocos segundos. En 30 segundos el
[ 79 ]
expositor solo podr decir entre 50 y 70 palabras. Luego, es aconsejable programar la exposicin oral sobre esa grfica en esa cantidad de palabras y de tiempo.
Lo habitual es combinar en las proyecciones texto y grficas. En la actualidad, los investigadores cuentan con el apoyo de los profesionales de diseo y las posibilidades de los
programas de computacin, asociacin muy efectiva para lograr presentaciones de calidad.
No dejar de consultarlos, ellos son creativos y saben como transmitir un concepto.
Pster (Cartel)
El pster, otro medio de apoyo visual, surgi como una necesidad para permitir una
mayor cantidad de presentaciones en las sesiones cientficas. Habitualmente no son tan valoradas por el autor como una presentacin oral. Sin embargo, el mayor tiempo de exposicin y
la posibilidad de discutir los resultados con los espectadores pueden provocar un gran inters
y resultar de mayor divulgacin. La discusin ms personal que puede generarse entre los
autores, los revisores y los lectores del pster presentes en el lugar, suele ser muy provechosa
y enriquecedora.
El pster introduce una variedad de ilustraciones que permite presentar el trabajo con
claridad. Debe combinar la parte escrita y grfica con un diseo agradable y legible, y su tamao debe facilitar la lectura desde una distancia prudencial. La informacin volcada debe
contener los mismos puntos que la presentacin con diapositivas: ttulo, autores, objetivo,
etc. Evite incorporar demasiados datos, dispngalos en orden y destaque visualmente los
elementos clave.
Imprevistos
Pero suponga el presentador que se ha cortado la luz, no dispone de micrfono ni de medio de proyeccin. O que los inconvenientes suceden en forma menos trgica, como un proyector de diapositivas daado, se interrumpe solamente el micrfono o, lo que es ms comn,
falla la computadora o la insercin de la memoria. Deber usted declinar la presentacin?
Puede hacerlo, pero quizs no tenga otra oportunidad hasta varios meses despus, tiempo
en que probablemente otro investigador presentar un estudio muy semejante al suyo y le
quitar primaca. Asimismo, puede mal interpretarse y verse como un desprecio al auditorio
que ha asistido a orlo. Mejor improvise una presentacin parcial, empleando sus mejores
condiciones pedaggicas e histrinicas.
Aydese con un pizarrn y tiza, y hasta con alguna humorada para elevar el estado de
nimo de los presentes. Al usar el pizarrn hay datos claves que se pueden escribir en l,
nombres cientficos, una frmula o un resultado numrico importante. Esto contribuye a
mantener la atencin, ayuda a la comprensin y ofrece un tiempo extra para analizar lo
que se expres en palabras. Siempre se debe contar con recursos para salir del mal trance,
y el mejor instrumento es la experiencia del presentador. Entienda que todo material sirve
de apoyo, y que lo relevante es el discurso y su trasfondo. No hay muchas oportunidades
para presentar su experiencia y demostrar sus habilidades cientficas y comunicativas, no
las desperdicie!
[ 80 ]
3. La presentacin oral
Elaborar una presentacin para una reunin local, nacional o interdisciplinaria no es
momento para apresurarse, una exposicin efectiva requiere de ensayo. La espontaneidad es
un nmero infinito de posibilidades entrenadas. Practicar le otorga al expositor la oportunidad de medir cunto tiempo tomar la exposicin, planear las pausas en el momento oportuno y familiarizarse con las diapositivas, tratar de memorizar y recitar la conferencia no es
la forma de presentar. Ensayar le permitir modificar la presentacin al instante, segn las
necesidades o ante una pregunta de la audiencia. Si se admiten preguntas durante la presentacin, podr fcilmente saltar adelante o atrs por las diapositivas, demostrando conocer la
informacin contenida en ellas y reforzando la evidencia para las respuestas.
El ensayo debe incluir probar el equipo que va a usar y crear un plan de apoyo, por si deja
de operar. Practique la presentacin en voz alta, expresndose diferente cada vez. Puede ser
de ayuda hacerlo frente a los coautores o, mejor an, en un ateneo de su servicio. Sus colegas
pueden proveer informacin honesta acerca del contenido, colores y/o cualquier defecto en
los grficos. An con las mejores intenciones, pocas presentaciones estn realmente acabadas. Tmese el tiempo necesario para encontrar la imagen que destaque su exposicin, y
reemplace a la imagen que no lo har. Agregue contenido actualizado y haga la presentacin
interactiva. Intente tener acabado el borrador bastante tiempo antes de la fecha tope, y use el
tiempo extra para mejorarlo.
Depender de notas para trabajar o emplear largas pausas para componer pensamientos
desva la atencin y afecta la calidad de la presentacin. No es recomendable la lectura de
notas, o debe hacerse con moderacin, los buenos conferencistas rara vez las necesitan. Gastar tiempo leyndolas puede convencer a la audiencia que el presentador no est preparado.
Es posible que un presentador hable lentamente, otros hablan y se mueven muy rpido por
las diapositivas. Por regla general, cada diapositiva merece al menos 10 segundos, y ninguna
debera superar 1 o 2 minutos. Si toma ms tiempo para cubrirla, probablemente es mejor
rehacer el contenido en dos diapositivas.
Disponga de una vestimenta adecuada al lugar y el foro de presentacin, no se acicale
o atave excesivamente. Puede ocurrir que un atuendo inadecuado o inslito conduzca a la
desatencin o, lo que es peor, al sentimiento de menoscabo, y que entonces el auditorio no se
concentre en la meta ms importante que es el aspecto cientfico. Lo aconsejable es utilizar
una indumentaria que no desentone con el medio en que se encuentra, pero nunca estar mal
con el clsico saco y corbata.
En ese momento, usted es el centro de las miradas, aparezca lo ms natural y relajado posible. Recuerde, nadie sabe ms del tema que usted. Si puede escoger, elija la parte izquierda
del auditorio, la explicacin del material audiovisual ser ms lgica, es la forma en que se lee
nuestro idioma. Comunicar la presentacin con pasin y confianza le aadir credibilidad al
mensaje, y la audiencia reconocer esas emociones.
Al mostrar imgenes, oriente a la audiencia hacia el punto relevante, proporcineles el
tiempo suficiente para asimilar la informacin y permitir conjeturar las conclusiones. Muchos oradores se apresuran a travs de las diapositivas, hacen declaraciones que aluden a
conclusiones en las imgenes, pero no explican o sealan claramente esas conclusiones. Una
tcnica que ayuda al auditorio a comprender mejor las diferencias es mostrar un ejemplo
[ 81 ]
normal, seguido de uno que no lo es. Exprese claramente las diferencias entre los dos, es un
error dejar a la audiencia que establezca la conexin entre ellos.
Considere cmo va a sealar los puntos importantes en una diapositiva, las herramientas
disponibles como el puntero de lser o el cursor del ratn, pueden ser efectivas si se emplean
adecuadamente. Es frecuente que el presentador no dirija el haz de luz sobre el elemento
que desea sealar, sino que lo mueva displicentemente en forma circular, oval o totalmente
asincrnica tratando de englobar mltiples reas o, lo que es peor, no sealando ninguna en
especial. Esto no resulta til, sino ms bien distrae y hasta puede llegar a ser desagradable.
El contenido de las diapositivas es explicativo y dirigido a la audiencia y no al orador,
que no debe leerlas. Es conveniente afrontar en direccin a los presentes y no a la proyeccin.
Adems no corresponde disculparse dentro de la presentacin, si una diapositiva ser difcil de
comprender no debera ser presentada. A veces las preguntas pueden ser ms importantes que la
presentacin real, piense y adelntese a las preguntas que podran manifestarle. Al replicar mire
a todos los oyentes, ya que todos pueden tener la misma duda. Evite elogiar algunas consultas y
no otras, adems, trate todas las cuestiones e interrogadores con el mismo respeto.
Contestar las dudas que le plantea el auditorio no debe ser un problema si ha sabido
transmitir las ideas esenciales, las preguntas suelen ir dirigidas a aclarar y ampliar alguno
de los puntos clave de su charla. Si no sabe la respuesta no intente responder con evasivas o
invenciones, mejor transmitir al interlocutor el inters por tratar de darle contestacin en un
futuro o, simplemente, admitir su desconocimiento al respecto. Suministrar toda la informacin, positiva o negativa, para que los dems puedan juzgar con ecuanimidad el valor de su
trabajo, no exponga informacin sesgada tratando de orientar el juicio de los presentes.
El aprendizaje es un proceso dinmico que requiere de la participacin activa de los presentes. Desde tiempos inmemoriales la clase profesoral ha sido una tcnica de instruccin ampliamente respetada. Sin embargo, en nuestros das una conferencia para transmitir informacin o
como mtodo de enseanza puede considerarse igualmente igualmente primordial. La presentacin oral debe orientarse para incluir la participacin de los oyentes, despertar su curiosidad,
motivarlos a aprender y pensar, en resumen, lograr ms que lo que puede cualquier libro o
publicacin.
El clima de la conferencia es importante, los factores que perturban la voluntad de atencin de la audiencia deterioran la comprensin. Un ambiente seguro y relajado facilita el
entendimiento. El orador, intencionalmente o involuntariamente, puede modificar el clima
emocional y debe comprometerse para lograr un contexto con estas caractersticas.
La interaccin informal con la audiencia, con el humor apropiado, ayuda a establecer
un clima que conduce al aprendizaje. Muchos autores recurren a alguna ancdota o hecho
inusual para llamar la atencin, inclusive, alguna cita o una gracia que causa hilaridad entre
los presentes. Esto despierta a un auditorio un tanto esttico y motiva su inters. Manejar
prudentemente una cantidad correcta de humor puede contribuir al mutuo entendimiento
con la audiencia. Est bien salirse ocasionalmente de la letra, no es un recurso desdeable,
pero con la precaucin de no ser ofensivo ni chabacano, ni hacer que la presentacin se recuerde por el imprevisto y no por la esencia cientfica.
Es aconsejable llevar las imgenes de la conferencia en la computadora personal, en un
CD o memoria electrnica, pero siempre con un duplicado. Examinar antes de la presen[ 82 ]
tacin las imgenes a proyectar para evitar inconvenientes, recordar que los programas de
computacin se renuevan muy frecuentemente, por ello consultar si los programas de la computadora a utilizar son compatibles con el formato que el presentador dispone.
Por sobre todas las cosas, respetar los tiempos. Todos los investigadores estn convencidos que sus hallazgos son de mxima importancia y que van a cambiar los destinos de
Occidente. Pero a todos se les da la misma cantidad de tiempo para su presentacin, por lo
general de 10 minutos o, a lo sumo, 15 minutos. Superado este lmite se reduce el tiempo de
los siguientes expositores, o el de las preguntas y respuestas. Es necesario que se entrene lo
suficiente como para asegurar de terminar en tiempo. Ms de una vez, los encargados de
cronometrar la exposicin, por lo general el presidente o secretario de mesa, truncan la comunicacin en el tiempo justo y el presentador se ve perjudicado por no haber expuesto las
conclusiones o el comentario ms importante.
Es necesario recalcar que el principiante debera ensayar la presentacin varias veces en
presencia de sus colegas para habituarse al medio, a las formas y al tiempo. Ellos le aconsejaran sobre todo aquello que pueda mejorar y optimizar, inclusive hacerle preguntas que
podran surgir luego desde el auditorio y prepararse para ello. Solo despus de mucho tiempo
y amplia experiencia podr exponer sin temores ni mayores errores.
Los mensajes publicitarios tratan de captar la atencin en pocos segundos, y es un ejemplo importante que debemos tener en cuenta porque aunque dispongamos de un plazo mayor
para presentar nuestro trabajo, tenemos un mnimo de tiempo para atraer la atencin. De no
hacerlo, por mucho que hablemos no conseguiremos ser eficaces en nuestro objetivo. Para
cumplir con esta recomendacin debemos comenzar la presentacin de manera original y
atractiva, utilizando los recursos de la narracin oral (vista, voz, cuerpo, manos y pies).
Nuestra presencia ante la audiencia tendr un impacto en su reaccin para lo que sigue, el
orador debe estar cmodo y controlado, o al menos transmitir esa impresin. La cabeza debe
estar en alto con la barbilla arriba, actitud que da la impresin de tener el mando. Los brazos
cruzados en el pecho se ven como un signo de defensa. Si uno esta sentado, enderezarse en la
silla manteniendo la columna recta, los pies en el suelo y las manos extendidas sobre la mesa.
Los gestos son un refuerzo visual para las ideas y las palabras enunciadas, dirjase a la audiencia con movimientos que cautiven la atencin. Es ms cmodo atender a un conferencista
dinmico que escuchar a alguien que est detrs de un podio con los brazos cruzados. Use gestos
amplios y envolventes, nunca emplee ademanes rpidos y espasmdicos. Los gestos ms efectivos
son extensiones naturales de uno mismo y deben ser variados, la repeticin puede ser molesta.
Algunos modales, como apuntar con el dedo o el puo cerrado, son amenazadores. Evite
poner las manos en los bolsillos, use las palmas de la mano abiertas hacia el pblico, incline la
cabeza y sonra para enfatizar aquello que expone. No permanezca durante un perodo prolongado detrs del podio, separa al orador de la audiencia y se percibe como lejano. Alcance a los
presentes fsicamente, aumentar la atencin e inters, y alentar a las preguntas y respuestas.
Los oradores efectivos hacen contacto visual con el pblico y advierten sus reacciones,
aburrimiento, entusiasmo, etc. Para hacer el contacto visual correcto debe barrer con la
mirada a la audiencia, observe a cada persona unos segundos. Es importante hacerlo, deja
percibir si estn atentos o qu nos indica su lenguaje corporal, se mueven irritados, toman
notas o estn dormidos.
[ 83 ]
Tcnicas pedaggicas
Existen algunas tcnicas pedaggicas que pueden ser tiles de conocer cuando se prepara
una clase u otro tipo de exposicin, ya que orientan en como concitar y mantener la atencin
del auditorio.
[ 84 ]
Esta tcnica fue inicialmente utilizada para conocer el nivel de atencin de la audiencia
durante una exposicin, y es til que el orador la tenga presente para intentar mantener un
nivel uniforme de atencin de la audiencia. Puede alternar con cierta periodicidad frases o
proyecciones que impacten positivamente a la audiencia, concitando una atencin pareja
durante la exposicin. O por lo menos, utilizar los elementos de mayor importancia en forma
escalonada o peridica para despertar inters. Tambin es importante que el orador exprese
la hiptesis del trabajo y los objetivos al principio, cuando la audiencia est ms interesada, y
que sea claro y determinante en las conclusiones al final de la presentacin.
Eplogo
La intencin este artculo fue acercar algunas recomendaciones a los que se enfrentan por
primera vez a un auditorio para difundir informacin cientfica. Es posible que estas consideraciones parezcan intrascendentes, sin embargo, pocas veces se tienen en cuenta y el resultado
de una exposicin se ve innecesariamente disminuido. Hablar en pblico es un arte, algunas
personas parecen haber nacido con las habilidades y el deseo para hacerlo. Sin embargo, la
mayor parte de nosotros necesitamos aprender este arte, trabajando continuamente para
mejorar. Vale la pena el esfuerzo, comunicaremos mejor el conocimiento y provocaremos
un cambio en las actitudes y/o la prctica cotidiana de los oyentes. Este es el resultado que
uno desea cuando se involucra con la investigacin y la educacin mdica. No olvide que la
constancia genera talento.
tinuing Medical Education Course. Med Educ Online [serial online] 2002; 7: 17. Available from http://www.med-ed-online.org.
11. Council of Biology Editors. Council of Biology Editors Style Manual. Arlington, VA,
Council of Biology Editors, Inc, 4th Edition, 1978.
12. Cruz Verduit L, Arencibia JR, Prez Fernndez E. Aspectos metodolgicos bsicos para la preparacin y el empleo de las diapositivas. http://www.bvs.sld.cu/revistas/aci/
vol10_4_02/aci030402.htm.
13. Dalal MD, Daver BM. Computer generated slides: a need to curb our enthusiasm. Br J
Plast Sur 1996; 49: 568-571.
14. Estrada CA, Patel Sangnya R, Talente G, Kraemer S. The 10-Minute Oral Presentation:
What Should I Focus on? Am J Med Sci. 2005; 329(6): 306-309.
15. Farrow R. ABC of learning and teaching in medicine: Creating teaching materials. Br
Med J 2003; 326: 921-923.
16. Garity J. Creating a professional presentation. J Intraven Nurs 1999; 22: 81-86.
17. Garson A, Gutgesell HP, Pinsky WW, McNamara DG. The 10-minute talk: Organization, slides, writing, and delivery. Am Heart J 1986; 111: 193-203.
18. Greenhalgh T. Cmo leer un trabajo cientfico. Gua basica de la medicina basada en la
evidencia. Buenos Aires, Volpe/Fox S.A., 2005.
19. Haber RJ, Lingard LA. Learning oral presentation skills: a rhetorical analysis with pedagogical and professional implications. J Gen Intern Med 2001; 16: 308-314.
20. Hewson M, Little M. Giving feedback in medical education. Verification of recommended techniques. J Gen Intern Med. 1998; 13: 111-116.
21. Hoffman M, Mittelman M. Presentations at professional meetings: notes, suggestions
and tips for speakers. Eur J Intern Med 2004; 15: 358-363.
22. Jadoul M. Ten ways to ruin or market your oral presentation. Nephrol Dial Transplant
2001; 16: 2119-2123.
23. Kroenke K. The 10-minute talk. Am J Med 1987; 83: 329.
24. Leddy C. How to effectively present your product. Multichannel News 2001; 22: 44.
25. Maddow CL, Shah MN, Olsen J, Cook S, Howes DS. Efficient communication: assessment-oriented oral case presentation. Acad Emerg Med. 2003; 10: 842-847.
26. Manterola C, Pineda V, Vial M, Grande L. Cmo presentar los resultados de una investigacin cientfica? I. La comunicacin oral. Cir Esp. 2007; 81(1): 12-7.
27. Mecklenburger JA. Emerging technologies for education, beyond the computer revolution. Peabody J Edu 1986; 64: 183-187.
28. Moore Weaver L, Augspurger P, OBrien King M, Proffitt Ch. Insights on the poster
preparation and presentation process. Applied Nursing Res 2001; 14: 100-104.
29. Niamtu J. The power of power point. Plast Reconstr Surg 2001; 108: 466-484.
30. Noguerol Rodiguez B, Gonzalez Lpez S, Sicilia Felechosa A. Uso de la diapositivas en
presentaciones cientficas III: confeccin de diapositivas mediante el ordenador. Periodoncia 1995; 5: 153.
31. Ruhl KL, Suritsky S. The pause procedure and/or an outline: Effect on immediate free
recall and lecture notes taken by college students with learning disabilities. Learning
Disability Quarterly 1995; 18: 2-11.
[ 87 ]
32. Sherbino J, Bandiera G. Improving communication skills: Feedback from faculty and
residents. Acad Emerg Med 2006; 13: 467-470.
33. The eclectic slide. Goverment Computer News 2001; 20: 12.
34. Van Overbeek J. The presentation of scientific papers. Science, new series 1941; 93: 184185.
35. Wikinski JA, Usubiaga JE, Hernandez HH. El trabajo cientfico. Buenos Aires, Editorial
Diagraf, 2da Ed, 1977.
36. Thompson WM, Mitchell RL, Halvorsen RA, Foster WL, Roberts L. Scientific presentation, what to do and what not to do. Invest Radiol. 1987; 22: 244-245.
37. Zorrilla AM. Hablar, escribir, traducir en espaol. Buenos Aires, Editorial Dunken,
2003.
[ 88 ]
Captulo 8
Metanlisis
Luis Alcocer
Introduccin
Por muchos siglos, el conocimiento mdico se ha basado primordialmente en la observacin cuidadosa de los sntomas y signos de la enfermedad. El mdico clnico educado, ha
practicado desde siempre una semiologa esmerada de los signos recogidos con sus sentidos,
la vista (inspeccin), el tacto (palpacin), el odo (auscultacin y percusin), el olfato y an
el gusto, ms recientemente ampliados por los exmenes de laboratorio y gabinete, que en
ltima instancia amplifican estos sentidos.
El interrogatorio sistemtico de los sntomas ha permitido al mdico vivir las caractersticas propias de la enfermedad manifiesta de su paciente. Usando ambos mtodos, (el
interrogatorio y la exploracin fsica simple y armada), ha elaborado la historia clnica, que
le permite sentar una hiptesis razonable sobre el estado de salud de su paciente, y que sobre
todo sirve de base para la toma de decisiones, que se centran en recomendar o ejecutar medidas para preservar el estado de salud, si este se considera satisfactorio, o a restaurarlo lo
mejor posible si se juzga alterado. Este es el proceso mdico primordial que es empleado hasta
la fecha en la mayora de las acciones mdicas.
El anlisis de la propia experiencia, basada en la senso-percepcin, inici el intento por
conocer la naturaleza propia de la enfermedad, y se aplic en sus orgenes al anlisis de los
resultados de los intentos teraputicos. La medicina se aprenda directamente de otro mdico
experimentado y dispuesto a trasmitir su experiencia personal a sus alumnos. El registro de
las experiencias era personal del Mdico y las primeras publicaciones mdicas se refieren a
descripcin de casos, en forma especialmente de sntomas, signos y sndromes, que se relacionaban con enfermedades especficas: Esa fue la gran poca de los epnimos, pues al descubrir
alguna asociacin el investigador era premiado bautizando con su nombre su descubrimiento. Los investigadores describan las manifestaciones que resultaban propias de entidades
patolgicas, que se comprobaban de preferencia con autopsias y que eran de mayor valor si
resultaban de series de enfermos observados retrospectivamente.
Si clasificamos a la investigacin mdica, desde un punto de vista de jerarquas crecientes en trminos de validez, el primer grupo ms bajo en la escala es, precisamente, el de los
estudios descriptivos, y de ellos los retrospectivos de casos o series de enfermos. Todava es
posible encontrar en las revistas ms modestas estudios retrospectivos de series de pacientes,
[ 91 ]
ahora reforzados los sentidos del mdico con estudios ms o menos elaborados de laboratorio
y gabinete. Algunas revistas tan prestigiosas como el New England Journal of Medicine, an
reportan casos completos, muy bien estudiados y se les considera de un alto valor didctico.
Este mtodo del anlisis del caso es empleado como un mtodo muy actual, por ejemplo en
las grandes escuelas de negocios.
Los estudios de series se completan con estadstica descriptiva. Se refieren fundamentalmente a enfermedades, sndromes o sntomas-signos y en ocasiones a resultados sobre determinado procedimiento, especialmente quirrgico. Su validez es simplemente descriptiva y, en
ocasiones, se intenta justificar su publicacin al limitarlos a un grupo de inters particular,
como por ejemplo: Caractristicas de la enfermedad X en grupo de ciudadanos del pas Y,
en edades de n a p aos.
Los caminos de la intuicin, la fe, la magia y an la percepcin extrasensorial, han sido
utilizados por siglos por la medicina para reconocer, interpretar el sentido e intentar curar
la enfermedad. El mtodo cientfico es el pensamiento que permite al hombre tener una certeza razonable de lo que sus sentidos recogen (Senso) y su mente elabora (Percepcin). Es lo
ms cercano posible a la verdad y es actualmente el nico aceptable para tomar decisiones
sobre el estado de salud-enfermedad de las personas y para preservar, promover o restaurar
su estado de salud, entendido este como tiempo de calidad de vida. El mtodo cientfico
nace formalmente desde el siglo XVII con el pensamiento de Galileo y es un proceso destinado a explicar fenmenos, establecer relaciones entre los hechos y enunciar leyes que
expliquen los fenmenos fsicos del mundo y permitan obtener, con estos conocimientos,
aplicaciones tiles al hombre.
El siguiente nivel de la investigacin mdica emplea el mtodo cientfico en un ms alto
nivel, y nace cuando se comparan las caractersticas de un grupo francamente enfermo con
otro grupo de personas de caractersticas similares, pero sin evidencias de enfermedad. Estos
estudios son llamados Caso-Control y permiten emplear la estadstica no solo descriptiva
sino tambin inferencial, esto es que permiten inferir relaciones.
Es consustancial a la investigacin cientfica el someterse siempre a una prueba de
la verdad, que consiste en evidenciar que cada hecho descubierto pueda ser comprobado,
mediante otros experimentos, por cualquier persona y en cualquier lugar, y en que sus hiptesis son revisadas y cambiadas si no se cumplen. Esto es ya posible en los estudios casocontrol, que son todava vigentes, se emplean para construir hiptesis causa-efecto, aunque
no permiten demostrarlas y son especialmente tiles para el estudio de condiciones muy
raras, en las que es imposible conseguir muestras grandes en nmero de sujetos enfermos.
El siguiente nivel de estudios se llama estudios de cohorte. Consiste en seleccionar un
grupo de personas y seguir en el tiempo la evolucin de su estado de salud. En general se compara la incidencia del evento que se decidi estudiar, entre personas expuestas y no-expuestas
a diversos factores. Los estudios de cohorte se han utilizado de manera clsica para determinar la ocurrencia de un evento especfico en un grupo de individuos inicialmente libres del
evento o enfermedad en estudio.
Permiten estudiar los factores de riesgo para una enfermedad determinada y son la base
de la epidemiologa moderna. Quiz el ms significativo de ellos es el estudio Framingham,
con ms de 50 aos de seguimiento.
[ 92 ]
Hasta este nivel el mtodo que se emplea es la observacin, sin interferir en el proceso,
por lo que podramos decir que estos grupos de estudios estn destinados a conocer la historia natural del proceso salud-enfermedad y su principal producto es la caracterizacin de las
enfermedades y la posibilidad de conocer y evaluar el riesgo.
La experimentacin es un procedimiento mediante el cual se trata de comprobar una
hiptesis, mediante la manipulacin de una o ms variables, manteniendo fijas las otras
conocidas, lo que permite estudiar las relaciones y el peso que estas variables tienen para
el desarrollo del fenmeno en estudio. La experimentacin es fundamental para poder
ofrecer explicaciones causales. La experimentacin en humanos es desafortunadamente
esencial para conocer en especial los efectos benficos e indeseables de los agentes teraputicos. Es por ello que las normas ticas son fundamentales cuando se experimenta
con humanos y deben ser muy estrictas y muy vigiladas en estos estudios. Este tipo de
investigacin se emplea para valorar la eficacia de diferentes terapias, de actividades preventivas o para la evaluacin de actividades de planificacin y programacin sanitarias.
Como en los estudios de cohorte, los individuos son identificados en base a su exposicin,
pero a diferencia de estos, en los estudios experimentales es el investigador el que decide
la exposicin.
Los estudios experimentales son de varios tipos:
Ensayo clnico: Es el estudio experimental ms frecuente. Los sujetos de estudio son
en la mayora de los casos pacientes y se planean para evaluar uno o ms tratamientos
para una enfermedad o proceso. Deben ser comparativos, entre dos o ms grupos en los
que la intervencin debe ser distribuida aleatoriamente. (Principio activo en estudio contra placebo o principio activo en estudio contra tratamiento estndar, o principio activo
en estudio contra otro principio activo conocido). La validez de estos estudios radica
fundamentalmente en que el proceso aleatorio haga los grupos comparables en las variables ms relevantes en relacin al problema a estudiar, con el objeto de poder atribuir
las diferencias en los resultados a la accin de la intervencin practicada. Este tipo de
estudios se emplean desde la investigacin pre-registro de los medicamentos (fases I-III),
hasta las fases post-registro. Tienen posibilidades de diseo muy variado y la muestra estudiada puede ser pequea, 20-100 probandos o hasta los grandes estudios que incluyen
a miles de pacientes, tan en boga actualmente y que son bautizados frecuentemente con
un acrnimo ingenioso.
Ensayos de campo: Tratan con sujetos que an no han adquirido la enfermedad o con
aqullos que estn en riesgo de adquirirla, y estudian factores preventivos de enfermedades
como pueden ser la administracin de vacunas o el seguimiento de dietas.
Ensayos comunitarios: Incluyen intervenciones sobre bases poblacionales amplias. Este
tipo de diseos suelen ser cuasi experimentales (existe manipulacin pero no aleatorizacin),
en los que una o varias comunidades recibirn la intervencin, mientras que otras servirn
como control.
Los estudios experimentales, si tienen un diseo cuidadoso con un tamao muestral
suficiente, un proceso de aleatorizacin adecuado, una intervencin y un seguimiento perfectamente controlados pueden proporcionar evidencias muy fuertes que nos permitan emitir
juicios sobre la existencia de relaciones causales entre variables.
[ 93 ]
los datos primarios o cmo integrarlos; por lo tanto, no existe un estndar para evaluar la
calidad de la revisin.
2. Revisiones sistemticas): Son aquellas que resumen y analizan la evidencia respecto
de una pregunta especfica en forma estructurada, explcita y sistemtica. Tpicamente, se
explicita el mtodo utilizado para encontrar, seleccionar, analizar y sintetizar la evidencia
presentada. Existen dos tipos de revisiones sistemticas:
a) Cualitativas: Cuando se presenta la evidencia en forma descriptiva, sin anlisis estadstico.
b) Cuantitativas o Metanlisis: Cuando mediante el uso de tcnicas estadsticas, se
combinan cuantitativamente los resultados en un slo estimador puntual.
Los metanlisis se requieren por la misma razn por la que se necesitan los grandes
estudios, aleatorizados y controlados, y mientras estos se realizan pueden sustituirlos. Los
estudios pequeos y medianos tienen mayor oportunidad de sufrir un sesgo estadstico, fundamentalmente por una menor oportunidad de que el reparto entre los grupos sea realmente
por azar, y frecuentemente no tienen el poder estadstico, por el tamao de la muestra, para
distinguir diferencias no tan obvias. El metanlisis, a diferencia de los grandes estudios controlados, no est sujeto a reglas tan estrictas, por lo que siempre sus conclusiones deben ser
tomadas como interinas, mientras se tiene la informacin proveniente de un gran estudio. Su
ventaja ms importante es que para brindar informacin, no requiere del periodo de tiempo
tan largo como un buen gran estudio.
1. Se elabora un protocolo, que defina claramente los objetivos y que describa minuciosamente los mtodos que se utilizarn durante el estudio, el establecimiento de la pregunta
que se desea responder y las razones para ella se deben especificar claramente.
2. Se identifican las fuentes bibliogrficas que se sometern a revisin, principalmente
consultas en Medline con palabras clave, en ocasiones es necesario contactar a los investigadores originales para obtener permisos y bases de datos. Se debe realizar una bsqueda exhaustiva, objetiva y reproducible de los trabajos originales sobre el tema, que adems de bases
de datos electrnicas incluya bsquedas detalladas en las revistas relacionadas y bsquedas
manuales de la llamada literatura gris (referencias bibliogrficas, tesis doctorales, comunicaciones a congresos, informes de instituciones pblicas o privadas, trabajos no publicados o
publicados en revistas no indexadas, etc). La exhaustividad y el rigor de la bsqueda bibliogrfica determinar en gran medida la calidad y validez final del metanlisis.
3. Es necesario declarar expresamente, desde antes los criterios de seleccin de los ensayos clnicos que deben ser incluidos, esto es criterios de inclusin y exclusin clara de
estudios. Los investigadores deben establecer cules de los trabajos recuperados sern incluidos finalmente en el metanlisis, elaborando una lista de criterios de inclusin y exclusin que deber ser lo ms objetiva posible. Para evitar el denominado sesgo de seleccin,
es importante aplicar dichos criterios rigurosamente a cada estudio, siendo recomendable
que esta evaluacin sea realizada de forma ciega e independiente por varios evaluadores.
Entre los criterios de seleccin utilizados con mayor frecuencia en el metanlisis estn: el tipo
de diseo de los trabajos, el tamao muestral estudiado, la exhaustividad de la informacin
que presentan o la comparabilidad en la definicin de los factores de exposicin, de las intervenciones y de las respuestas estudiadas.
Aunque algunos autores sugieren utilizar la calidad metodolgica de los trabajos como
un criterio de inclusin, es ms aconsejable considerarlo como una variable ms a tener en
cuenta en la interpretacin de los resultados del metanlisis mediante un anlisis de sensibilidad, es conveniente emplear la clasificacin de la evidencia segn las revistas mayores del
tema. En cualquier caso, una vez valorada la calidad metodolgica de cada trabajo, algunos
autores proponen utilizar las puntuaciones asignadas como pesos en el metanlisis, mientras
que otros defienden la utilizacin en su lugar de un anlisis de sensibilidad.
4. La seleccin de investigadores independientes que lean, clasifiquen, codifiquen, cuantifiquen y finalmente evalen y elijan el grupo de ensayos clnicos que sern incluidos, es una
opcin para garantizar la equidad de acceso de los estudios.
5. Elaborar una gua de los datos que deben ser recolectados de los ensayos clnicos escogidos para ser procesados en el metanlisis.
6. Combinar los resultados obtenidos y asegurar la calidad de los datos y su procesamiento estadstico adecuado. Los investigadores debern concretar qu medidas se van a
utilizar para medir el efecto de inters, en funcin del tipo de respuesta a estudiar y el diseo
[ 97 ]
de los estudios revisados. As, por ejemplo, si la respuesta es binaria (enfermedad/no enfermedad, muerte/supervivencia,) las medidas de efecto utilizadas suelen ser la diferencia de
proporciones, el riesgo relativo o la relacin de desventajas o momios. Por el contrario, si la
respuesta es un parmetro numrico (por ejemplo, la determinacin de un parmetro analtico) el efecto suele medirse mediante la diferencia estandarizada de medias en los grupos de
inters. Debe tenerse en cuenta que en los estudios experimentales, con grupos aleatorizados,
el propio diseo controla la confusin y los efectos pueden medirse con resultados crudos
como los descritos. Por el contrario, en metanlisis realizados a partir de evidencia observacional, el control del sesgo en el anlisis deber hacerse mediante tcnicas de regresin
multivariada, siendo los resultados de estos modelos los que deben combinarse en la etapa del
metanlisis para obtener una medida global de inters.
Finalmente, es tambin aconsejable que en el momento de planificacin de la investigacin
se fije la diferencia mnima en la variable respuesta que ser considerada de relevancia clnica.
En la mayora de los casos, el estimador del efecto combinado se calcula como una
media ponderada de los estimadores de cada estudio, donde los pesos se asignan en base a
la precisin de cada trabajo, generalmente el inverso de la varianza de la estimacin correspondiente. De esta forma, los estudios con mayor variabilidad (por ejemplo, aquellos con
un tamao muestral ms reducido), tienen una contribucin menor en el estimador global.
La heterogeneidad entre estudios puede ser tenida en cuenta en estos clculos utilizando el
llamado modelo de efectos aleatorios, o no ser incluida mediante el uso del modelo de efectos
fijos.5 La principal diferencia es que con este ltimo se considera que no existe heterogeneidad
entre estudios, mientras que con el modelo de efectos aleatorios se consideran dos posibles
fuentes de variabilidad, la variabilidad intra-estudio y la variabilidad entre-estudios, que se
incorporan al estimador combinado a travs de los pesos correspondientes. No obstante,
debe tenerse en cuenta que cuando existe una gran heterogeneidad entre estudios el metaanlisis, an bajo la suposicin de efectos aleatorios, no es apropiado y lo que procede es
identificar las fuentes de variabilidad y realizar un anlisis por subgrupos.
Cuando hay informacin suficiente son dos los pasos que se siguen: en primer lugar la
extraccin del estimador especfico del estudio y su error estndar y luego la combinacin de
esos estimados en un estimador o funcin de resumen.
Cuando la informacin existente es incompleta como para permitir utilizarla con algunos clculos sencillos, existen mtodos estadsticos complejos que permiten hacerlo: ajustes
usando estimadores externos de confusin tales como factorizacin de riesgos relativos y
ajuste de coeficientes; ajustes para sesgos de seleccin y clasificacin; tasas y razones de regresin; estimacin desde informes que emplean categoras amplias de exposicin y estimacin
de coeficientes desde informes que slo presentan promedios. El estimador adecuado puede
ser una diferencia de proporciones entre dos grupos, una relacin de momios, un riesgo relativo, etc. Cada uno de ellos tiene sus ventajas e inconvenientes y por lo tanto su eleccin debe
ser meditada y justificada. Tambin podemos estar evaluando una variable cuantitativa continua, en cuyo caso habitualmente se utilizar como medida del efecto la diferencia de medias
entre los grupos, o situaciones ms complicadas, que de momento no vamos a considerar,
como pueden ser variables de tipo ordinal, o variables similares a las utilizadas en el anlisis
de supervivencia (observaciones censuradas), etc.
[ 98 ]
Aunque existen diferentes propuestas estadsticas para combinar estudios, hay tres fundamentales, que se conocen con el nombre modelo de efectos fijos, modelo de efectos aleatorios y por ltimo el modelo bayesiano.
En el modelo de efectos fijos los estudios se combinan considerando que no existe heterogeneidad entre ellos, y que por lo tanto todos ellos constituyen estimaciones de un efecto
real, cuya magnitud se desea conocer. As pues, la inferencia realizada est condicionada a
los estudios que se han efectuado.
En el modelo de efectos aleatorios la inferencia se basa en suponer que los estudios incluidos en el anlisis constituyen una muestra aleatoria del universo de estudios posibles, y
sus resultados son ms conservadores al tener en cuenta una fuente extra de variacin, ya que
ahora se incluyen dos posibles fuentes de variacin: la existente dentro de los estudios y la
variacin entre los estudios.
La utilizacin de modelos bayesianos constituye, una alternativa interesante a la estadstica inferencial clsica.
7. Anlisis de la heterogeneidad de los estudios: la evaluacin del grado de heterogeneidad de los estudios puede llevarse a cabo mediante distintas pruebas estadsticas, entre las
que destaca la prueba Q propuesta por Der Simonian y Laird.6 No obstante, estos tests presentan una potencia muy baja, dado que adems en la mayora de los casos los metaanlisis
incluyen un nmero relativamente pequeo de estudios, aumentando as la posibilidad de cometer un error de Tipo II. Por todo ello, el anlisis de la heterogeneidad suele llevarse a cabo
mediante mtodos grficos como el grfico de LAbb o el grfico de Galbraith que permiten
inspeccionar visualmente la falta de homogeneidad entre los estudios recopilados.
En caso de que exista heterogeneidad entre los estudios incluidos en la revisin, los investigadores pueden optar simplemente por no realizar el metaanlisis, por obtener una medida
agregada del efecto de inters indicando una medida de la variabilidad entre estudios o bien
por realizar un anlisis por subgrupos homogneos de ser posible identificar la causa de la
heterogeneidad.
8. Anlisis de sensibilidad: El anlisis de sensibilidad permite estudiar la influencia individual de cada estudio al resultado del metaanlisis y, por lo tanto, determinar si los resultados pueden verse sesgados por estudios con escasa calidad metodolgica, trabajos no
publicados o que no cumplan estrictamente los criterios de seleccin, etc. Consiste en replicar
el metaanlisis quitando en cada paso uno de los estudios incluidos, para ver si se obtienen o
no resultados similares de forma global.
9. Identificacin del sesgo de publicacin: Como en cualquier otro estudio, en un metanlisis deber valorarse la existencia de posibles sesgos entre los que el sesgo de publicacin
es uno de los ms importantes. Entre los mtodos disponibles para valorar el sesgo de publicacin el grfico en embudo o funnel plot7 es quiz el ms utilizado, en el que se representa el
tamao muestral de cada trabajo frente al tamao del efecto detectado. Este tipo de grficos,
puesto que pueden dar lugar a interpretaciones poco objetivas, suelen complementarse con
tcnicas estadsticas como la prueba de Begg y Egger.8
[ 99 ]
Caractersticas cualitativas:
1. Un protocolo prospectivo
2. Definicin comparable de los eventos cruciales a incluir
3. Control de calidad de los datos
4. Inclusin de todos los pacientes, de todos los estudios seleccionados, para el anlisis
final
Caractersticas cuantitativas:
1. Cuidado de que la muestra total sea suficientemente grande para asegurar resultados
reales y confiables
2. Empleo de tcnicas cuidadosas de estadstica para constatar, que la acumulacin de
datos es correcta y que los resultados del metanlisis puedan ser confiables.
accesibles y citados y adems existe una preferencia en el nmero de citas, lo que conlleva a que la
probabilidad de que determinados resultados intervengan o no en un metaanlisis est sesgada.
El otro problema frecuente que limita la validez externa de los metanlisis, es la heterogeneidad entre los ensayos seleccionados para el metanlisis, que se da necesariamente por
diferentes caractersticas clnicas y socio-demogrficas de las poblaciones de cada ensayo,
pues suceden en distintas instituciones y regiones del mundo. Los mtodos de evaluacin
clnica aplicados, la dosis, forma farmacutica o pauta de dosificacin del frmaco evaluado,
etc., resultan muy heterogneos pues proceden de diferentes protocolos.
[ 102 ]
Referencias
1. Greendlands S. Quantitative methods in the review of epidemiologic literature. Epidemiol Rev 1987; 9: 1-30.
2. Thacker SB Meta-analysis: A quantitative approach to research integration JAMA 1988;
259: 1685-1688.
3. Guallar E, Banegas JR, Martn-Moreno JM, Del Ro A. Metaanlisis: su importancia en
la toma de decisiones clnicas en cardiologa. Rev Esp Cardiol 1994; 47: 509-517
4. Sociedad Espaola de Hipertensin y Liga Espaola de Hipertensin www.seh-lelha.org/
stat1.htm, consultada noviembre 15-2007
5. Egger M, Smith GD, Phillips AN. Meta-analysis: Principles and procedures. BMJ 1997;
315: 1533-1537.
6. DerSimonian R, Laird N. Meta-analysis in clinical trials. Control Clin Trials 1986; 7:
177-188.
7. Egger M, Smith GD, Schneider M, Minder C. Bias in meta-analysis detect by a simple,
graphical test. BMJ 1997; 315: 629-634.
8. Begg CB, Mazumsdar M. Operating characteristics of a rank correlation test for publication bias. Biometrics 1994; 50: 1088-1101.
9. Yusuf S, Peto R, Lewis J, Collins R, Sleight P. Beta blockade during and after myocardial
infarction: an overview of the randomized trials. Prog Cardiovasc Dis 1985; 27:335371
10. Egger M, Smith GD, Phillips AN. Meta-analysis: Principles and procedures. BMJ 1997;
315:1533-1537
11. Ruano-Ravia A, Figueiras A, Barros-Dios JM. El metaanlisis a debate. Med Clin
(Barc) 2002; 119(11): 435-439.
12. Egger M, Smith GD. Meta-analysis bias in location and selection of studies. BMJ 1998;
316: 61-66.
[ 103 ]
Captulo 9
Salim Yusuf
Rafael Daz
n 1836, el editor del American Journal of Medical Sciences, Elisha Bartlett, present un
estudio declarndolo como uno de los ms importantes trabajos mdicos del siglo que
marcar el comienzo de una nueva era en la ciencia. Dicha proclama, que sugera un cambio
de paradigma, la determinaba una coleccin sistemtica y presentacin numrica de una serie
de datos acerca de flebotomas (sangras) efectuadas por el Dr Pierre Louis.1 Este mdico Francs acumul una vasta cantidad de datos de una gran cantidad de pacientes durante sus aos
de actividad como clnico y anatomopatlogo en el hospital Parisino de la Charit. Louis fue
un clnico meticuloso, lo cual tuvo importantes implicancias en la calidad de su investigacin
sobre la eficacia de la flebotoma para el tratamiento de la neumona. Despus de establecer en
cada paciente el tiempo desde el inicio de los sntomas, analiz la duracin de la enfermedad y
la frecuencia de muerte segn el momento en que se efectu la primera sangra, obteniendo dos
grupos comparables. Louis argumentaba que esto era necesario para equilibrar las diferencias
entre ellos, pues siguiendo esta metodologa los errores (que son inevitables) se distribuyen
igualmente en los dos grupos de pacientes sometidos a diferente tratamiento y, de esta manera,
se compensan mutuamente pudiendo ser desestimados sin afectar sensiblemente la exactitud de
los resultados.2 Louis prosegua: un agente teraputico no puede ser empleado con alguna
probabilidad de xito, a menos que su eficacia en casos anlogos haya sido previamente documentada y as, sin la ayuda de la estadstica, nada que se parezca a la medicina es posible.3
El concepto prevaleciente de la poca era que los enfermos se hallaban contaminados,
bien por alguna toxina o contagio, o por un exceso de uno u otro. Esta concepcin de la enfermedad contena en s la idea de que esos estados mejoraran abriendo una vena para dejar
salir el padecimiento al exterior. La investigacin de Louis comprob que la sangra aceleraba
la muerte de los pacientes portadores de neumona, mostrndose como una sorpresa devastadora. Precisamente, a George Washington se le haban extrado 2,4 litros de sangre en las
15 horas previas a su muerte: haba estado padeciendo fiebre, dolor de garganta y dificultad
respiratoria durante 24 horas.4 Basados en la observacin de Louis algunos han sostenido que
Washington fue asesinado.5-7
Aunque ste es un ejemplo relativamente reciente, el reclamo de una evaluacin comparativa se materializ tempranamente, y a travs de la historia hubo repetidos exhortos para
cuantificar los problemas mdicos o sanitarios y para comparar los resultados en grupos de
[ 104 ]
pacientes bajo diferentes conductas teraputicas y asistir a los mdicos en forma individual.
En este captulo discutiremos el significado de la medicina basada en la evidencia y su
consecuente toma de decisiones. Desarrollaremos un caso clnico como recurso didctico en
la aplicacin de estos conceptos.
Figura 1. Modelo temprano de los elementos clave para las decisiones clnicas basadas en la
evidencia.
[ 105 ]
Los conceptos de medicina basada en la evidencia han evolucionado considerablemente y
el modelo inicial ha sido recientemente ampliado, especialmente en lo que se entiende por experiencia clnica y en lo concerniente a la consideracin de las circunstancias clnicas. En la seccin
siguiente utilizamos este nuevo modelo de decisiones clnicas basadas en la evidencia para
ayudar a resolver un caso clnico frecuente.
paciente son extendidas hasta incluir las acciones del paciente, y stas se superponen con
evidencia experimental, comprometiendo su frecuente precedencia frente a sta. Integrar
los tres aspectos requiere juicio y experiencia clnica, constituyendo un cuarto elemento
integrador. Describiremos cada componente, y el rol de la experiencia clnica que los fusiona.
incorrecta a su disposicin, etc.8 Individuos con estados clnicos y circunstancias muy semejantes pueden elegir cursos de accin muy diferentes, a pesar de haber sido confrontados con
la misma informacin acerca de los beneficios y riesgos de una intervencin.
Para nuestro paciente con FANV la evidencia experimental nos provee informacin sobre las diferentes preferencias de los pacientes y sus mdicos respecto de la terapia antitrombtica en la fibrilacin auricular, al evaluar los riesgos de ACV y sangrado.18 En este
caso, los participantes (mdicos y pacientes) revisaron material que describa en detalle las
consecuencias en el corto y largo plazo de un ACV mayor y menor y de un sangrado mayor.
A los participantes se les inform que la probabilidad de ACV mayor y menor era la misma.
Los participantes fueron entonces interrogados mediante un cuestionario tcnico (trade-off
technique*) que determinaba el nmero mnimo de ACVs que sera necesario poder prevenir
para que cada participante juzgara que la terapia antitrombtica estaba justificada (valor
determinado para la warfarina y la aspirina), considerando el riesgo asociado de sangrado,
costos e incomodidades.
La misma tcnica fue empleada para determinar el nmero mximo de sangrados que
el participante considerara aceptable con la teraputica antitrombtica (determinado para
warfarina y aspirina dados los beneficios en trminos de reduccin de los ACV con esta
terapia). Este estudio demostr una variabilidad significativa entre mdicos y pacientes en
su ponderacin de los posibles resultados asociados con la fibrilacin auricular y su tratamiento. Los pacientes requeran menos reduccin de los ACV y eran ms tolerantes con el
riesgo de sangrado que los mdicos. Por ejemplo, en promedio, los pacientes se hallaban
dispuestos a aceptar el riesgo de 17 eventos extra de sangrado mayor en 100 pacientes en un
perodo de 2 aos, si la warfarina prevena 8 ACVs entre esos 100 individuos. Los mdicos,
no obstante, estaban dispuestos a aceptar solamente 10 eventos de sangrado mayor por el
mismo nivel de beneficios. Ms an, los mdicos variaban significativamente acerca de qu
riesgo de sangrado era aceptable para una determinada reduccin en los ACV asociada
con un agente antitrombtico. De este modo, distintos mdicos daran recomendaciones
muy diferentes al mismo paciente con idnticos riesgos de sangrado y ACV. Esto subraya
la importancia de guiar las decisiones por medio de los valores y preferencias del paciente.
Es el paciente el que est en riesgo de eventos y as, siempre que lo desee y sea apto para
hacerlo, debera ser l quien pondere los potenciales beneficios versus los riesgos, costos
e incomodidades.
Existe controversia en cuanto al modo ptimo de obtener e incorporar las preferencias
del paciente en la elaboracin de las decisiones clnicas. Un mtodo es discutir los beneficios
y los riesgos potenciales con el paciente e incorporar la impresin del mdico acerca de las
preferencias del paciente en la decisin clnica.
Cualesquiera que sus preferencias puedan ser, las conductas de los pacientes pueden diferir de sus preferencias y de los consejos del mdico.19 Por ejemplo, un paciente puede preferir
perder peso, dejar de fumar y tomar sus medicamentos de acuerdo a las prescripciones, pero
* trade-off technique: postula que un individuo puede elegir entre un conjunto de alternativas disponibles de forma
que maximice su satisfaccin. Ello implica que conoce cada una de las alternativas y es capaz de evaluarlas. En el caso
de un individuo racional y consistente es posible definir una funcin de valor (determinstica) o una funcin de utilidad
(probabilstica) que represente sus preferencias.
[ 109 ]
su conducta contrastar y estar alejada para llegar a alcanzar esos objetivos. Alternativamente, pueden seguir el tratamiento como est prescripto, an siendo renuentes a la imposicin,
los efectos adversos y el costo. Desafortunadamente, las estimaciones de los mdicos sobre
la adherencia de sus pacientes a los tratamientos prescriptos no tienen ms exactitud que la
de una conjetura. 20
Debemos reconocer que actualmente las preferencias de los pacientes raramente son incorporadas a la prctica clnica. Esto puede estar relacionado con la falta de entrenamiento
del mdico en este tipo de enfoques, el recelo de transitar por terrenos poco familiares, y tambin en muchas circunstancias a la falta de informacin cuantitativa exacta de los posibles
peligros o beneficios y sobre herramientas de prediccin del riesgo.
Evidencia Experimental
Nosotros respaldamos una definicin muy amplia de la evidencia experimental, que
podra ser: cualquier observacin emprica acerca de la relacin aparente entre eventos.
De acuerdo con esta definicin, la evidencia experimental incluye desde la observacin no
sistemtica de un solo mdico, hasta la revisin sistemtica de grandes ECRs. No toda la
evidencia se origina por igual, y por lo tanto hay una jerarqua de evidencias que vara segn
se trate de decisiones diagnsticas, pronsticas o teraputicas. 21
Toda evidencia es valiosa, y la mejor evidencia disponible debe ser entonces considerada. As, las observaciones no sistemticas de los colegas no deberan ser desestimadas cuando no existe un nivel de evidencia mayor. Ciertamente, las observaciones aisladas
pueden conducir a concepciones muy valiosas, y los clnicos experimentados generalmente
tienen respeto por los conceptos de sus colegas ms avezados. No obstante, es igualmente
importante reconocer que las observaciones no sistematizadas estn corrientemente limitadas por el pequeo nmero de casos observados, la variabilidad de los resultados, la falta de
objetividad y las dificultades para integrar otras variables (por ejemplo, al tomar en cuenta
la historia natural de la enfermedad, el efecto placebo y el deseo del paciente de complacer al
mdico). 22 Toda evidencia tiene limitaciones, aunque la mayora de los avances en medicina
son inicialmente trados a la luz a travs de observaciones individuales, estudios fisiolgicos,
observacionales o ensayos controlados y randomizados designados para evaluar eventos surrogantes. Sin embargo, hubo varios descubrimientos que causaron marcada confusin y, en
algunas oportunidades, han llegado a producir dao. Es importante recordar que no han sido
pocos los casos de resultados contradictorios entre diferentes estudios, con distintos niveles
de jerarqua en la tabla de evidencias. Quiz el ejemplo ms importante est en la historia de
la terapia antiarrtmica. A pesar de la evidencia alentadora de que la encainida y la flecainida
podan prevenir la extrasistolia ventricular, un ECR demostr una mayor tasa de mortalidad
con esas drogas que con placebo, resultando en una muerte extra por cada 20 pacientes que
reciban esta teraputica. 23 Se estima que ms norteamericanos murieron a causa de esas drogas que en la guerra de Vietnam. 24 En forma ideal, correspondera tener evidencias en todos
los niveles de jerarqua, evidencias que deberan ser coherentes con cada uno de estos niveles
[ 110 ]
transformndolas en las ms convincentes. No obstante, esto raramente ocurre, porque todava los ECRs exhiben frecuentemente por azar hallazgos contradictorios, especialmente
cuando son pequeos.
Por lo tanto, es deseable utilizar el mayor nivel de evidencia disponible para la toma de
decisiones, como la proveniente de la revisin sistemtica de varios ECRs o, simplemente, de
un extenso ECR bien diseado. El ECR es una herramienta muy poderosa porque la randomizacin es nuestro nico medio para reducir el sesgo en las comparaciones de tratamientos,
al controlar factores pronsticos conocidos y desconocidos. 25 Es as que, los ECRs tienen
la posibilidad de proveer la ms valiosa estimacin del efecto del tratamiento y cuando
sus criterios de inclusin son amplios aumentan la generalizacin de sus hallazgos (validez
externa). 26
Retornando a nuestro caso del paciente con FANV, el mayor grado de evidencia procede
de una revisin sistemtica de todos los ECRs que han evaluado la terapia antitrombtica en
pacientes con fibrilacin auricular. 27 Este estudio demuestra que la warfarina reduce el riesgo
relativo de ACV (isqumico y hemorrgico) en 62%, y la aspirina en 22%.
Considerando el riesgo de sangrado asociado con la terapia con warfarina, hay un ECR
que demuestra un 50% de disminucin del riesgo de sangrado si el paciente est dispuesto a
someterse a un proceso de aprendizaje, entrenamiento y auto-monitoreo del tiempo de protrombina. 28
Experiencia clnica
La toma de decisiones requiere experiencia clnica para establecer y balancear el estado del paciente, sus condiciones, preferencias, conductas y la mejor evidencia experimental
disponible. Antes de considerar cualquier decisin teraputica se necesita la pericia clnica
suficiente para obtener un diagnstico y un pronstico correctos. Como se ha visto, los procedimientos para la prediccin clnica pueden ser extremadamente tiles para determinar
el pronstico del paciente, pero es muy improbable que puedan eliminar la necesidad de un
juicio slido basado en la experiencia clnica.
Como parte de la experiencia clnica, la comunicacin con el paciente adquiere gran
importancia debido a un creciente deseo de los pacientes de involucrarse en las decisiones
relativas a su salud. La experiencia clnica es necesaria para proveer a los pacientes la informacin que necesitan, conocer sus preferencias e incorporarlas en las decisiones. Actualmente no existe consenso acerca de cmo debe presentarse la informacin a los pacientes y
cmo incorporar sus preferencias. No obstante, sabemos que la informacin no debe manifestarse en trminos relativos (por ejemplo, la warfarina disminuir su riesgo en de ACV
en 62%). 29 Una reciente revisin sistemtica de ECRs que comparaban ayudas de decisin
(trade-off technique) con los mtodos tradicionales de involucrar/informar a los pacientes
en la toma de decisiones, demostr que las ayudas de decisin, al contrario que los mtodos
corrientes, mejoraban los puntajes promedio de comprensin de las opciones y resultados
posibles en 20% (95% CI 13 25), redujeron los puntajes de conflicto de decisiones (esto
es, los pacientes se sintieron ms seguros, informados y orientados acerca de los alcances
de su decisin), y aumentaron la participacin del paciente en la toma de decisiones. 30
[ 111 ]
[ 112 ]
Las chances de desarrollarla aumentan con la edad y est presente en alrededor del 10%
de las personas por encima de los 75 aos de edad.
Sntomas
Hay medicaciones para licuar o disolver la sangre, que ayudan a prevenir los cogulos y
por lo tanto el ataque cerebral (stroke).
La sangre licuada aumenta a su vez el riesgo de sangrado.
Tabla 2. Los accidentes cerebrovasculares pueden ser mayores o menores segn su severidad.
Si usted padece uno a causa de la fibrilacin auricular, las posibilidades de que sea mayor o
menor, son las mismas.
Accidente menor
Accidente mayor
Sntomas fsicos
Sntomas mentales
Dolor
No siente dolor
No siente dolor
Es internado.
No se puede vestir por s mismo.
Las enfermeras lo alimentan.
No puede caminar.
Recuperacin
Riesgo subsiguiente
Es internado.
Su debilidad, embotamiento y problema
con el habla mejoran, pero todava siente
algo dbil o torpe un brazo o pierna.
Despus de 1 mes de fisioterapia puede
Puede realizar casi todas sus actividades
mover los dedos de los pies y levantar el
como antes del ataque.
brazo de la cama.
Puede manejarse en forma independiente.
Deja el hospital luego de 1 semana.
Permanece en este estado por el resto
de su vida.
Tiene un mayor riesgo de sufrir otros
ataques cerebrales.
Las descripciones de ACV mayor y menor, y de sangrado severo, son ligeras modificaciones de las desarrolladas y chequeadas por Man-Son Hing y colegas. 31 Tambin hemos
personalizado el balance de las probabilidades para nuestro paciente, asumiendo que realizara el monitoreo de su tiempo de protrombina en caso de decidir terapia con warfarina
(Figura 4).
Tabla 3. Sangrado severo mientras toma warfarina o aspirina: un ejemplo a nivel del estmago.
Fsicamente
Tratamiento
Es hospitalizado.
Suspende la toma de warfarina o aspirina.
Un mdico lo examina mediante un tubo que pasa por la garganta, para localizar de dnde
viene la sangre.
Recibe sedacin para aliviar las molestias del examen.
No necesita operaciones (ciruga).
Recibe transfusiones de sangre para reemplazar la que ha perdido.
Recuperacin
Al alcanzar esta decisin clnica basada en la evidencia, nuestra tarea an no est completa. El paciente necesitar control para asegurar que l est en condiciones de seguir y
concretar el tratamiento indicado. Una ventaja de la ayuda de decisiones provista es que el
paciente puede llevar a su domicilio la informacin y no tiene que confiar en su memoria para
recordar los hechos discutidos durante la entrevista mdica.
[ 114 ]
Aspirina
Chance de ACV en los prximos
2 aos
es por 100.
Chance de sangrado severo en los
prximos 2 aos
es por 100.
Warfarina
Chance de ACV en los prximos
2 aos
es por 100.
Chance de sangrado severo en los
prximos 2 aos
es por 100.
Figura 3.
Conclusiones
Los fundamentos de la medicina basada en la evidencia han sido establecidos a lo largo
de los siglos pero las filosofas especficas, conceptos, definiciones y modelos han evolucionado esencialmente en las ltimas dcadas. La medicina basada en la evidencia trata de la
solucin de problemas clnicos. La toma de decisiones basada en la evidencia depende de la
utilizacin de la experiencia clnica para integrar la informacin acerca del cuadro clnico y
las condiciones de un paciente, con la mejor evidencia experimental disponible, incorporando al mismo tiempo las preferencias y conductas del enfermo.
[ 115 ]
Aspirina
Chance de ACV en los prximos
2 aos
es 6por 100.
Chance de sangrado severo en los
prximos 2 aos
es ..1,3...por 100.
Warfarina
Chance de ACV en los prximos
2 aos
es 3por 100.
Chance de sangrado severo en los
prximos 2 aos
es 4por 100.
Figura 4
Referencias
1. Louis PCA. Researches on the effects of blood-letting in some inflammatory diseases,
and on the influence of tartarised antimony and vesication in pneumonitis. Am J Med Sci
1836;18:102-11.
2. Louis PCA. Researches on the Effects of Bloodletting in Some Inflammatory Diseases
and on the Influence of Tartarised Antimony and Vesication in Pneumonitis. Translated
by CG Putnam. Boston: Hilliard, Gray, 1836.
3. Louis PCA. Medical statistics. Am J Med Sci 1837; 21: 525-8.
4. Morens DM. Death of a president. N Engl J Med 1999; 341: 1845-9.
5. Lloyd JU. Who killed George Washington? Eclectic Med J1923; 83: 3536, 403-8, 453-6.
6. Marx R. A medical profile of George Washington. Am Heritage 1955; 6: 43-7, 106-7.
7. Pirrucello F. How the doctors killed George Washington. Chicago Tribune Magazine, 20
February 1977.
8. Haynes RB, Devereaux PJ, Guyatt GH. Clinical expertise in the era of evidence-based
medicine and patient choice. ACPJournal Club 2002; 136: A11-A13.
9. Evidence-based medicine working group. Evidence-based medicine, a new approach to
teaching the practice of medicine. JAMA 1992; 268: 2420-5.
[ 116 ]
10. Haynes RB, Sackett DL, Gray JMA, Cook DC, Guyatt GH. Transferring evidence from
research into practice: 1. The role of clinical care research evidence in clinical decisions.
ACPJournal Club 1996; 125: A-14. Evidence-Based Medicine1996; 1: 196.
11. Sackett DL, Richardson SR, Rosenberg W, Haynes RB. Evidence-Based Medicine: how
to practice and teach EBM. London: Churchill Livingstone, 1997.
12. Sackett DL, Rosenberg WMC, Gray JA, Haynes RB, Richardson WS. Evidence-Based
Medicine: What it is and what it isnt. BMJ 1996; 312: 71-2.
13. Sackett DL, Straus S, Richardson SR, Rosenberg W, Haynes RB. Evidence-Based Medicine: how to practice and teach EBM, 2nd edn. London: Churchill Livingstone, 2000.
14. Cook DJ, Guyatt GH, Jaeschke R. Determinants in Canadian health care workers of the
decision to withdraw life support from the critically ill. JAMA 1995; 273: 703-8.
15. Atrial Fibrillation Investigators. Risk factors for stroke and efficacy of antithrombotic
therapy in atrial fibrillation. Arch Intern Med 1994; 154: 1449-57.
16. Beyth RJ, Quinn LM, Landefeld S. Prospective evaluation of an index for predicting the
risk of major bleeding in outpatients treated with warfarin. Am J Med 1998; 105: 91-9.
17. Antithrombotic Trialists Collaboration. Collaborative metaanalysis of randomised
trials of antiplatelet therapy for prevention of death, myocardial infarction, and stroke in
high risk patients. BMJ 2002; 324: 71-86.
18. Devereaux PJ, Anderson DR, Gardner MJ et al. Differences between perspectives of physicians and patients on anticoagulation in patients with atrial fibrillation: observational
study. BMJ 2001; 323: 1218-22.
19. Haynes RB. Improving patient adherence: State of the art, with a special focus on medication taking for cardiovascular disorders. In: Burke LE, Okene IS (eds). Patient Compliance in Healthcare and Research. American Heart Association Monograph Series.
Armonk, NY: Futura Publishing Co, 2001.
20. Stephenson BJ, Rowe BH, Macharia WM, Leon G, Haynes RB. Is this patient taking
their medication? JAMA 1993; 269: 2779-81.
21. Guyatt G, Haynes B, Jaeschke R et al. Introduction: the philosophy of evidence-based
medicine. In: Guyatt G, Rennie DR (eds). Users guides to the medical literature. AMA
Press, 2002.
22. Nisbett R, Ross L. Human Inference. Englewood Cliffs, NJ:Prentice-Hall, 1980.
23. Echt DS, Liebson PR, Mitchell LB. Mortality and morbidity in patients receiving encainide, flecainide, or placebo: The Cardiac Arrhythmia Suppression Trial. N Engl J Med
1991; 324: 781-8.
24. Moore TJ. Excess mortality estimates. Deadly medicine: why tens of thousands of heart
patients died in Americas worst drug disaster. New York: Simon & Schuster, 1995.
25. Kunz R, Oxman AD. The unpredictability paradox: review of empirical comparisons of
randomised and non-randomised clinical trials. BMJ 1998; 317: 1185-90.
26. Chalmers I. Unbiased, relevant, and reliable assessments in health care. BMJ 1998; 317:
1167-8.
27. Hart RG, Benavente O, McBride R, Pearce LA. Antithrombotic therapy to prevent stroke
in patients with atrial fibrillation: a meta-analysis. Ann Intern Med 1999; 131: 492-501.
28. Beyth RJ, Quinn L, Landefeld CS. A multicomponent intervention to prevent major
[ 117 ]
bleeding complications in older patients receiving warfarin. Ann Intern Med 2000; 133:
687-95.
29. Malenka DJ, Baron JA, Johansen S, Wahrenberger JW, Ross JM. The framing effect of
relative and absolute risk. J Gen Intern Med 1993; 8: 543-8.
30. OConnor AM, Rostom A, Fiset V et al. Decision aids for patients facing health treatment
or screening decisions: a systematic review. BMJ 1999; 319: 731-4.
31. Man-Son-Hing M, Laupacis A, OConnor A et al. Warfarin for atrial fibrillation: The
patients perspective. Arch Intern Med 1996; 156: 1841-8.
[ 118 ]
Captulo 10
Daniel Fernndez-Bergs
Antonio Paragano
esde el advenimiento de la informtica y la llegada de Internet los tiempos han cambiado; hoy da, el mdico ve como lejanas las pocas en que deba realizar las bsquedas
bibliogrficas en los complejos libros del Index Medicus para, finalmente, localizar los trabajos que otros colegas citaban en sus artculos de investigacin. En este momento cualquier
buscador, cada vez menos especfico, nos permite introducir un ttulo o referencia y una ola
de informacin inunda la pantalla de nuestra computadora. ste es un autntico cambio cualitativo, una inflexin en la evolucin de nuestro acceso a la informacin y en la modulacin
de nuestro pensamiento.
La experiencia, adquirida con los aos de ejercicio en la profesin, contina siendo importante, pero es imprescindible unir a ella el conocimiento que surge de las investigaciones. La
medicina basada en la evidencia1 ha demostrado con claridad cmo la informacin o el conocimiento que no ha sido verificado puede llegar a incorporarse por dcadas en la prctica clnica
con resultados opuestos al esperado. Sirven a modo de ejemplo los estudios CAST I y II,2-3 donde se expuso que la administracin de drogas antiarrtmicas del grupo I-C, de la clasificacin
de Vaughan Williams,4 aumenta la mortalidad en los pacientes que han padecido un infarto
agudo de miocardio. Esta informacin, ahora hecha conocimiento, anul un errneo concepto
teraputico previo, la muerte sbita en el paciente coronario sobreviene como consecuencia
de las arritmias ventriculares, luego, cualquier frmaco capaz de tratarlas con eficacia evitar
millones de muertes. Por supuesto, no se consideraba que una droga antiarrtmica por sus
efectos arritmognicos podra aumentar la mortalidad de estos pacientes.
La introduccin del meta-anlisis constituy un notable avance en el conocimiento y, sobre todo, destac la necesidad de emprender estudios con el poder suficiente para demostrar
con robustez una hiptesis de trabajo. La investigacin biomdica produce actualmente una
gran cantidad de informacin cientfica, disponible en grandes bases de datos electrnicas, el
punto crucial es poder distinguir si lo que leemos es realmente creble, es decir, si es aceptable
segn la idea que poseemos sobre el tema para ser incorporado a nuestra prctica cotidiana
con seguridad.
Cmo se construye la informacin resultante de una investigacin es el tpico que nos
ocupa, pero nadie puede negar que para comprender adecuadamente un trabajo de investigacin es necesario tener un conocimiento aproximado en lo referente a metodologa y anlisis
estadstico, de lo contrario, habr que recurrir a comentarios sobre el estudio en cuestin pa[ 121 ]
ra tener una idea ms concreta acerca de su credibilidad. Uno de los objetivos de este captulo
es transmitir al lector la necesidad de leer un trabajo de investigacin con cierto orden y rigor,
cuestionando y contrastando lo ledo con otras publicaciones sobre el mismo tema. Tambin
pretende orientar acerca de cmo interpretar rpida, correctamente y con pocas frmulas, las
medidas estadsticas ms frecuentes en la bibliografa mdica.
El artculo cientfico
Un artculo cientfico recoge en forma ordenada la informacin que surge de un trabajo
de investigacin. Por lo tanto, debemos leerlo crticamente y en cada apartado observar si lo
que sostiene o propone tiene una base razonable. 5 Corresponde saber si la publicacin que
seleccionamos es de calidad y si sus resultados pueden aplicarse a nuestro desarrollo profesional. La medicina basada en la evidencia ha contribuido considerablemente para facilitar esta
tarea, aunque, finalmente quien lee es el que decide si lo que examina es creble. La credibilidad surge del juicio cualitativo, pero este juicio de valor conlleva implcito el conocimiento
de la metodologa empleada para resolver el problema investigado.
Un primer paso para reconocer la calidad del artculo es averiguar si la revista que lo
publica est indexada, esta comprobacin nos da ciertas garantas, ya que probablemente
lo hayan ledo previamente al menos dos revisores y un editor jefe, que han tratado que su
revista gane prestigio con la publicacin que acepta. Es cierto que a veces, a la hora de publicar, no se puede evitar el sesgo de aceptacin que tiene un autor conocido, pero no es lo ms
frecuente. Este punto nos lleva a recomendar que siempre se verifiquen los autores. Conocen
el tema que publican o es su primer artculo? Son de una institucin con reconocida trayectoria en investigacin? Quiz, esto puede parecer discriminatorio, pero debemos saber qu
vamos a leer porque en la profesin mdica la lectura es constante, y la velocidad con que se
desarrolla el conocimiento, y nos llega la informacin, obliga a este ejercicio cotidianamente
pues nuestro tiempo es limitado.
Adems del ttulo, la publicacin debe adjuntar al inicio un resumen que sintetice la
investigacin y sus conclusiones. Luego comenzar con una introduccin al tema, que nos
anuncia el estado actual de la situacin que se investiga, nos informa acerca de la hiptesis
que sustenta el trabajo y cules son los objetivos del mismo. Proseguir con el material que
es objeto de la investigacin (pacientes generalmente) y los mtodos seguidos, donde conoceremos el diseo del trabajo y con qu herramientas ha sido construido. A esta exposicin
sucedern los resultados obtenidos para culminar con la discusin, donde los autores deben
defender, criticar, justificar sus hallazgos, proponer cambios o nuevos estudios y comunicar
las limitaciones de su investigacin.
Frecuentemente surgen otros puntos de valor y que son parte de los requerimientos de
las revistas cientficas, como la declaracin de conflicto de intereses, que tambin deben ser
ledos con atencin pues no son banales. El artculo cerrar con los agradecimientos y por
ltimo la bibliografa.
A continuacin, las secciones mencionadas y de las que corrientemente se compone una
comunicacin cientfica sern examinadas en sus aspectos ms esenciales.
[ 122 ]
1. Ttulo y resumen
El ttulo debe responder a la hiptesis planteada para el progreso de la investigacin, o
enumerar el o los resultados importantes, instruyndonos acerca de las caractersticas del
ensayo o, qu tipo de artculo vamos a leer.
El resumen es una sntesis ordenada que slo pretende dar un pantallazo informativo al
lector, pero no es el artculo. Ninguna prctica peor que leer el resumen y sus conclusiones asumiendo, falsamente, que sta lectura nos ha brindado el conocimiento integral de la investigacin.
El resumen puede, a lo sumo, informarnos en lneas muy generales sobre el tema que se discutir
y si el mismo es de nuestro inters. El conocimiento vendr luego de evaluar la informacin completa, de tal manera podremos conformar una idea ms concreta sobre su credibilidad.
2. Introduccin
La introduccin debe ser sucinta, pero relevante, y dejar claramente planteado el estado
de la cuestin y los puntos que deben todava investigarse, porque resultan conflictivos o bien
porque han surgido nuevas evidencias en la literatura mundial. A lo largo de todo el trabajo
deberemos cotejar las citas bibliogrficas, al leerlo verificaremos si la hiptesis que lo sustenta se apoya en otras investigaciones, sealadas en las referencias, y que son el antecedente
cientfico que respalda la teora de la nueva publicacin. Puesto que es muy difcil tener ideas
absolutamente originales u observar hechos que nadie ha visto, debemos recordar siempre la
frase del genial Nbel espaol Ramn y Cajal: No hay cuestiones agotadas sino hombres
agotados en las cuestiones.
3. Objetivos
Cada ensayo debe exponer claramente el objetivo principal, si van a estudiarse otros
puntos de inters los mismos sern secundarios, y deben estar especificados antes de realizar la investigacin. De la propia hiptesis de trabajo se desprende el objetivo. Es cierto que
el resultado del anlisis de subgrupos de pacientes puede servir como molde para futuras
investigaciones, aunque resulta cuestionable observar la cantidad de estudios que analizan
subgrupos de pacientes, que fueron parte de un ensayo clnico con determinado objetivo,
donde se demuestra una cuestin que no form parte del objetivo inicial. El diseo de un estudio depende del punto a estudiar, si se cambia el objetivo, lo ms probable es que el diseo
ya no sea el adecuado y las conclusiones sern discutibles.
4. Material y mtodos
Este apartado nos pone en contacto con las caractersticas propias del estudio. Debe
especificar el lugar geogrfico donde se realiz la investigacin, la edad y gnero de los su[ 123 ]
pasado se observa su efecto en el presente. En este caso se llaman estudios de cohorte histricos o de cohorte retrospectivos, y nicamente son posibles si los registros de seguimiento
se hallan completos.
B. Estudios experimentales:
En seres humanos se denominan pruebas clnicas, su propsito es extraer conclusiones
acerca de un procedimiento o tratamiento particular.
B1- Pruebas clnicas controladas: estudios donde un procedimiento o frmaco experimental se compara con otro aceptado. Estos se clasifican en:
B1.1- Pruebas con controles paralelos o concurrentes, independientes: incluyen dos grupos, el experimental o sometido al procedimiento que se probar, y el grupo control que recibe el tratamiento estndar o placebo. Los dos grupos deben ser iguales en todos los aspectos,
de modo que las diferencias encontradas se puedan adjudicar al procedimiento y no a otros
factores. Los grupos deben participar del estudio en el mismo perodo, concurrentes, y para
garantizar que los investigadores o los participantes no vean lo que esperan ver, ninguno conoce el grupo al que fue asignado, doble ciego. A su vez estos estudios pueden ser:
Aleatorios o randomizados: los sujetos que participarn en los grupos son distribuidos al azar, esta metodologa proporciona la evidencia ms fuerte de asociacin,
asegurando que el resultado se debe a la participacin.
No Aleatorios: los pacientes no son asignados al azar, presentan el inconveniente de
que nada previene el sesgo en la distribucin de los participantes, y por lo tanto son
menos confiables.
B1.2- Controles secuenciales: incluyen a las pruebas clnicas con autocontroles y los
estudios cruzados. Los estudios con autocontroles utilizan al mismo grupo de sujetos para
opciones experimentales y de control, los pacientes se evalan al inicio del estudio y luego
son sometidos a un procedimiento o tratamiento, para ser estimados nuevamente en busca
de cualquier cambio.
Los estudios con controles cruzados emplean dos grupos, uno experimental y otro control.
Despus de un perodo de tiempo se suspende el tratamiento, experimental y placebo, se deja
transcurrir un tiempo de reposo, en general sin tratamiento alguno, y luego se asigna a cada
grupo el tratamiento alterno, o sea, el grupo control pasa a ser experimental y viceversa.
B1.3- Pruebas con controles externos: el tercer mtodo para controlar experimentos es el
manejo de controles que no pertenecen al ensayo, o externos. Estos comparan el resultado del
propio estudio, grupo experimental, con el de otro investigador, grupo control. En ocasiones
son sujetos que el mismo observador ha tratado previamente con otro procedimiento, en este
caso se llaman controles histricos.
B2- Pruebas clnicas no controladas: son estudios que slo incluyen al grupo experimental, no hay controles. Es ms probable que se usen con procedimientos y no con un frmaco,
el principal conflicto es que los investigadores suponen que el procedimiento experimental es
mejor que cualquier otro, sin haber comprobado su eficacia.6
[ 125 ]
C. Revisiones
C1- No Sistemticas: clsicamente se basa en la seleccin de un nmero determinado de
artculos sobre una cuestin en particular, tras su examen el autor expone una conclusin
ms o menos general sumando adems su experiencia u opinin personal. Esta modalidad de
revisin genera un margen de duda sobre la confiabilidad de lo expresado pues nicamente
ofrece el punto de vista, a veces subjetivo, del autor.
C2- Sistemtica cuantitativa, meta-anlisis: es una metodologa de anlisis cimentada en la combinacin de la informacin obtenida en diferentes ensayos clnicos sobre un
tema determinado. El objetivo es proporcionar una estimacin cuantitativa de todos los
estudios disponibles, y dado que incluye un nmero mayor de observaciones tiene un poder
estadstico superior al de los propios trabajos que contiene. Los principales problemas metodolgicos de los meta-anlisis resultan como consecuencia de la diversidad de los ensayos
clnicos que incluye, ya que las caractersticas clnicas, sociales, demogrficas, etc., de los
sujetos reclutados son diferentes en cada uno de ellos; como tambin son dismiles los mtodos de evaluacin aplicados, la forma farmacutica o dosificacin del frmaco evaluado,
etc. Asimismo, considerando que no todos los ensayos clnicos han sido publicados, por
resultados no esperados o negativos, siempre mantienen la posibilidad de incurrir en un
posible sesgo de publicacin.7 - 13
Continuando con los aspectos metodolgicos, cuando leemos un trabajo de investigacin debemos distinguir si se ha procedido en forma correcta al establecer el tamao de la
muestra, si no encontramos esta informacin nos enfrentamos al menos con dos problemas:
el primero es que no sabemos si el nmero escogido fue el necesario para demostrar las diferencias que se buscaban, y el segundo es si no se ha incluido ms gente innecesariamente,
con los riesgos que puede conllevar para los pacientes seleccionados, adems de la prdida
de tiempo y recursos econmicos. Tambin repararemos sobre la estimacin del nmero de
pacientes perdidos durante el perodo de observacin, porque es muy difcil lograr un seguimiento completo en un estudio de ms de seis meses.
La determinacin del tamao muestral es una tarea del epidemilogo, que mediante un
modelo matemtico que incluye varios elementos, como variabilidad del parmetro, el error
y que indican el nivel de confianza, etc., establece el nmero mnimo imprescindible de
individuos a incluir en los grupos que van a estudiarse. No es necesario en todas las investigaciones, pero es ineludible cuando se buscan diferencias predefinidas entre grupos.
En general se puede decir que a mayor nivel de precisin y confianza, mayor debe ser la
muestra. Se trata en definitiva de entender que si el estudio es pequeo y con un resultado
positivo existe la posibilidad de que sea un falso positivo, ya que el hallazgo pudo ser vlido
nicamente por azar. Investigaciones futuras homologarn su valor, o no, cuando se intenten
confirmar sus deducciones con estudios ms grandes.14
Si hay muestras sanguneas, cmo se recolectaron; si las sustancias que se examinaron
son estables; cuntas muestras se recogieron y en qu condiciones se produjo el almacenamiento y el traslado (si es que lo hubo). Estos aspectos, con las muestras sanguneas en particular, han merecido varios artculos en la literatura mdica dentro de los cuales el de Jaffe y
Vatus15 es particularmente revelador.
[ 126 ]
B. Sesgo de informacin u observacin: los grupos de pacientes del estudio no son comparables debido a como se obtuvieron los datos. Incluye cualquier error sistemtico en la
exactitud de los datos o los resultados. Por lo tanto producen una distorsin en la estimacin
del efecto, las fuentes de sesgo de informacin ms frecuentes son: instrumento de medicin
inadecuado, criterios diagnsticos incorrectos, omisiones, o imprecisiones en la bsqueda o
clasificacin de los datos introducidos por los cuestionarios o los encuestadores.
C. Factores de confusin: los autores no han apreciado informacin sobre un factor que
se relaciona a la vez con la exposicin y con el efecto estudiado. Dicho error provocar una
alteracin en la estimacin del resultado, debido a una o ms variables no consideradas. La
prevencin y control de los sesgos potenciales debe considerarse durante el diseo del estudio,
ya que al momento del anlisis no es posible solucionarlos. Por el contrario, los factores de
confusin s pueden controlarse durante el anlisis.16
Por ltimo cules fueron los puntos finales? o end-points. El punto final ms duro es
la mortalidad de cualquier causa o mortalidad total, es fcil de averiguar durante el seguimiento, a travs de un llamado telefnico a familiares o al registro civil. Algunos estudios seleccionan un punto final combinado (dos o ms) aumentan as la tasa de eventos esperada, de
esta manera necesitan incluir menos pacientes que los requeridos al escoger un nico punto
final.17 Cuestin que nos obliga a examinar la publicacin completa, para ver que efecto tuvo
cada uno de los factores que componen el punto final combinado sobre mortalidad global, y
ste ejercicio nos permitir redimensionar las conclusiones.
5. Anlisis estadstico
El anlisis de los datos reunidos durante la investigacin culmina con la obtencin de un
resultado, que es el producto de estimar un parmetro o una diferencia entre grupos o bien
una asociacin entre variables, y este resultado procura responder a la o las preguntas planteadas en el objetivo. En general, el anlisis de los datos experimentales apunta a establecer si
las diferencias o las asociaciones observadas entre los distintos conjuntos estudiados reflejan
caractersticas reales de las poblaciones, o si estos contrastes podran haberse dado por el
azar del muestreo. Esta ltima posibilidad se conoce como hiptesis nula, y el poder rechazarla le confiere legitimidad automtica a la hiptesis alternativa, que es la que suele interesar
especialmente al investigador. En este punto, ante una desigualdad (u otro tipo de relacin)
entre muestras, las tcnicas estadsticas posibilitan cuantificar la probabilidad con que una
diferencia, igual o ms extrema que la advertida, podra ser observada si las muestras provinieran de la misma poblacin, esto es, si la diferencia se debiera solamente a las fluctuaciones
del muestreo. Si dicha probabilidad resulta pequea, digamos menor que el 5%, se dice que la
diferencia observada es significativa, con una probabilidad p< 0,05. De modo que el nivel de
significacin dado por p, mide la probabilidad de equivocarnos al rechazar la hiptesis nula
como improbable y aceptar la alternativa como vlida.
Por lo tanto, p< 0,05 significa que la diferencia observada tiene el 95% de probabilidades
de no provenir de muestras del mismo universo, sino que stas deben representar poblaciones
[ 128 ]
diferentes. El valor 95% se conoce como nivel de confianza de la estimacin. Cuanto menor
es la p, es decir, cuanto menor es la probabilidad de que los resultados observados ocurran
como producto del azar, mayor ser la tendencia a concluir que la diferencia existe en realidad. Deducimos entonces que existe una diferencia significativa entre los grupos o variables
estudiadas, que la posibilidad de equivocarnos es tan slo de un 5% y que nuestra diferencia
en un 95% se debe al factor analizado y no a la mera casualidad. Inversamente, si el valor
de p es mayor que el 5%, se considera que no hay suficientes indicios para descartar que la
o las desigualdades obtenidas se deben a la intervencin del azar, no pudiendo descartar la
hiptesis de nulidad o equivalencia entre lo que se compar.18
Segn lo expresado, podremos juzgar si el estudio que estamos leyendo es creble en
cuanto a sus conjeturas, revelando un valor de p suficientemente pequeo que permite aceptar que el efecto que se comunica existe realmente y en la direccin en que se informa. La
falta de claridad conceptual es la que hace pensar que la estadstica se equivoca y tambin
que puede manipularse, por ello debemos dominar conocimientos bsicos de la estadstica y
de sus limitaciones, para descubrir errores, sesgos o simplemente falta de rigor o calidad en el
artculo que estamos examinando.
Si leyramos estudios de los aos 60, observaramos que el anlisis bivariado era la metodologa estadstica ms corrientemente empleada, y la simple obtencin de una p< 0.05
conclua que el resultado era estadsticamente significativo. Generalmente as fundamentados, sugeran que el hallazgo de A en la enfermedad B podra ser de valor para determinar
el diagnstico, el pronstico o el tratamiento. La significacin estadstica no quiere decir significacin clnica, quien no comprende este concepto puede creer que la significacin lograda
indica causalidad y que el resultado obtenido en un trabajo nos obliga a aplicar una determinada intervencin para lograr mejorar, por ejemplo, el pronstico de una enfermedad, esto
es un error de criterio importante.
Los ensayos clnicos metodolgicamente ms convincentes son relativamente nuevos, en
1948 el Consejo ingls de Investigacin Clnica dio a conocer los resultados del primer estudio
randomizado para evaluar la eficacia de la estreptomicina; y en 1951 Bradford Hill proporcion la primera definicin sobre la sistemtica de un ensayo clnico: Es un experimento
diseado cuidadosa y ticamente con el objetivo de responder alguna pregunta formulada
con precisin.19 Inmediatamente surgieron los estudios que incluyen el anlisis multivariado,
regresin, correlacin, etc. Estos modelos de anlisis nos informan si la o las variables que en
el bivariado surgan como estadsticamente significativas (an aquellas con valores de p de
hasta 0.15 y en algunas ocasiones hasta 0.20, por considerarlas de inters clnico trascendente) mantienen su independencia con respecto al objeto principal de la investigacin o variable
dependiente. Lo que nos anunciar la posibilidad de que pudieran ser tenidas en cuenta como
parte o causa de la enfermedad o evento. El ejemplo que sigue nos ilustrar, si en un modelo de
regresin se incluye la edad para conocer su posible independencia con la variable objetivo, por
ejemplo mortalidad, lo ms probable es que la edad tenga un vnculo significativo o causalidad
con la muerte. Si en el mismo modelo se introduce arrugas, stas no tendrn probablemente
la misma asociacin o vnculo, pero si se quita la edad pasarn a tener una significacin muy
similar, dado que es muy probable que nuestro cuerpo tenga ms arrugas a mayor edad.20
[ 129 ]
Sano
Positivo
Verdaderos positivos
(vp)
Falsos positivos
(fp)
Negativo
Falsos negativos
(fn)
Verdaderos negativos
(vn)
[ 130 ]
permiten extrapolar los resultados de otros estudios a datos propios. Para ello, es necesario
considerar otros ndices de estimacin clnicamente tiles y que no dependen de la prevalencia de la enfermedad en la poblacin a estudiar. As, adems de los conceptos anteriormente
citados, se suele hablar de razn de verosimilitudes, razn de probabilidad, cociente de probabilidades o likelihood ratio. Ellos indican cunto ms probable es un resultado concreto
(positivo o negativo) segn la presencia o ausencia de enfermedad, y se definen como sigue:
Razn de verosimilitudes positiva o cociente de probabilidades positivo: es la razn
entre la probabilidad de un resultado positivo en los pacientes enfermos y la probabilidad de
un resultado positivo entre los sanos. O bien, el cociente entre la fraccin de verdaderos positivos (sensibilidad) y la fraccin de falsos positivos (1 especificidad): RVP = sensibilidad/
(1 especificidad).
Razn de verosimilitudes negativa o cociente de probabilidades negativo: se calcula
dividiendo la probabilidad de un resultado negativo en presencia de enfermedad entre la
probabilidad de un resultado negativo en ausencia de la misma. O bien, el cociente entre la
fraccin de falsos negativos (1 sensibilidad) y la fraccin de verdaderos negativos (especificidad): RVN = (1 sensibilidad)/especificidad.21, 25
Una RV de 1 significa que la probabilidad de un resultado positivo es exactamente la
misma que la de uno negativo, en enfermos o sanos. RV superiores a 1 incrementan la probabilidad de que se encuentre presente el trastorno objetivo y, al contrario, RV inferiores a 1
disminuyen esta probabilidad.
La razn de probabilidades ofrece la ventaja de que relaciona la sensibilidad y la especificidad de una prueba en un solo ndice. Permite expresar la informacin de manera no
dicotmica (resultado normal o anormal, positivo o negativo) y, al igual que sucede con
la sensibilidad y la especificidad, no vara con la prevalencia. Estas consideraciones nos
permiten adoptarla como ndice de comparacin entre diferentes pruebas para un mismo
diagnstico.
Finalmente, otra opcin estadstica til a la hora de valorar la capacidad diagnstica de
una prueba cuantitativa son las llamadas curvas ROC (Receiver Operating Characteristic).
Se calculan a partir de la sensibilidad y especificidad para cada uno de los posibles valores de
corte de la prueba. Hasta ahora nos ocupamos del caso de un test con un resultado dicotmico, positivo o negativo, pero en muchas situaciones la confirmacin de un diagnstico debe
hacerse a partir de un parmetro numrico. Estos se pueden clasificar en forma dicotmica
segn sean superiores o inferiores al elegido como corte. La estrategia de este anlisis consiste
en representar grficamente los distintos valores de especificidad y sensibilidad obtenidos,
generndose as una grfica llamada curva ROC. El rea bajo dicha curva se convierte as en
el mejor indicador de la capacidad predictiva del test, pues es independiente de la prevalencia
de la enfermedad en la poblacin de referencia, admitiendo efectuar comparaciones entre
diferentes pruebas diagnsticas. En forma muy general, puede aceptarse que la capacidad de
prediccin para un rea bajo la curva de 0,50-0,60 se considera mala; de 0,60-0,70 pobre;
de 0,70-0,80 aceptable; de 0,80-0,90 buena a muy buena, y de 0,90-1,00 excelente. 26
[ 132 ]
Cuando leemos un artculo que informa sobre una nueva herramienta diagnstica debemos
conocer estos conceptos y valorar si su introduccin en la prctica clnica aporta informacin
relevante o no. Adems, no debemos olvidar que existen determinados aspectos en el diseo de
este tipo de investigaciones que pueden afectar a la precisin y a la validez de las estimaciones
realizadas. La poblacin de estudio, la estrategia de muestreo, la seleccin del criterio de referencia y la forma de aplicacin de las pruebas diagnsticas sern algunos de los elementos a
cuidar para evitar la presencia de sesgos. Por supuesto, siempre deberemos valorar el costo que
introduce en nuestro accionar (costo/beneficio) para saber si es aplicable en nuestro medio.
Interpretacin de los estudios sobre pronstico y tratamiento. Ensayos clnicos
Los ensayos clnicos han permitido un enorme avance en el conocimiento y han terminado con muchas indicaciones teraputicas que se tenan por buenas.
Los estudios observacionales son muy importantes, porque de ellos surgen conjeturas
que luego habrn de comprobarse en otras investigaciones, pero no debemos tomar conductas basados en ellos. Ciertas hiptesis fisiopatolgicas o trabajos con un reducido nmero de
casos, y por lo tanto con insuficiente potencia, llevaban a la aplicacin de una determinada
medicacin que luego result ser nociva. Podramos citar el ejemplo de la administracin
profilctica de lidocana, por su efecto antiarrtmico, a los pacientes que padecan un infarto
miocrdico agudo, pero luego los ensayos clnicos demostraron que no otorgaba beneficio,
sino ms bien era perjudicial. 27
Otro ejemplo, relativamente cercano, fue la aceptacin de que el suplemento hormonal
en la mujer menopusica disminuira los eventos cardiovasculares, no obstante, los ensayos
con terapia sustitutiva encontraron que podan aumentarlos. Un reciente meta-anlisis sobre
el tema muestra que si bien no incrementa el riesgo de nuevos eventos cardacos, tampoco lo
reduce, pero s agranda el riesgo de accidente cerebrovascular, 28 esto condujo a que las recomendaciones internacionales desaconsejaran su aplicacin. 29
El nmero de ensayos clnicos y meta-anlisis se ha multiplicado en los ltimos aos,
en muchos de ellos se despliega una metodologa estadstica que habitualmente expresa los
resultados en forma de razn o ratio. Al leerlos descubrimos expresiones como: odds ratio
(OR), riesgo relativo (RR) o lo que es igual cuando se trata de estudios de supervivencia, hazard ratio (HR), trminos que son poco intuitivos y a veces de difcil comprensin. Seguidamente, intentaremos orientar acerca de cmo interpretar correctamente estas medidas muy
empleadas en bibliografa mdica.
Una forma de estimar el riesgo entre dos grupos es mediante una relacin que se suele
denominar relacin de odds o chance. La OR es la relacin entre las odds del grupo experimental sobre las odds del grupo control, y se obtiene dividiendo el nmero de eventos sobre
el nmero de no eventos en cada grupo.
En otras estimaciones del riesgo relativo (RR), el numerador contiene el nmero de eventos y el denominador el nmero total de pacientes en riesgo (eventos + no eventos). Ambas
expresiones se emplean como estimadoras del riesgo relativo, la diferencia fundamental entre
la OR y el RR reside en el denominador que se emplea para calcular las tasas de eventos. En
la tabla 2 ejemplificaremos la diferencia:
[ 133 ]
Grupo Control
Grupo Experimental
Evento
Si
a 30
b 10
No
c 70
d 90
Totales
a + c = 100
b + d = 100
Tabla 2
Odds ratio: [b/d]/[a/c] = [10/90]/[30/70] = 0,11/0,43 = 0,26 o 26%.
Riesgo relativo: [b/(b+d)]/[a/(a+c)] = [10/100]/[30/100] = 0,10/0,30 = 0,33 o 33%.
En este ejemplo, la probabilidad del evento en el grupo experimental se redujo a 0,26
segn la OR, y a 0,33 de acuerdo al riesgo relativo.
Cuando la tasa de eventos en el grupo control es menor a 30%, la OR y el RR se aproximan o son similares, pero cuando la proporcin de eventos es mayor al 30%, como sucede
habitualmente en ensayos clnicos, la OR y el RR tienden a distanciarse.
Reduccin de riesgo relativo (RRR) es la reduccin proporcional en la tasa de eventos
entre grupo control y el experimental, se calcula como [(a b)/a] o bien [1 RR]. Del ejemplo
anterior, [(30 10)/30] = 20/30 o directamente [1 0,33 = 0,67]. De igual manera que la
RRR se puede obtener la reduccin de la OR (ROR = 1 - OR) en el ejemplo, ROR = (1 0,26
= 0,74).18, 30-33
Cmo se interpretan estas medidas, intervalo de confianza (IC)
Aunque su frmula matemtica es diferente, el significado de la OR, el RR y el HR es
equivalente. Siempre hay un grupo experimental al que se le adjudica el valor de la ratio, lo
que equivale a tomar como referencia al otro grupo. En el ejemplo anterior, B es el grupo de
inters al que se refiere la estimacin, y el grupo que sirve de referencia o de grupo control
es A, cuyo valor es 1. La OR o similares deben ser distintos que 1 para aceptar con alguna
certeza que existe un efecto. Una OR, un RR o un HR igual a 1 significa que en B se produce
el mismo efecto que en A, en tanto, la OR del ejemplo indica que por cada evento en A hay
0,26 en B o sea, hay una reduccin del 74%. El RR indica lo mismo, por cada evento en A hay
0,33 en B, reduccin del 67%. Como vemos la OR suele magnificar el efecto.
Si se tratara de un estudio de supervivencia (por ejemplo, estimacin de la sobrevida
a travs del mtodo de Kaplan-Meier), el HR indicara que el riesgo de eventos terminales
que se podran esperar en B, durante el tiempo de seguimiento, es 0,33 a 1 comparado
con A.
Estas estimaciones estadsticas suelen comunicarse seguidas del intervalo de confianza
(IC) que expresa, en la poblacin de estudio, la variabilidad del clculo debida al azar. La
mayora de las investigaciones mdicas incluyen muestras de una poblacin, aunque la autntica realidad de un fenmeno slo puede alcanzarse analizando la totalidad de esa poblacin.
Lo que en un estudio se calcula y ofrece como un resultado puntual, razn o ratio, no tiene
por qu corresponderse con el verdadero valor en la poblacin, estimacin que siempre ser
[ 134 ]
ayudara el clculo de la diferencia relativa de riesgo, que traduce las ratio a porcentajes, medidas que son ms fciles de interpretar.
Por ltimo, el nmero necesario a tratar, number needed to treat (NNT), se ha convertido en un indicador muy apreciado por los mdicos, pues tiene la ventaja de darnos una
idea rpida de la efectividad de un tratamiento, es ms fcil de recordar y adems permite
comparar los beneficios y efectos adversos de una determinada terapia. Es un indicador especfico para cada opcin teraputica, y describe la diferencia que hay entre dicha opcin de
tratamiento y el control para alcanzar un resultado clnico concreto. Su rango de valor va de
1 a infinito, siendo 1 el NNT ideal, ya que la mejor terapia es aquella donde debo tratar a un
solo paciente para que este se beneficie. Por consenso, slo se expresa en nmeros enteros y
cuanto ms alto es el NNT menos eficaz es la intervencin. Al agrupar un nmero mayor de
pacientes las revisiones sistemticas o meta-anlisis, elaborados con ensayos clnicos aleatorizados, proporcionan resultados de mayor confiabilidad al momento de calcular el NNT.
La reduccin del riesgo absoluto (RRA), absolute risk reduction (ARR), es la diferencia
absoluta entre la tasa de eventos en los grupos evaluados [Tasa de eventos grupo control
Tasa eventos grupo experimental]. En el ejemplo de la tabla 2, [a b] o [30% 10%] = 20%,
su IC 95%, entre 9% y 31%. El NNT, nmero de pacientes que se necesitan tratar para evitar
un evento, se obtiene aplicando regla de tres simple a partir de la RRA. Si cada 100 pacientes
tratados se reducen 20 eventos, cuntos necesitamos para reducir un evento?: [100/20 = 5].
O bien como [1/RRA], 1/0,2 = debemos tratar 5 pacientes para impedir el efecto adverso en
uno de ellos. Estas estimaciones renen cierto grado de incertidumbre que ha de ser expresada mediante el intervalo de confianza. Para calcular el IC del 95% del NNT se emplea el
valor inverso de los extremos del IC del 95% de la RRA, en el ejemplo, IC 95% del NNT=
1/0,09 a 1/0,31 = 3 a 11. Significa que si los estudios se repitiesen, en el 95% de las veces el
resultado estara entre esas cifras, es decir, debemos tratar entre 3 y 11 pacientes para reducir
el efecto en 1 de ellos.18, 34, 35
Al mismo tiempo, recordemos que toda intervencin puede promover efectos adversos o
no deseados, y tambin se pueden estimar.
El incremento del riesgo absoluto (IRA) o absolute risk increase (ARI), es la diferencia
absoluta en las tasas de eventos perjudiciales entre los grupos evaluados, revela que el tratamiento experimental causa ms dao que beneficio. Su clculo es semejante al de la reduccin del riesgo absoluto. IRA = [Tasa de eventos adversos en el grupo control Tasa eventos
adversos en el grupo experimental].
El nmero necesario para hacer dao (NND) o number needed to harm (NNH), nos
indica a cuntos pacientes hay que tratar para que en uno de ellos se presente un efecto no
deseado. O bien, el nmero de pacientes que si recibiesen el tratamiento experimental tendran un efecto adverso adicional comparado con el tratamiento control. Se calcula como 1/
IRA, y su rango tambin va de 1 a infinito, pero al contrario del NNT, cuanto menor es su
valor menos segura es la intervencin. Si un ensayo muestra un bajo NNT con un alto NND
implica que el perfil teraputico es seguro. Tambin, si el estudio informa o hace referencia a
estos indicadores, se puede obtener la relacin beneficio/riesgo del tratamiento experimental
(NNT/NND). Y si adjunta el costo por perodo de tiempo necesario para evitar el evento, se
puede construir un indicador de costo/efectividad.18
[ 136 ]
7. Discusin y conclusiones
En este apartado l o los autores defienden la validez de sus observaciones, apoyados en
los resultados de la propia investigacin y los publicados en otros informes. Usualmente la
discusin incluye una visin general de los hallazgos principales, su integracin o relacin con
la teora que sustent el ensayo clnico y de sus limitaciones, ambigedades e implicancias para futuras vas de investigacin. Aceptar como vlidas las conclusiones de una investigacin
depende de una adecuada preparacin metodolgica que nos permitir analizar, calificar
y reconocer lo publicado en forma objetiva, hasta que nuevas evidencias sean presentadas.
Al mismo tiempo, fundamentados en nuestras propias deducciones podremos evaluar si los
resultados estn de acuerdo con el conocimiento actual, y si nos permiten trasladar sus probables beneficios a la prctica clnica.
8. Referencias bibliogrficas
Constituyen una parte importante del artculo porque brindan solidez a los hechos expuestos por el autor, adems, ofrecen varias opciones de informacin sobre conceptos, tcnicas, metodologas, etc., que sustentan la teora de la investigacin. Las referencias facilitan la
posibilidad de ampliar la informacin sobre el aspecto tratado, por ello es primordial que el
ensayo cuente con las referencias adecuadas y actualizadas.
9. El conflicto de intereses
Gran parte de la investigacin en medicina ha quedado en manos privadas, y sobre todo
la investigacin farmacolgica. Esta realidad nos lleva a tener en cuenta que las empresas esperan rendimientos; y si bien es cierto que cuanto ms efectiva sea una droga ms aceptacin
tendr en la clase mdica, no es menos cierto que muchas investigaciones se realizan teniendo
en cuenta las necesidades del mercado, y sobre todo de un mercado que pueda enfrentar gastos sanitarios.
Esto no es una crtica, es la descripcin de un hecho, la investigacin puede encararse de
diferente manera si el que investiga lo hace para solucionar un problema o para obtener rendimientos econmicos. Por ello, es necesario que al publicar se explicite con toda claridad si se
tiene algn conflicto de intereses, y si la investigacin ha sido financiada total o parcialmente
por empresas interesadas en el resultado. El conocerlo no invalida de ninguna manera los
logros, simplemente permite a los lectores ampliar el juicio global del estudio en cuestin. 36
Corolario
Hasta aqu comentamos qu buscar y cmo interpretar la informacin contenida en cada
seccin de un artculo cientfico, el objetivo fue ofrecer las herramientas para valorar en forma
[ 137 ]
crtica la informacin que se consulta y particularmente ponderar los mritos conceptuales y metodolgicos de las investigaciones publicadas. Esperamos que este captulo sea de utilidad para
los que se inician en el apasionante campo de la investigacin. Elaborar las propias conclusiones
y confrontarlas con los resultados que ofrecen otros investigadores puede ser el primer paso.
Referencias
1. Sacket D, Scout Richardson W, Rosenberg W, Brian Haynes R. Evidence-based Medicine. How to practice & Teach EBM. 1997, Pearson Professional Limited.
2. Echt DS, Liebson PR, Mitchell LB, Peters RW, Obias- Manno D, Barkers AH et al. Mortality and morbidity in patients receiving encainide, flecainide, or placebo. The Cardiac
Arrhythmia Suppression Trial. N Engl J Med 1991; 324: 781-788.
3. The Cardiac Supresin Trial II Investigators. Effect of the antiarrhythmic agent moricizine on survival after myocardial infarction. N Engl J Med 1992; 327: 227-233.
4. Vaughan Williams EM. A classification of antiarrhythmic actions reassessed after a decade of new drugs. J Clin Pharmacol 1984; 24: 129-147.
5. Greenhalgh T. How to read a paper. The basics of evidence based medicine. 2nd Edition
2001. BJM Books.
6. Dawson-Saunders E, Trapp R. Basic and Clinical Biostatistics 1990. Ed Appleton &
Lange. Cap. 2; 7-21.
7. Greenhalgh T. Assessing the methodological quality of publisher papers. BMJ, 1997;
315: 305-308.
8. LeLorier J, Grgoire G, Benhaddad A, Lapierre J, Derderian F. Discrepances between
meta-analyses and subsequent large randomized, controlled trials. N Engl J Med 1997;
337: 536-542.
9. Cappelleri JC, Ioannidis JPA, Schmid CH, et al. Large trials versus meta-analysis of smaller trials. How do their results compare? J Am Med Ass 1996; 276: 1332-1338.
10. Villar J, Carroli G, Belizan JM. Predictive ability of meta-analyses of randomised controlled trials. Lancet 1995; 345: 772-776.
11. Naylor David C. Meta-analysis and the meta-epidemiology of clinical research. Br Med
J 1997; 315: 617-619.
12. Egger M, Davey Smith G. Misleading meta-analysis. Br Med J 1995; 310: 752-754.
13. Ioannidis J., Cappelleri J. C., Lau J., et al. Meta-Analyses and Large Randomized, Controlled Trials. N Engl J Med 1998; 338: 59-62.
14. Dawson-Saunders E, Trapp, R. Basic and Clinical Biostatistics 1990. Ed Appleton &
Lange. Cap. 7; 136-138.
15. Jaffe AS, Vatus H. Acute coronary syndrome biomarkers. The need for more adequate
reporting. Circulation 2004; 110: 104-106.
16. Dawson-Saunders E, Trapp R. Basic and Clinical Biostatistics 1990. Ed Appleton &
Lange. Cap. 15; 305-318.
17. Gottlieb S. Dead is dead - artificial definitions are no substitute. Lancet 1997; 349: 662663.
[ 138 ]
18. Greenhalgh T. How to read a paper. The basics of evidence based medicine. BMJ Publishing Group. 2001; Cap. 5: 76-93.
19. Hill B. The clinical trial. Med Bull 1951; 7: 278-282.
20. Brotman DJ, Walter E, Lauer MS, OBrien RG. In search of fewer independent risk factors. Arch Intern Med 2005; 165:138-45.
21. Greenhalgh T. How to read a paper. The basics of evidence based medicine. BMJ Publishing Group. 2001; Cap. 7:105-119.
22. Jaeschke R, Guyatt GH, Sackett DL. Usersguides to the medical literature. III. How to
use an article about a diagnostic test. Are the results of the study valid? Evidence-Based
Medicine Working Group. J Am Med Ass 1994; 271: 389-391.
23. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 1: sensitivity and specificity.
Br Med J 1994; 308: 1552.
24. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 2: predictive values. Br Med
J 1994; 309: 102-107.
25. Dujardin B, Van der Ende J, Van Gompel A, et al. Likelihood ratios: a real improvement
for clinical decisin making? Eur J Epidemiol 1994; 10: 29-36.
26. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 3: receiver operating characteristic plots. Br Med J 1994; 309: 188-193.
27. Antman E, Lau J, Kupelnick B, et al. A comparison of results of meta-analyses of randomized control trials and recommendations of clinical experts. Treatments for myocardial
infarction. J Am Med Ass 1992; 268: 240-248.
28. Magliano DJ, Rogers SL, Abramson MJ, Tonkin AM. Hormonal therapy and cardiovascular disease: a systematic review and meta-analysis. BJOG 2006; 113:5-14.
29. Evidence-Based guidelines for cardiovascular disease prevention in women: 2007 Update. Circulation 2007; 115: 1481-1501.
30. A. Fahey T, Griffiths S, Peters TJ. Evidence based purchasing: understanding results of
clinical trials and systematic reviews. Br Med J 1995; 311: 1056-1060.
31. Pearce N. What Does the Odds Ratio Estimate in a Case-Control Study? Int J Epidemiol
1993; 22(6):1189-1192.
32. Forrow L, Taylor WC, Arnold RM. Absolutely relative: How research results are summarized can affect treatment decisions. Am J Med 1992; 92: 121-124.
33. Naylor CD, Chen E, Strauss B. Measured enthusiasm: Does the method of reporting trial
results alter perceptions of therapeutic effectiveness? Ann Intern Med 1992; 117:916-921.
34. Furukawa TA, Guyatt GH, Griffith LE. Can we individualize the number needed to
treat? An empirical study of summary effect measures in meta-analyses. Int J Epidemiol
2002; 31:72-76.
35. Sinclair JC, Cook RJ, Guyatt GH, Pauker SG, Cook DJ. When should an effective
treatment be used? Derivation of the threshold number needed to treat and the minimum
event rate for treatment. J Clin Epidemiol 2001; 54: 253-262.
36. Doval Hernn C. Es fiable lo que leemos en las revistas mdicas? Resultados diferentes
segn el patrocinio de los ensayos clnicos Rev Arg Cardiol 2007; 75: 498-502.
[ 139 ]
Captulo 11
Eduardo B. Arribalzaga
[ 140 ]
[ 141 ]
Tecnologa
Orientada al conocimiento
Parte de la utilidad
Soluciona interrogantes
Inquisidora
Constructiva
[ 142 ]
Tcnica
Tecnologa
Es Procedimental e instrumental
cientfico
Intereses colectivos
Intereses individuales
Fuera del limitado espectro del mtodo cientfico, otra limitacin es la imperfeccin
en muchos casos en la bsqueda del apropiado acercamiento y se da muchas veces por
casualidad con el mtodo adecuado. Cuando se prueba la experimentacin a una cuestin
aparentemente sencilla en un campo de estudio bien definido,61, 62 el sendero es a menudo
tortuoso, con muchas falsas opciones. En el edificio de la ciencia, muchos ladrillos pueden
reemplazarse por otros antes que el defecto pueda ser revelado, demostrando as que los
ms importantes avances en la ciencia son rpidamente aceptados, 69 las incertidumbres
en algunas reas pueden originar extensas controversias: 67 ocasionalmente se sugiere la
existencia de fraude cientfico, 84 cuando es imposible de verificar.85 Muchas veces la pasin
puesta en la investigacin en perseguir una lnea de trabajo origina tensiones y prdida de
la objetividad: el cientfico quiere probar que no est equivocado y ve ms all de los
verdaderos resultados obtenidos. 86, 88 La responsabilidad de aceptar su correspondencia
con la realidad,90 hace que las reacciones iniciales a la nueva propuesta sean infludas tanto
por modas, prestigio de los investigadores, relaciones pblicas-comerciales, rivalidades de
grupos de investigacin y la fuerza de las necesidades de aceptacin de las novsimas ideas.
Por eso, es tan difcil la adhesin a nuevas lneas de investigacin o de sus resultados. 87, 91
destruda por una fea realidad. Por eso, los investigadores son particularmente impacientes
cuando se presentan en la prensa no cientfica evidencias o grotescos argumentos creando
falsas expectativas a la sociedad. 5
Una herramienta a considerar es la telaraa o www (world wide web) o simplemente
web, interfase de la red de computadoras interconectadas que tiene un complejo y atractivo
formato (las pginas web) donde se intercalan figuras con texto y que posee un localizador uniforme de recursos, transmitido mediante un protocolo de transferencia de hipertexto (el famoso
http); se escribe por medio de un lenguaje especial (html, hypertext markeup language). Los
programas que usan la web estn disponibles en muchos sistemas operativos de sistemas de
computacin: simplemente al teclear (y marcar) o resaltar un texto en la pantalla de computacin, el usuario puede navegar (o surfear) en la red de Internet en busca de informacin.
De esta manera, crear con buena calidad una pgina web no es tan dificultoso como
lento de hacer, pero se deben seguir diversas guas que caracterizan la autora de la telaraa
(web). Existen criterios de autora protegidos por leyes (3), similares a todos los conocidos
en la actualidad (especialmente en libros, revistas, videos, pelculas, etc), con reconocimiento
expreso de la propiedad intelectual y un importante inters comercial no bien advertido en
los pases en desarrollo. En determinadas especialidades mdicas como la radiologa, el uso
intenso de imgenes puede ser beneficioso para la educacin de especialistas, al existir en
diferentes lugares del mundo depsitos de informacin radiolgica que estn siempre disponibles al alcance de los usuarios de esta red de redes como es Internet.
Una de las desventajas, por ms que se encuentre la informacin en las pginas web, es
que esto no asegura su bsqueda y que tenga una aplicacin prctica de consulta. No existe un
acceso universal a Internet por ahora, aunque se predice que en los prximos aos todo el mundo lo tendr facilitado.3 Tambin otra dificultad es comunicar resultados preliminares de estudios de investigacin que puedan originar tcnicas o teraputicas dainas para los pacientes.
Por eso se deben considerar los artculos que hayan sido aprobados por sistemas de revisin de
revistas o comits de tica. Ciertas revistas como el New England Journal of Medicine plantean
la necesidad de seguir la regla de Ingelfinger51 que establece no publicar aquello que no ha sido
sometido a revisin por pares o si ya fue publicado con anterioridad. Se considera a la presentacin de un artculo en correo electrnico como una publicacin cientfica formal, aunque slo
sea un resumen o abstract. La revisin por pares (peer review system) es fundamental para
mantener la calidad de la informacin provista por las revistas cientficas, aunque estas sean
electrnicas o slo usen el correo electrnico como medio de difusin.3
Se advierte que si se utiliza la red Internet para solamente artculos preliminares, en muy
poco tiempo las revistas cientficas convencionales podran publicar muy poco, por haber
sido la informacin ya publicada mediante otra forma.
Otra forma de divulgacin de un artculo cientfico mediante Internet es su disponibilidad en un simple formato que almacena un documento. A esto se llama Portable Data Format
(PDF) que necesita un programa especial para su lectura (muchas veces se descarga gratis de
Internet, el programa Acrobat Adobe Reader, en varias versiones).
Tambin el artculo cientfico escrito para una revista electrnica, parece ser una va
actual en amplio proceso de expansin, como una nueva manera de comunicacin propuesta
que es la presentacin en PowerPoint de archivos que semejan artculos de una revista3 en
virtud de ser una estructura capaz de capturar informacin tecnolgica (IT en ingls) con
su procesamiento, almacenamiento, filtrado y distribucin. As se reconocen condiciones
para que el manejo del conocimiento entre pares (cientficos, especialistas mdicos, etc.) sea
[ 146 ]
completo en una flamante forma. Una desventaja es no poder evaluar cmo son presentados
los manuscritos al sistema de revisin por pares: hay que actuar con la misma metodologa
porque actualmente es el tiempo de la evidencia basada en la comunicacin cientfica, pasible
tambin de una estricta evaluacin para no trasmitir conocimientos de escasa o nula importancia. As se han visto diferencias entre la revista tradicional y aquella hecha en PowerPoint, 3 donde adems hay un proceso de post-revisin por pares en el cual se evala la calidad
al final de la presentacin de PowerPoint.
La ms novedosa idea, an sin ejecucin, fue presentada en Recife, Brasil, durante un
Workshop de Editores cientficos en septiembre de 2004. En una Mesa Redonda denominada
Experiencias positivas/innovadoras de algunas revistas cientficas brasileas, se propuso
la unin de un conjunto de Editores cientficos que cree un sitio WEB, y en l se colocaran
electrnicamente los nuevos artculos que estaran protegidos por un certificado digital.100
Los editores estaran constantemente tomando conocimiento de las informaciones que se
almacenan y aquellas que fueran de calidad e inters para las revistas tradicionales seran
seleccionadas electrnicamente para una mayor difusin va impresin en papel.
Por otro lado, la publicacin en papel se ve paulatinamente limitada debido al progresivo
aumento del costo de su materia prima (el papel), adems de tornar complejo el continuo
almacenamiento de publicaciones impresas porque el espacio es limitado y de alto valor econmico. Internet ofrece, entonces, soluciones a estos problemas al cambiar drsticamente la
forma como los cientficos comunican el resultado de sus investigaciones.
Revisin Editorial
Todas las posibles formas de futuras publicaciones tienen como caracterstica comn dar
una mayor agilidad al proceso de publicacin del conocimiento cientfico. Se pretende as
ayudar principalmente a los nuevos graduados en el proceso de elaboracin de manuscritos
de conocimientos con creciente valor cualitativo y de inters,100 y atender la elaboracin de
nuevas cuestiones, basados estos en problemas de la prctica asistencial.
Por lo tanto, es absolutamente necesario conocer las actividades de los cuerpos editoriales
para, de esta forma, saber si se cuenta con interlocutores vlidos ante la evaluacin de un manuscrito original:3 no se puede exigir evaluacin imparcial y perfecta donde no haya un cuerpo
u rgano editorial sin interpretar acabadamente sus funciones y responsabilidades,92, 106 que
use pautas internacionales de edicin y asimismo sea reconocido por entidades editoriales
como el Comit Internacional, Consejo de Editores Cientficos, Asociacin Mundial de Editores, Asociacin Europea de Editores, etc, entes que cumplen funciones de investigacin y
docencia en esta particular rea de la publicacin cientfica. Precisamente en 1988, el Comit
Internacional de Editores de Revistas Mdicas agreg normas para presentar por escrito los
aspectos estadsticos de la investigacin89 o intensificar en aspectos gramaticales del manuscrito para facilitar su claridad y precisin. 34 Recordar que una buena redaccin es como
una pecera: si el vidrio est opaco impedir ver a los peces pero si es transparente y claro se
apreciar en toda su magnitud la belleza de su contenido. 3 Lo mismo ocurre con un original
bien redactado.
Este procedimiento de revisin por pares de todo manuscrito original10, 107 no es un capricho de los editores sino que constituye la piedra fundamental de la idea de publicar ni[ 147 ]
camente aquello con valor y poseedor de una metodologa cientfica eficaz, luego de una
evaluacin exhaustiva de su contenido y forma. De este modo, se evitarn hiptesis confusas o
no probadas, triviales o hasta peligrosas.26, 102, 104 Se solicitar el consentimiento informado de
los pacientes involucrados en el escrito,19 distinguir si se publica para un evento cientfico o una
revista biomdica,3 o si es la divulgacin de conocimientos a la comunidad no cientfica20, 78 o
un original mtodo de enseanza a estudiantes y jvenes graduados. Para ello es ventajoso
comprender si efectivamente el autor es quien realiz la investigacin, 3 si se realiz una previa
y profunda evaluacin de la literatura pertinente, 3 con adecuada seleccin de revistas consultadas73 y recuperacin de citas atinentes95 que permiten la formulacin de preguntas apropiadas a la idea de investigacin, sin dejar de lado ni las evidencias31, 53, 96 ni todas aquellas
explicaciones cientficas necesarias. 3, 29 Recordar que la ausencia de evidencia no es evidencia
de ausencia de importancia de los resultados obtenidos,1 Se detectar y excluir toda conducta catalogada como incorrecta desde el punto de vista tico76, 101 como formal 28 ni publicar
probadamente resultados intrascendentes o muy preliminares.40
Por estas razones, que no son todas las involucradas en un artculo cientfico que es el corolario final de toda investigacin cientfica (experimental u observacional), cada autor/investigador debe estar dispuesto a ampliar sus lecturas de trabajos y/o reas de investigacin,44, 45,
66
para asegurar la calidad del material escogido y ser la base para la elaboracin de un marco
terico3 y definir as qu clase de artculo cientfico es el mejor para enumerar sus resultados.
Asimismo, tendr en consideracin su forma de presentacin, 56, 65 el detalle de complejos
diseos de investigacin70 o si la revista a enviar el manuscrito original es la ms apropiada
para sus observaciones;3 igualmente si es preferible su difusin por va electrnica36, 51 o la
tradicional en papel. La decisin final de aceptacin o rechazo del manuscrito, luego de su
revisin editorial, no es ms que la bsqueda de la excelencia en las publicaciones39 para no
proponer insignificante o irrelevante informacin, con errores graves en su intentada originalidad o sin destacar la precedencia de otros autores en la idea investigada, uso excesivo
de auto-citas bibliogrficas (como si uno fuera el nico que estudi ese tema) o con defectos
de forma. Por eso, antes de la entrega del manuscrito a la editorial correspondiente para su
evaluacin, averiguar con un par de ojos nuevos y frescos, como si se lo leyera por primera
vez, si est a prueba de balas3 desde todos los aspectos posibles a considerar en una revisin
para que no sea rechazado.80
No olvidar que la salud pblica debe ser preservada y por lo tanto, slo investigaciones
cuyos resultados fueron evaluados por rbitros y/o especialistas certificados mediante el proceso de revisin editorial, como tambin el prestigio y la reputacin de los autores y la revista
implicada, exigen un cuidado especial en el manejo del manuscrito, excluyndolo si la informacin contenida es dada a conocer por otra va no evaluada cientficamente:42 recordar el caso
de Robert Gallo que primero se preocup en dar a publicidad por peridicos no cientficos el
supuesto descubrimiento del virus del SIDA-HIV y luego se prob que todo era falso.78
La responsabilidad de la publicacin de investigaciones inexistentes no debe recaer exclusivamente en los editores que las permiten16 sino tambin en los lectores que estn siempre
comprometidos con el contenido al admitir aquellos notoriamente engaosos, confusos al
entregarse en formato electrnico49 o provenir del mundo en desarrollo68, 105 donde se aduce
que los sistemas de revisin no existen o son muy inverosmiles.79, 105 En ms de la mitad de
[ 148 ]
los casos no hubo respuestas por parte de los autores ante reclamos y/o preguntas de los
lectores,48 con lo cual invalidaban y distorsionaban peligrosamente el nuevo conocimiento
clnico presentado.
Los autores creen poseer grandes ideas y saber escribir maravillosos artculos,71 pero no
conocen en realidad cmo se hace el trabajo; por esta simple razn es que los editores esperan
de los investigadores/autores que comprendan y acepten las decisiones editoriales y que dicho
procedimiento debe permanecer en el anonimato con una demanda de bastante tiempo de
revisin;77 el resultado final es la mejora del trabajo expuesto inicialmente. Si los equvocos
de los autores son responsabilidad del cuerpo editorial por no ser evidente lo que se pide al
evaluar y reaccionar como si se exigiera algo utpico o irreal,93 es innegable que los trabajos
no se reformarn y el complejo tramado de edicin de una revista3 se transformar en un intrincado galimatas de muy difcil resolucin. Se comprometer a mejorar la calidad como si
fueran informes sucintos que delimiten el problema y sus posibles soluciones probadas.94
Tambin debern recordar los autores que los consensos han sido ampliamente usados
desde hace mucho tiempo como forma de ayuda para la distribucin de recursos o en la toma de decisiones: se disminuirn los sesgos durante la investigacin y se evitaran decisiones
unilaterales del investigador, supuestamente ms famoso, para interpretar equvocamente
la realidad de los resultados logrados. Mtodos de consenso universalmente aceptados son
el Delphi y la tcnica del Grupo Nominal;6 en estos mtodos existe una combinacin, casi
perfecta, de la sntesis de evidencia cientfica y la interaccin intelectual y experimentada
de los expertos. Las Recomendaciones y Guas que se obtienen para la Prctica Clnica, fin
ltimo de la mayora de las investigaciones, se basan en la lectura crtica de literatura cientfica previa, y por lo tanto, es necesario conocer toda la informacin relacionada con un
tema especfico de investigacin, con seleccin y resumen en funcin de su aportada calidad.
Con el fin de analizar la calidad de la informacin en cuanto a las Guas de prctica clnica,
una iniciativa europea (AGREE) produjo un listado de criterios tiles para su lectura crtica
(www.agreecollaboration.org).6
Reflexin final
No hay fin del progreso cientfico-tecnolgico ni final de la difusin de las revistas cientficas porque involucrara la falta de investigaciones; por eso empezar ahora mismo una investigacin, ya sea para escribir la Tesis nunca realizada, una revisin actualizada de un tema
que interesa especialmente y de utilidad prctica asistencial o un caso clnico observado que
demand un tiempo mayor de preocupacin intelectual. El tiempo es hoy y ya estn presentes
las formas imaginables del artculo cientfico del siglo XXI a disposicin de todos, segn el
tipo de investigacin a desarrollar y las consecuencias de sta (Mapa Conceptual 1):
[ 149 ]
Mapa Conceptual 1:
investigacin
cientfica
recurso
que identifica
Causas de
enfermedad
Dilemas
ticos
a travs de
analizado con
Investigacin Bsica
Principios
y Reglas
Inventigacin Clnica
que implican
Decisiones
y resolver
Problemas
actuales
Los avances cientficos dependen tanto de poner las manos en la masa (la prctica de la
observacin, clnica o experimental) como de tener ideas y nuevos conceptos (formar la teora) para recprocamente disponer tanto de la inteligencia como de la habilidad de manipular
herramientas o instrumentos que permitan el progreso de la evolucin humana, con orgullo
y sin prejuicios de ningn tipo.64
As como se ense a ser investigador profesional, 21, 29 tambin se debe aprender a ser
autor. Parafraseando a Maran, investigadores/autores, a las cosas!!!!
Referencias
1.
2.
3.
4.
Altman DG, Bland M. Absence of evidence is not evidence of absence. BMJ 1995;311:485.
Andrews LB. Genes and patent policy: rethinking intellectual properties rights. Nature
2002;3:803-7.
Arribalzaga EB, Borracci RA, Giuliano RJ y Jacovella PF. El artculo cientfico. Del papiro al formato electrnico. Editorial Magster Eos, Buenos Aires, 2005.
Arribalzaga EB y Mihura ME. Ciruga basada en la evidencia: moda, mito o metodologa moderna? Rev Argent Cirug, 2001;81(1-2):18-29.
[ 150 ]
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
Arribalzaga EB. Dilemas de investigacin cientfica. Anal Fac Medicina Univ May San Marcos
1997;58(2):149-152.
Asua J. Conferencias de consenso basadas en la evidencia. Gac Med Bilbao 2006;103:3-6.
Bachelard G. La formacin del espritu cientfico. Editorial Argos, Buenos Aires, 1999, 22. Edicin.
Bachrach SM. Scientific journals of the future. American Academy of Arts and Sciences, 2005.
Barcat JA. Original e interesante. Rev Md Rosario, 1992;60(1):42-43.
Baue AE. Peer and/or peerless review. Arch Surg, 1985;120:885-6.
Beecher HK. Ethics and clinical research. N Engl J Med 1966;274(24):1354-1360.
Berkwits M. From practice to research: the case for criticism in an age of evidence. Soc Sci Med
1998;47(10):1539-1545.
Bhandari M, Busse J et al. Association between industry funding and statistically significant proindustry findings in medical and surgical randomized trials. CMAJ 2004;170(4):477-80.
Bhutta ZA. Ethics in international health research: a perspective from the developing world. Bull
WHO 2002;80(2):114-120.
Borracci R, Arribalzaga EB y Chiappetta Porras LT. El pensamiento abstracto en el nivel universitario. Rev Argent Cirug, 1997;72:123-30.
Brice J, Bligh J. Author misconduct: not just the editors responsibility.Med Educ
2005;39(1):83-9.
Bunge M. La investigacin cientfica. Siglo XXI Editores, Barcelona, 2000.
Caminiti C, Scoditti U, Diodati F and Passalacqua R. How to promote, improb and test adherence to scientific evidence in clinical practice? BMC Health Services Research 2005;5:62 Disponible
en http://www.biomedcentral.com/1472-6963/5/62.
Clever LH. Obtain informed consent before publishing information about patients. JAMA,
1997;278(8):628-9.
Cooper C. Writing for the popular press: to inform and entertain.Hosp Medicine,
2001;62(6):364-5.
Cruess SR, Cruess RL. Professionalism must be taught. BMJ, 1997;315:1674-7.
DNegri CE, De Vito EL. Introduccin al razonamiento aproximado; lgica difusa. Rev Arg Med
Resp, 2006;4:126-136.
Davis BD. The scientists world. Microbiol Mol Biol. Rev, 2000;64(1):1-12.
Decullier E, Lheritier V, Chapuis F. Fate of biomedical research protocols and publication bias in
France: retrospective cohort study. BMJ 2005;331:19-25.
del Pino J. EEUU prob en Africa un frmaco antiSida sin develar sus riesgos. El Pas
10/01/2005.
Dietrich H. Nueva gua para la investigacin cientfica. Editorial 21, Buenos Aires, 1999.
di Trocchio F. Las mentiras de la ciencia. Alianza Editorial, Madrid, 1998.
Downes S. How to publish a scientific paper. Australian National University, 2005.
Duran P. Qu investigamos cuando investigamos? Arch Argent Pediatr 2006;104(4):292-294.
Durand SE, Mombr A (Compiladores). Encrucijadas del pensamiento. Anlisis crticos del quehacer cientfico. Gran Aldea Editores, Buenos Aires, 2003.
Editorial. The need and means for evidence-based medicine in developing countries. ACP Journal
2000; July/August: A-11.
[ 151 ]
32. Elliot GC. A brief guide to understanding patentability and the meaning of patents. Acad Med
2002;77(12Pt2):1309-14.
33. Evett IW, Jackson G, Lambert JA. More on the hierarchy of propositions: exploring the distinction
between explanations and propositions. Sci Justice, 2000;40(1):3-10.
34. Eyssautier de la Mora M. Metodologa de la investigacin. Desarrollo de la inteligencia. International Thomson Editores, Mxico, 2002.
35. Flanagin A, Glass RM, Lundberg GD. Electronic journals and duplicate publication. Is a byte a
word? JAMA,1992;267(17):2374.
36. Fontoura Costa L. Bioinformatics: perspectives for the future. Get Mol Res, 2004;3(4):564-574.
37. Frisse ME, Tova JN. The commerce of ideas: copyright in the digital era. Acad Med, 1996;71(1):4553.
38. Garca Marcos F. Investigacin con seres humanos. Rev Fund Fac Med 1998;VII(27): 6-11.
39. Goldwyn R. Manuscript acceptance: excellence not favoritism. Plast Reconstr Surg, 2004;114
Suppl:22-23.
40. Goldwyn R. Preliminaryresults: facts or excuses? Plas Reconstr Surg, 2004;114 Suppl:32-33.
41. Gonzalez de Dios J. De la medicina basada en la evidencia a la evidencia basada en la medicina.
Anal Esp Pediatria 2001;55(5):429-439.
42.
42. Hamad S. Ingelfinger over-ruled. Lancet 2000;356:s16.
43. Harvard Business Review. La gestin en la incertidumbre. Ediciones Deusto SA, Bilbao, 1999.
44. Haynes RB, McKibbon K A et al. Deciding which journals to read regularly. An Intern Med,
1986;105(2):309-12.
45. Haynes RB, McKibbon KA et al. Expanding the number of journals you read regularly. An Intern
Med, 1986;105(3):474-8.
46. Heler M. tica y ciencia: la responsabilidad del martillo. Editorial Biblos, Buenos Aires, 1996.
47. Hofmann B. The technological invention of disease. J Med Ethics:Medical Humanities 2001;27:1019. 2002;287(21):2843-2847.
48. Huth EJ. Is the medical world ready for electronic journals? Online J Curr Clin Trials, 1992 Jul 1;Doc
No 7. Ingelfinger FJ. Purpose of the general medical journal. N Engl J Med, 1972;287(20)1043-4.
49. International Committee of Medical Journals Editors. Statements on electronic publication and
on peer reviewed journals. Ann Intern Med, 1992;116(12):1030. Isaacs D, Fitzgerald D. Seven
alternatives to evidence based medicine. BMJ, 1999:319:1618.
50. Jenkins D. Investigations: how to get from guidelines to protocols. BMJ 1991; 303:323-4.
51. Kates RW, Kasperson JX. Comparative risk anlisis of technological hazards. Proc Nat Acad Sci
USA 1983;80:7027-7038.
52. Kaufman JL. Protection of research sujects (Correspondence). N Engl J Med 2003;349(2): 188192.
53. Kauffmann R, Reyes H, Goic A. Various suggestions for the presentation of manuscripts in biomedical journals. Rev Med Chil 1991;119(8):933-7.
54. Kelch RP. Maintaining the public trust in clinical research. N Engl J Med 2002;346(4):285-287.
55. King DB, Dickinson JA, Boulton MR, Toumpas C. EBM Notebook: Clinical Skills Textbooks Fail
Evidence-based Examination.EMB (Ed Esp) 2005;4:241-242.
56. Knietowicz Z. Medical journals are corrupted by dependence on drug companies. BMJ
2005;330:1169.
[ 152 ]
57. Lede R, Abriata G, Copertari P. La medicina basada en las evidencias. Un movimiento cultural a
favor de una mejor asistencia mdica. Obstet y Ginec Lat Amer 1998;56 (5-6):305-311.
58. Lee JS, Urschel DM, Urschel JD. Is general thoracic surgical practice evidence based? Antorcha
Surg 2000;70:429-31.
59. Lee KP, Schotland M, Bacchetti P, Bero LA. Association of journal quality indicators with methodological quality of clinical research articles. JAMA 2002;287(21):2805-2808.
60. Lemmens T. Confronting the conflict of interest crisis in medical research. Monash Bioeth Rev
2004;23(4):19-40.
61. Lock S. Pride and prejudice. BMJ 1989;298:1197.
62. Logan PM. Preparing and presenting a scientific paper. CARJ 2001;52(6):361-5.
63. Loke YK, Derry S. Does anybody read evidence-based article? BMC Med Research Methodol
2003;3:14-20.
64. Los padres de la oveja Dolly crean gallinas con genes humanos. El Pas, 14/01/2007. Disponible
en: http://www.elpais.com.aertculo/sociedad/padres/oveja/Dolly.
65. Lown B, Bukachi F, Xavier R. Health information in the developing world. Lancet, 1998;352:3438.
66. Manterola C, Pineda V, Vial M, Losada H and MINCIR Group. What is the methodologic quality
of human therapy studies in ISI publications? Ann Surg 2006;244(5):827-832.
67. McSherry DMG. Intelligent dialogue based on statistical models of clinical decisin-making.
Statist Medicine, 1986;5:497-502.
68. Mee C. 10 lessons on writing for publication. J Infusion Nurs 2003;26(2):110-113.
69. Moses H, Martn JB. Academic relationships with industry. JAMA 2001;285(7):933-935.
70. National Library of Medicine. Journal selection for INDEX MEDICUS/MEDLINE, fact sheet
sent by Elsevier Science inc, July 1991.
71. Norelle Lickiss J. Late lessons from Auschwitz- is there anything more to learn for the 21st century?. J Med Ethics 2001;27-137.
72. Nuffield Council on Bioethics. Etica de la investigacin relativa a la atencin sanitaria en los pases en desarrollo. Stephemn Austin & sons Ltd, London 2002.
73. Office of Research Integrity (ORI). Managing allegations of scientific misconduct: a guidance
document for editors. January 2000, http://ori.dhhs.gov
74. Organ CH jr. What an editor wants or expects from authors. BJS 2000;87:1123-1124.
75. 78. Papponetti M. Los siete pecados capitales de la prensa. http://intramed.net.actualidad/art1.
asp.
76. Pellegrini Filho A, Goldbaum M, Silvi J. Production of scientific articles on health in six LatinAmerica countries, 1973-1992.Rev Panam Salud Publica 1997;2(2):121-132.
77. 80. Pierson DJ. The top 10 reasons why manuscripts are not accepted for publication. Respir Care
2004;49(10):1246-52.
78. Popper KR. La lgica de la investigacin cientfica. Ed. Tecnos SRL, Buenos Aires, 1985.
79. Poynard T, Munteanu M et al. Truth survival in clinical research: an evidence-based rquiem?.
Ann Inter.n Med 2002;136:888-895.
80. Raths LE. Cmo ensear a pensar. Teora y aplicacin. Editorial Paidos, Buenos Aires, 1999.
81. Relman AS. The Ingelfinger rule. N Engl J Med 1981;305(14):824-826.
82. Rhodes R, Strain JJ: Whistleblowing in academic medicine. J Med Ethics 2004;30:35-39.
[ 153 ]
[ 154 ]
Captulo 12
Luis Mara Ziehr
Rubn F. Iannantuono
Responsabilidades de un CEI
Considerar la competencia de los investigadores y revisar los contratos entre el patrocinador y el investigador y/o institucin.
Requerir, cuando corresponda, que se proporcione informacin adicional en tiempo
y forma a las personas voluntarias participantes en un ensayo clnico que pudiera
dar mayor relevancia a la proteccin de los derechos, seguridad y/o bienestar de las
personas.
Actuar en el completo inters de los voluntarios (sanos o enfermos) de la investigacin y de las comunidades involucradas dentro del contexto regulatorio vigente en la
Argentina y de las normativas internacionales en la materia.
Evaluar la pertinencia del pago a los voluntarios por participar en una investigacin
y establecer (de corresponder) tanto la cantidad como el mtodo.
Asegurar que tanto la cantidad como el mtodo de pago no vulnere la autonoma
que todo voluntario debe tener al momento de tomar la decisin de participar o de
continuar participando en un ensayo clnico.
Asegurar que toda informacin referente a pagos y reintegros a los voluntarios participantes en un ensayo clnico (mtodo, cantidad, prorrateo, etc.) est correcta y claramente estipulada en las hojas de informacin para el voluntario, y en el consentimiento
informado escrito de tal forma que el voluntario pueda comprenderla fcilmente.
por profesionales con experiencia en metodologa de la investigacin cientfica, entrenamiento en normas/regulaciones/lineamientos a los que adhiere el CEI relacionados
con la investigacin clnica y estudios en reas relacionadas con la salud de no menos
de 5 aos;
c) Area administrativa para la distribucin de la documentacin entrante y para el procesamiento de los documentos generados por el CEI y para el archivo adecuado de todos los
documentos entrantes y copia de los salientes.
d) Un asesor para voluntarios participantes en ensayos clnicos encargado de asesorarlos
en relacin a sus derechos y deberes como participantes o futuros participantes en una
investigacin clnica. El responsable de la asesora a pacientes debe ser un miembro del
cuerpo tcnico.
e) El CEI debe realizar sus tareas en sesiones programadas contando con por lo menos 5
miembros que colectivamente tengan la capacidad y experiencia para revisar y evaluar
los aspectos cientficos, mdicos y la tica de los estudios que se les proponen. Los miembros podrn ser hombres o mujeres y al menos:
Dos de ellos debern tener amplia experiencia en las reas de investigacin y metodologa en ensayos clnicos;
Un miembro deber tener conocimientos de leyes;
Un miembro deber ser representante de la comunidad.
La actividad de un CEI no debe circunscribirse a la evaluacin y seguimiento de
protocolos de investigacin clnica.
Dentro de sus funciones est la de generar mbitos de discusin y anlisis de las
distintas problemticas relacionadas con la investigacin clnica como, por ejemplo, conflictos metodolgicos (placebo, submedicacin y equivalencias) y conflictos pragmticos (poblacin vulnerable, situaciones de emergencia/urgencia, entre
otros).
Conflictos ticos
Mltiples son los conflictos que se presentan en la investigacin clnica. Desde un punto
de vista metodolgico podemos resaltar el uso del placebo, la submedicacin, la equiponderacin y el proceso de randomizacin.
Y, dentro de los que podemos denominar pragmticos, la investigacin clnica en pediatra y la toma de consentimiento informado en situaciones de urgencia/emergencia pueden
ser buenos ejemplos.
Placebos
La conveniencia metodolgica para el uso de placebo (medicamento sin principio activo)
y su justificacin tica debe analizarse caso por caso y puede tener diferentes enfoques:
Visin metodolgica: el placebo es necesario por cuestiones cientficas.
[ 158 ]
Visin tica: los derechos y bienestar de los pacientes estn por encima de la necesidad
de uso de placebo por cuestiones cientficas (visin compartida por la ltima versin de la
Declaracin de Helsinki).
En una aclaratoria posterior a la declaracin del ao 2000, la Asociacin Mdica Mundial permite el uso de placebos en dos situaciones: si no hay riesgos mayores o daos irreversibles para los probandos, y si hay motivos cientficos slidos para el uso de placebos, lo cual
constituye una flexibilizacin que recupera nuevamente el uso de placebos con argumentos
contingentes.
Submedicacin
El uso de un medicamento de referencia subdosificado en los grupos control para evitar
el uso de placebo podra aportar ventajas metodolgicas pero, como contrapartida, podra
someter a los voluntarios a todos los efectos negativos de una dosificacin insuficiente de un
principio activo (como por ejemplo, tolerancia, taquifilaxia entre otras). Por ello, tambin
esta estrategia de investigacin ha sido expresamente cuestionada por Helsinki al exigir que
los grupos controles reciban los mejores mtodos probados existentes.
Equiponderacin
Slo en circunstancias clnicas con terapias alternativas aparentemente equivalentes o
donde hay incertidumbres sobre el valor de una sobre otra, se da la situacin de equiponderacin, que justifica o requiere un estudio para decidir la mejor opcin mdica.
La equiponderacin clnica y toda otra equiponderacin slo tienen sentido como requerimiento normativo en ensayos clnicos bajo la suposicin que los investigadores tienen una
obligacin teraputica con los probandos, pero esa obligacin teraputica para investigadores...constituye una falacia teraputica acerca de la tica de estudios clnicos.
El objetivo de la equiponderacin no est en reforzar la metodologa cientfica, sino en la
proteccin a los pacientes de ser expuestos como probandos a terapias insuficientes y riesgos
innecesarios.
Es tica la randomizacin?
El imperativo de equidad implica que todos los sujetos de investigacin deben tener igualdad en la probabilidad de riesgos y beneficios independientemente de clase social, gnero,
raza o cualquier otro atributo. En este sentido, la randomizacin puede considerarse tica
porque slo considera el azar.
[ 159 ]
Patrocinante:
Investigador Principal:
Direccin Centro:
Telfono:
3. Introduccin:
4. Tratamientos alternativos: Deben figurar todos los tratamientos alternativos, considerando que en emergencia en general no existen muchos tratamientos alternativos.
5. Voluntariedad
6. Riesgos: Todos los eventos adversos serios. Clusula por daos (recordar que legalmente la Clusula de no renuncia, est implcita aunque no est colocada).
7. Beneficios: slo debe constar que el paciente puede no tener beneficios.
8. Procedimientos: Este tem debe contener slo los procedimientos relacionados a la
etapa aguda. Se debe explicar de ser necesario, la aleatorizacin, uso de placebo, procedimientos invasivos, etc.
9. Gratuidad
10. Firmas
Conclusiones
El ensayo clnico controlado, entendindose como un experimento que se realiza en seres humanos siguiendo metodologa cientfica vlida y ticamente justificado, es una de las
herramientas que garantiza y salvaguarda los derechos de los pacientes o voluntarios sanos
enrolados.
Es, tambin, el instrumento por el cual el paciente ingresa a un proceso teraputico de
elevada seguridad y respeto por los derechos de los pacientes, ya que recibe instrucciones por
[ 161 ]
escrito sobre, por ejemplo, la forma en que debe administrarse la medicacin, los medicamentos prohibidos, los procedimientos relacionados al protocolo junto a otro conjunto de pautas
conductuales (por ejemplo, clusula de no embarazo).
Esto significa que el paciente conoce sus obligaciones (por ejemplo, cumplir con las pautas del tratamiento y con las visitas de seguimiento establecidas en el protocolo) y sus derechos que siempre puede hacer valer si considera que se han vulnerado.
Tambin el cumplimiento estricto de los procesos establecidos en un protocolo de investigacin aprobado por un CEI por parte de los investigadores y su equipo y por las autoridades
regulatorias (de corresponder) sumado al estricto apego de las normas internacionales: Good
Clinical Practice (GCP), The International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use (ICH), Food and Drug Administration (FDA), Agencia Europea de Medicamentos (EMEA) y locales: Administracin
Nacional de Medicamentos, Alimentos y Tecnologa Mdica (ANMAT), todas regulatorias
de la investigacin clnica en seres humanos, aseguran el respeto de sus derechos.
Todo ello con el objetivo de propender al desarrollo de medicamentos o procedimientos
teraputicos no medicamentosos eficaces y seguros para prevenir, tratar o diagnosticar las
enfermedades de los seres humanos entendidos como personas y mejorar sus condiciones de
vida como bien supremo a salvaguardar.
Referencias
1. Beecher HK. Ethics and Clinical Research. N Engl J Med 1966; 274: 1354-60.
2. Calvo JM. Hiroshima en el Oeste. Bogot, Colombia. Diario Ocho columnas, 25 de
febrero de 1994: 4.
3. Caplan AC. Twenty year after: The legacy of the Tuskegge Syphilis study. When evil
introduces hasting center report 1992; 22: 6-15.
4. Clayton EW, Steinberg KK, Khoury MJ et al. Informed consent for genetic research on
stored tissue samples. JAMA; 274: 1786-1792.
5. Bauchner H, Sharfstein J. Failure to report ethical approval in child health research:
review of published papers. Br Med J 2001; 323 : 318319.
6. Frana O, An F, Garca C, Gravert R, Nez J, Wodowooz O, Queirolo E. Etica en la
investigacin clnica. Una propuesta para prestarle debida atencin. Rev Med Uruguay
1998; 14: 192-201.
7. Medical Research Council (MRC). MRC guidelines for good clinical practice. In MRC
Clinical Trials Series . London: External Communications, 1998.
8. Food Drug Administration (FDA). International conference on harmonization, good clinical practice: consolidated guidelines. Federal Register 1997; 62: 2569225709.
9. International Conference on Harmonisation of Technical Requirements of Pharmaceuticals for Human Use (ICH). Topic M4 Organisation of Common Technical Document
for the International ethical regulations on placebo-use in clinical trials: a comparative
analysis. Bioethics ISSN 0269-9702 (print); 1467-8519 (online) 2008; 22: pp 6474
10. Josefson D. US researchers guilty of breaking safety rules. Br Med J 2001; 323: 69.
[ 162 ]
11. International Conference on Harmonisation of Technical Requirements of Pharmaceuticals for Human Use (ICH). Topic M4 Organisation of Common Technical Document
for the Registration of Pharmaceuticals for Human Use CPMP/ICH/ 2887/99. London:
European Agency for the Evaluation of Medicinal Products, 2000.
12. Lzaro P, Pozo F, Rico JR. Direccin General de Ordenacin de la Investigacin y Formacin. Ministerio de Sanidad y Consumo. Una estrategia de investigacin en el sistema
nacional de la salud (II): Investigacin en servicios de salud Madrid. Med Clin (Barc)
1995; 104: 67-76
[ 163 ]
captulo 13
Introduccin
La investigacin en educacin mdica comenz hace ms de 30 aos. Desde aquellos
inicios ha ido creciendo hasta expandirse alrededor del mundo con intensidad creciente.
Existen marcadas diferencias en los indicadores de avances cientficos entre la investigacin
en educacin mdica y medicina.1 En medicina, los indicadores de avances cientficos pueden
medirse a travs de puntos finales duros como la mortalidad, el infarto agudo de miocardio
o un accidente cerebro vascular. En educacin mdica este tipo de puntos finales duros no
existen por algunas razones:
1. Paradjicamente, diferencias evidentes en las estrategias educativas pueden no reflejarse en los puntos finales establecidos, por ejemplo desempeo profesional y carrera
de medicina. Simplemente porque los participantes, estudiantes de medicina, estn
con una fuerte motivacin, no estn ciegos a las distintas intervenciones y compensan cualquier defecto que pueda presentarse durante la currcula.
2. Un programa o una currcula no funciona como una droga o un frmaco. La droga
se aplica en dosis establecidas en horarios definidos y tiene al menos una cintica
predecible. La currcula de una carrera no es posible dosificarla, tiene mltiples componentes o porciones que son administrados por diferentes docentes con diferentes
niveles de calidad.
3. El tiempo entre la aplicacin de la estrategia educativa y los resultados puede ser tan
largo, que los efectos del programa podran verse discutidos.
La investigacin en educacin mdica ha contribuido y contribuye enormemente a comprender los intrincados procesos de aprendizaje con el fin de mejorar sus resultados. En los
ltimos aos, tanto la comunidad educativa como las autoridades universitarias estn considerando a la evidencia en educacin mdica como una herramienta esencial en la toma de
decisiones.1
Luego, el propsito de este captulo es reflexionar sobre temas generales de investigacin en educacin mdica. Analizaremos el significado del tpico de investigacin, el valor
de generar una adecuada pregunta de investigacin y una hiptesis como pasos esenciales
[ 167 ]
Otros sitios que indexan artculos de revistas cientficas de educacin son el Education
Index (www.educationindex.com) y el Psychological Abstracts www.apa.org/psycinfo/
products/psycabs.html .
Medline (www.pubmed.gov) en tambin un sitio en donde se indexan gran cantidad de
artculos vinculados a la educacin mdica.8
[ 169 ]
Validez
Los resultados de una evaluacin son vlidos cuando son apropiados, pertinentes y
adecuados a lo que estoy midiendo. Mide lo que quiero medir. Ej: si quiero medir habilidades de comunicacin, la herramienta (Gua de Observacin) mide comunicacin y no
examen fsico, y si quisiera medir glucemia, el mtodo (glucometer) mide glucemia y no
natremia.11
Es importante tener en cuenta algunos puntos
La validez se refiere a lo apropiado y adecuado de los resultados de una herramienta
de evaluacin para un grupo determinado de individuos y no a la herramienta en s
misma. Que un test sea altamente vlido para un grupo de estudiantes de medicina
de quinto ao no significa que lo sea para residentes de cardiologa.
La validez es un concepto continuo y no dicotmico.
La validez es siempre especfica para uso particular. Ninguna herramienta es vlida
[ 171 ]
para todos los propsitos. Una herramienta de evaluacin como el examen de opcin
mltiple de cardiologa puede ser altamente vlido para indicar habilidades de conocimiento, moderado para indicar habilidades de razonamiento y bajo para predecir
xito en la prctica del da a da.
La validez es un concepto nico, es decir no hay distintos tipo de validez, si distintos
modos de considerarla
Reproducibilidad
La reproducibilidad se refiere a la consistencia de la medicin. Supongamos que tuvisemos un examen perfectamente reproducible. Si se lo administramos a un grupo de personas
y luego pudisemos borrar de sus memorias el examen y se lo tomramos nuevamente, deberan obtener exactamente el mismo resultado. No podemos esperar exmenes con consistencia perfecta ya que muchos factores pueden influenciar los resultados.12
Tenemos que tener en cuenta los siguientes puntos
La reproducibilidad se refiere a los resultados con el examen y no al examen en si mismo. Un examen tiene distinta reproducibilidad dependiendo del grupo evaluado, del
contexto etc.
La reproducibilidad siempre se refiere a algo en particular. Puede estar vinculada a
los resultados del examen, a los resultados inter-evaluadores o mismo intra-evaluadores.
La reproducibilidad es necesaria pero no una condicin suficiente de validez. Un
examen que arroja datos totalmente inconsistentes no podr brindarnos informacin vlida. Exmenes altamente consistentes podran estar midiendo cosas equivo[ 172 ]
cadas. Ej: supongamos que tengo un glucometer y una muestra de sangre. Si pongo
la muestra en el glucometer en varias oportunidades y siempre me indica valores de
glucemia de 100 mg/dl significa que el resultado de la medicin es vlido (siempre
mide glucemia) y reproducible (los valores son similares). En cambio si indica valores
distintos el resultado sigue siendo vlido (mide siempre glucemia) pero no es reproducible (da valores distintos). La reproducibilidad es necesaria pero no es una condicin
suficiente de validez.
Existen diferentes formas de evaluarla: test-retest, Split-half, coeficiente alfa, teora de
la generalizacin.
Test-retest: se administra en mismo examen en dos oportunidades al mismo grupo en
momentos distintos.
Split-half: se administra en examen en una oportunidad y posteriormente se hace una
correlacin entre los resultados de la primera mitad con la segunda.
Coeficiente alfa: se administra en examen en una oportunidad y se aplica la frmula de
Kuder-Richarson.
Teora de la generalizacin: a travs del anlisis de componentes de varianza, utiliza todos
los datos disponibles para cuantificar todas las fuentes de error en la misma experiencia.
Conclusiones
La investigacin en educacin mdica es comparable en general con la investigacin biomdica. Muchos investigadores tratan de aplicar las metodologas de investigacin de biomedicina y el resultado es que el proyecto no puede llevarse adelante o bien deben adaptar la pregunta de investigacin a la metodologa y no la metodologa a la pregunta de investigacin.
Otro problema importante es que la investigacin en educacin mdica es considerada
por muchos como algo sencillo y que cualquier persona medianamente inteligente la puede
llevar adelante inclusive sin un adecuado periodo de entrenamiento. Si bien es cierto que est
al alcance de todos, es imprescindible entrenarse en este sentido.
Los investigadores que llevan adelante los proyectos son en general extremadamente
tericos y sus resultados difciles de aplicar en la prctica del da a da. Es necesario integrar
habilidades de investigacin pero no perder la conexin con la docencia y la prctica mdica
en terreno.
Para concluir, no es la metodologa la que define la rigidez cientfica de la investigacin
sino la fortaleza de la pregunta de investigacin, el valor de definiciones operacionales, la
eleccin de la metodologa para la bsqueda de los objetivos propuestos y del cuidado y la
prolijidad como se lleva a cabo el proceso.13
[ 173 ]
Referencias
1. Norman G. Research in medical education: three decades of progress. BMJ 2002;324:156062.
2. Crowl. Selecting a research topic In Fundamentals of Educational Research. 2nd edition
Mc Graw Hill 1996;.
3. Alves de Lima A, Barrero C, Barratt S, et al. Validity, reliability, feasibility and satisfaction of the Mini-Clinical Evaluation Exercise (Mini-CEX) for Cardiology Residency
Training 2007.
4. Alves de Lima A, Thierer J, Paulin J, et al. A qualitative study of the impact on learning of the mini clinical evaluation exercise in postgraduate training. Medical Teacher
2005;27:46-52.
5. Alves de Lima A, Botto F, Azzari F. Examenes de seleccin para postulantes a residencias
en cardiologa. Variables que se asocian con los resultados. Revista Argentina de Cardiologia 2001;69:327-331.
6. Alves de Lima A, Baratta S, Falconi S, et all. Lerning Strategies used by cardiology residents: Assessment of their learning styles and their correlations. Education for health
2006;19:289-297.
7. Alves de Lima A. Evaluacin de calidad de una residencia en cardiologa: comparacin
de las opiniones de los egresados y sus actuales jefes en el mercado laboral. Revista del
CONAREC 2005;21:152-156.
8. Erbert J, Erwin P. Searching the medical literature using PubMed: A tutorial. Foundation for medical Education and research 2003;78:87-91.
9. Crowl. Formulating research hypothesis In Fundamentals of Educational Researh. 2nd
edition. The McGraw Hill companies 1996;
10. Henquin R. Clasificacion de los estudios de inbvestigacion. En Introduccin a Epidemiologa y Estadstica. 1 edicion. ELALEPH.COM 2006.
11. Linn R, Gronlund N. Validity, In Measurements and Assessment in Teaching. Merrill
Pprentice Hall 2000; ISBN: 0-13-878356-X.
12. Linn R, Gronlund N. Reliability and other desired characteristics, In Measurements and
Assessment in Teaching. Merrill Pprentice Hall 2000; ISBN: 0-13-878356-X.
13. Schuwirth L. Challenges for educationalists. BMJ 2006;333:544-46.
[ 174 ]
Captulo 14
Nora Br
maginemos por un instante a Buenos Aires en 1810. Una aldea de unos 40.000 habitantes
con calles de barro en las que, segn escribi un viajero francs, en las horas de la siesta
no se vean ms que mdicos y perros.
Con ocho alumnos en los cursos del Protomedicato, el cuidado de la salud recaa en
otros tantos egresados, siete cirujanos, trece boticarios y algn que otro dentista u oftalmlogo.
En materia de remedios, se los utilizaba enrgicos (otra forma de decir que muchos
de ellos eran mortales en dosis elevadas), lo que de algn modo favoreca las malas artes de
curanderos y falsos mdicos, que se lanzaban a ejercer la profesin ms ardua e interesante
de la vida del hombre, segn las crnicas de la poca.
Por esos tiempos, el Ministro Godoy envi una memoria sobre el poder desinfectante
de los cidos minerales y, entre ellos, el nitro-muritico-oxigenado, recomendando que se
adoptaran las fumigaciones y se mandaran practicar en todos los Lazaretos fijos o provisionales, en todos los Hospitales militares y civiles, en todos los Cuarteles, presidios, crceles
y dems parajes, que por contener mucho nmero de individuos enfermos o sanos adulteran
la atmsfera que respiran y no basta la ventilacin del aire libre para destruir los grmenes
funestos que se anidan en su camas, muebles y paredes.
La medicina colonial inspira una sonrisa, pero entre el mercurio y la amalgama pulverizada surge un detalle de insospechada modernidad: en la misiva enviada por Godoy ya se
haca hincapi en la conveniencia de divulgar los conocimientos mdicos.
Considero escriba que conviene al mejor servicio del Rey y del Estado que se vulgaricen todo lo posible estos conocimientos; que se facilite a todos los jefes que vigilan o
tienen a su cargo la salud pblica, la instruccin que importa posean en ese importante
objeto...
Dos siglos ms tarde, la comunicacin de noticias mdicas y cientficas es una realidad
de crecimiento explosivo en los medios de comunicacin globales.
Prcticamente no existe emisora de radio, canal de televisin, diario o revista de inters
general que no incluya en su oferta informativa una seleccin de temas mdicos o un especialista que comente las ltimas novedades. Basta con teclear un vocablo mdico en Internet
para que la pantalla nos devuelva miles de sitios electrnicos.
[ 175 ]
Claro que, con 54.000 publicaciones cientficas, especialistas vidos por figurar en letras
de molde o aparecer en una pantalla de TV, y un pblico dispuesto a aceptar sin chistar las
novedades ms disparatadas, divulgar conocimientos cientficos no es tarea sencilla.
Para elegir el men del da, el periodista especializado deber bucear en decenas de
informaciones armado de un conocimiento apropiado de los temas que frecuenta y criterio
adecuado para valorar los nuevos conocimientos. El supermercado de la salud es un terreno pantanoso y sus ofertas deslumbran como luces de nen.
Una ancdota vale ms que mil palabras. Despus del xito de la pldora de la virilidad,
mientras todava se impriman pginas y pginas sobre el Viagra, ms de diez compaas
norteamericanas comenzaron a ofrecer frmacos para mejorar lo que, en un alarde de mercantilismo, denominaron prestaciones sexuales. Empresas dedicadas a la herboristera y
farmacias alternativas ofrecieron pcimas, pomadas, pldoras y ts destinados a optimizar el
rendimiento de los varones en el terreno amoroso.
En los Estados Unidos, Hypnovisin, una empresa de Nueva York, por ejemplo, produjo un
audiocassette subliminal que proclamaba: Mi sexo es perfecto porque Viagra funciona bien.
Bodyonics, de Hicksville, envi cartas a 10.000 mdicos anunciando Longevity, una
lnea de hierbas preparada para la generacin que pisa los cincuenta aos. Y los laboratorios
HerbaSway anunciaron la pldora Stamina, con hierbas provenientes de la China.
Los cables de las agencias noticiosas traan a nuestro escritorio todas estas novedades
y tambin las promesas de la medicina tradicional, que se ufanaba de haber encontrado un
abanico de remedios para otorgar vitalidad al orgullo masculino, como los extractos de ciertas plantas o comidas, como la sopa de pene de tigre, el polvo de cuerno de rinoceronte o las
pociones de animales tan extraos como la civeta, un cuadrpedo parecido a la mangosta.
El ejemplo tal vez suene un tanto exagerado, pero los hay incluso peores. Y si discriminar entre promesas, a cual ms seductora, no parece una prueba suficientemente ardua, en
nuestra particular carrera de obstculos para alcanzar la tan ansiada primicia se nos interponen desde los inventores autodidactos hasta los mdicos heterodoxos que desarrollan
tratamientos propios (y, por supuesto, no sometidos a la aprobacin de sus pares) para curar
algunos de los males ms persistentes.
En una sala de redaccin, atender el telfono resulta una experiencia que puede poner a
prueba la capacidad de asombro. Nuestro ocasional interlocutor suele apresurarse a explicar
que posee un mtodo revolucionario que hace recuperar el cabello a los calvos, restablece la
secrecin de insulina o elimina las secuelas del accidente cerebrovascular. Los medios de comunicacin ejercen una atraccin magntica para mercaderes de sueos dudosos. Los hay de
muchos tipos, pero todos tienen algo en comn: suenan absolutamente convincentes.
Por eso, hay momentos en que a uno le encantara tener a mano una bola de cristal o
poseer poderes anticipatorios.
Sobre todo cuando algn experimento cientfico parece inusualmente promisorio. Y en
especial cuando lo que promete es una pavada como erradicar el cncer o curar el sida.
Ah surge un dilema difcil de resolver: consiste en prever qu probabilidades tiene ese
cheque en blanco de convertirse en realidad. Y en qu plazo: maana, el ao que viene,
dentro de medio siglo...?
Estas decisiones son las que tenemos que tomar varias veces por da los periodistas que
[ 176 ]
trabajamos en temas de salud. Por ejemplo, hace un par de aos, un equipo de la Universidad
de Harvard anunci que haba encontrado una protena que protega a ciertos monos del
sida. Bastaba una extrapolacin un poquito ms optimista de lo razonable para empezar a
pensar que la misma cadena de aminocidos podra proteger a los seres humanos. Un poco
ms y casi, casi estbamos a un paso del remedio contra la pandemia.
Lamentablemente, la historia reciente demuestra que, en medicina y en investigacin,
nada es tan sencillo.
En agosto de 1995, Madeleine Nash se preguntaba en la revista Time si habamos encontrado el nirvana de la prdida de peso: el doctor Jeffrey Friedman, de la Universidad Rockefeller, haba inyectado diariamente durante dos semanas una hormona en ratones obesos
y stos sbitamente haban comenzado a comer menos y a quemar ms grasas. En un alarde
que slo pudo comprobarse en el mundo ratonil, stos no slo haban perdido un 30% de
su peso, sino que al mismo tiempo haban registrado descensos en sus ndices de colesterol y
glucemia.
La leptina una palabra que dio la vuelta al mundo se transform en el imaginario
colectivo en la hormona milagrosa que terminara definitivamente con la tortura de la
obesidad. Sin embargo, casi una dcada ms tarde y a pesar de los esfuerzos, todava no se
encontr la manera de remedar esos milagros a escala humana.
Antes del 3 de mayo de 1998, pocos haban escuchado los vocablos angiostatina y endostatina ms all de un estrecho crculo de investigadores en oncologa. Pero bast un artculo en
la primera plana de The New York Times para que se encendieran las ilusiones de todos: estaba
dedicado a las investigaciones en ratones de Judah Folkman y Timothy OReilly sobre cmo
impedir la formacin de nuevos vasos sanguneos (antiangiognesis) en un tumor. Cuando le
preguntaron a Folkman si lo consideraba una buena noticia, contest: Si usted es ratn, s.
Es en ocasiones como stas cuando la informacin responsable adquiere todo su valor.
Por eso, los comits de tica de diferentes asociaciones periodsticas aconsejan:
1. Ser vigilantes en la seleccin de fuentes, sopesando y descubriendo todo conflicto de
inters, sea este financiero, personal o profesional
2. Investigar e informar sobre lazos entre nuestras fuentes y empresas o laboratorios
cuando se promueve una nueva idea o terapia.
3. Investigar e informar sobre posibles lazos entre investigadores y compaas privadas,
instituciones, grupos de pacientes y sus sponsors.
4. Reconocer que la mayora de las historias que cubrimos implican un grado de complejidad que una fuente nica no puede proveernos.
5. Entender el proceso de la investigacin clnica para informar adecuadamente sobre
los avances (por ejemplo, reconociendo las diferencias entre pruebas de Fase I, II, o
III). Ser cauto en la informacin de estudios preliminares, in vitro o en animales.
6. Preservar la independencia periodstica.
7. Ser especialmente cuidadosos en el uso de estadsticas o en la informacin de conocimiento que pueda influir en el estado de nimo de los pacientes.
8. No explotar los costados dramticos y sensacionalistas de historias que involucren
a individuos enfermos.
[ 177 ]
[ 179 ]
Rogelio A. Machado
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
1 Introduccin
2 Conceptos bsicos
3 Frecuencia y probabilidad de un suceso
4 Distribuciones de probabilidades
5 Muestreo. El desvo estndar de la media o error estndar
6 Inferencia estadstica
7 Comparaciones entre dos medias muestrales. La distribucin t
8 Comparaciones entre proporciones
9 Correlacin y regresin
10 Anlisis de la varianza
11 Regresin mltiple
12 Regresin logstica
13 Mtodos no paramtricos
14 Pruebas diagnsticas
15 Anlisis de la sobrevida
16 Enfermedades en las poblaciones
1. Introduccin
hay ms de un mtodo para tratar con un mismo problema. En estos casos, frecuentemente
ser necesario el trabajo en conjunto con el matemtico, y aqu los conocimientos de bioestadstica del investigador nuevamente sern necesarios para ayudar a orientar el enfoque
del anlisis hacia los aspectos mdicos o biolgicos de mayor importancia, sobre los que el
matemtico podr no estar demasiado informado.
En lo que sigue se procura exponer los aspectos bsicos de la bioestadstica vistos desde
la orilla del mdico, aunque se mencionan algunos aspectos ms generales y formales a fin de
fundamentar algunos de los requisitos y limitaciones de los mtodos y de hacer comprensible
la lgica subyacente en los mismos, tratando de evitar la impresin de arbitrariedad que suele
surgir de la lectura de los textos cuando los diversos mtodos son presentados como una coleccin de recetas. Como se ha dicho, la consulta al especialista en bioestadstica ser muchas
veces necesaria, pero el planteo de las preguntas y los lineamientos de un estudio conciernen
directamente al mdico, para no mencionar la interpretacin biolgica de los hechos observados, sobre lo que el estadgrafo tendr en general menores posibilidades de contribuir.
Los temas abarcados en el texto, como el lector podr suponer, son slo algunos de los
ms importantes de la bioestadstica y de ninguna manera se trata de una revisin exhaustiva
de los mismos, sino ms bien de una introduccin que haga comprensibles y aprovechables
los procedimientos ms frecuentemente utilizados en esa disciplina. Las referencias sugieren
lecturas complementarias que pueden ayudar a la comprensin de ciertos aspectos que excederan los lmites de estos elementos de bioestadstica. Los nmeros entre parntesis, si no
se indica prrafo (), se refieren siempre a ecuaciones u expresiones anlogas incluidas en el
texto.
Asimismo, a lo largo de las distintas secciones se encontrarn ejemplos que procuran
ilustrar algunos de los aspectos prcticos de los distintos mtodos y complementar los conceptos vertidos en el texto. Por lo tanto su lectura no debera omitirse, si bien algunos detalles
numricos y de clculo pueden leerse superficialmente, ya que lo fundamental son los conceptos que ilustran, y que refuerzan o completan el tema de fondo. En este respecto, tanto en el
texto como en los ejemplos, se han introducido algunas expresiones algebraicas o frmulas
sencillas, por su valor para describir los procedimientos bsicos del clculo estadstico y
ayudar a comprender las ideas en que se basan. Consecuentemente, al tratar de los aspectos
ms complejos de la bioestadstica, se ha evitado la reproduccin de frmulas y algoritmos de
clculo extensos que van ms all de los propsitos del texto.
Algunos ejemplos se basan en datos publicados, generalmente simplificados para mayor
sencillez, y en estos casos se cita la fuente original. En tanto, en su mayora han sido elaborados mediante simulacin numrica con programas de estadstica, y si bien se ha procurado
que versen sobre conocimientos mdicos ampliamente aceptados, su finalidad ha sido ilustrar
los procedimientos de la bioestadstica y en ningn caso introducir juicios de verdad o proponer conceptos de validez comprobada en el campo de la medicina.
[ 184 ]
2. Conceptos bsicos
sistlico, y viceversa. Estas conclusiones pueden ser muy difciles de percibir por la mera
inspeccin de las tablas con las mediciones originales. Ms an, en el caso de dos grupos con
diferentes promedios de presin arterial y en el de la correlacin entre frecuencia cardaca y
volumen sistlico, es importante conocer el nivel de seguridad o confianza que se puede tener
de que los resultados observados traduzcan relaciones realmente existentes en las poblaciones
de las que provienen los datos y no se hayan originado en fluctuaciones debidas al azar, y
estos son problemas tpicos que la estadstica ayuda a contestar. A continuacin se exponen
algunos de los conceptos bsicos utilizados en bioestadstica.
El trmino individuo se suele emplear para referirse a seres humanos, animales y tambin
a los diversos objetos de inters de la biologa en cuanto constituyan unidades productoras
de datos. Estos son nmeros provenientes de observaciones realizadas en los individuos y se
refieren a propiedades de tales individuos, como pueden ser el pulso, la presin arterial o las
glucemias. En general, los datos se obtienen midiendo, contando, comparando o clasificando
el material observado, proceso que converge en la produccin de nmeros. Los nmeros constituyen el material apto para ser analizado mediante los distintos mtodos de la estadstica.
Pero la estadstica no maneja nmeros aislados sino conjuntos de nmeros, de los que extrae
la informacin til.
Como ha mencionado, uno de los objetivos fundamentales de la estadstica es llegar
a conocer las caractersticas de conjuntos ms o menos extensos de individuos a partir de
muestras formadas por algunos de ellos. Este es el punto de partida de los procedimientos de
inferencia estadstica, que se vern en 6.1 y siguientes. En estadstica, cualquier conjunto
de datos extrado de un entorno mayor es una muestra del conjunto mayor, llamado a su vez
poblacin universo. Con ms propiedad, se entiende por poblacin o universo la totalidad
de los resultados experimentales posibles. En tanto, el trmino resultados experimentales
designa, no slo conjuntos de mediciones, como por ejemplo, de la presin arterial o de la
glucemia, sino tambin los datos provenientes de cualquier coleccin de individuos o especmenes biolgicos donde se puedan realizar observaciones. De esta forma, la cantidad de crisis
anginosas o el grado de disnea referidos por los pacientes, son datos biolgicos pasibles de
ser medidos, contados, estimados en su intensidad o clasificados, esto es, transformados en
nmeros.
Por otra parte, es fundamental que la extensin del universo del que provienen los resultados experimentales est claramente definida, como por ejemplo, hombres de 50 a 75 aos
residentes en tal rea geogrfica. Al definir un universo como la totalidad de los resultados
posibles, se establece la exigencia de que todos sus integrantes estn enunciados y definidos.
Sin embargo, el acceso a todos los elementos de un universo es casi siempre difcil de conseguir en la prctica, y puede llegar a ser imposible cuando se definen condiciones que implican
cierto grado de incertidumbre, como pueden ser coronarios o hipertensos. Muchas veces
los universos son entidades con aspectos dinmicos que hacen imposible congelarlos para
proceder a su medicin, como los pacientes de una determinada enfermedad, que se renuevan
constantemente en la poblacin. Por estos motivos, habr que ser siempre cuidadoso al hacer
extensivos los resultados obtenidos de las muestras, a todo el universo.
Ntese que cada individuo de una muestra puede proporcionar uno ms datos (por
ejemplo, una ms tomas de la presin arterial). Cada dato es un elemento de la muestra, y
[ 186 ]
el nmero de datos es una caracterstica muy importante de la misma, que define el tamao
muestral. De modo que, en cuanto a su obtencin, una muestra proviene de un grupo de individuos y est constituida por un conjunto de datos proporcionados por dichos individuos.
Cada dato es un elemento del conjunto muestral.
Se dijo que las muestras estn formadas por datos numricos, y esto es as an en los
casos especiales en que es estudiada una cualidad, como sano enfermo, alto bajo, leve,
moderado o severo: para el trabajo estadstico tales cualidades son representadas por nmeros o codificadas (por ejemplo, sano = 1, enfermo = 2). Cada nmero es as un elemento de la
muestra, representando a un individuo. En ltima instancia, si bien el concepto de individuo
es til, en forma ms rigurosa es preferible considerar una muestra como un conjunto de datos numricos. Como se ha mencionado, un mismo individuo puede proporcionar ms de un
dato elemento muestral. Por ejemplo, puede haber ms de una cifra de presin arterial por
paciente. Esto motiva ciertos cuidados en los procedimientos estadsticos para que no haya
individuos sobre infra representados en el estudio, y para dar cuenta de la correlacin
que podr existir entre datos provenientes de un mismo sujeto. Una breve referencia a los
mtodos para la obtencin de muestras se encontrar en 5.1.
2.2. Variables muestrales
Los nmeros que integran las muestras, procedentes de observaciones y mediciones, varan segn los casos dentro de lmites que pueden ser ms menos amplios. Las clases o
categoras de objetos sobre las que se realizan las mediciones se conocen como variables:
son variables la presin arterial y la frecuencia cardaca, as como el sexo, la condicin de
fumador y la capacidad funcional. Las tres ltimas deben ser codificadas segn ya fuera
mencionado, adjudicndose distintos nmeros a los diferentes casos posibles. Estas variables
se conocen como cualitativas. En tanto, las originadas en mediciones o en recuentos, como
la presin arterial y la frecuencia cardaca, se denominan variables cuantitativas.
Dentro de las variables cualitativas son muy abundantes las que se refieren a caractersticas que pueden exhibir solamente dos estados. Estas variables, como el sexo, la sobrevida o
cualquier otra variable que pueda ser definida por un par de estados (como gnero femenino
o masculino, prueba positiva o negativa, tabaquismo presente o ausente), se llaman binarias
o dicotmicas.
Las variables cuantitativas suelen dividirse en discretas y continuas. En las primeras,
que suelen provenir de recuentos, los valores estn claramente separados sin posibilidades
intermedias, como la frecuencia del pulso o el nmero de glbulos rojos por milmetro cbico de sangre. En cambio, las variables continuas pueden asumir una gama ininterrumpida
de valores y suelen resultar de mediciones, como la presin arterial, el peso y la glucemia.
Sin embargo, en la prctica, la distincin entre variables discretas y continuas no siempre es
clara, dado que toda variable continua es redondeada al ser medida (por ejemplo, la presin
arterial suele redondearse a centmetros de mercurio, y an si se expresara en milmetros de
mercurio se estara efectuando un redondeo). Afortunadamente, las consecuencias no suelen
ser importantes en la prctica, ya que la mayora de los mtodos estadsticos diseados para
variables continuas pueden aplicarse sin prdidas de exactitud a variables discretas, con tal
de que exista una subdivisin suficientemente fina de la escala, como puede ser el caso del
[ 187 ]
pulso arterial en latidos por minuto o los glbulos rojos por milmetro cbico de sangre (que
en rigor son variables discretas).
2.3. Organizando y resumiendo los datos: Tablas y distribuciones de frecuencias.
Estadstica descriptiva
Los datos obtenidos de cualquier investigacin y destinados al anlisis, son en general
un conjunto de nmeros del cual no es sencillo obtener conclusiones tiles por inspeccin
directa, esto es, sin haberlos organizado y resumido. Una buena manera de iniciar un anlisis
estadstico es disponer los datos en una tabla y a continuacin tratar de representarlos como
figuras o grficos. De esta manera la informacin contenida en los datos se puede compactar o resumir de modo de hacerla interpretable y asignarle sentido en el contexto biolgico
en el que fue obtenida y en relacin con las posibles hiptesis de trabajo. Estas tareas forman
parte de la llamada estadstica descriptiva.
Las tablas son arreglos o presentaciones de los datos que organizan la informacin y son
un buen punto de partida para proseguir con el anlisis numrico. Ciertas tablas permiten
presentar los datos sin ningn tipo de elaboracin estadstica, como no sea su ordenamiento
de acuerdo a su fuente de origen y a las variables consideradas. Estas tablas estn formadas
por un conjunto de filas (horizontales) y columnas (verticales) que se cortan determinando
celdas en las que se disponen los datos originales sin ningn tipo de elaboracin previa. Es la
forma de presentacin corriente de las hojas de clculo y de las planillas de anlisis de los diversos programas estadsticos. Existe una construccin de uso muy frecuente en la que a cada
tipo de variable (presin arterial, glucemia) se le asigna una columna y a cada fuente de datos
(individuo, preparado de laboratorio, etc.) una fila. Si por ejemplo se mide la glucemia en
varios individuos, los valores hallados se colocan en las celdas correspondientes a la columna
Glucemia, en la interseccin con las filas correspondientes a cada individuo estudiado. Este
arreglo de los datos es particularmente til para trabajar con hojas de clculo y programas de
anlisis estadstico, que operan sobre la matriz de datos introducida en la tabla, realizando
gran variedad de clculos en forma eficiente y rpida.
La construccin de tablas y la elaboracin estadstica de los datos est en la actualidad
notablemente facilitada por los programas de computacin y no tiene mayor sentido considerar el trabajo artesanal con papel y lpiz a menos que se trate de grupos reducidos de
datos o con el objeto de analizar y comprender mejor ciertas tcnicas. De esta manera, la
estructura de las tablas arriba citadas est disponible en hojas de clculo del tipo Excel, debiendo solamente asignarse la identidad de filas y columnas y llenar las celdas con los datos
correspondientes. A su vez, la matriz de datos resultante es accesible a numerosos programas
estadsticos, incluyendo los recursos propios con que cuentan las hojas de clculo.
Otro tipo de tablas ya presentan un primer paso en el resumen de los datos, que consiste en
agrupar los valores de una variable en niveles o categoras consignando el nmero de veces que
la misma se presenta en cada nivel. En el caso de variables cualitativas con los datos agrupados
en pocas categoras, el conteo de casos cayendo dentro de cada categora y eventualmente, la
proporcin o porcentaje del total de casos dentro de cada una es en principio suficiente, como
puede observarse en la Tabla 2.1, donde un conjunto de 646 pacientes con estenosis valvular
artica son clasificados segn el origen de la enfermedad (Passik y col, 1987).
[ 188 ]
Tabla 2.1. Pacientes portadores de estenosis valvular artica clasificados segn la etiologa de
la enfermedad (Passik y col, 1987).
Tipo de alteracin valvular
Frecuencia (N de pacientes)
Porcentaje ( % )
246
38
213
33
155
24
Otras causas
Totales
32
646
100
En cambio, para variables continuas, los datos deben agruparse en intervalos como se
observa en la Tabla 2.2, donde la presin arterial sistlica de 150 individuos se agrup en
intervalos de 10 mm Hg, comenzando por el que va de 80 a 89 mm Hg. Cualquier valor de
presin dentro del intervalo se cuenta como un dato en el mismo, sin importar su valor exacto. Esto implica un resumen de los datos, ya que a todos los que caen en un intervalo de clase
se les adjudica un mismo valor (en general el valor central del intervalo). Hay un efecto de
redondeo de los datos que origina prdida de informacin y es el costo de haberlos resumido,
aunque con intervalos no demasiado grandes dicha prdida suele ser pequea. La variable
queda as condensada y una tabla que tendra 150 filas se convierte en una de 10, como puede
observarse en la Tabla 2.2. Se ve claramente como los datos se agrupan hacia el centro de la
distribucin y as se tiene una imagen rpida de la misma.
Tabla 2.2. Tabla de distribucin de frecuencias. Presin arterial sistlica en 150 individuos
extrados de una poblacin con media de 120 mm Hg y desvo estndar de 15 mm Hg.
Presin Arterial
Frecuencia
por intervalo
(N de pacientes)
Frecuencia relativa
(%)
Frecuencia
acumulativa
(N de pacientes)
Frecuencia acumulativa
(%)
80 - 89
1.3
1.3
90 - 99
11
7.3
13
8.7
100 - 109
20
13.3
33
22.0
110 - 119
40
26.7
73
48.7
120 - 129
33
22.0
106
70.7
130 - 139
29
19.3
135
90.0
140 - 149
12
8.0
147
98.0
150 - 159
0.7
148
98.7
160 - 169
0.7
149
99.3
170 - 179
0.7
150
100.0
TOTALES
150
100
[ 189 ]
Una tabla como sta se conoce como tabla de distribucin de frecuencias. Los intervalos se eligen en forma arbitraria y en general iguales. La frecuencia relativa con que aparece
la variable en cada intervalo respecto del nmero total de casos, puede ser aadida a la tabla
como una nueva columna y expresada como porcentajes. El concepto de distribucin de
frecuencias es fundamental porque da una idea de la distribucin de probabilidades para la
variable en cuestin, ya que la frecuencia con que se presentan los distintos valores de una variable est en relacin con sus probabilidades (estos conceptos se completan en las Secciones
3 y 4). Una instancia ms en este tipo de tablas incluye la llamada frecuencia acumulativa,
que consiste en la suma de las frecuencias en cada fila desde el extremo inferior de la distribucin (primera fila de la tabla) hasta cada uno de los niveles en que sta ha sido dividida
(Tabla 2.2, columnas 4 y 5 ).
Con el objeto de realizar clculos estadsticos y contndose con programas de computacin elementales, que no tienen dificultades para manejar grandes cantidades de
datos, la tabla sin resumir mencionada en primer trmino es la de eleccin, ya que las
tablas de distribucin de frecuencias sacrifican una parte de la informacin contenida en
los datos al resumirlos en una cierta cantidad de niveles sin tomar en cuenta sus valores
exactos.
Otras tablas, muy frecuentes en la presentacin final de los resultados, ahorran la exposicin de toda la distribucin de frecuencias de las variables y la reemplazan por sus indicadores de posicin y dispersin, como la media y el desvo estndar o el rango, que como se ver
ms adelante, dan una rpida visin de la magnitud y forma de distribucin de la variable.
De esta manera la informacin es comprimida sin prdida de lo esencial y una sola tabla
puede albergar mltiples variables distintas, reducidas a sus medias y desvos estndar. Estas
tablas, como el lector habr notado, son muy utilizadas para la presentacin de los resultados
en los trabajos de investigacin.
2.4. Resumiendo los datos en forma visual: Grficos
Por su parte, los grficos brindan una apreciacin global de la informacin organizada
en las tablas. La impresin visual proporcionada por tales presentaciones informa de un golpe de vista sobre muchas propiedades de las muestras que pueden no ser en absoluto evidentes
a travs del examen directo de las tablas.
Los grficos son figuras donde se representan convencionalmente los datos numricos.
Algunos de ellos son el histograma, el polgono de frecuencias, el llamado box-and-whisker
(cuadro y lnea) y los diagramas de dispersin, pero hay muchos otros y pueden ser diseados
de acuerdo a las necesidades que planteen los datos a representar. Frecuentemente se construyen
sobre un sistema de dos ejes perpendiculares que se intersecan en el origen de las series de valores representados. El eje horizontal (eje de abscisas o de las x) se suele simbolizar con la letra X
y el vertical (eje de ordenadas o de las y) con la Y. En los ejes se hallan representadas las escalas
y las variables que permiten identificar y atribuir sus correspondientes valores a los elementos
del grfico. Un principio general establece que debe existir una relacin clara y bien definida,
en general aunque no siempre de proporcionalidad directa, entre las magnitudes reales de
los distintos datos y las de las figuras que los representan en los grficos. El no cumplimiento
de este requisito puede llevar a una interpretacin distorsionada de los datos.
[ 190 ]
Figura 2.1. Etiologa de la estenosis valvular artica en un grupo de 646 pacientes de ambos
sexos (Passik y col, 1987).
En lo que sigue, dentro de otros tipos de grficos ms elaborados, slo se mencionarn
algunos de los ms frecuentes.
2.4.1. Histograma y polgono de frecuencias
El histograma es un grfico de barras apropiado para la representacin de distribuciones
de frecuencia, indicadas en la escala vertical como nmero de casos o porcentajes, mientras
que cada rectngulo o barra representa una de las clases en que se dividen los datos. En la
Figura 2.2 aparece el histograma correspondiente a la distribucin de la Tabla 2.2. Siendo los
intervalos de clase de la misma magnitud, los rectngulos tendrn igual base y por lo tanto
sus reas sern proporcionales a las frecuencias representadas en el eje vertical. Por razones
tericas, lo esencial para la correcta representacin de distribuciones de frecuencias, es que
las reas del histograma sean proporcionales a stas.
Si se unen mediante segmentos los puntos medios del techo de cada rectngulo, se obtiene
una lnea quebrada llamada polgono de frecuencias. Cuando los intervalos de clase aumentan en forma indefinida, el polgono tiende a una curva continua (lo mismo ocurrir con el
[ 191 ]
borde superior del correspondiente histograma, ver Fig. 4.2 ). Estas curvas de frecuencias
son importantes en teora estadstica y se relacionan con las curvas de distribucin de probabilidades (ver Seccin 4). En la Fig. 2.2 se ha superpuesto al histograma la curva normal de
distribucin de probabilidades (ver 4.7).
Figura 2.2. Histograma de frecuencias correspondiente a los 150 individuos con presin
arterial sistlica media de 120 mm Hg y desvo estndar 15 mm Hg de Tabla 2.2. Se ha superpuesto la funcin de distribucin normal terica correspondiente a los datos.
[ 192 ]
Figura 2.3. Diagrama de tipo box and whisker para dos grupos de individuos con presin
arterial sistlica media de 120 y 160 mm Hg respectivamente. Los asteriscos corresponden a
datos alejados del centro de la distribucin.
ms marcada en la evolucin de cada grupo, lo que se debe a que la porcin del eje de ordenadas
entre el 0 y el 75% de la escala ha sido cortada. A pesar de todo, este procedimiento puede
ser til para evitar largos intervalos libres de datos, precisamente cuando stos oscilan dentro
de regiones muy pequeas de la escala.
Figura 2.4. Dos presentaciones de la sobrevida libre de eventos en dos grupos de individuos, A y
B. En el grfico de la derecha, la escala del eje de ordenadas ha sido omitida entre 0 y 75%.
(2.1)
La media tiene importantes funciones en una gran cantidad de tcnicas estadsticas y es
el estimador de posicin central ms ampliamente utilizado.
Otra medida de posicin es la mediana, que se define como el valor del dato que se halla
en la mitad de la serie cuando los datos son ordenados en forma ascendente o descendente.
Si el nmero de datos es par, habr dos observaciones centrales y se acepta como mediana el
promedio de stas.
Una ventaja de la mediana sobre la media es no estar influida por los valores extremos de
los datos, inconveniente que s presenta la media. En la serie:
1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 8, 8, 70
la mediana es 5, ms en el centro y de acuerdo a las magnitudes de la mayora de los datos,
mientras que la media es igual a 7.9, muy a la derecha de la distribucin por estar muy influida por el valor extremo 70. A pesar de todo, el papel de la media en la teora estadstica
es mucho ms importante que el de la mediana, precisamente por tomar en cuenta las magnitudes de todos los datos. El problema de los datos extremos y su influencia excesiva sobre
la media aritmtica puede requerir tratamiento especial en ciertos casos, pues si bien podrn
provenir de la poblacin estudiada, tambin podr tratarse de elementos extraos a la misma
incluidos por error, de errores en la medicin o an de errores de copia.
El modo es el valor del dato que se presenta con mayor frecuencia dentro de un conjunto de observaciones, esto es, el valor de la observacin xi que se repite ms veces en
la tabla de distribucin de frecuencias. Pueden presentarse varios modos en un grupo de
datos, y aparte de cierto inters descriptivo, es poco usado en estadstica como indicador
de posicin.
2.5.2. Medidas de dispersin. Varianza y desvo estndar
Como ya se sealara, la forma en que una serie de datos se dispersa alrededor de sus valores centrales se puede apreciar a travs de las tablas y grficos de distribucin de frecuencias.
Sin embargo, es deseable obtener estimadores de la dispersin que a partir de la informacin
de los datos resuman en pocos nmeros las propiedades de aqulla. La media aritmtica
puede usarse como punto central de referencia para medir las desviaciones de los datos individuales de una serie.
Con el objeto de evaluar la dispersin de los datos, se puede restar a cada dato la media.
Las diferencias as obtenidas tendrn signo positivo o negativo segn el respectivo dato sea
mayor o menor que la media. Si estas diferencias se suman con el objeto de promediarlas
y obtener un estimador de la dispersin de los datos, se ver que la suma es cero, con lo
cual el mtodo es inaplicable. La sencilla opcin de tomar todas las desviaciones con su
valor absoluto, es decir como positivas, sumarlas y dividirlas por el nmero de los datos,
proporciona un promedio conocido como desviacin media, que si bien es un estimador
de la dispersin, resulta de escasa utilidad dentro del clculo estadstico, por lo cual no es
habitualmente utilizado.
En cambio, el recurso de elevar al cuadrado cada diferencia entre dato y media, adems
de eliminar el problema de los signos (todos los cuadrados son positivos), da origen a esti[ 195 ]
La varianza y el desvo estndar son estimadores eficaces de la dispersin de los datos
alrededor de la media, y de los dos, el desvo estndar tiene las mismas dimensiones que los
datos originales y es el que permite obtener una idea ms clara e inmediata del grado de dispersin de stos.
Por razones tericas, cuando se utilizan la varianza y el desvo estndar para estimar sus
valores en el universo del que se han extrado los datos, debe emplearse el divisor (n 1) en
lugar de n, restando 1 al total de los datos empleados para calcularlos. En efecto, la varianza
y el desvo estndar obtenidos de las muestras presentan siempre valores ligeramente menores que los que tienen en sus respectivos universos, y esta desviacin sistemtica, conocida
como sesgo (bias), se corrige disminuyendo el denominador de (2.2) y (2.3) en una unidad.
Se demuestra que la varianza y el desvo estndar muestrales calculados con divisor ( n 1 )
resultan estimadores sin sesgo o insesgados, de los valores (muchas veces desconocidos)
que tienen en la poblacin. Estos estadsticos muestrales insesgados suelen designarse como
s (varianza muestral) y s (desvo estndar muestral, que es la raz cuadrada de s):
[ 196 ]
Ejemplo 2.1
El objeto del ejemplo es mostrar el clculo de la media y el desvo estndar muestrales a
fin de familiarizarse con la forma de manejar los datos en los procedimientos estadsticos. Este
tipo de clculo se realiza actualmente mediante programas de computacin que slo requieren
la introduccin de los datos originales sin procesar, por lo que el trabajo con calculadoras de
escritorio ya es obsoleto, pero seguir el desarrollo del clculo a travs del ejemplo ayuda a comprender la estructura de esos estadsticos muestrales. Considrese un conjunto de 10 individuos
para los que el laboratorio dio las cifras de HDL colesterol (en mg/dl) que forman la segunda
columna de la tabla. En la ltima fila se hallan las sumatorias o totales de columna.
Paciente N
HDL ( = x )
xx
( x x )
81
35
1225
37
-9
81
35
- 11
121
64
18
324
46
37
-9
81
45
-1
43
-3
21
- 25
625
10
51
25
TOTALES
460
2492
Ntese como la suma de las desviaciones de los datos con respecto a la media es igual a
0, por lo que no se puede utilizar en las medidas de dispersin. En tanto, los cuadrados de las
desviaciones son siempre positivos y no se cancelan, permitiendo el clculo de la varianza. La
varianza, si bien es un indicador til de la dispersin de los datos, no resulta inmediatamente
interpretable por estar las desviaciones elevadas al cuadrado. Esto se subsana en el desvo
estndar mediante la extraccin de la raz cuadrada. Su valor tiene las unidades originales y
resulta rpida e intuitivamente interpretable: se ver ms adelante que en las llamadas distribuciones normales, un 95% de los datos suele encontrarse entre la media y dos desvos estndar, en este caso entre 46.0 ms/menos 2 16.6 o sea, entre 79.2 y 12.8 mg/dl. Comprubese
que en la tabla slo hay un dato fuera de estos lmites
[ 197 ]
[ 198 ]
mo ocurrir para cualquiera de las otras cinco caras. En este caso, y siempre que nos conste que
el dado es normal, no consideraramos necesario hacer una prueba experimental para determinar las probabilidades de cada una de las caras. Sin embargo, en la prctica, para obtener una
aproximacin a 0.166 suficientemente exacta, se debera realizar una gran cantidad de tiradas,
pues de hacerlo unas pocas veces, las desviaciones por azar podran ser importantes y el resultado estar muy lejos del deducido en forma terica. Este hecho exige que los universos donde se
estiman probabilidades permitan muestreos suficientemente grandes (ntese que en el caso de
un dado o una moneda, el tamao del universo no est dado por el nmero de caras sino por el
hecho de que las tiradas posibles son infinitas). Las probabilidades definidas por modelos como
los de la tirada de monedas o dados, se conocen como clsicas o a priori, en contraste con las
derivadas de frecuencias, denominadas frecuenciales o a posteriori. A pesar de su apariencia
slida, la probabilidad clsica o a priori no carece de dificultades tericas y esto, unido a las
limitaciones para su aplicacin a los problemas surgidos de situaciones reales, que en la gran
mayora de los casos deben abordarse a partir de muestras de universos slo parcialmente conocidos, hace que el modelo frecuencial o a posteriori sea de uso habitual y corriente.
3.2. La probabilidad de un suceso puede variar entre 0 y 1
Para cualquier experimento, el nmero de ocurrencias o apariciones de un suceso (n) no
puede ser mayor que el nmero total de casos evaluados (N), ni menor que cero. Como la
probabilidad se estima mediante la razn n / N, cuando n = N la probabilidad es 1, y cuando
n = 0, la probabilidad es 0. Cuando la probabilidad es 1, el hecho estudiado ocurre en todos
los casos y se tiene la certeza de que ocurrir siempre: es la probabilidad del suceso seguro.
Cuando la probabilidad es 0 tambin se tiene certeza, pero de que no ocurrir. Un suceso con
probabilidad 0 se dice que es un suceso imposible. La probabilidad de un suceso A se denota
habitualmente como P(A) o p(A), por lo cual la probabilidad antes mencionada de hallar individuos con hipertrofia ventricular izquierda (HVI) se expresar P(HVI) = 0.161. Es comn
expresar probabilidades con respecto a un valor de corte, y si quisiramos redondear datos
podramos decir que P es menor que 0.17 y expresarlo como P(HVI) < 0.17. Si se sobreentiende a qu variable nos estamos refiriendo, se puede ahorrar el parntesis y escribir P < 0.17.
3.3. Operaciones bsicas con probabilidades
Es importante tener en cuenta que la probabilidad de que ocurra un determinado acontecimiento (en general denominado suceso), sumada a la probabilidad de que no ocurra, debe
valer 1, ya que no hay otra forma en que las cosas puedan suceder. Si la probabilidad de que
ocurra un suceso A es igual a 0.30, la probabilidad de que no ocurra deber ser igual a 1
0.30 = 0.70. En smbolos: P(A) + P(no A) = 1.
Los sucesos (A) y (no A) se denominan complementarios. Conocida la probabilidad de
un suceso (A), la de su complementario ser: P(no A) = 1 P(A).
Es posible realizar clculos con las probabilidades para obtener nuevos conocimientos a
partir de sus relaciones lgicas, y si bien las operaciones ms sencillas con probabilidades no
son excesivamente complicadas, ciertos aspectos concernientes a su suma y multiplicacin
deben conocerse pues tienen significados importantes, tanto en lo terico como en lo prctico. En los prrafos siguientes se hace un resumen de los mismos.
[ 200 ]
(3.1)
Por lo tanto, para resolver la suma planteada en el ejemplo, falta conocer la probabilidad que tiene un individuo de presentar sobrepeso y dislipemia a la vez. Si suponemos como
ejercicio, que un 32% o 0.32 del total de la poblacin presentar conjuntamente sobrepeso y
dislipemia, la probabilidad buscada quedara estimada segn la ecuacin anterior, en 0.64 +
0.40 0.32 = 0.72 o 72%, que es un valor plausible para una probabilidad y es una estimacin de la probabilidad de elegir un individuo al azar y encontrar que presenta sobrepeso, o
dislipemia, o ambas condiciones a la vez.
Si A y B no pueden ocurrir juntos, P(A y B) = 0 y la frmula (3.1) queda reducida a:
P(A o B o [A y B]) = P(A) + P (B)
(3.2)
que fuera empleada en el ejemplo de la tirada de dados.
[ 201 ]
La regla para la suma de probabilidades se comprende mejor formalizando el tema y
mediante el uso de diagramas para representarlas. El conjunto de todos los sucesos posibles
en una situacin o experimento se llama espacio muestral del experimento. Por ejemplo, en
la tirada de un dado el espacio muestral es el conjunto [ 1, 2, 3, 4, 5, 6 ], y en la poblacin
considerada en el ejemplo anterior, cada uno de los individuos que la integran. Estos podrn
exhibir sobrepeso aislado, dislipemia aislada, sobrepeso y dislipemia, o bien no presentar
ninguna de las dos patologas, y cada individuo se considera un punto del espacio muestral.
Tambin se acepta que cada individuo o punto tiene las mismas probabilidades que los dems
de ser elegido u ocurrir, pasando a ser un suceso. Los espacios muestrales se pueden representar por reas dentro de una lnea cerrada que las delimita. Dichas figuras son conocidas
como diagramas de Venn y como se ver, son muy tiles para visualizar las relaciones lgicas
entre conjuntos en general y entre probabilidades en particular. Estas reas o figuras se utilizan para representar conjuntos de puntos muestrales de un experimento es decir, resultados
posibles del mismo. Los conjuntos de puntos de los espacios muestrales pueden contener subconjuntos formados por algunos de ellos, que a su vez pueden graficarse como otros tantos
diagramas de Venn contenidos en el conjunto principal. As, como se puede ver en la Figura
3.1, el conjunto de la poblacin a la que se refieren los datos del ejemplo, es el espacio muestral, y est representado por el rectngulo exterior, que a su vez contiene el subconjunto de
los individuos que presentan sobrepeso u obesidad ( S ) y el de los que son dislipmicos ( D ).
Algunos individuos presentan a la vez sobrepeso y dislipemia y forman el conjunto interseccin, que se simboliza (S D). Por ltimo, el conjunto de todos los individuos con sobrepeso,
o dislipemia, o sobrepeso y dislipemia, se denomina conjunto unin de S y D, y se simboliza
(S U D) (Fig. 3.1). Los puntos que quedan fuera del conjunto unin, son los que completan
el espacio muestral y como se deducir, est integrado por los individuos que no presentan
sobrepeso ni dislipemia. Debe entenderse que estos conjuntos representan a la vez las clases
de individuos, y sus respectivas probabilidades.
La suma de probabilidades, que se expresa como S, o bien D, o bien ambos calcula
las probabilidades del conjunto unin (S U D). De la inspeccin de la Fig. 3.1 surge que para
hallar la probabilidad de un suceso de ese conjunto, se debern sumar las probabilidades de S
y las de D, pero al hacer esto se tomarn dos veces las probabilidades del suceso interseccin
(S D) que resulta de la superposicin de S y D (grisado oscuro en la Figura). Por lo tanto hay
que proceder a restarlas de la suma S + D, lo que da lugar directamente a la frmula 3.1.
[ 202 ]
Figura 3.1. El rectngulo claro exterior representa el espacio muestral formado por los individuos de la poblacin general. Los conjuntos D (dislipemia) y S (sobrepeso) presentan un
rea comn (ms oscura) de interseccin (S D). En tanto, el conjunto unin (S U D, sigla no
incluida en la figura) corresponde a toda el rea grisada, y expresa solamente S + solamente
D + (S y D a la vez), lo que es igual a P(S) + P(D) P(S D).
y en forma general:
P (A y B) = P (A) (B | A)
(3.3)
Volviendo al ejemplo anterior, para conocer la probabilidad de la presencia simultnea de
sobrepeso y dislipemia en cualquier individuo de la poblacin, deber conocerse la probabilidad condicional de una de esas patologas con respecto a la otra, por ejemplo, la probabilidad
condicional de dislipemia en un individuo que presenta sobrepeso (dislipemia, dado sobrepeso). Si aceptamos para proseguir el ejemplo, que esta probabilidad condicional sea igual al
50% o 0.50, se tendr, reemplazando P(A) por P(sobrepeso) = 0.64 y P(B | A) por P(dislipemia
| sobrepeso) = 0.50, que la probabilidad de elegir un individuo al azar en la poblacin general y
que ste padezca simultneamente sobrepeso y dislipemia, resulta igual a 0.64 0.50 = 0.32 o
32%. Alrededor de un tercio de los individuos presentar las dos condiciones a la vez.
Cabe agregar que el mismo resultado debera esperarse si se empleara la probabilidad
de ser dislipmico y se multiplicara por la probabilidad condicional de presentar sobrepeso
siendo dislipmico, P(sobrepeso | dislipemia).
Debe notarse que en el ejemplo que se viene considerando, la probabilidad de dislipemia
en un sujeto con sobrepeso, P(dislipemia | sobrepeso), no es la misma que para un individuo
de la poblacin general en el que no se exija la condicin de sobrepeso. En cambio, en el caso
hipottico en que la probabilidad condicional P(dislipemia | sobrepeso) fuera la misma que
la probabilidad de dislipemia para la poblacin general, habra que aceptar que la presencia
de sobrepeso no afecta la probabilidad de dislipemia en la poblacin y podra escribirse
P(dislipemia / sobrepeso) = P(dislipemia). En general, cuando la presencia de una variable A
no afecta las probabilidades de otra variable B, puede escribirse
P (B | A) = P (B)
(3.4)
(3.5)
que es la frmula para la multiplicacin de probabilidades independientes.
Las tiradas de monedas son ejemplos tpicos en que los resultados en distintas tiradas
o con distintas monedas tienen probabilidades independientes, ya que no dependen de los
resultados obtenidos en tiradas anteriores o con las dems monedas. As, la probabilidad de
obtener dos caras con dos monedas a y b, es igual al producto de la probabilidad de obtener
cara con cada moneda, ya que el resultado con la moneda b no depender de lo ocurrido con
la moneda a, y se podr escribir P(cara con moneda b) = P(cara con moneda b | cara con
moneda a). Como la probabilidad de cara es igual a con cada moneda, la probabilidad de
dos caras ser igual a .
Como se ha visto, la multiplicacin de probabilidades calcula la probabilidad de la aparicin conjunta de dos sucesos A y B, que es la probabilidad del suceso interseccin A B,
respecto de todos los resultados posibles o sea, respecto del espacio muestral completo. Muchas
veces se tienen datos acerca de dos sucesos A y B sin conocerse la probabilidad de su aparicin
conjunta, y es posible conocer la probabilidad condicional del suceso A una vez que se ha pro[ 204 ]
Moneda A
cara
cara
cruz
cruz
Moneda B P (A B)
cara
0.5 0.5 = 0.25
cruz
0.5 0.5 = 0.25
cara
0.5 0.5 = 0.25
cruz
0.5 0.5 = 0.25
Las tiradas 2 y 3 proporcionan una cara y una cruz, aunque con las monedas invertidas.
De modo que la probabilidad de una cara y una cruz (no importando cul de las monedas sea
cara y cul cruz) es igual a la suma de las probabilidades de las tiradas 2 y 3, igual a 0.25 +
0.25 = 0.50. Una cara y una cruz ocurrirn en la mitad de las tiradas y hubiera sido un error
calcular la probabilidad como P(cara) P (cruz) = 0.5 0.5 = 0.25 porque tal estimacin corresponde a la tirada 2 y omite la tirada 3 es decir, no considera el espacio muestral completo.
Sin embargo, 0.25 es la probabilidad de dos caras, o de dos cruces, que no tienen ms que un
modo de ocurrir.
La segunda mencin se refiere a la dificultad general para asignar las probabilidades correctas a los distintos sucesos reales dada la variabilidad de las muestras y las poblaciones, de
los procedimientos de medicin y de las condiciones experimentales. Una vez que pequeos
errores se hayan introducido en las estimaciones, las diversas operaciones realizadas sobre
las mismas tendern a aumentarlos y por eso, aferrarse al significado numrico exacto de
los clculos con probabilidades puede llevar a conclusiones poco consistentes que deben ser
consideradas en forma crtica.
3.4. Probabilidades y Odds
Si se divide la probabilidad de ocurra un suceso A, por la probabilidad de que el mismo
suceso no ocurra, el resultado puede entenderse como las chances del suceso A contra el suceso no A. As, una enfermedad que tiene una probabilidad de estar presente igual al 75% o
0.75, tiene una probabilidad de no estar presente igual al 25% o 0.25 y por lo tanto, sus chances son iguales a 0.75 / 0.25 = 3. Esto se puede entender como chances de 3 a 1 a favor de
[ 205 ]
(3.6)
(3.7)
Los odds pueden variar entre 0 (probabilidad de ocurrencia igual cero) hasta valores
ilimitadamente grandes cuando la probabilidad del suceso aumenta. As, un suceso con una
probabilidad de 0.95 tiene odds iguales a 0.95/0.05 = 19 y como se ve, no hay lmite superior
para el valor posible de los odds, cuyo rango posible se extiende entre cero e infinito. En cambio, no existen odds negativos.
Como se ve, el lenguaje de los odds es mucho menos intuitivo que el de las probabilidades y se aleja bastante de la experiencia diaria. Una probabilidad de enfermedad del 95%
es claramente imaginable mientras que no lo es tanto su expresin en odds, igual a 19 (que
debera entenderse como chances de 19 a 1). Porqu entonces su importancia en estadstica? Porque adems de expresar la probabilidad de un suceso en relacin a su complemento
(1 P), aparecen en el desarrollo terico de varios procedimientos y tcnicas, tpicamente en
la regresin logstica y en las estimaciones del riesgo relativo en los modelos epidemiolgicos
de tipo caso-control, mtodos que se hallan relacionados entre s y tienen extensos campos
de aplicaciones en medicina (ver Secciones 12 y 16).
[ 206 ]
4. Distribuciones de probabilidades
[ 207 ]
Figura 4.1. Probabilidad de obtener cero, una o dos caras tirando dos monedas.
En general, las variables aleatorias pueden ser discretas o continuas. En el caso de una
variable discreta, cada valor de la misma se corresponde con una probabilidad finita. El histograma de la figura 4.1 muestra la distribucin de probabilidades examinada en 3.3.2. Las
probabilidades de obtener cero, una o dos caras tirando dos monedas a la vez, son 0.25, 0.50
y 0.25 respectivamente. Su suma es igual a 1, lo que implica que no quedan otros resultados
posibles.
Ntese que las distribuciones de frecuencias descriptas en 2.3, resumen las frecuencias
con las que se han presentado los distintos valores de una variable medida durante un experimento, esto es, de una variable muestral. Si bien las frecuencias se relacionan con probabilidades y pueden servir para estimarlas, las distribuciones de frecuencia son objetos empricos
resultado de la recoleccin de datos. En tanto, las distribuciones de probabilidades resultan de
funciones matemticas que asignan probabilidades a los distintos valores que puede adoptar
una variable independiente, sin que sea un requisito la observacin de los datos. As, no ha sido
necesario efectuar tiradas de monedas para calcular la distribucin de probabilidades de la
Figura 4.1, que se obtuvo a partir de una funcin de probabilidad.
Las funciones probabilsticas o funciones de probabilidad asignan probabilidades a
cada valor x que pueda adoptar una variable aleatoria X, de modo que las probabilidades
resultan una funcin de los valores de la variable aleatoria y se expresan P(X = x) o ms
sencillamente, p(x). En el ejemplo de la tirada de dos monedas analizado en 3.3.2 e ilustrado
en la Figura 4.1, las probabilidades de obtener 0, 1 o 2 caras son funcin de estos valores y
se expresan como P(X = 0 caras) = 0.25, P(X = 1 cara) = 0.50 y P(X = 2 caras) = 0.25. Las
probabilidades son funcin de cada posible valor de la prueba, 0, 1 y 2 caras, y en este caso
se obtienen de la llamada funcin binomial, que se examinar en 4.4. En relacin con esto,
obsrvese que las probabilidades de tirar cero, una o dos caras, se han determinado en forma
analtica en funcin de los valores que puede adoptar la variable (nmero de caras), y no ha
sido necesario realizar experimentos de muestreo para conocerlas.
[ 208 ]
Anlogamente a lo que ocurre con las distribuciones de frecuencias (2.3), las funciones de probabilidad deben cumplir con el requisito de que la suma de todas las probabilidades sea igual a la probabilidad total, o sea 1. Esto tiene que cumplirse de un punto
de vista matemtico para que la funcin represente correctamente las probabilidades de
una variable aleatoria. En el histograma de la figura 4.1 se observa que las probabilidades para cero, una y dos caras son 0.25, 0.50 y 0.25 respectivamente, con lo que la suma
es igual a 1 (que es adems el rea del histograma, integrada por rectngulos con base
igual a 1 y altura igual a la respectiva probabilidad). En las representaciones grficas, las
funciones de probabilidad pueden corresponder a histogramas (funciones discretas con
un nmero finito de valores posibles para la variable aleatoria) o a reas delimitadas por
lneas curvas que expresan un cambio gradual y continuo de las probabilidades a medida
que la variable aleatoria toma sus infinitos valores posibles (funciones continuas, ver ms
adelante). En la Figura 4.2 se observa el histograma de una variable discreta y la curva
que resultara de proseguir indefinidamente la subdivisin de la variable independiente
(ver 4.6). En cualquier caso, el rea de estos histogramas o curvas de probabilidades
debe valer siempre 1, que es el valor de la probabilidad para todos los valores posibles de
la variable aleatoria.
Figura 4.2. Histograma de una distribucin discreta de probabilidades, y curva de la funcin
continua a la que tiende al proseguir indefinidamente la subdivisin de la variable aleatoria.
La probabilidad de una variable aleatoria de tomar valores comprendidos entre el extremo izquierdo de la curva de probabilidades y un valor xi arbitrario, es cada vez mayor a
medida que xi se corre hacia la derecha de la distribucin. Esta acumulacin de probabilidades puede representarse como una nueva funcin de x llamada funcin de distribucin
acumulativa o simplemente funcin de distribucin (ver 4.6.1).
Las distribuciones probabilsticas tienen importancia por su capacidad para describir
ajustadamente el comportamiento de distintos tipos de variables obtenidas de mediciones
[ 209 ]
(4.1)
donde expresa el proceso de sumar los productos de las i observaciones de x por sus respectivas probabilidades. Se ha mencionado antes que la probabilidad P depender del valor
que tome x, esto es, P es una funcin de x y puede escribirse P = f( x ), con lo cual (4.1) toma
la forma:
E ( X ) = xi f(xi)
(4.2)
La esperanza matemtica corresponde al valor medio de la x para todos sus valores
posibles y es la media de la correspondiente distribucin de probabilidades. En el caso de
variables continuas, que implican infinitos valores posibles para la variable x, el clculo de la
esperanza matemtica requiere reemplazar la sumatoria por las integrales de las funciones de
probabilidad f( xi ), con lo cual la expresin (4.2) toma la forma
E ( X ) = x f(x) d(x)
(4.3)
E(nmero de caras) = (0 caras) P( 0 caras) + (1 cara) P(1 cara) + (2 caras) P(2 caras)
= 0 0.25 + 1 0.50 + 2 0.25 = 1
Ntese que para cada posible resultado, su probabilidad depende o es funcin del nmero de caras de que se trate, y en este caso est determinada por la llamada funcin binomial,
que se examinar con algn detalle ms adelante. As, la probabilidad de 2 caras o cero caras
es la misma e igual a 0.25, mientras que la probabilidad de 1 cara corresponde a la suma de
la probabilidad de cara en la moneda A ms la probabilidad de cara en la moneda B, igual a
0.25 + 0.25 con lo que P(1 cara, cualquier moneda) es igual a 0.50. Ntese tambin que las
probabilidades, que se determinan en funcin de los valores que puede adoptar la variable
aleatoria, se originan en funciones de probabilidad tericas y no requieren estar avaladas por
experimentos. Puede observarse asimismo la correspondencia de la esperanza matemtica
con la media de un experimento ideal donde, en cuatro tiradas de dos monedas cada una, se
dieran las cuatro posibles combinaciones expuestas en 3.3.2: la suma del nmero de caras
en cada tirada sera igual a 2 + 1+ 1+ 0 = 4, lo que dividido por 4 tiradas es igual a 1, resultado idntico al de la esperanza matemtica. La diferencia entre la esperanza matemtica
y la media muestral reside en que sta tiene carcter experimental y oscila alrededor de un
valor central, siendo muy difcil que an con un nmero grande de experiencias (tiradas de
monedas) la media muestral tenga exactamente el valor de la media terica de la poblacin,
mientras que la esperanza matemtica de la variable aleatoria X es por definicin la media de
dicha variable, dada por la funcin de probabilidades correspondiente.
La varianza de una variable aleatoria X se define como la esperanza matemtica de la
diferencia entre las x y , elevada al cuadrado: E(x ), y tiene un significado anlogo al de
la varianza de una muestra, vista en 2.5. Para obtenerla, cada valor del trmino (xi ) se
multiplica por su probabilidad Pi en forma anloga a lo visto para la esperanza de la X. La
varianza se simboliza con la letra griega elevada al cuadrado ( ) y su expresin es:
= E (x ) = (xi ) Pi
(4.4)
Su raz cuadrada, , es el desvo estndar de la distribucin:
=
(4.5)
tos empricos que estn bien descriptos por los estadsticos muestrales ya mencionados. El
motivo es que las llamadas funciones probabilsticas demuestran ajustarse notablemente bien
al comportamiento de los datos muestrales y por otra parte, a partir de sus propiedades,
posibilitan la elaboracin terica de predicciones e inferencias que no podran obtenerse
sin ellas. Por ejemplo, se ver ms adelante que en una distribucin normal o gaussiana, las
observaciones que se hallan comprendidas entre la media y dos desvos estndar a cada lado
de la misma, constituyen casi exactamente el 95% de los casos. Por ende, la probabilidad de
encontrar observaciones o casos por fuera de la media 2 desvos estndar, es de slo el 5%.
Estas propiedades son caractersticas de la funcin normal y no se podran deducir sencillamente del examen directo de las muestras.
Conviene por lo dems tener en cuenta que para que las funciones de probabilidad resulten tiles en el estudio de poblaciones, el comportamiento de las muestras debe estar adecuadamente descrito por aqullas funciones tericas. En otras palabras, deben emplearse las
funciones de probabilidad que mejor se ajusten a la distribucin de los elementos muestrales
en cuestin. Cul de las distintas posibles funciones probabilsticas es la adecuada para cada
clase de muestra depende en gran parte del tipo de datos y de sus fuentes de origen: puede
tratarse de variables discretas o continuas, muestras grandes o pequeas, sucesos con alta
o baja probabilidad de aparicin, etc. La experiencia puede ayudar a determinar cul es el
tipo de distribucin ms adecuado, y a veces, podr ser necesario realizar distintas pruebas
exploratorias como evaluar la normalidad de los datos y eventualmente ensayar su transformacin para aproximarlos a la normalidad si este no fuera el caso y el tratamiento estadstico
lo hiciera necesario. Algunos de estos aspectos se irn mencionando a lo largo del texto (ver
4.8). En lo que sigue, se examinarn brevemente las principales distribuciones tericas de
probabilidad.
4.4. Distribucin Binomial
Como en el caso de las monedas visto en el punto anterior, existen variables que tienen
slo dos estados o resultados posibles, y en cada oportunidad presentan uno de los dos (variables dicotmicas o binarias). En el caso de las monedas los resultados posibles son cara
y cruz, que en general pueden denominarse A y B, de modo que la aparicin del suceso A
significa que no se ha producido B. Si se realiza una serie de experiencias con tales variables,
como puede ser una serie de tiradas con una moneda, surge la pregunta por la probabilidad
de obtener un nmero determinado de sucesos A (o simplemente, sucesos, como podran considerarse las caras) en un nmero n de experiencias o tiradas. En cada experiencia se puede
obtener cara o cruz, A o B, con lo que se entiende que el nmero de posibles caras o sucesos
en n pruebas podr variar entre 0 y n. Ese nmero de sucesos en n experiencias, se puede
denominar r. Resulta intuitiva la idea de que si se tira diez veces una moneda (n = 10) el valor
ms probable para el nmero de caras que se obtengan ser 5 (r = 5), y esto se debe a que en
este caso se tiene por cierto que las probabilidades de cara son iguales a las de no cara, independientemente de cul pudiera ser el comportamiento de una moneda real. En este mismo
caso, otros valores de r pueden ser esperados con menor frecuencia a medida que se apartan
del valor central 5. La distribucin que describe las probabilidades de obtener un nmero
r de sucesos en funcin de n y de la probabilidad de la variable binaria de que se trate, se
[ 212 ]
(4.6)
(4.7)
Como ejemplo prctico para afirmar los conceptos anteriores considrese el caso sencillo de calcular la probabilidad de obtener 2 caras (no menos ni ms) tirando una moneda 4
veces: hemos visto que 2 caras en cuatro tiradas pueden disponerse de 6 formas diferentes,
dadas por 4C 2 = 6, y que la probabilidad de cualquiera de estas seis disposiciones est dada
(suponiendo la probabilidad de cara = = 0.50), por:
r ( 1 ) n r = 0.50 ( 1 0.50 ) 4 2
= 0.25 0.25 = 0.0625
Por lo tanto, de acuerdo a (4.7), la probabilidad buscada es 6 0.0625 = 0.375.
Calculando por el mismo procedimiento las probabilidades para cada resultado posible, desde 0 a 4 caras, se tienen todos los datos de la distribucin binomial para n = 4 y =
0.50. Teniendo en cuenta que los coeficientes binomiales son 4 C 0 = 1, 4 C1 = 4, 4 C 2 = 6, 4 C 3
= 4 y 4 C 4 = 1, se puede comprobar fcilmente utilizando 4.7, que las respectivas probabilidades son:
P(0 cara) = 0.0625, P(1 cara) = 0.25, P(2 caras) = 0.375, P(3 caras) = 0.25 y P(4 caras)
= 0.0625, siendo su suma igual a 1 como corresponde a una funcin de probabilidades. El
correspondiente histograma se muestra en figura 4.3
[ 214 ]
(4.8)
donde p denota la proporcin de sucesos en n ensayos. Este cociente estima la proporcin de sucesos en el universo, que se suele representar con la letra y es la esperanza matemtica de p:
E ( p ) =
(4.9)
y tambin puede interpretarse como la probabilidad del suceso A. Se demuestra que la varianza de p es
Var ( p ) = (1 ) / n
(4.10)
(4.11)
4.3, donde se ha trazado la curva normal sobre el histograma que representa la distribucin
binomial para n = 4 y = 0.5. Con = 0.5 la distribucin es simtrica, y a pesar del exiguo
nmero de ensayos, la correspondencia entre ambas grficas es ya muy clara. Con algunas
decenas de ensayos ya suele ser suficientemente buena como para poder emplearse las propiedades de la funcin normal en aplicaciones de inferencia estadstica. La binomial es simtrica
cuando es igual a 0.5, y se torna asimtrica a medida que se aproxima a los extremos, 0 o
1. La simetra con cercano a 0.5 contribuye a que la funcin se aproxime ms rpidamente
a la normal al crecer n.
4.5. La Distribucin de Poisson
Una distribucin de probabilidades importante, aplicable a variables dicotmicas o binarias, es la distribucin de Poisson. Por razones de espacio slo se mencionarn sus propiedades y aplicaciones ms relevantes. Como todas las distribuciones de probabilidades, se trata
de un modelo matemtico que expresa el comportamiento de cierto tipo de variables, en este
caso el de sucesos que ocurren espordicamente en un continuo de espacio o tiempo, y con
una probabilidad relativamente pequea. Son ejemplos tpicos de variables que siguen esta
distribucin el nmero de bacterias, clulas u otros elementos formes esparcidos por campo
de microscopio o volumen de lquido (continuos de espacio) o la incidencia de enfermedades
relativamente poco frecuentes en perodos determinados (continuo de tiempo).
Aparte de las aplicaciones mencionadas, la distribucin de Poisson resulta una buena
aproximacin a la distribucin binomial cuando p es pequea y n grande, situaciones en las
que puede reemplazarla en el clculo.
4.6. Distribuciones continuas. Generalidades
Como ya se anticipara en 4.1, en las funciones de variables continuas las probabilidades
se distribuyen a lo largo de un conjunto infinito de posibles valores de la variable independiente, que pueden entenderse como el lmite al que tenderan los intervalos de una variable
discreta si se subdividieran indefinidamente hasta aproximarse a cero. En la Figura 4.2 se
observa un histograma que representa la distribucin de probabilidades de una variable discreta, y el resultado que se obtendra de ser posible continuar indefinidamente con la subdivisin de la variable hasta que la base de cada rectngulo tienda a convertirse en un punto. En
ese momento, el perfil del histograma tender a mostrar un contorno donde la lnea quebrada
formada por el techo de cada rectngulo ser reemplazada por una lnea curva (geomtricamente, sin discontinuidades). Se obtiene as una distribucin continua de probabilidades.
Estas distribuciones son generadas por distintas funciones de la variable aleatoria X, siendo
la ms importante la llamada normal o de Gauss, que se referir en el siguiente apartado.
Como se ha visto, en las distribuciones discretas hay proporcionalidad entre las reas de
los rectngulos de los histogramas y las probabilidades que representan, con un rea total
que debe ser igual a la unidad y corresponde a la sumatoria de todas las probabilidades de la
variable. Tambin se ha dicho que esto es un requisito para cualquier funcin probabilstica.
En las distribuciones continuas surge una dificultad para sumar las probabilidades en forma
convencional, ya que las bases de los rectngulos tienden a cero convirtindose en puntos correspondientes a los infinitos valores que puede tomar la variable aleatoria, y los rectngulos
[ 216 ]
se han transformado en infinitas lneas verticales adyacentes, sin un rea individual medible, ya que tienen base cero. Entonces, la probabilidad de un determinado valor puntual
resulta igual a cero, lo que contradice la intuicin, que espera una probabilidad para cada
posible resultado. Sin embargo, el equivalente de la suma aritmtica de infinitos valores de
probabilidad cada uno tendiendo a cero, se logra en forma analtica mediante la integracin
de la funcin de probabilidad f( x ) sobre el rango de las x. En esta integracin, el rea total
de la funcin de probabilidad, tambin conocida como funcin de densidad de probabilidad
y representada por una lnea curva, debe hacerse corresponder a 1, que se vio que es un requisito para este tipo de funciones, sean continuas o discretas. De esta forma, la integral de
f( x ) corresponde a la sumatoria de las probabilidades puntuales de la variable aleatoria X
y tambin, al rea bajo la curva de la funcin de probabilidad. El rea bajo esta curva puede
ser entonces dividida por lneas verticales (ordenadas) correspondientes a diversos valores
de la variable X con un resultado importante: el rea entre dos ordenadas representa la
probabilidad de que la variable tome valores comprendidos entre ellas (Fig. 4.4). En otras
palabras, aunque la probabilidad en un punto dado de una distribucin continua no es calculable, la probabilidad de x puede determinarse para cualquier intervalo entre dos valores de
la variable, estn prximos o separados, y est dada por la fraccin del rea bajo la curva de
la funcin de probabilidad, comprendida entre ambos valores. As, en la Figura 4.4, el rea
grisada correspondiente a los valores 1 y 2 de la variable aleatoria es igual al 14% del rea
bajo la curva, lo que expresa que la probabilidad de que la variable aleatoria X adopte valores
comprendidos entre 1 y 2, es igual a 0.14. Esto puede expresarse como P(1 < x < 2 ) = 0.14.
Figura 4.4. Distribucin normal. En el eje x los desvos estndar alrededor de la media. La
probabilidad de que la variable x tome valores comprendidos entre dos ordenadas cualesquiera puede determinarse con exactitud mediante el clculo. As, para el rea grisada, entre x =
1 y x = 2 desvos estndar, P = 0.14.
[ 217 ]
Figura 4.5. Curvas de densidad f(x) y de distribucin F(x) de probabilidades, correspondientes a la funcin normal. La probabilidad de obtener x entre 1 y 2 desvos estndar a un lado
de la media, est dada por el rea de f(x) en ese intervalo y tambin por el crecimiento de la
integral F(x) entre los mismos puntos.
[ 218 ]
[ 219 ]
(4.12)
colas de la distribucin, por lo cual la probabilidad de la x de ser mayor que el valor de la media
ms 2 desvos estndar ser aproximadamente del 2.5%, y la probabilidad de ser menor que
la media menos 2 desvos estndar, el 2.5% restante (vase Fig. 6.2). Estos valores son muy
aproximados, siendo el valor de z por fuera del cual queda exactamente el 5% de los casos,
igual a 1.96. Este nmero aparece frecuentemente en el desarrollo de pruebas de significacin
estadstica, aunque para el clculo aproximado y rpido puede usarse z = 2.
En las Figuras 4.4 y 4.5 se ha visto que el rea comprendida entre 1 y 2 desvos estndar
a partir de la media es igual al 14% del rea total de la curva, y por lo tanto tiene asociada
una probabilidad P = 0.14. Existen muchas formas de obtener este resultado a partir de las
distintas tablas de la distribucin normal. Por ejemplo, se puede consultar el valor de la
probabilidad entre la media y 2 desvos estndar y restarle la probabilidad entre la media
y 1 desvo estndar. Tambin se puede buscar la probabilidad de la variable x para valores
comprendidos entre dos desvos estndar alrededor de la media, y restarle la probabilidad
para valores comprendidos entre 1 desvo estndar. Estas son 0.95 y 0.68, y su diferencia,
igual a 0.27, da la probabilidad de x entre 2 y 1 desvos estndar y entre +1 y +2 desvos
estndar. Por lo tanto, la probabilidad de x comprendida entre +1 y +2 desvos estndar ser
igual a la mitad, o sea 0.135 o 0.14, con diferencias debidas al redondeo. En la prctica esto
significa que en una muestra normal, el 14% de las observaciones se hallarn a una distancia
de la media comprendida entre 1 y 2 desvos estndar (y la misma probabilidad existir para
la misma desviacin a la izquierda de la media, ya que la distribucin es simtrica).
Tabla 4.1. Valores de la variable estandarizada z y probabilidad de adoptar valores ms
extremos en cualquier direccin (dos colas).
z = ( x ) /
0.000
1.00
1.000
0.317
1.960
0.05
2.000
0.0455
2.576
0.01
3.000
0.0027
4.8. Transformaciones
En lo que sigue se har una sucinta referencia al tema de las transformaciones en estadstica, que bsicamente constituye un cambio de la escala en la cual se expresan las variables. Su inclusin en este punto se debe a que existen numerosas variables muestrales cuyas
distribuciones se alejan de la normal, y que se pueden normalizar mediante algn tipo de
transformacin, como por ejemplo, tomando los logaritmos de los valores originales. En esta
eventualidad se hablar de una transformacin logartmica de los datos. Como se ha mencionado, la importancia de obtener distribuciones normales es hacerlas accesibles a los mtodos
de anlisis que requieren la distribucin normal de los datos y pueden originar resultados
distorsionados o errneos si se aplican a muestras cuyas distribuciones se alejan en mayor o
menor grado de la normalidad.
[ 221 ]
Una modalidad frecuente de alejamiento de la normalidad consiste en la asimetra de la
distribucin, lo que ocurre cuando las colas no son similares, esto es, cuando una de ellas
presenta una mayor proporcin de observaciones alejadas de la media, con lo cual aparece
ms extensa o larga que la otra. Cuando la cola ms alargada es la izquierda se habla de
asimetra negativa, y cuando lo es la cola derecha, de asimetra positiva. Esta ltima es con
mucho la ms frecuente en las muestras biolgicas en general (Figura 4.6, A). La asimetra
derecha suele corregirse mediante la transformacin logartmica de los datos, es decir, tomando su logaritmo, habitualmente el logaritmo natural (con base en el nmero e = 2.7182),
aunque los resultados no se alteran con el cambio de base. Resulta ms o menos intuitivo,
que como los logaritmos de los nmeros mayores que 1 crecen con menor rapidez que stos,
los incrementos derechos ms extremos que experimentan los datos en las distribuciones con
asimetra derecha, tendern a ser contrabalanceados al tomar logaritmos. En la Figura 4.6
se observa la distribucin de la masa ventricular izquierda en 205 adultos sanos (datos de
Rodrguez y col, 2004), que exhibe ligera asimetra derecha, y su normalizacin mediante el
empleo del logaritmo de la misma.
Figura 4.6. A: Distribucin de frecuencias de la masa ventricular izquierda en gramos, en
205 individuos normales. Se observa ligera asimetra derecha. B: distribucin del logaritmo
natural de la masa ventricular. La distribucin se ha normalizado. En cada histograma se ha
superpuesto la curva normal.
La asimetra derecha tambin tiende a corregirse tomando la raz cuadrada de los datos o bien su inversa. La primera de estas transformaciones es algo menos fuerte, y ltima
es ms fuerte, que la transformacin logartmica. Cul de las tres emplear, es una cuestin
prctica que debe decidirse para cada caso en particular. Si bien es posible calcular el grado
de asimetra a partir de los datos muestrales, un mtodo sencillo y rpido para evaluarla es la
inspeccin visual de los histogramas de frecuencias tal como se muestran en la Figura 4.6. En
la misma puede verse que la transformacin logartmica tiende a producir un ligero exceso en
la correccin, con una leve asimetra izquierda. Una forma de comprobar que la asimetra ha
sido eliminada es evaluar la normalidad de la distribucin resultante, y para hacerlo existen
numerosos mtodos, entre ellos los de Kolmogorov-Smirnov y de Shapiro-Wilk, disponibles
en los paquetes estadsticos corrientes y de sencilla implementacin en ese entorno. En cuanto
[ 222 ]
[ 223 ]
[ 225 ]
en los prrafos siguientes. De modo que, si en las secciones precedentes se ha hecho referencia
a la varianza y el desvo estndar de los individuos en las muestras, en lo que sigue se incorpora el concepto de variabilidad de las medias.
5.3. Esperanza matemtica, varianza y desvo estndar de la media muestral
La media universal est estimada por la media muestral x, de modo que el valor ms
aproximado que se puede adjudicar a es x , aunque debido a las variaciones aleatorias
del muestreo, raramente una media muestral proporcionar el valor exacto de la media del
universo (que por otra parte no suele ser conocido). Con todo, la media muestral x es un
estimador insesgado de la media universal , lo cual significa que obteniendo muestras y
promediando los valores de sus medias, el resultado tender a aproximarse cada vez ms a
, oscilando a su alrededor cada vez ms estrechamente, a medida que el nmero de medias
muestrales promediadas aumenta. Esto equivale a decir que la esperanza matemtica de la
media muestral es la media universal o de poblacin:
E (x) =
(5.1)
Conociendo el grado variabilidad de x alrededor de , una gran cantidad de procedimientos de inferencia estadstica se hacen posibles, y se demuestra que la varianza de la
media muestral es igual a la varianza poblacional dividida por el nmero n de elementos
que forman la muestra:
var (x) = / n
(5.2)
Esta relacin expresa que cuanto mayor es el tamao de la muestra ( n ) menor es la
varianza de la media muestral. As, duplicando el nmero de elementos de la muestra, la
varianza de la media se reduce a la mitad. Se hace evidente que al reducirse la varianza de
las medias muestrales, stas tendern a oscilar cada vez ms prximas al centro de la distribucin . Tambin es evidente que las medias muestrales x, que resultan de promediar dos o
ms x, tendrn siempre una varianza menor que la variable original x de la que proceden (Fig.
5.1)
El desvo estndar de la media muestral es, por definicin, igual a la raz cuadrada de la
varianza y se conoce tambin como error estndar de la media, designndose como ES (x) de
modo que:
Desvo estndar (x) = ES (x) = ( / n) = / n
(5.3)
El trmino error estndar tiene la ventaja de evitar confusiones con el desvo estndar
de la variable x, y es el desvo estndar de la media de las x o x. Por ser en esencia un desvo
estndar, el error estndar describe la dispersin de las medias muestrales alrededor del centro
de la distribucin representado por la media universal . Resulta evidente que el incremento del
nmero de casos de una muestra, al reducir la varianza de la media muestral x, reduce tambin
la magnitud del error estndar, de modo que ambos estimadores de la dispersin de x pueden
[ 226 ]
hacerse ms pequeos con slo aumentar el nmero de casos de la muestra. En las prximas
secciones se ver que estos hechos son fundamentales en inferencia estadstica, para la deteccin de diferencias significativas en situaciones donde hay involucradas medias muestrales.
Figura 5.1. Dispersin de los individuos y de las medias de muestras de 9 individuos, alrededor de la media de poblacin . La campana amplia representa la distribucin de los individuos y la campana angosta la distribucin de las medias.
(5.4)
y que la varianza de dicha diferencia es igual a la suma de las respectivas varianzas muestrales:
(5.5)
siendo el desvo estndar igual a la raz cuadrada de la varianza, que por apreciaciones anlogas a las ya vistas en el prrafo anterior, se designa como error estndar de la diferencia:
ES (x1 x2) = (1 / n1) + (2 / n 2)
(5.6)
Otro dato importante es que, si las medias x 1 y x 2 tienen distribucin normal, su diferencia tambin la tiene. La utilidad de estos resultados se har ms evidente en las secciones
siguientes.
Anlogos resultados se aplican a las diferencias entre proporciones. Siendo p1 la proporcin de individuos que presentan una caracterstica determinada en una muestra de tamao
n1 extrada de un universo donde dicha proporcin es 1, y p2 la proporcin que presenta esa
[ 228 ]
misma caracterstica en una muestra de tamao n2 proveniente de un universo donde la proporcin es 2 , se demuestra que:
E (p1 p2) = 1 2
y
var (p1 p2) = [1 (1 1) / n1] + [2 (1 2) / n 2]
(5.7)
(5.8)
donde se ve que la varianza de la diferencia de proporciones (p1 p2) es igual a la suma de las
varianzas de cada grupo (4.4).
Se ha visto cmo una diferencia entre medias o proporciones muestrales puede manejarse
como una nueva variable, con una varianza que es igual a la suma de las varianzas de cada
variable. Esto encuentra aplicacin en las comparaciones entre muestras de las que se ocupa
la inferencia estadstica. Cabe agregar que los resultados vistos ms arriba para la diferencia
entre dos medias o proporciones muestrales, se aplican por igual a la suma, de modo que
tanto la suma como la diferencia de medias se distribuyen con una varianza que es la suma
de las varianzas originales de las muestras. Se ha subrayado el caso de las diferencias por ser
el ms empleado en los problemas de inferencia estadstica. Un requisito que debe cumplirse
para que la varianza estimada sea vlida, es que las muestras sean independientes, o sea
que no exista correlacin entre las muestras (seccin 9), pues en este caso la varianza total
se reduce y, lo que es importante, existen mtodos ptimos para aprovechar esta reduccin
de la variabilidad de la diferencia de medias cuando se trata de comparaciones y pruebas de
hiptesis entre datos correlacionados (seccin 7).
[ 229 ]
6. Inferencia estadstica
6.1. Generalidades.
La inferencia estadstica es el conjunto de procedimientos por el cual la informacin
contenida en las muestras se utiliza para hacer estimaciones relativas a los universos de los
que proceden. En cierto sentido, la informacin de las muestras se hace extensiva a los universos. Este proceso de generalizacin tiene sus fundamentos, procedimientos y limitaciones.
Por ejemplo, se demuestra que la media muestral es la mejor aproximacin a la media del
universo, y que la varianza muestral, provistas ciertas restricciones, es la mejor aproximacin
a la varianza del universo. Si bien el pasaje desde la informacin provista por las muestras hacia las estimaciones acerca de los universos implica cierta prdida de exactitud, el margen de
error de las estimaciones realizadas s puede calcularse exactamente. Por ejemplo, si bien al
estimar la media de un universo mediante la media de una muestra, la diferencia exacta entre
ambas no se puede llegar a conocer con exactitud, la probabilidad de que la media universal
se halle comprendida dentro de determinados lmites alrededor de la media muestral puede
ser calculada con precisin, y ste es uno de los aspectos ms caractersticos de la inferencia
estadstica.
En general, la inferencia estadstica se ocupa de dos tipos de aplicaciones: la estimacin
de parmetros u otras caractersticas de las distribuciones de las variables en los universos de
los que proceden las muestras, y la verificacin de hiptesis acerca de dichos universos. En
ambos casos la informacin es proporcionada por las muestras y la direccin de la inferencia
estadstica es de la muestra hacia el universo, posibilitando estimaciones y comparaciones
que de otra forma exigiran la medicin de todos los individuos del mismo. En lo que sigue
se examinarn algunos temas de inferencia estadstica con particular referencia a la distribucin normal.
6.2. Estimacin de parmetros de poblaciones. Estimaciones puntuales, intervalos
y lmites de confianza
Un ejemplo que ilustra la prctica de estimaciones mediante inferencia estadstica consiste en obtener informacin acerca de la media del universo () a partir de una media
muestral x de tamao n, conociendo el desvo estndar del universo (). En principio, la
propia media muestral x es la mejor estimacin de (es un estimador insesgado), y si bien
es improbable que coincidan exactamente, se espera que las probabilidades de x de hallarse
[ 230 ]
cerca de sean mayores que las de hallarse lejos. Este tipo de estimacin mediante un nmero que se espera se aproxime al parmetro estimado, se denomina estimacin puntual
(point estimate). Prosiguiendo, se puede desear tener una idea del grado de exactitud de la
estimacin puntual llevada a cabo por la media muestral x . Esto puede lograrse calculando
un intervalo alrededor de x , en el cual exista una probabilidad definida, digamos del 95%
o 0.95, de encontrar la media universal . El procedimiento tiene en cuenta que tomando
muestras de una poblacin normalmente distribuida, el 95% de las medias muestrales
x estar comprendido en el intervalo entre +1.96 y 1.96 errores estndar alrededor de la
media de poblacin , lo que equivale a decir que una muestra tomada al azar tiene el 95%
de probabilidades de contener la media en el intervalo dado por x 1.96 errores estndar
(ntese que el error estndar es el nombre del desvo estndar de x , igual a / n, [5.3]).
Por lo tanto, la diferencia entre x y estar en el 95% de los casos comprendida entre +1.96
y 1.96 errores estndar. En smbolos:
1.96 ( / n) < ( x ) < 1.96 ( / n)
(6.1)
con probabilidad igual a 0.95. Si se resta x de cada trmino y se reordenan las desigualdades,
se obtiene:
x 1.96 ( / n) < < x + 1.96 ( / n)
(6.2)
lo que expresa que la media del universo se hallar con probabilidad igual a 0.95, en el intervalo comprendido entre la media muestral x y 1.96 veces el error estndar a cada lado (prcticamente 2 veces el desvo estndar a cada lado de la media muestral). Dicho intervalo se
llama intervalo de confianza de la estimacin (en este caso, intervalo de confianza del 95%).
Sus lmites, esto es, x ms/menos 1.96 / n, son los lmites de confianza, en este caso, del
95%. En resumen, no conocemos con exactitud la media universal , pero la consideramos
muy prxima a la media muestral y su estimacin puntual es precisamente el valor de x, y
adems tenemos un nivel de confianza del 95% de que se halle dentro de los lmites de confianza calculados. La expresin nivel de confianza no debe entenderse como una expresin
de credulidad, sino en el sentido de que estamos seguros de que si repetimos la estimacin 100
veces, 95 veces estaremos en lo cierto y las restantes 5, equivocados. La ltima eventualidad
es el error de la estimacin y expresa la probabilidad de que la media universal se halle por
fuera de los lmites de confianza calculados, eventualidad que debe ser siempre tenida en
cuenta al analizar los resultados. Desde ya, el nivel y los correspondientes lmites de confianza pueden establecerse en otros valores y as, para P = 0.01 debe reemplazarse el valor 1.96
de la variable estandarizada z empleado ms arriba, por z = 2.58
Ejemplo 6.1
Supongamos que se conozca el desvo estndar de la glucemia en una determinada poblacin (esto es bastante difcil sin examinar la poblacin completa, aunque si est muy bien
estudiada podra llegar a tenerse una idea suficientemente aproximada, como se acepta en
este ejemplo). Supongamos que dicho desvo estndar es de 12 mg/dl. Si calculamos la media
[ 231 ]
muestral x en un grupo de 100 individuos de dicha poblacin y resulta ser de 88 mg/dl, cul
es el intervalo de confianza para la estimacin de la media de la poblacin, ?
En primer lugar, se acepta como el valor ms probable de la media de la poblacin, el de
la media muestral, 88 mg/dl. Esta es la estimacin puntual de . En cuanto al intervalo de
confianza, si aceptamos un nivel del 95% slo debemos reemplazar los datos en 6.2:
88 1.96 (12 / 100) < < 88 + 1.96 (12/ 100)
85.6 < < 90.4
de lo cual se puede inferir que debe estar comprendida entre 85.6 y 90.4 mg/dl, con un nivel
de confianza del 95%.
6.3. Hiptesis, evaluacin de hiptesis y pruebas de significacin estadstica.
Se ha visto cmo es posible depositar cierto nivel de confianza en que un determinado
intervalo obtenido a travs de una muestra contenga un parmetro universal como puede ser
la media de la poblacin. De acuerdo al ejemplo anterior y en forma muy general, debera
esperarse que las medias de otras muestras tomadas de la misma poblacin tendieran a caer
dentro del intervalo de confianza establecido para la media de la poblacin, y el hecho de
que esto no ocurriera debera alertar sobre la posibilidad de estar muestreando un universo
diferente. Este universo diferente podra corresponder, por ejemplo, al universo original modificado por una enfermedad o por un tratamiento, o bien a otro universo independiente sin
ninguna relacin con el primero. As, cuando se hallan diferencias entre dos o ms muestras,
es frecuente querer saber si pueden haberse dado por azar entre muestras que en realidad
pertenecen a un mismo universo, o bien, si las muestras pueden estar representando universos
diferentes. El chequeo de hiptesis y las llamadas pruebas o tests de significacin estadstica
se basan en estas ideas, que se examinan a continuacin.
Las hiptesis estadsticas son proposiciones, en general originadas en conocimientos previos sobre la materia, que se refieren a las caractersticas de las poblaciones involucradas en el
estudio. Estas proposiciones se evalan mediante el estudio de muestras extradas de dichas poblaciones. Una hiptesis puede ser, por ejemplo, el colesterol LDL difiere entre individuos con
y sin sndrome metablico o, el conjunto de individuos estudiados, con una glucemia media
de 102 mg/dl, pertenece a un universo distinto de otro cuya media es de 90 mg/dl. En el primer
caso se postula la existencia de dos universos, uno formado por los individuos con sndrome
metablico y otro por los individuos que no lo padecen. Ms exactamente, los universos estn
formados por las cifras de colesterol LDL en cada una de las dos condiciones. En el segundo
caso, la comparacin surge entre una media muestral, y la media de un universo terico. Para
evaluar una hiptesis, en general se necesitan muestras representativas de las poblaciones en
estudio. Como se ver, el mtodo consiste en comparar las medias u otros valores muestrales, y
a partir de ellos realizar las correspondientes inferencias acerca de las caractersticas de los respectivos universos. Si bien es muy frecuente estar interesado en las medias, las hiptesis pueden
referirse tambin a otros parmetros de las poblaciones, entre ellos las varianzas.
Como queda dicho, lo que se desea frecuentemente es establecer si existe una diferencia
entre los parmetros de dos universos: son diferentes las medias universales del colesterol
[ 232 ]
LDL en los individuos con y sin sndrome metablico, como lo sugieren las muestras? Las
glucemias del grupo en estudio, podran provenir de un universo con una determinada media? Las preguntas se refieren a los universos, mientras que los datos de los que se dispone
provienen de las muestras. El procedimiento corriente es establecer una hiptesis nula, segn
la cual no hay diferencias entre las poblaciones comparadas en lo que respecta a los parmetros que interesan: los niveles sricos de colesterol LDL seran los mismos en individuos con y
sin sndrome metablico, y la media de glucemia de la muestra pertenecera a una poblacin
con la misma media que la del universo con cuya media se desea comparar (y las diferencias
se deberan en cada caso, a las fluctuaciones del muestreo). Estas hiptesis nulas comnmente contraran las expectativas sugeridas por el examen de las muestras, pero sin embargo,
para afirmar que realmente existe una diferencia entre los parmetros de las poblaciones,
las hiptesis nulas deben ser puestas a prueba y deben poder ser rechazadas como altamente
improbables. Solo as ser lcito aceptar como verdadera la hiptesis alternativa, que es la que
suele presentar mayor inters por significar en general conocimientos nuevos acerca de las
poblaciones en estudio.
Los procedimientos por los cuales se evalan las hiptesis se denominan pruebas o tests
de significacin estadstica. Tales procedimientos consisten en el clculo a partir de los datos
muestrales, de ciertos valores o estadsticos (2.5), que como se ver, permiten determinar en
qu grado se acercan o se alejan los valores muestrales de aqullos esperados por hiptesis y,
en consecuencia, calcular la probabilidad de que una hiptesis sea verdadera. En el problema
del colesterol LDL, si fuera cierta la hiptesis nula que plantea que los niveles de colesterol
LDL son los mismos en individuos con y sin sndrome metablico, habra que esperar una
diferencia entre las medias muestrales, igual o muy prxima a cero. En este caso, la variable
que se examina en busca de informacin acerca de diferencias entre los universos con y sin
sndrome metablico es la diferencia entre las medias de cada una de las dos muestras: si
fuera muy distinta de cero se podra deducir que los respectivos universos deben diferir entre
s en lo que se refiere al colesterol LDL.
Para probar la hiptesis con variables normalmente distribuidas, la diferencia hallada
entre las medias de las dos muestras se divide por una estimacin de su error estndar ( 5.5)
para as poder apreciar la magnitud de su desviacin de cero en los trminos de una variable
estandarizada. En el siguiente apartado se vern algunos detalles del procedimiento.
Los estadsticos calculados a partir de las muestras, como las diferencias entre medias,
siguen funciones de probabilidad ya tabuladas y permiten estimar la probabilidad (P) de que
esas diferencias hayan ocurrido por azar de muestreo. Si esa probabilidad es grande, se acepta que las diferencias encontradas pueden haberse debido simplemente a las fluctuaciones
del muestreo y, en el caso del colesterol LDL habra que aceptar la hiptesis nula de medias
iguales y no habra motivo para suponer que el colesterol LDL de los individuos con sndrome metablico constituya un universo diferente al del colesterol LDL de los individuos sin
el sndrome. Si por el contrario, la probabilidad de una diferencia igual o mayor a la hallada
es muy baja, digamos P < 0.05, debemos aceptar que una diferencia tal, difcilmente pueda
provenir del azar al muestrear un mismo universo, y que las diferencias observadas en las
muestras representan diferencias reales existentes entre distintos universos. En el ejemplo,
habra que aceptar que individuos con y sin sndrome metablico deben tener niveles diferen[ 233 ]
tes de colesterol LDL. En esta eventualidad, la hiptesis nula sera rechazada y la hiptesis
alternativa, de distintos niveles de LDL, sera automticamente aceptada.
El valor de P, que se adopta antes de realizar la prueba de significacin, se denomina
nivel de significacin y el test, en caso de motivar el rechazo de la hiptesis nula, es declarado
estadsticamente significativo en el nivel elegido, por ejemplo P = 0.05. El rechazo de la hiptesis nula no significa la certeza absoluta de que el colesterol LDL difiera entre los grupos
comparados, ya que si se acepta que una diferencia como la observada se puede obtener por
azar el 5% de las veces muestreando un mismo universo o dos universos iguales respecto del
colesterol LDL, no hay garanta absoluta de que este no sea nuestro caso, pero es un riesgo
que se acepta correr, pues de lo contrario no hay inferencia posible. Queda un nivel de incertidumbre del 5% al rechazar la hiptesis nula, y es un hecho caracterstico de la inferencia
estadstica que la cuanta de esa incertidumbre pueda ser calculada con exactitud.
Las pruebas de significacin pueden realizarse en pares de muestras o en grupos de tres o
ms muestras a la vez. Por ejemplo, pueden compararse las medias de la presin arterial bajo
tres o ms tratamientos diferentes, originndose comparaciones mltiples. Estas se realizan
mediante procedimientos especiales que son extensiones de los mtodos utilizados para la
comparacin de pares de muestras y se esbozarn en la Seccin 10.
En lo que sigue se examinar con cierto detalle el procedimiento para comparar medias
muestrales cuando las variables son continuas y siguen la distribucin normal o de Gauss.
Esto ayudar a comprender mejor la forma en que se llevan a cabo los procedimientos de la
inferencia estadstica. Por su parte, los programas computarizados evitarn gran cantidad de
clculo numrico, ya que slo requieren la entrada de los datos muestrales y la eleccin entre
los procedimientos disponibles.
6.4. Comparaciones entre medias de variables con distribucin normal
Al comparar dos medias muestrales la hiptesis nula ms frecuente suele ser que las medias de los respectivos universos son iguales y que las diferencias observadas entre las medias
muestrales se han debido al azar. En general lo que se busca son diferencias entre los universos o poblaciones y como ya se ha dicho, la forma de poder afirmarlas es tener suficientes
argumentos como para rechazar la hiptesis nula, es decir, como para poder demostrar que
dicha hiptesis tiene muy bajas probabilidades de ser cierta. Denotando las medias de los
universos con 1 y 2 , si la hiptesis nula es verdadera entonces debe ser 1 2 = 0, y en este
caso la diferencia entre las medias de las muestras x 1 x 2 debera tambin ser o estar muy
prxima a cero. De modo que, cuanto mayor sea la diferencia hallada entre las medias de las
muestras, mayor ser la evidencia en contra de la hiptesis nula.
La clave para evaluar la diferencia encontrada entre las medias muestrales, es tomar en cuenta que esta diferencia es una nueva variable, cuya distribucin es normal si lo es la distribucin de
x 1 y x 2 , y cuyo valor esperado por hiptesis nula es cero (ver Fig. 6.1 y Ejemplo 6.2). De esta forma,
lo que se evala es el grado de alejamiento de la diferencia de medias hallada en las muestras,
x 1 x 2 , del valor 0 esperado por hiptesis nula. Formalmente, se compara la diferencia de medias
muestrales con la diferencia de medias universales de la hiptesis nula, esto es: (x 1 x 2) (1
2), y como el segundo trmino es igual a cero, la prueba de la hiptesis se reduce a evaluar si la
diferencia de medias hallada en las muestras se aleja significativamente de cero.
[ 234 ]
La diferencia x 1 x 2 tiene un desvo estndar, que al tratarse de medias se denomina
error estndar y se calcula como se vio en 5.5, ecuacin (5.6). Dividiendo la diferencia x 1
x 2 por su error estndar, dicha diferencia queda expresada en unidades de desvo estndar,
como una variable estandarizada z:
z = (x 1 x 2) / ( 1 / n1 ) + ( 2 / n 2 )
(6.3)
(6.4)
2. Hiptesis nula (H0): el colesterol LDL no es afectado por la presencia de sndrome metablico, con lo que las medias son las mismas para los respectivos universos y la diferencia
observada entre las medias muestrales se ha dado por azar. La hiptesis nula queda planteada como la igualdad de las medias universales:
H0: SM = C
por lo que su diferencia debe ser cero:
SM C = 0
Si no resulta posible rechazar esta hiptesis tampoco ser lcito aceptar que se ha encontrado una diferencia significativa entre los dos grupos en estudio.
3. Eleccin del nivel de significacin de la prueba. El valor de P a partir del cual se rechazar la hiptesis nula debe elegirse antes realizar la prueba de significacin. Habitualmente
se elige P = 0.05 o P = 0.01. Se optar por el primero.
4. Prueba de la hiptesis: el estadstico z y la obtencin de P. La pregunta que la prueba de
significacin debe contestar es: Cul sera la probabilidad de obtener una diferencia igual o
incluso mayor que la observada, si la hiptesis nula fuera verdadera, es decir, si no hubiera
diferencias entre las medias universales de individuos con y sin sndrome metablico?
Como se ha dicho, la diferencia entre las medias (x SM x C) es una nueva variable, que
en el presente par de muestras tiene un valor igual a 145.9 mg/dl 134.6 mg/dl = 11.3 mg/
dl. Si se repitiera el experimento de la toma de pares de muestras de los grupos en estudio, se
observara que las diferencias entre los pares de medias de cada experimento se distribuyen
en una campana normal alrededor de un valor central. Este valor representara el promedio
de las diferencias entre pares de medias en varias repeticiones del experimento. Esta media
de las diferencias, si fuera cierta la hiptesis nula, debera oscilar alrededor de cero. El valor
obtenido fue 11.3 mg/dl. En la Fig. 6.1 se observa la distribucin terica de las diferencias
entre pares de medias para los datos del ejemplo, con centro en el valor muestral 11.3 mg/
dl. Puede observarse que el valor 0 esperado por hiptesis nula queda hacia la cola izquierda
de la campana normal trazada en base a los datos muestrales, muy lejos de su centro de 11.3
mg/dl. Ser muy difcil seguir aceptando la hiptesis nula, pues la diferencia entre las medias
muestrales est muy lejos de cero y as, es demasiado grande como para admitir que podra
haberse dado por azar sin que los universos sean diferentes.
[ 236 ]
Figura 6.1. La diferencia entre dos medias muestrales es otra variable, que en el ejemplo 6.2
tiene un valor igual a 11.3 mg/dl. Este valor se compara con la hiptesis nula que propone que
la media de poblacin para la diferencia de medias vale cero.
La correspondiente prueba de significacin consiste en estimar si la distancia entre el
valor de la diferencia de medias obtenido en el experimento (x SM x C = 11.3 mg/dl ) y la
diferencia de medias esperada por hiptesis nula ( SM C = 0 mg/dl), es suficientemente
grande como para rechazar esta ltima. Siendo la diferencia (x SM x C) una variable normal,
hay que dividirla por su error estndar para expresarla en unidades de error estndar como
variable estandarizada z y as poder comprobar en tablas de la distribucin normal, si se
aleja o no significativamente del cero de la hiptesis nula. La variable z es el estadstico de
prueba. Su clculo se obtiene directamente de ( 6.4 ), reemplazando por los valores muestrales:
z = (x1 x2) / ( s1 / n1 ) + ( s2 / n 2 )
= (145.9 134.6) / ( 236 / 100 ) + ( 253 / 100 )
= 11.3 / 2.21 = 5.11
donde el numerador es la diferencia de las medias muestrales y el denominador estima el
error estndar de la diferencia de medias. Las varianzas muestrales (sSM = 236 y s C = 253)
se calculan directamente segn ( 2.4 ) y el nmero de casos, n SM y nC , es igual a 100 en ambas
muestras.
La probabilidad de encontrar valores de z iguales o mayores por azar de muestreo, se
obtiene directamente de tablas de la distribucin normal. En la tabla 4.1 se puede ver que
un desvo mayor de 3 se puede esperar por azar en menos de 3 casos por mil, de modo que
el desvo obtenido, que es mucho ms grande, implica probabilidades extraordinariamente
bajas de haber sido obtenido por azar muestreando universos con medias idnticas.
5. ltimo paso: aceptacin o rechazo de la hiptesis nula. En base a lo anterior corresponde el rechazo de la hiptesis nula por altamente improbable. Esto implica automticamente
aceptar la hiptesis alternativa, o sea, que las medias de los universos SM y C difieren sig[ 237 ]
(6.5)
Ejemplo 6.3. Comparacin de una media muestral con una media universal hipottica
En una muestra de 100 individuos se midi una glucemia media x = 102 mg/dl, siendo
el desvo estndar de la muestra s = 16 mg/dl. Puede afirmarse que el universo del que proviene la muestra tiene una media mayor que la de un universo terico cuya media es 0 = 90
mg/dl?
Para contestar afirmativamente se debe poder rechazar la hiptesis nula de que ambos
universos tienen la misma media, esto es, que x 0 = 0. La magnitud de la desviacin de 0 exhibida por la diferencia entre la media muestral y la media del universo hipottico, se evala
mediante el cociente de prueba (6.5). Reemplazando por los datos del problema se obtiene:
z = (102 90) / (16 / 100) = 7.5
Este resultado expresa que la diferencia entre la media muestral y la media terica con la
que compara, es igual a 7.5 errores estndar. En tablas de la distribucin normal se obtiene
para z = 7.5 una probabilidad muy inferior a 0.0001, lo que significa que una diferencia igual
o mayor que la observada es altamente improbable de ser obtenida de universos con la misma
o muestreando un mismo universo. En base a esto corresponde el rechazo de la hiptesis
nula y la aceptacin de la hiptesis alternativa, o sea, que el universo del cual procede la
muestra y el universo con el que se compar tienen medias que difieren significativamente.
El nivel de significacin de la prueba se puede expresar como P < 0.0001 (si bien P < 0.05
tambin es verdadera, P < 0.0001 es ms exacta).
[ 238 ]
De acuerdo a lo dicho, practicar una prueba a una cola puede ser una oportunidad para
producir una diferencia significativa donde el test a dos colas no la detect. Por este motivo,
la decisin de utilizar pruebas a una cola debe ser tomada antes de realizar el clculo de P,
y debe estar muy slidamente fundada, ya que es posible que rinda un exceso de resultados
significativos, por lo cual nunca debera utilizarse ante el fracaso de la prueba a dos colas.
Asimismo, la decisin de realizar una prueba a una cola nunca debe ser tomada luego de
examinar las muestras y ver cmo se disponen las medias. Por estas razones, el consenso es
que, salvo circunstancias muy especiales, siempre debera utilizarse la prueba a dos colas, an
[ 240 ]
cuando parezcan existir buenas razones para que cualquier diferencia slo pudiera darse en
un solo sentido, como en el ejemplo del placebo versus droga.
6.5.3. Formas de expresar el nivel de significacin
Se ha dicho que en medicina frecuentemente se acepta P = 0.05 como un nivel de significacin suficientemente convincente para rechazar una hiptesis nula. Ciertamente que si el
nivel de significacin de una prueba es mayor an, digamos P = 0.01 o P = 0.001, la incertidumbre se reduce en forma proporcional y la evidencia producida por el test es ms fuerte.
A cada valor de z corresponde un valor definido de P, y los programas de clculo estadstico
los proporcionan en forma rutinaria. De modo que puede darse el valor exacto de P, ya que
ser evidente si tal valor es mayor o menor que el nivel de significacin adoptado. Estas cifras
exactas pueden dar una mejor idea del desvo que presenta z y del grado de significacin alcanzado.
La opcin de aproximar los valores de P a cifras redondeadas y de cmoda lectura, como
0.05, 0.01 o 0.001, es tambin vlida pero menos exacta, y se lleva a cabo expresando P como
menor que el valor que ms se le aproxime. As, si P = 0.0008 puede informarse P < 0.001.
Es obvio que en este caso tambin es verdadero que P < 0.05, pero esta expresin no informa
la alta significacin del resultado.
6.5.4. En una comparacin de medias, el rechazo de la hiptesis nula implica que sta no
se halla comprendida en el intervalo de confianza de la diferencia de medias
Esto relaciona las pruebas de hiptesis con la determinacin de los intervalos de confianza para los parmetros de las poblaciones. Por ejemplo, calculemos el intervalo de confianza
para la diferencia de medias entre los individuos con y sin sndrome metablico, SM C del
Ejemplo 6.2. Dicho intervalo se calcula a partir de las respectivas medias muestrales, segn
la ecuacin empleada en Ejemplo 6.1 para el clculo de intervalos de confianza:
x 1.96 / n < < x + 1.96 / n
Reemplazando x por la diferencia entre las medias muestrales y / n por el error estndar de la diferencia, se tiene:
11.3 (1.96 2.21) < 11.3 < 11.3 + (1.96 2.21) = 6.97 < 11.3 < 15.63
con un nivel de confianza del 95%. El valor ms probable de la diferencia de las medias
universales est en la diferencia muestral 11.3, y slo en el 5% de los casos ser menor que
6.97 o mayor que 15.63. Es fcil comprobar que tomando 3 errores estndar a cada lado, el
intervalo de confianza se extiende entre 4.67 y 17.93, y la media universal se encontrar fuera
de estos lmites en menos de 3 de cada mil pruebas (P = 0.0027). En cualquier caso, queda
excluido el 0, que es la diferencia que postula la hiptesis nula. En otras palabras, es altamente improbable que la diferencia entre la media de las poblaciones sea cero, como propone la
hiptesis nula. Esto equivale a su rechazo, llegndose al mismo resultado que en el Ejemplo
6.2, donde se evala la diferencia de medias contra la hiptesis nula de diferencia cero.
[ 241 ]
6.5.5. Si se toman en cuenta todos los elementos de los universos, no tiene sentido hablar
de diferencias significativas entre las medias
Cuando se habla de diferencias significativas entre medias muestrales se est haciendo
referencia a diferencias muestrales que expresan diferencias entre sus respectivos universos.
Se infiere a travs de muestras, la existencia de diferencias entre universos, por lo comn inaccesibles en su totalidad o que, por algn motivo, no han sido evaluados ntegramente. Por lo
tanto, siempre hay un nivel de confianza y una probabilidad de error asociados con este tipo
de apreciaciones fundadas en muestras. Por el contrario, si dos universos han sido medidos
en todos sus elementos y se halla que sus medias no son iguales, no tiene sentido preguntarse
si existe una diferencia significativa entre las medias pues la diferencia existe y ha sido puesta
en evidencia fuera de toda duda al medir ambos universos en la totalidad de sus individuos. El
trmino significativa se refiere a la confianza que generan las muestras en que la diferencia
no se limita a ellas mismas y puede por lo tanto hacerse extensiva a los universos. Pero si no se
trata de muestras, sino de los universos ntegramente medidos en todos sus elementos, cualquier diferencia hallada, pequea o grande, simplemente existe y no tiene sentido preguntar
si es significativa. S tendra sentido, en cambio, preguntar si la diferencia tiene importancia
mdica.
Por otra parte, es frecuente asociar el trmino significativa con importante, cosa que
debera evitarse, ya que diferencias muy pequeas entre muestras, pueden ser significativas,
esto es, denotar diferentes universos de procedencia y con todo, tener muy poca importancia
prctica (en lenguaje coloquial el trmino significativo tambin tiene la acepcin de importante, y en este sentido puede ser utilizado lcitamente, siempre que no ocasione ambigedades en la interpretacin).
6.6. Rechazo errneo de una hiptesis nula verdadera: Error alfa.
Qu ocurre si rechazamos la hiptesis nula y aceptamos una diferencia como estadsticamente significativa en un nivel P = 0.05, y en realidad las muestras estudiadas se hallan dentro
del 5% de los casos en que se pueden observar diferencias iguales o an ms extremas, solamente por azar y siendo que no existen diferencias entre las correspondientes poblaciones?
Cometemos un error conocido como error alfa. Si se realizan 100 comparaciones entre muestras extradas del mismo universo, en alrededor del 5% de los casos, esto es unas 5 veces, se
encontrarn diferencias significativas a nivel P = 0.05, como sera de esperar si efectivamente
se estuvieran analizando universos diferentes.
Si bien no tiene mayor sentido realizar un experimento como el mencionado, la probabilidad de encontrar diferencias significativas en realidad inexistentes es mucho ms peligrosa
cuando el investigador las cree posibles o an las espera, de acuerdo a sus hiptesis de trabajo.
Como se dijo, este es un riesgo inherente al procedimiento y exige siempre cautela en la interpretacin de las pruebas estadsticas, as como un juicio crtico cuidadoso al leer los informes.
Un hecho de la mayor importancia es que, si se realizan comparaciones mltiples, ser
inevitable obtener algunos resultados donde diferencias muestrales que aparecen significativas no traduzcan la realidad de los correspondientes universos. El problema de las comparaciones mltiples es de la mayor importancia y existen diversas tcnicas para abordarlo, que
se comentarn sucintamente en la Seccin 10.
[ 242 ]
Por otra parte, un recurso contra el error alfa es hacerlo ms pequeo reduciendo el nivel
de significacin de las pruebas, por ejemplo del 5% al 1%, con lo cual el riesgo de caer en
el mismo ser de una vez en cien. El precio que se paga es aumentar las chances de que las
comparaciones no alcancen el nuevo nivel de significacin exigido, y se pierdan hallazgos que
efectivamente sealen diferencias entre las poblaciones muestreadas. El nivel de error alfa
con el que se elige trabajar depende en parte del rigor que se quiere dar a las conclusiones.
Asimismo, nunca debe olvidarse que la interpretacin de los resultados de las evaluaciones
de hiptesis debe estar sujeta al criterio del investigador, quien suele tener conocimientos
fundados acerca de la materia en estudio y debe dar el peso correspondiente a los diversos
hallazgos. Si un resultado altamente significativo parece contradecir conocimientos previos
bien establecidos, debera ser evaluado cuidadosamente, ya que si bien puede sealar un hecho novedoso, podra tambin deberse a un caso de error de tipo alfa.
6.6.1. Necesidad de la publicacin de los resultados negativos
Una forma fundamental de evitar el dao potencial producido por la aceptacin de diferencias inexistentes debido al error alfa, es la publicacin de los resultados negativos, es decir,
de los resultados donde dichas diferencias hubieron de ser rechazadas. Frecuentemente se
buscan diferencias significativas a favor de distintas drogas y procedimientos y el hallazgo de
tales diferencias ocasiona su inmediata publicacin y difusin. Si hay suficientes datos y estudios que lo corroboren, el hallazgo tendr el respaldo necesario. Pero en los casos en los que
prima el entusiasmo teraputico es posible que las corroboraciones no se esperen demasiado
y los investigadores se involucren en conclusiones que a la larga son enmendadas por nuevos
conocimientos, aunque a veces esto tarde en llegar. A esto se suma el hecho de que, en general,
los hallazgos de diferencias significativas tienden a recibir prioridad y a ser publicados con
mayor frecuencia que los resultados negativos, tanto por los autores como por los editores
(publication bias). En este punto, la publicacin de resultados donde otros investigadores no
hayan encontrado diferencias a favor del nuevo tratamiento, obliga fuertemente a los sostenedores del mismo a reforzar las evidencias a favor, por ejemplo mediante nuevas evaluaciones
y ensayos clnicos. As, conviene no atender a la difundida creencia de que los estudios que
no hallan diferencias son inservibles. Ms an, la difusin de tales estudios es un control
efectivo contra las aceptaciones prematuras de resultados auspiciosos, que si bien pueden
deberse a fallas en el diseo de las investigaciones, tambin pueden originarse en el error de
tipo alfa, en especial cuando se realizan mltiples comparaciones sobre muestras divididas en
un nmero grande de subgrupos y evaluando distintos resultados teraputicos posibles.
6.7. Falla en la deteccin de una diferencia que realmente existe: Error beta
En 6.5.1 se mencion la posibilidad de que muestras pequeas no permitan detectar una
diferencia existente entre medias de distintos universos, esto es, que el nivel de significacin
alcanzado no sea suficiente para rechazar la hiptesis nula, an cuando la hiptesis alternativa
fuera cierta. En esta eventualidad, la hiptesis nula no ser rechazada y se aceptar que no existen diferencias significativas entre universos que en realidad difieren entre s. Este tipo de error
se conoce como error beta. La posibilidad de incurrir en este tipo de error debe ser especialmente tenida en cuenta cuando habiendo motivos bien fundados para pensar que deben existir
[ 243 ]
diferencias, stas no se han podido poner en evidencia en las muestras analizadas. Desde ya, el
ensayo con muestras ms grandes suele ser el recurso ms til contra el error beta.
El error beta se expresa, como el error alfa, por un valor de P, pero ahora con el significado de probabilidad de no detectar una diferencia que realmente existe, entre las medias de
diferentes universos. La definicin debe ampliarse a cualesquiera que sean las caractersticas
o parmetros de poblacin que se estn considerando. En general el error beta es ms tolerado
que el alfa, aunque las conclusiones a las que lleva son igualmente errneas. Sin embargo, es
ms comn que el error beta slo postergue o dilate los hallazgos, siendo ms difcil que por
su causa se tomen decisiones imprudentes, aunque esta afirmacin es muy general y por ejemplo, debido a este tipo de error podran llegar a pasarse por alto consecuencias indeseables de
diversos tratamientos, que sera importante conocer con certeza.
Si el error beta es del 10% o sea, P = 0.10, en una de cada diez veces el test de significacin fallar en detectar una diferencia significativa, pero la encontrar en las nueve restantes.
Estas nueve veces de cada diez representan la potencia de la prueba estadstica. Por lo tanto,
la potencia de un test es la probabilidad complementaria del error beta:
Potencia = 1 error beta
(6.6)
Por otra parte, el error beta depende del nivel aceptado de error alfa, del desvo estndar
de las variables implicadas y del tamao de las muestras. La probabilidad de error alfa queda
fijada al elegir el nivel de significacin para una prueba, y cuanto menor sea dicha probabilidad, mayor ser la probabilidad de error beta. La relacin inversa entre la magnitud de los
errores alfa y beta resulta de que si se pretende disminuir la probabilidad de error alfa, debern exigirse mayores diferencias entre las variables comparadas antes de aceptar su significacin estadstica y esto, a su vez, har ms probable que diferencias menores, aunque reales,
se pasen por alto y se desechen como no significativas (error beta). En cuanto a la influencia
del desvo estndar de las variables y el tamao de las muestras, sus efectos convergen en la
determinacin del error estndar empleado en las pruebas de hiptesis (ver 6.5.1).
El error beta puede calcularse con exactitud conociendo sus determinantes, mencionados en el prrafo anterior, y para algunos modelos de distribucin de probabilidades ha sido
calculado y tabulado. Su clculo no ser abordado aqu dada su relativa extensin, pudiendo
consultarse Armitage, 1994. Slo se mencionar que, de acuerdo a lo establecido ms arriba,
el investigador puede reducirlo agrandando las muestras, reduciendo la variabilidad de las
mismas y renunciando a niveles de significacin muy altos para el error alfa. La primera opcin es en general la ms factible. En cuanto a la variabilidad de las muestras, en general slo
se puede, en ciertas ocasiones, tratar de reducir el componente relacionado con la precisin de
las mediciones, ya que la variabilidad inherente a los datos no es influenciable directamente.
Sin embargo, hay un aspecto relacionado que slo se mencionar aqu, y que se refiere a la
posibilidad de controlar el efecto de ciertas variables que no intervienen en el estudio pero
que influyen sobre las que interesan. Por ejemplo, al medir la duracin del intervalo QT del
electrocardiograma, generalmente no interesan los efectos de la frecuencia cardaca, que son
conocidos y que tendern a acortarlo a medida que sta aumenta. La correccin para la
frecuencia cardaca, que tiende a eliminar su influencia en el QT medido, consiste en el uso de
[ 244 ]
[ 245 ]
z = d / ( / n ) + ( / n )
de donde se puede despejar y obtener el valor de n reemplazando d, z y por los valores asignados por el investigador. Para despejar n se comienza elevando al cuadrado ambos trminos
de la ecuacin, con lo que se elimina la raz:
z = d / ( / n ) + ( / n )
= d / ( 2/n )
= n d / 2
de donde resulta:
n = 2 z / d
= 2 ( z / d )
(6.7)
(6.8)
d = 10
z = 1.96
[ 246 ]
[ 247 ]
Puede observarse que hacia los extremos de la curva, un mismo desvo estndar deja
por fuera un rea de probabilidades mayor que en la distribucin de Gauss. Esto quiere decir
que en las muestras pequeas, las probabilidades de que la variable asuma valores cercanos
a las colas de la distribucin, son relativamente mayores que en la distribucin normal. Por
[ 248 ]
esta razn, para poder afirmar que una observacin se aleja significativamente del centro de
la distribucin, deber hallarse a mayor distancia del mismo que si la distribucin fuera la
normal o de Gauss.
Dada una variable con distribucin normal y media , si se extrae una muestra de tamao n, con media x y desvo estndar s, se tiene que
t = (x ) / (s / n)
(7.1)
individuos antes y despus de alguna intervencin o de algn posible cambio en las variables
en estudio. En el primer caso se habla de muestras no apareadas, por lo que se entiende que
no hay correlacin estadstica entre los datos de las dos muestras.
Como se sabe, al comparar las medias de dos muestras, la hiptesis nula suele ser que
provienen de universos con la misma media, de modo que 1 = 2 y por lo tanto 1 2 = 0. De
acuerdo a esta hiptesis, se espera que las diferencias entre las medias muestrales, x 1 x 2 , presenten una distribucin en forma de campana con centro en 0, y la prueba consiste en dividir
la diferencia encontrada por su error estndar, lo que proporciona un valor de t. Este a su vez
permite encontrar en las tablas de la distribucin, la probabilidad de una diferencia x 1 x 2
igual o mayor que la hallada en el estudio. Si esa probabilidad es suficientemente pequea, la
hiptesis de medias de poblacin iguales debe ser rechazada, aceptndose la hiptesis alternativa de medias diferentes.
Siempre que las varianzas de las muestras sean similares, el error estndar de la diferencia de medias se obtiene a partir de una varianza nica s, que combina las varianzas de cada
una de las muestras, s1 y s2 :
s = [( n1 1) s1 + (n 2 1) s2 ] / [( n1 1) + (n 2 1)]
(7.2)
donde n1 y n2 es el tamao de cada muestra, y (n1 1) y (n2 1) son los grados de libertad de
las muestras.
Con esta estimacin de la varianza muestral, el error estndar de la diferencia de medias
se calcula a partir de (5.6), donde cada est estimada por la varianza combinada s :
ES (x1 x2) = ( s / n1 ) + ( s / n 2 )
(7.3)
(7.4)
X2
640
460
Nmero de casos ( n )
)
Media (x
10
10
64.0
46.0
Varianza muestral ( s )
422.4
276.9
A partir de (7.2) se obtiene una varianza muestral nica, s, que combina ambas varianzas muestrales, s1 y s2 :
s = [( n1 1) s1 + (n 2 1) s2 ] / [( n1 1) + (n 2 1)]
= [(10 1) 422.4 + (10 1) 276.9 ] / [ (10 1) + (10 1) ] = 349.7
El error estndar de la diferencia de medias se calcula segn 7.3:
x
) = ( s / n ) + ( s / n )
ES (x
1
2
1
2
= ( 349.7 / 10 ) + ( 349.7 / 10 ) = 8.36
El estadstico t se calcula entonces como:
t = (x1 x2) / ES (x1 x2)
= (64 46) / 8.36
= 2.15
siendo (n 1) + (n 1) = 9 + 9 = 18, la suma de los grados de libertad de las muestras.
La probabilidad de significacin buscada se encuentra en tablas de la distribucin t de
Student, en la fila correspondiente a 18 grados de libertad, donde para t = 2.10 corresponde
P = 0.05, con lo cual el valor 2.15 obtenido es ligeramente ms significativo, y por lo tanto se
puede escribir P < 0.05. El valor exacto de P (que se puede calcular de la tabla por interpolacin) se obtiene inmediatamente de los paquetes estadsticos y es P = 0.045.
5. ltimo paso: aceptacin o rechazo de la hiptesis nula
Dado que la diferencia de las medias se considera significativa en un nivel P < 0.05 y este
nivel ha sido alcanzado, se rechaza la hiptesis nula y se acepta la significacin de la diferencia de medias.
[ 251 ]
HDL pre-tratamiento
HDL post-tratamiento
81
85
Diferencia ( d )
4
37
38
35
37
64
72
46
51
6
7
37
45
45
38
8
7
43
58
15
21
25
10
51
61
10
TOTALES
460
510
50
[ 252 ]
Las respectivas medias muestrales antes y despus del tratamiento son 46.0 y 51.0 mg/dl,
y su diferencia, igual a 5.0 mg/dl, sugiere un leve aumento del colesterol HDL No obstante,
la diferencia entre las medias muestrales es menor que en el ejemplo anterior y, como el lector
puede comprobarlo, si se aplica el mismo mtodo de comparacin, no resulta significativa.
Sin embargo, si se observan en la cuarta columna de la tabla los cambios del HDL ocurridos en cada individuo, se ver que en nueve casos aument en la muestra post-tratamiento,
y que no hay grandes contrastes entre la magnitud de las variaciones para cada individuo: el
paciente con 81 mg/dl pasa a tener 84 (d = 84 81) y el paciente con 21 mg/dl pasa a tener 25
(d = 25 21). Por qu no analizar solamente las diferencias, ocurridas en cada individuo? Si
sobre las mismas no hubiera un efecto del tratamiento, su media debera oscilar alrededor de
cero, y sta es una buena hiptesis nula. Tal es el fundamento de la comparacin de muestras
apareadas. Si la media de las diferencias individuales difiere significativamente de cero,
se admite que un cambio significativo ha ocurrido entre las tomas de cada par datos. La
variable es la diferencia d entre cada par de datos, que se compara con una diferencia media
hipottica D = 0.
El procedimiento es como sigue. En la cuarta columna se hallan las diferencias ( d ) entre
ambas mediciones del HDL para cada individuo. La media de esas diferencias es igual a su
sumatoria dividida por el nmero de casos:
y en el ejemplo es igual a 5.0 mg/dl (es la misma que la diferencia entre las medias muestrales).
ESD = (sD / n )
(7.7)
d = (4 + 1+ 2+ + 10) / 10 = 5.0
sD = [ (45) + (15) + (25) + + (105)] / (101)
= 314 / 9 = 34.9
ESD = (sD / n)
= (34.9 / 10) = 1.87
t = 5.0 / 1.87 = 2.68
lo que corresponde segn tablas de la distribucin t de Student, a P = 0.0253, con lo cual
se satisface la condicin P < 0.05. Las diferencias observadas en el colesterol HDL antes y
despus del tratamiento se apartan significativamente de cero.
5. Ultimo paso: aceptacin o rechazo de la hiptesis nula
La hiptesis nula de una diferencia media universal D = 0 igual a cero deber ser rechazada, aceptndose la alternativa D 0.
Para comprender lo que ha ocurrido, hay que tener en cuenta que las cifras de HDL estn
(o pueden estar) influidas por el tratamiento y tambin por otras caractersticas particulares de
cada individuo. Las diversas fuentes de variabilidad generan las varianzas de cada muestra por
separado, mientras que por el contrario, la columna con las diferencias de HDL pre y post-tratamiento slo expresa las variaciones ocurridas entre la primera y la segunda medicin. Otras
fuentes de variabilidad, que se manifiestan en el hecho de que los distintos individuos se presentan inicialmente con valores de HDL ms altos o ms bajos, tienden a cancelarse cuando se
restan entre s los dos valores de cada par de datos. En el ejemplo, las varianzas de las muestras
son iguales a 276.9 y 332.4 (pre y post-tratamiento), mientras que la varianza de las diferencias
entre pares es igual a 34.9. Esto determina un menor error estndar y consecuentemente, el
incremento del valor de t y la posibilidad de detectar cambios significativos. En el ejemplo se
ha producido un aumento pequeo pero significativo del colesterol HDL, que hubiera quedado
oculto por la variabilidad individual de haberse empleado directamente las varianzas muestrales como se hace en el caso de muestras independientes, donde no es posible controlar la variabilidad dentro del grupo. Como se ve, la mayor eficacia del mtodo de muestras apareadas
se debe a que permite aislar las variaciones producidas por una determinada circunstancia o
intervencin, de la variabilidad existente entre los individuos de un grupo.
[ 254 ]
[ 255 ]
Ejemplo 8.1. Comparacin de dos proporciones en muestras independientes. Aproximacin mediante la distribucin normal
En un conjunto de 470 individuos internados por endocarditis infecciosa (Modenesi y
col., 2005) se encontr que 66 presentaron insuficiencia renal crnica (IRC) durante la evolucin (grupo 1) y 404 no la presentaron (grupo 2). Durante la hospitalizacin se observaron
24 muertes en el grupo 1 (IRC), y 90 muertes en el grupo 2 (no IRC).
La proporcin de fallecimientos fue p1 = 24 / 66 = 0.36 = 36% en el grupo 1, y p2 = 90 /
404 = 0.22 = 22% en el grupo 2. Son los datos prueba suficiente de que la muerte intrahospitalaria en la endocarditis infecciosa, es ms frecuente en los portadores de insuficiencia
renal crnica que en los que no la presentan?
La hiptesis nula es que la mortalidad intrahospitalaria es la misma en portadores de
insuficiencia renal crnica que en los que no la presentan, o lo que es lo mismo, la mortalidad en el universo del que procede el grupo 1 (1) es la misma que en aqul del que procede el grupo 2 ( 2). Para poder afirmar que la diferencia observada es estadsticamente
significativa, debe poder rechazarse la hiptesis nula y para esto, debe demostrarse que la
diferencia p1 p2 obtenida de las muestras tiene muy bajas probabilidades de observarse
muestreando universos en los que 1 = 2 .
Al igual que p1 y p2 , la diferencia (p1 p2) se distribuir en forma aproximadamente normal siempre y cuando las muestras no sean pequeas y las p no presenten valores extremos,
y en estos casos pueden utilizarse procedimientos similares a los ya vistos en Seccin 6. Esto
requiere construir un estadstico z para evaluar la diferencia (p1 p2) en trminos de su error
estndar, y as conocer la probabilidad de haber obtenido una diferencia igual o mayor siendo
verdadera la hiptesis nula de medias iguales (o diferencia cero). Llamando ES (p1 p2) al
error estndar de (p1 p2), se tiene:
z = (p1 p2) / ES (p1 p2)
(8.1)
Para calcular el error estndar de (p1 p2) debe obtenerse primeramente una p muestral
comn que suma los numeradores y los denominadores de p1 y p2:
p = (r1 + r2) / (n1 + n 2)
(8.2)
(8.3)
(8.4)
(8.5)
no hubiera asociacin alguna con cualquiera de los grupos. La Tabla 8.1 correspondiente al
ejemplo anterior permite ilustrar el resultado:
Tabla 8.1. Tabla de 2 2 correspondiente a los datos del Ejemplo 8.1
Grupo 1
Obitos
Vivos
Totales
Observados 24
Observados 42
66
(IRC)
Esperados 16
Esperados 50
Grupo 2
Observados 90
Observados 314
( No IRC )
Esperados 98
Esperados 306
Totales
114
356
404
470
Se comprueba que frente a 16 bitos esperados en el grupo 1, ocurrieron 24, y frente a los 98 bitos esperados en el grupo 2, slo se presentaron 90. La magnitud de las diferencias entre casos
observados y casos esperados, permite elaborar un estadstico muestral llamado chi-cuadrado
(que se suele escribir X), que se compara con una familia de distribuciones tambin conocidas
como chi-cuadrado y que se suelen denotar como . Este estadstico se calcula como:
X = [ (O E) / E ]
(8.6)
lo que expresa que para cada una de las cuatro celdas de la tabla, la diferencia entre los casos
observados ( O ) y los esperados ( E ), debe elevarse al cuadrado y dividirse por el nmero de
casos esperados, para finalmente sumar los resultados de las 4 celdas. Cuanto ms grande
resulte X, ms improbable ser que las discrepancias se deban al azar, y esto lleva a aceptar
la existencia de algn tipo de asociacin entre la mortalidad intrahospitalaria y la insuficiencia renal crnica en las poblaciones representadas por las muestras. En forma ms general,
la magnitud de X expresa el grado de asociacin entre las variables de filas y columnas. Al
igual que la normal, las distribuciones son continuas y se caracterizan por un parmetro
llamado grados de libertad, que en el caso de una tabla de 2 2 es igual a 1. Las probabilidades de que X supere determinados valores, en ausencia de asociacin entre los elementos de
filas y columnas, se hallan tabuladas para distintos grados de libertad. En el Ejemplo 8.2 se
elabora con ms detalle el procedimiento de clculo de X reseado hasta aqu.
Ejemplo 8.2. Comparacin de dos proporciones en muestras independientes.
La distribucin
Clculo de los casos esperados: Considrense los casos observados en el ejemplo anterior,
dispuestos en una tabla de dos filas y dos columnas o tabla de 2 2:
Grupo 1
Obitos
Vivos
Totales
Observados 24
Observados 42
66
Observados 90
Observados 314
404
114
356
470
IRC
Grupo 2
No IRC
Totales
[ 258 ]
En las filas, los pacientes son clasificados segn la presencia de insuficiencia renal crnica: en la primera aparecen los 66 pacientes que la presentan (grupo 1), divididos en 24 individuos que fallecen y 42 que sobreviven, y en la segunda aparecen los 404 pacientes que no
exhibieron insuficiencia renal crnica (grupo 2), divididos en 90 individuos que fallecen y 314
que sobreviven. Por otra parte, en las columnas, los pacientes son clasificados por la supervivencia: en la primera columna aparecen los bitos, y en la segunda los casos que sobreviven.
Las sumas de cada fila y de cada columna forman cuatro totales marginales. La suma de los
totales marginales es igual al gran total, que representa a todos los individuos del estudio
y se ubica en el ngulo inferior derecho de la tabla.
Para obtener los casos esperados, hay que calcular cuntos individuos debera haber en
cada celda de la tabla, si se distribuyeran en forma proporcional a los totales de fila y de
columna. Por ejemplo, 66 de los 470 pacientes, o sea 66 / 470 = 0.14 o 14% del total, present insuficiencia renal crnica (y un 86% no la present). Si se espera que los 114 bitos
observados se hayan producido en forma independiente de la presencia de insuficiencia renal,
su nmero en los grupos 1 y 2 slo debera depender del tamao de estos grupos y as, en el
grupo 1 (insuficiencia renal crnica presente) deberan esperarse 0.14 114 = 16 bitos, que
es un 14% del total de bitos observados, ya que el grupo 1 contiene el 14% del total de los
pacientes del estudio. Esta expectativa corresponde a la hiptesis nula de la prueba, a saber,
que los fallecimientos son independientes de la presencia de insuficiencia renal crnica.
Los 16 bitos esperados en el grupo 1, corresponden a la celda interseccin de la fila Grupo
1 y la columna Obitos.
Como se ha visto, para calcular los casos esperados en la casilla que corresponde a la
interseccin de la fila Grupo 1 y la columna Obitos, se hizo (66 / 470) 114, o sea, (total de
fila Grupo 1 / gran total) total de columna Obitos. Esto significa que, en general, para la
casilla correspondiente a la fila i y la columna j, se tendr:
Casos esperados = (total de fila i total de columna j ) / gran total
(8.7)
Con este procedimiento se pueden calcular los valores esperados en las restantes celdas.
En realidad, en tablas de 2 2 basta con calcular el valor esperado para una celda, y los otros
tres se obtendrn por diferencia con los correspondientes totales marginales. Por ejemplo, si
se esperan 16 bitos en el grupo 1, en el grupo 2 debern esperarse necesariamente 114 16
= 98 bitos.
En la Tabla 8.1 pueden verse los valores observados y calculados para el estudio que nos
ocupa. En el grupo 1 (insuficiencia renal crnica presente), se observaron ms bitos que los
esperados, exactamente 24 16 = 8 bitos ms. Lo opuesto ocurre en el grupo 2 (insuficiencia renal ausente), donde los bitos observados son menos que los esperados de acuerdo a
la cuanta del grupo. Otro tanto puede discurrirse acerca de los casos en que los pacientes
sobreviven la internacin: en el grupo 1 son menos que los esperados, y lo inverso ocurre en
el grupo 2. La diferencia entre observado y esperado es la misma para las cuatro casillas, y
slo cambia de signo: en dos casillas el signo es positivo y en dos es negativo. En la magnitud
de esta diferencia, que indica cunto se alejan las proporciones muestrales de las esperadas
bajo la hiptesis nula, se basa la prueba de chi cuadrado.
[ 259 ]
Conviene saber que el hecho de que los valores esperados en este ejemplo sean nmeros
enteros, es casual (en realidad, para fila 1 y columna 1 se esperan exactamente 16.0085 casos,
valor que ha sido redondeado). Al respecto, cuando hay decimales deben ser incluidos en los
clculos segn la precisin deseada (por ejemplo, uno o dos decimales).
La prueba de significacin se realiza mediante el estadstico X, definido ms arriba
(8.6). Como se ha mencionado, este estadstico sigue una funcin de probabilidad conocida
como chi-cuadrado y su magnitud aumenta cuanto mayor es la diferencia entre valores
observados y esperados. La distribucin se halla tabulada de modo de dar la probabilidad
con que distintos valores de la funcin son sobrepasados por azar de muestreo. En el caso
particular del arreglo 2 2, se dice que chi-cuadrado se halla distribuido con un grado de
libertad.
Los grados de libertad pueden entenderse como el nmero de celdas en que deben calcularse los casos esperados, para que queden automticamente determinados, por diferencia
con los marginales, los valores de las dems. As, se ha hecho notar ms arriba que en una
tabla de 2 2, basta calcular el valor en una de las celdas para que queden automticamente
determinados los valores de las otras tres: luego, en estas tablas X se distribuye con un grado
de libertad.
En la celda determinada por la fila Grupo 1 y la columna Obitos, se han observado 24 casos
y se han calculado 16 casos esperados. Luego, el primer trmino de la sumatoria en (8.6) es:
(O E) / E = (24 16) / 16
= 64 / 16
=4
Prosiguiendo con las tres celdas restantes, puede comprobarse que en todas ellas la diferencia es igual, en dos con signo positivo y en dos con signo negativo. Los correspondientes
cuadrados son siempre positivos y los cuatro numeradores de la sumatoria de X son iguales:
X = [ (O E) / E ]
= [(24 16) / 16] + [(42 50) / 50] + [(90 98) / 98] + [(314 306) / 306]
= 64 / 16 + 64 / 50 + 64 / 98 + 64 / 306 = 6.14
Segn tablas de la distribucin , para un grado de libertad y X = 6.14, se tiene P =
0.013, lo que obliga a aceptar una desviacin significativa de los valores observados, de aqullos que se esperan bajo la hiptesis nula de proporcionalidad entre los valores de las celdas
y sus marginales. La mortalidad y la presencia de insuficiencia renal crnica se hallan asociadas en forma estadsticamente significativa en la muestra analizada. Ntese tambin que
el valor de P obtenido aqu, es igual al que se obtuvo con la aproximacin normal (esto no es
casual, dado que las distribuciones normal y se hallan emparentadas matemticamente).
El mtodo de las tablas de contingencia se generaliza para ms de dos filas y / o columnas, siendo los procedimientos, anlogos al caso ms frecuentemente utilizado de la tabla
22. En todos los casos, los valores esperados para una celda se calculan como en (8.7), mul[ 260 ]
en el Ejemplo 8.1 sin efectuar la correccin de continuidad. Como se ve, sta resulta conservadora en el sentido de disminuir el nmero de resultados significativos en las pruebas.
En el caso de X la correccin de continuidad se aplica reduciendo en 0.5 la diferencia
entre cada valor observado y su correspondiente calculado. Dicha correccin es obligatoria
siempre que el valor esperado en alguna celda sea menor que 5.
Ejemplo 8.4. Correccin de continuidad en el Ejemplo 8.2
La correccin se efecta restando 0.5 del valor absoluto de cada diferencia entre valor
observado y valor calculado. De esta manera, (8.6) queda modificada de la siguiente forma:
X = [ ( O E 0.5 ) / E ]
(8.8)
donde las barras significan la diferencia tomada siempre con signo positivo (valor absoluto).
Reemplazando por los datos del ejemplo, se tiene para el primer trmino:
(O E 0.5 ) / E = (24 16 0.5 ) / 16
= (8 0.5) / 16
= 56.25 / 16
= 3.52
que resulta as de menor magnitud que sin la correccin, circunstancia en la que es igual a 4.
Procediendo de la misma forma con los tres restantes trminos, se obtiene X = 5.40, que
es menor que el valor 6.14 obtenido sin la correccin y, con un grado de libertad, corresponde
a P = 0.02, resultado igual al obtenido mediante la aproximacin normal, al aplicar la correccin de continuidad.
Resulta evidente que la repercusin de la correccin de continuidad en las estimaciones
disminuir al aumentar n y as, su importancia ser menor cuando se trate de muestras grandes y sus efectos sern mayores en las muestras pequeas. Por este motivo se suele aconsejar
emplearla siempre, aunque es un tema discutido y no todos los autores estn de acuerdo (ver
Armitage, 1994).
8.4. Riesgo y riesgo relativo
Los resultados del estudio en pacientes con endocarditis infecciosa visto en los ejemplos anteriores, permitieron afirmar que la proporcin de muerte intrahospitalaria es significativamente
mayor entre quienes presentan insuficiencia renal crnica, y asimismo, que la mortalidad y la
presencia de insuficiencia renal crnica se hallan asociadas en forma estadsticamente significativa. Por otra parte, la proporcin de muerte intrahospitalaria permite estimar su probabilidad
en el correspondiente grupo (3.1), y sta es una medida del riesgo del suceso en cuestin. As, el
riesgo de bito en los pacientes con insuficiencia renal crnica del Ejemplo 8.1 se estima mediante
la razn p1 (bitos / total de enfermos en el grupo IRC), y en forma anloga se calcula el riesgo en
los pacientes del grupo sin IRC. De este modo, el riesgo se define como la probabilidad de desarrollar una enfermedad (o cualquier suceso de inters) en un tiempo determinado de observacin
[ 262 ]
(en el ejemplo, durante la duracin de la internacin). El concepto de un tiempo dentro del cual se
realizan las observaciones es de importancia, como se ver en las Secciones 15 y 16.
Tratndose de una probabilidad, el riesgo puede expresarse como una proporcin y tambin como un porcentaje. En el Ejemplo 8.1, el riesgo de muerte en el grupo 1 se estim como
p1 = 0.364 o 36.4%. Los intervalos de confianza para el riesgo se calculan como los correspondientes a las proporciones que lo estiman.
Ejemplo 8.5.
En el Ejemplo 8.1 se vio que la proporcin de bitos en pacientes con endocarditis infecciosa e insuficiencia renal crnica, que estima el riesgo en el grupo, estuvo dada por
p1 = r1 / n1
= 24 / 66 = 0.364 o 36.4%
El intervalo de confianza del 95% para la estimacin se obtiene por aproximacin a la distribucin normal, tomando z = 1.96. La varianza (4.11) y el error estndar de p son iguales a :
Var (p) = p (1 p) / n
ES (p) = p (1 p) / n
y los lmites de confianza del 95% estarn dados por p 1.96 ES (p).
Con los datos del ejemplo:
Var (p) = 0.364 (1 0.364) / 66 = 0.00351
ES (p) = 0.00351 = 0.059
Lmites de confianza del 95%: 0.364 (1.96 0.059) = 0.480 y 0.248, o sea 48.0% y
24.8%.
El intervalo de confianza del 95% para la proporcin de bitos observada en la muestra
cuando coexiste insuficiencia renal crnica, se extiende entre 24.8% y 48.0%, y dentro del
mismo es de esperar que se halle la media de poblacin, con el mismo nivel de confianza.
Para comparar el riesgo entre dos grupos diferentes, es posible dividir el riesgo en uno de
ellos por el riesgo en el otro. El cociente se denomina riesgo relativo (RR, relative risk o risk
ratio) y expresa el riesgo del grupo en el numerador, con respecto al grupo en el denominador.
Simbolizando el riesgo con el cociente p = r/n, entre el nmero de individuos afectados ( r )
y el nmero total de individuos ( n ) en el correspondiente grupo, el riesgo relativo entre dos
grupos queda expresado por:
RR = (r 1 / n 1 ) / (r 2 / n 2)
(8.9)
donde los subndices identifican los grupos y el RR expresa el riesgo del grupo 1 con
respecto al grupo 2. En el ejemplo, el riesgo de bito en pacientes con insuficiencia renal
crnica result igual a 0.364, mientras que en los pacientes sin insuficiencia renal fue igual
[ 263 ]
a 0.223, con lo que el cociente 0.364 / 0.223 = 1.63, expresa el riesgo relativo de muerte
en los pacientes con insuficiencia renal, respecto de los que no la presentan. Si se invierten
los trminos del cociente, se cambia el grupo de referencia, y en el caso que nos ocupa se
obtiene el riesgo relativo del grupo sin insuficiencia renal, con respecto al grupo de los que
la presentan. Su valor est dado por 0.223 / 0.364 = 0.613, que es la inversa de 1.63 y al
ser menor que 1, indica un menor riesgo en los individuos sin insuficiencia renal cuando
se toma como referencia al grupo que la presenta. En el caso en que RR = 1 los dos grupos
comparados presentan el mismo riesgo, concepto que se extiende a todas las estimaciones
del riesgo relativo.
Existen varios mtodos para estimar el riesgo relativo, en buena parte originados en las
distintas posibilidades que brindan el tipo de datos y los modelos que se manejan, lo cual se
presta a algunas consideraciones. Por ejemplo, en el seguimiento de dos grupos a lo largo
del tiempo, la medicin de la proporcin de casos de enfermedad en cada uno de los grupos
al final del estudio, si bien es un modo de obtener una idea acerca del riesgo relativo, pierde
informacin acerca de lo sucedido durante el tiempo de seguimiento. As, no es lo mismo un
10% de mortalidad incidiendo gradualmente durante varios aos, que ocurriendo mayoritariamente en los primeros das o semanas del seguimiento. En el ejemplo de la endocarditis
infecciosa no se ha informado el tiempo de internacin hasta el bito, aunque no son de esperar perodos muy prolongados por tratarse de procesos agudos o subagudos y, en todo caso,
su registro no ha sido un objetivo de los autores del estudio, de modo que las estimaciones del
riesgo y el riesgo relativo se realizaron a partir de las proporciones de eventos en los distintos
grupos durante toda la internacin. En tanto, para estudios en los cuales el seguimiento en
el tiempo es una caracterstica relevante, existen mtodos apropiados para estimar el riesgo
relativo entre dos o ms grupos, diseados para obtener la mayor informacin posible de la
distribucin temporal de los sucesos y que se comentarn en la Seccin 15. Por otra parte,
otro modo muy difundido de estimar el riesgo relativo es mediante la razn de odds u odds
ratio entre los grupos que se comparan. Este procedimiento, que se emplea siempre en los estudios llamados de caso-control y se examinar en Seccin 16, presenta ciertas limitaciones
cuando se aplica a otro tipo de datos, como los de la endocarditis infecciosa vistos ms arriba,
sobre las que se discutir brevemente en 16.7 y s.
8.5. El test exacto de Fisher
Otro mtodo para la comparacin de proporciones consiste en disponer los datos en
una tabla 2 2 y examinar todas las variaciones que se pueden introducir en los mismos
sin permitir que varen los totales marginales. Con mtodos apropiados, se puede calcular
la probabilidad de cada una de las posibles disposiciones de los datos y luego, proceder a
sumar la probabilidad de la disposicin observada en el experimento, con las probabilidades de todas aquellas disposiciones o tablas que muestren desviaciones ms extremas. El
siguiente esquema ejemplifica el mtodo: Supngase que con un tratamiento A se observan 6
mejoras y 19 faltas de respuesta, y con un tratamiento B se observan 2 mejoras y 20 faltas
de respuesta. La tabla 2 2 con sus totales marginales es la siguiente:
[ 264 ]
Mejoras
Fallas
Total Tratamientos
Tratamiento A
19
25
Tratamiento B
20
22
Total respuestas
39
47
Aparentemente hay cierta ventaja con el tratamiento A. Por lo dems, existen otras dos
tablas que mejoran las cosas a favor de A sin modificar los marginales:
7
1
18
y
21
8
0
17
22
con 7 y 8 xitos respectivamente (compruebe que los marginales son los mismos). No hay
tablas ms extremas que la que le adjudica las 8 mejoras al tratamiento A.
Ahora bien, la probabilidad de presentacin de cada tabla se puede calcular mediante tcnicas de combinatoria que no examinaremos. La pregunta sobre cuntas veces o con
qu probabilidad se puede obtener la tabla del problema o cualquiera de las otras dos ms
extremas, se responde simplemente sumando las probabilidades de cada tabla (que son
independientes). Aqu las probabilidades para las tablas con 6, 7 y 8 xitos a favor de A, si
no hay ninguna influencia de los tratamientos (hiptesis nula) son 0.1301, 0.0336 y 0.0034
respectivamente, disminuyendo a medida que las cuentas se alejan de los valores esperados
en la hiptesis de no asociacin (el lector puede comprobar que el valor esperado bajo esta
hiptesis, para mejora con el tratamiento A, es igual a 4.26). La suma de las probabilidades
arriba calculadas es P = 0.167, que excede el nivel de significacin P = 0.05, por lo que la
hiptesis nula no puede rechazarse. Hay un 16% de probabilidades de obtener por azar una
tabla con 6, 7 u 8 xitos a favor de A.
Tambin se ha propuesto evaluar y sumar la probabilidad de los valores extremos de
la tabla en la otra direccin, esto es, con el tratamiento A en desventaja, con 2, 1 o 0 xitos. Esto equivale a una prueba a dos colas (vase 6.5.2). Existen an otras propuestas,
como calcular P en una sola direccin pero exigir un nivel de significacin ms estricto,
por ejemplo dividiendo P por dos y requiriendo P = 0.025 en lugar de 0.05 como nivel de
significacin.
El mtodo exacto de Fisher se obtiene en los programas estadsticos desde el men para
el anlisis de asociacin en variable discreta. Por otra parte, debe preferirse al mtodo de
chi-cuadrado cuando el nmero de casos esperado en alguna casilla sea menor que 5, o
bien cuando el tamao total de la muestra sea menor que 20. En el primer caso, si bien el
test de chi-cuadrado con correccin de continuidad es adecuado, el hecho de disponerse de
programas para el clculo estadstico hace preferible el empleo del test exacto.
[ 265 ]
9. Correlacin y regresin
9.1. Introduccin
Si se miden la talla y el peso de un grupo de personas, se observar que en general los
individuos ms altos son los de mayor peso, y los ms bajos los de menor peso. Se trata de dos
variables cuantitativas talla y peso que se presentan apareadas, cada par proviniendo de
un individuo, y entre las cuales existe un tipo de asociacin que puede expresarse diciendo
que al aumentar la talla tiende a aumentar el peso. Este tipo de asociacin se denomina
positiva. Otras veces, a los valores ms altos de una variable corresponden los ms bajos de la
otra, como puede ser el caso de la frecuencia cardaca y la duracin de la sstole: cuanto ms
alta la primera, menor la duracin de la segunda. En estos casos se habla de una asociacin
negativa o inversa entre las dos variables. Debe insistirse en que cada par de mediciones procede de una misma fuente, por ejemplo, cada individuo provee su estatura y su peso, o bien la
frecuencia cardaca y la duracin de la sstole. Adems, debe notarse que en vez de expresar
al aumentar la talla tiende a aumentar el peso podra decirse al aumentar el peso tiende a
aumentar la talla, ya que lo que se est haciendo es describir cmo se asocian las variables,
sin pretender afirmar si una variable determina el valor de la otra. Este tipo de asociacin
entre dos variables se suele referir con el nombre de correlacin.
El grfico natural para este tipo de datos es el diagrama de dispersin (scatterplot)
representado en la figura 9.1. Consiste en un par de ejes cartesianos, uno horizontal, comnmente llamado eje de abscisas o eje de las x, y otro vertical, eje de ordenadas o eje de las
y. A cada una de las dos variables correlacionadas se les adjudica un eje y de esta manera,
a cada par de datos xi e yi , le corresponde un punto de la grfica, con coordenadas xi , yi.
En la figura 9.1. A, estn representados los puntos correspondientes a la talla y peso de un
grupo de adultos de ambos sexos. Observando un punto, que representa a un individuo,
se pueden obtener la talla y el peso proyectndolo en forma perpendicular sobre cada uno
de los dos ejes, en donde se leen los correspondientes valores. En este ejemplo y en forma
arbitraria, se adjudicaron el eje de abscisas a la talla y el de ordenadas al peso. El hecho de
que ambas variables tiendan a crecer o decrecer conjuntamente, se evidencia en la direccin
de la nube de puntos que las representa, que se orienta hacia la derecha y arriba. Como se
mencion, este tipo de correlacin se llama positiva, y si los puntos se representan por una
recta que pase a travs de ellos, sta tendr pendiente positiva. Desde ya se puede adelantar
que si la relacin entre las variables fuera perfecta (y lineal), los puntos estaran sobre
[ 266 ]
una recta. Este no es el caso de la figura, donde forman una nube alargada que sigue una
direccin ms o menos lineal.
En la figura 9.1.B, se hallan representados la frecuencia cardaca y la duracin del perodo
eyectivo del ventrculo izquierdo medida en milisegundos, en una muestra de 100 individuos
adultos de ambos sexos. En este caso se observa que cuanto mayor es la frecuencia cardaca
el perodo eyectivo tiende a ser ms breve. Este tipo de correlacin, donde una variable tiende
a disminuir cuando la otra aumenta, se llama negativa o inversa, y si los puntos de la grfica
se representaran por una recta, sta se orientara hacia la derecha y abajo, exhibiendo una
pendiente negativa.
Figura 9.1. Grficos de dispersin. A: correlacin positiva entre talla y peso en 255 individuos
adultos de ambos sexos. B: correlacin negativa entre frecuencia cardaca y perodo eyectivo
en 100 adultos de ambos sexos sin enfermedad cardaca.
Lo visto es el aspecto grfico de la relacin entre dos variables. Cmo se puede medir
el grado de intensidad o fuerza de la asociacin? Corrientemente se emplea un estadstico
muestral conocido como coeficiente de correlacin, que se suele simbolizar con la letra r y
cuyo valor absoluto puede oscilar entre 0 (en cuyo caso hay ausencia total de correlacin y
los puntos de la grfica forman una nube sin direccin alguna) y 1 (en cuyo caso los puntos
se hallan perfectamente alineados sobre una misma recta). En los casos intermedios los
puntos tienden a agruparse en forma que sugieren la relacin que hay entre ellos, y cuanto
[ 267 ]
[ 268 ]
a corresponde al valor que toma y cuando x = 0, o sea al punto en que la recta cruza el eje
vertical o eje de las y. Por este motivo representa el valor de la ordenada ( y ) en el origen de
las x (x = 0) y se denomina ordenada al origen.
En tanto, b multiplica a la variable independiente x, y el producto contribuye al valor de
y. Por lo tanto, si x se incrementa en una unidad, el incremento de y ser igual a b (al hacer
x = x + 1 el producto bx pasa a valer b (x + 1) = bx + b, con lo que bx aumenta b unidades).
Dicho de otra forma, b expresa el crecimiento de la funcin y = a + bx cada vez que x aumenta
en una unidad. Cuanto ms grande sea el valor de b, ms rpidamente crecer la funcin y
mayor ser la inclinacin de la recta que la representa.
En la figura 9.2 se observa cmo a un incremento x de la variable independiente corresponde un incremento y de la funcin. El cociente y / x es la tangente trigonomtrica de
la recta que representa y = a + bx, y se observa que si x = 1, de acuerdo a lo visto arriba, y
debe ser igual a b. Por este motivo b se denomina pendiente de la funcin y corresponde a la
inclinacin de la recta que la representa.
Qu ocurre cuando b tiene signo negativo? Como se comprende, a cada incremento de
x le corresponder un producto bx con signo negativo, con lo que el valor de la funcin y
disminuye y la recta que la representa se inclina hacia la derecha y abajo. En este caso las
variables x e y se hallan correlacionadas negativamente y la recta correspondiente presenta
pendiente negativa, igual a b.
Bastan las constantes a y b para determinar una recta nica, y cada recta est completamente caracterizada por esos dos parmetros.
9.2. Regresin lineal
Se ha visto que a partir de los datos muestrales puede determinarse una ecuacin de regresin, que corresponde a una recta de regresin con respecto a la cual, la sumatoria de las
distancias de los puntos muestrales elevadas al cuadrado, es un mnimo. Cuando se estudia
la regresin entre dos variables, en general siempre interesa ms conocer el efecto de una de
ellas sobre la otra. Por ejemplo, entre el perodo eyectivo del ventrculo izquierdo y la frecuencia cardaca, en general interesar saber qu valores puede tomar el primero para diferentes
frecuencias cardacas, mientras que difcilmente se est interesado en estimar la frecuencia
cardaca a partir de la medicin del perodo eyectivo. La ecuacin que da el perodo eyectivo
(y) en funcin de la frecuencia cardaca (x) tendr la forma Eyectivo = a + (b frecuencia cardaca). Los valores de a y b se obtienen de las muestras. Esto significa que en cualquier caso,
para obtener una ecuacin de regresin se precisa un grupo de observaciones en las que basar
los clculos. Luego, el investigador podr aplicar los resultados al estudio de otros grupos,
con alguna de las finalidades que se comentarn en ms adelante. Tambin debera tenerse
presente que los valores de la variable dependiente dados por la ecuacin de regresin para
cada posible valor de la variable independiente, son los valores esperados o ms probables,
existiendo un margen de error, como se ver enseguida.
Es importante tener en cuenta el rol de cada variable. Cuando x acta como independiente e y como dependiente, sta puede calcularse dando valores a x, hablndose entonces
de regresin de y en x. Esto implica que el mnimo de las distancias que determinan los parmetros a y b de la recta, se toma en la direccin del eje vertical o de ordenadas. Es posible
[ 269 ]
intercambiar ejes y calcular la regresin de x en y, siendo la ecuacin de la nueva recta en general diferente a la anterior, ya que las distancias minimizadas se toman ahora a lo largo del
eje horizontal. Sin embargo, corrientemente se trabaja con la regresin de y en x, a la cual se
refiere esta resea. En algunas oportunidades, x suele ser referida como variable predictora
o covariable.
La pendiente de la recta, b, toma el nombre de coeficiente de regresin e informa el signo
y magnitud de la relacin entre x e y.
Ejemplo 9. Obtencin de las ecuaciones de regresin
Slo con el objeto de esbozar la obtencin de las ecuaciones de regresin a partir de las
muestras obtenidas en la prctica, se exponen someramente los procedimientos estadsticos
bsicos a partir de las variables x e y cuyos valores se dan en la tabla 9.1.
Tabla 9.1
Caso
(x x)
(y y)
(x x)
(y y)
(x x) (y y)
TOTAL
15
25
10
22
14
x = x / n = 15 / 5 = 3
(x x) = 10
y = y / n = 25 / 5 = 5
(y y) = 22
(x x) (y y) = 14
Las diferencias al cuadrado son ya conocidas y se utilizan en el clculo de la varianza y
el desvo estndar. Las columnas (x x) y (y y) corresponden a las mismas diferencias antes
de ser elevadas al cuadrado, por lo cual tienen signo positivo o negativo, y en total suman
cero. Sus productos, (x x) (y y) para cada par de datos, figuran en la ltima columna con
el signo correspondiente (signos iguales tienen producto positivo, signos diferentes producto
negativo). La sumatoria de los productos, (x x) (y y), que est relacionada con una
medida de la dependencia entre dos variables tericas llamada covarianza, interviene en el
clculo del coeficiente de regresin b que se obtiene mediante la frmula
b = (x x) (y y) / (x x)
(9.1)
Las medias de x e y determinan un punto que siempre se halla sobre la recta de regresin (en
este caso x = 3, y = 5). Aprovechando esto, una vez obtenido el coeficiente de regresin b, solo
queda calcular la ordenada al origen, a, para tener la ecuacin de regresin completa. Siendo y
= a + bx, pueden reemplazarse la x y la y por sus valores medios x = 3, y = 5 obtenindose:
5 = a + 1.4 3
= a + 4.2
de donde
a = 5 4.2
= 0.8
con lo cual la ecuacin de regresin puede escribirse:
y = 0.8 + 1.4 x
Existen, como es de suponer, una cantidad de condiciones y requisitos tericos para
garantizar que las ecuaciones de regresin calculadas a partir de las muestras proporcionen
resultados acordes con la realidad de los datos y para que los procedimientos de investigacin
e inferencia estadstica realizados sean correctos. No corresponde extenderse sobre el tema,
pero conviene saber que tanto x como y deben tener, cada una, distribuciones normales (o
muy prximas a la normal).
Los valores de la recta de regresin proporcionan el valor esperado o ms probable de
la variable dependiente y para cada valor de la variable independiente x. Sin embargo, en los
[ 271 ]
que expresa que por cada centmetro de estatura el peso vara en promedio 1.144 kg en la
poblacin muestreada.
Ntese que el valor de la ordenada al origen es igual a 117, lo que significa que el peso
esperado en el caso de una talla prxima a cero tendra valor negativo. La explicacin es
[ 272 ]
que la recta ha sido calculada dentro de rangos de talla y peso muy diferentes, y la variable
peso sencillamente no existe para talla cero. Otro resultado de extender la operacin de la
recta ms all de los lmites permitidos por el rango de las variables de origen, es que para
un individuo de 1.10 m de estatura estima un peso de 9 kg. Evidentemente, la ecuacin no es
adecuada para su empleo en nios o en adultos con valores extremos en sus caractersticas
corporales). Tampoco existe la posibilidad de que la frecuencia cardaca de un individuo tome el valor cero, aunque la ecuacin de regresin proporciona para el caso un perodo eyectivo muy prolongado. Estos resultados pueden ocurrir cuando funciones tericas se extienden
indefinidamente ms all de la existencia fsica de las variables y de los lmites para los que
han sido calculadas. As, aceptar que las variables se comportan como lo predice la recta de
regresin an ms all de dichos lmites, lo que se conoce como extrapolacin de las estimaciones o de las conclusiones, es un procedimiento al menos inseguro cuando no errneo, que
en general debe evitarse.
9.2.1. Variabilidad de los coeficientes de regresin muestrales
Debe tenerse en cuenta antes de proseguir, que los coeficientes a y b de la ecuacin de
regresin son estadsticos sujetos al azar del muestreo, que estiman los parmetros universales y respectivamente. Estos caracterizan la ecuacin de regresin del universo de donde
provienen las muestras, que se expresa y = + x. Surgen aqu varios temas de inferencia
estadstica, de los cuales slo se examinar lo relativo a la significacin del coeficiente de
regresin entre dos variables x e y.
Dadas dos variables, el coeficiente de regresin b entre ambas puede ser de mayor o
menor magnitud, expresando la variacin de y ante los cambios de x. Sin embargo, debe ser
distinto de cero, pues en este caso, el trmino bx de la ecuacin de regresin se anulara para
todas las x, que as no tendran ninguna relevancia en la determinacin de las y. En este sentido, una vez calculada la ecuacin de regresin, debe ponerse a prueba y poder rechazarse la
hiptesis nula = 0, que es la condicin para aceptar que el coeficiente b estima un parmetro
diferente de 0 y contribuye efectivamente en la determinacin de y.
Ejemplo 9 (continuacin). Significacin estadstica de b frente a la hiptesis nula = 0
Si se determina b en varias ocasiones se observarn las variaciones debidas al error del
muestreo. Como se ha mencionado, para aceptar una relacin entre las variables x e y, se debe
poner a prueba el coeficiente de regresin b y demostrar su significacin estadstica frente a
la hiptesis nula de que el coeficiente de regresin para la poblacin es igual a cero ( = 0).
El procedimiento consiste en construir a partir de los valores muestrales un estadstico de
prueba que tiene la forma
t = b / ES ( b )
(9.2)
donde ES (b) es el error estndar del coeficiente de regresin b. La distribucin correspondiente es t con (n 2) grados de libertad, siendo n el nmero de pares muestrales.
Para llegar a t, primero debe calcularse una cantidad que es anloga a la varianza muestral ya conocida, con la diferencia que en este caso, las desviaciones que se elevan al cuadra[ 273 ]
do y suman, son las que existen entre los puntos muestrales y la recta. En el ejemplo visto
antes e ilustrado en figura 9.2, cinco puntos muestrales producan la ecuacin y = 0.8 + 1.4
x. Para obtener las desviaciones mencionadas, se calcula el valor Y de la recta (Y recta) para
cada x de la muestra:
fila 1: x = 2 Y = 0.8 + 1.4 2 = 3.6
fila 2: x = 4 Y = 0.8 + 1.4 4 = 6.4
y as sucesivamente completando las filas como se muestra en la tabla 9.2.
Tabla 9.2
Caso
y observado
Y recta
y observado Y recta
( y observado Y recta )
3.6
0.6
0.36
6.4
+0.6
0.36
5.0
1.0
1.00
7.8
+0.2
0.04
2.2
+0.8
0.64
TOTAL
15
25
25
2.40
Para cada punto muestral, la diferencia entre el valor de y observado (real) y el valor de y
que da la recta para el correspondiente valor de x (Y recta), se eleva al cuadrado y, sumando
en la ltima columna se obtiene la suma de cuadrados residual, que dividida por (n 2) es un
trmino que equivale a la varianza alrededor de la recta y se denomina cuadrado medio residual. El trmino residual expresa que el grado de dispersin vertical alrededor de la recta que
miden estos operadores es un residuo de variabilidad que persiste una vez que la regresin ha
reducido la variabilidad de las y alrededor de su media y. El procedimiento es como sigue:
(9.3)
(9.4)
var (b) = S 0 / (x x)
(9.5)
[ 274 ]
(9.6)
En el ejemplo se tiene:
Suma de cuadrados residual = 2.40
S 0
= 2.40 / (5 2) = 0.8
var (b) = 0.8 / 10 = 0.08
ES (b) = 0.08 = 0.2828
t = 1.4 / 0.2828
= 4.95
que, con 5 2 = 3 grados de libertad corresponde a P = 0.0158. Se rechaza la hiptesis
nula, pues b se aparta significativamente de 0, y se asume la validez de la regresin entre
x e y.
Si la regresin de y en x resulta significativa como en el ejemplo, es lcito suponer una
relacin funcional entre ambas variables y se puede aprovechar la informacin que aporta la
variable independiente para predecir o estimar el comportamiento de la variable dependiente.
De lo que se ha visto, se deduce que al informar el resultado de un ensayo de regresin lineal
es fundamental proporcionar, adems de la ecuacin de regresin, la significacin estadstica
del coeficiente de regresin b, que en general se acepta si P < 0.05.
9.3 Correlacin
Se ha mencionado que el coeficiente de correlacin, simbolizado r, mide el grado de
asociacin entre dos variables y se aproxima a 1 o 1 a medida que los puntos muestrales del
diagrama de dispersin tienden a presentarse sobre una lnea recta. Se ha mencionado tambin que el signo positivo corresponde al caso en que las variables crecen juntas y el negativo
al caso en que una variable crece cuando la otra decrece. En el caso en que no exista ningn
grado de correlacin entre las variables el coeficiente de correlacin toma el valor cero. Por lo
tanto, el coeficiente de correlacin podr hallarse entre 1 y 1.
Como no ha de extraar, por describir la interrelacin entre dos variables, el coeficiente
de correlacin est emparentado con el coeficiente de regresin, y para una muestra cualquiera, evaluar la significacin estadstica de b o r frente a la hiptesis nula, tiene los mismos
resultados. Sin embargo, mientras b informa la posicin y modo de relacionarse las variables,
y es til para describir los valores esperados de la variable dependiente al asignar valores a la
variable independiente, el coeficiente de correlacin slo indica la magnitud de la tendencia
de los puntos muestrales a disponerse sobre una lnea recta.
Ejemplo 9 (continuacin). Clculo de r.
La frmula que proporciona r a partir de los datos muestrales guarda gran similitud con
la vista en el clculo de b, en particular por incluir el producto de los desvos de las x y las y:
r = (x x) (y y) / [ (x x) (y y)]
(9.7)
La significacin estadstica de r se halla tabulada para distintas r y para distintos tamaos de muestra. Para una muestra de tamao 5, el nivel de significacin de r = 0.944 es P =
0.0158, idntica a la significacin de b, como ya se ha mencionado.
No se abundar con el procedimiento de clculo de P, que se obtiene en forma inmediata
en los programas de estadstica y ya se ha dicho que es equivalente a la P obtenida en la evaluacin del coeficiente de regresin b, pero s se mencionar que para un mismo valor de r, la
significacin ser mayor al aumentar el tamao de la muestra (nmero de pares muestrales)
y para un mismo tamao de muestra, la significacin aumentar al aumentar el valor de r.
Esto es, la significacin estadstica de r frente a la hiptesis nula de no correlacin, aumenta
exclusivamente con el valor de r y con el tamao de la muestra.
9.3.1. El coeficiente de determinacin r
Si se eleva al cuadrado el coeficiente de correlacin, se obtiene el llamado coeficiente de
determinacin, r, con un rol muy importante en el anlisis ya que permite relacionar la suma
de cuadrados de y alrededor de su media (Tabla 9.1, columna [y y] ), con la suma de cuadrados residual a la que se reduce la variabilidad de y cuando se la mide con respecto a la recta de
regresin. Su significado se comprender mejor a travs del ejemplo que se viene examinando.
Ejemplo 9 (continuacin). Variabilidad total y variabilidad explicada por la regresin
Como se ha visto en 2.5.2, la varianza muestral es el cociente entre la suma de las desviaciones de la media elevadas al cuadrado y el nmero de elementos de la muestra. El numerador de esta expresin se denomina suma de cuadrados alrededor de la media, y es tambin
una medida de la variabilidad. En la Tabla 9.1, la suma de cuadrados alrededor de la media
para la variable dependiente y es el total de la columna (y y), que expresa la dispersin de
las y independientemente (sin tomar en cuenta) los valores de x.
Por otra parte, en Tabla 9.2 se calcularon las desviaciones verticales de las y respecto de
la recta (ver Figura 9.2, d). Estas desviaciones, elevadas al cuadrado y sumadas, expresan lo
que queda de la variabilidad total de las y cuando sus desviaciones se toman respecto de la
recta de regresin, y recibe el nombre de suma de cuadrados residual. En Tabla 9.2, es el total
de la columna (y observado Y recta).
Si ahora, a la suma de cuadrados alrededor de la media se le resta la suma de cuadrados
residual, puede comprenderse que la diferencia represente los cuadrados explicados por la
regresin, o sea, la porcin de variabilidad o incertidumbre en la estimacin de y que ha sido
suprimida al tomar como referencia a la recta de regresin en lugar de la media de las y (los
cuadrados suprimidos por la regresin se corresponden con las distancias desde la recta a
la media de y, tomadas a nivel del valor x de cada observacin [Y recta y] ). De acuerdo a
lo expresado, la relacin entre las sumas de cuadrados puede escribirse:
suma alrededor de la media (suma total) suma residual = suma explicada por la regresin
En el ejemplo, la suma total de cuadrados alrededor de la media de y est dada en la
Tabla 9.1 y es igual a 22, la suma residual, obtenida en Tabla 9.2, es igual a 2.4, y la suma de
cuadrados explicada por la regresin resulta igual a 22 2.4 = 19.6. La variabilidad que resta
en el modelo luego de aplicada la regresin de y en x, variabilidad residual, es muy pequea
[ 276 ]
comparada con la variabilidad de y sin regresin (igual a 22), y con la variabilidad explicada
por la regresin (igual a 19.6).
Se demuestra que el coeficiente de determinacin r es igual a la proporcin de la variabilidad total de la y, explicada por la regresin. En trminos de suma de cuadrados:
r = suma explicada por la regresin / suma alrededor de la media
En el ejemplo se tiene que
r = 19.60 / 22
= 0.891
valor idntico al que se obtiene elevando al cuadrado el coeficiente de correlacin r calculado
ms arriba (r = 0.944 = 0.891). Una proporcin muy alta de la variabilidad total de la y est
explicada en este ejemplo por la regresin, exactamente 0.891 u 89%. Queda un 11% de la variabilidad, no explicada por la regresin, que es la variabilidad residual alrededor de la recta.
Esto puede visualizarse en la Figura 9.2, donde las distancias de los puntos a la recta son pequeas comparadas con el rango de variacin total de las y alrededor de su media. Debe tenerse
presente que para evaluar el efecto de una regresin en la estimacin de la variable dependiente,
no es preciso realizar las sumas de cuadrados vistas ms arriba, sino que basta con calcular el
cuadrado del coeficiente de correlacin r, que resulta igual a la proporcin de la variabilidad
total de y eliminada por el empleo de la ecuacin de regresin. Cuanto ms se aproxima r a la
unidad, mayor es la eficacia de la regresin y menor la variabilidad residual de las observaciones
alrededor de la recta. Cuando r = 1, el 100% de la variabilidad est explicada por la regresin,
la residual es cero y los puntos se hallan exactamente sobre la recta.
Como se acaba de ver, la proporcin de la variabilidad total de una variable y explicada por
su regresin en una variable x, est dada por el coeficiente de determinacin r. Dicha variabilidad, por motivos tericos, est expresada en trmino de sumas de cuadrados, y la suma total es
precisamente el numerador de la varianza muestral de y. Para dar un ejemplo ms, en la regresin
del peso en la talla ilustrada en la Figura 9.3, el coeficiente de correlacin es r = 0.71 y el coeficiente
de determinacin r = 0.50, de donde se deduce que la variabilidad del peso, en trmino de suma
de cuadrados, se reduce en 50% al tomar en cuenta su regresin en la talla. Una idea de esta reduccin la da la inspeccin de la figura, donde se ve que la dispersin de los puntos hacia arriba
y abajo de la recta es bastante menor que la dispersin total alrededor de la media, que va desde
41 a 128 kg. Sin contar con la regresin en la talla, si hubiera que apostar al valor ms probable
del peso de un individuo sorteado del conjunto, lo ms ventajoso sera optar por la media de la
muestra, que es igual a 72 kg, ya que en distribuciones normales el mximo de probabilidad est
en el centro de la distribucin. En cambio, conociendo la regresin del peso en la talla, lo ms
conveniente sera apostar al valor que da la recta para la estatura del individuo en cuestin. Por
ejemplo, si se sabe es igual a 180 cm, la ecuacin proporciona y = 117 + 1.144 180 = 89 kg, y
este valor tiene ms probabilidades de acercarse al peso real del sujeto que la media muestral de 72
kg. Esto es as porque los pesos estn ms concentrados alrededor de la recta (variacin residual
de las y) que alrededor de su media (variacin total de las y). Puede argumentarse que, de llevarse
[ 277 ]
a cabo el experimento, el individuo con talla de 180 cm podra por azar exhibir un peso cercano a
72 kg y perderse la apuesta. Esto puede ocurrir porque los valores que proporciona la recta son solamente los ms probables, y existe una dispersin residual alrededor de la misma, no eliminada
(explicada) por la regresin. Por este motivo podran llegar a perderse algunas apuestas, pero en el
largo plazo, si se repitieran un cierto nmero de veces, se comprobara que en promedio, los pesos
reales se acercan ms a los pesos estimados a partir de la talla que a la media muestral, y esto es
as porque los pesos reales estn en promedio ms prximos a la recta que a su media muestral.
Muy generalmente, puede decirse que correlaciones que van entre r = 0.50 y r = 0.70 son
consideradas buenas. Sin embargo, el valor de un coeficiente de correlacin no slo descansa
en su magnitud sino tambin, en lo adecuado que resulta para la explicacin de los fenmenos estudiados y en las necesidades del estudio (ver ms adelante). Por otra parte, a una correlacin como la recin vista entre la talla y el peso corporal, con r = 0.71, corresponde r = 0.50
y la dispersin original slo se reduce un 50%. Queda una proporcin similar de variabilidad
en la suma de cuadrados residual. No obstante, la significacin estadstica de r = 0.71 en una
muestra de 255 individuos como la del ejemplo, tiene una P < 0.00001. Recurdese que esta P
es la misma que para la prueba del coeficiente de regresin b, y en cualquier caso significa que
una relacin tal como se dio en la muestra y se observa en la figura 9.3, se obtendra por azar
en una muestra no correlacionada, en menos de 1 en 100000 veces. Como se ha mencionado,
la significacin estadstica de un coeficiente de correlacin depende en gran parte del nmero
de casos en las muestras y as, pueden obtenerse coeficientes altamente significativos an con
valores absolutos relativamente bajos, por lo que la importancia del grado de correlacin no
debiera confundirse con la significacin estadstica del respectivo coeficiente.
9.4. Aplicaciones principales de la regresin
Dentro de las aplicaciones de la regresin a los problemas de la investigacin mdica
pueden mencionarse:
Descripcin de la relacin entre dos variables
Esta es la ms general de las aplicaciones: en presencia de asociacin entre dos variables
cuantitativas que puedan considerarse continuas, la regresin determina el signo de la misma,
su grado (dado por la magnitud de la variacin explicada por la regresin), la posicin y la pendiente de la correspondiente recta de regresin y aporta informacin sobre la distribucin de
las desviaciones residuales, que muchas veces resulta de utilidad. Puede decirse que la regresin
caracteriza y resume la informacin relativa a la asociacin de las variables implicadas.
Ciertos ndices clnicos corresponden a coeficientes de regresin; as, se podra afirmar
que en poblaciones adecuadamente representadas por la muestra del ejemplo de la talla y el
peso corporal, ste crece a razn de 1.14 kg por cada centmetro de incremento de la talla. El
valor 1.14 es el coeficiente de regresin de la correspondiente ecuacin del peso en la talla.
Interpretacin de la relacin entre dos variables
Este punto se halla relacionado con el anterior, y con la distincin entre asociacin y causalidad. Las caractersticas de la asociacin entre dos variables informan sobre su comportamiento
en el contexto biolgico del cual proceden y permiten extraer conclusiones tiles. Tpicamente,
[ 278 ]
un aumento de la pendiente de regresin seala una mayor tasa de cambio de la variable dependiente por cada aumento unitario de la variable independiente. Un punto de la mayor importancia relacionado con la interpretacin de la asociacin entre dos variables, es el relativo a las
posibles vinculaciones causales entre los fenmenos descriptos por aqullas. En este sentido, el
hallazgo de regresin entre dos variables est lejos de asegurar que una sea la causa de la otra.
De cualquier manera, el modelo matemtico de la regresin no es una herramienta destinada a
detectar causas, sino a establecer el modo de asociacin entre variables de acuerdo a modelos
estadsticos. En algunos casos la relacin causal puede ser ms o menos evidente, como la posible
relacin entre concentracin de antibitico y rea de inhibicin del crecimiento bacteriano, y la
interpretacin se basa en conocimientos mdicos y no en indicios provenientes de los datos de la
regresin. Ms an, la tendencia a relacionar causalmente dos variables no queda definitivamente convalidada por el solo hallazgo de asociacin estadstica, ya que sta puede deberse a otras
asociaciones interpuestas, cuya deteccin es un tema adicional. Por ejemplo, si bien es de esperar
encontrar correlacin positiva entre las cifras de urea y creatinina plasmtica, no parecera lgico atribuir a una de ellas el aumento de la otra, siendo lo ms plausible que ambas sustancias
varen en el mismo sentido de acuerdo a la funcin renal. En resumen, debe quedar claro que
asociacin estadstica no implica causalidad, aunque por cierto no la excluye, y las relaciones de
causa-efecto entre dos variables tendern a producir asociacin entre las mismas. La asociacin
entre dos variables es un hecho de demostracin estadstica, mientras que atribuir un mecanismo
de causa-efecto a la asociacin demostrada es un producto del juicio del investigador, basado en
sus conocimientos del tema y la informacin previa disponible.
Prediccin de la variable dependiente
Conociendo la regresin de una variable dependiente y en una variable independiente x,
es posible predecir el valor ms probable de y para cada magnitud que se asigne a x. Dicho
valor es el que toma la coordenada y de la recta de regresin para la correspondiente x. Esto
quiere decir que la prediccin de y es para valores determinados de x, y es el caso de la prediccin del peso corporal a partir de la talla comentado anteriormente. Hay que tener en cuenta
que el valor predicho de y tiene un grado de incertidumbre debido a la variacin residual alrededor de la recta, por lo cual, para aumentar la precisin, la residual debera ser lo ms pequea posible, lo que se consigue cuando el coeficiente de correlacin r es lo suficientemente
grande. Debido a esta aplicacin, la variable independiente x suele ser denominada variable
predictora o simplemente, predictor. Conviene tener presente que una prediccin eficaz de
la variable dependiente no requiere que existan nexos causales con la variable predictora,
sino que la variabilidad explicada por la regresin sea lo suficientemente grande como para
acotar el error residual, situacin que se expresar en un coeficiente de determinacin r ms
o menos cercano a la unidad.
Ajuste para una covariable
Se trata de un procedimiento extremadamente til para comparar una determinada variable, en dos muestras que difieren en forma importante en algn factor, variable independiente o covariable, que a su vez tiene la capacidad de alterar la variable en estudio. En la figura 9.4 se puede observar que el perodo eyectivo ventricular izquierdo (la variable de inters,
[ 279 ]
[ 280 ]
Si bien el deslizamiento de los puntos a lo largo de la recta puede imaginarse sin mucha
dificultad y la inspeccin visual del grfico es muy til, el anlisis se realiza por medio de tcnicas matemticas. Nuevamente conviene recordar que el procedimiento est disponible en la
mayora de los paquetes estadsticos bajo los ttulos comparacin de las rectas o anlisis
de la covarianza.
Se mencionarn algunos detalles de la prueba. Primero conviene obtener una recta de
regresin para cada grupo y comprobar que las pendientes no sean muy diferentes: en caso
contrario, la relacin funcional entre eyectivo y frecuencia cardaca ser distinta para cada
grupo y el ajuste para la frecuencia cardaca no ser seguro. Si en cambio las pendientes
son similares, se renen ambas regresiones en una sola y se evala si los puntos de un grupo
estn ms altos o bajos que los del otro, con respecto de la recta de regresin comn. La
eventual diferencia en la altura de las y para cada grupo, dar la pauta de diferencias entre
grupos corregidas o ajustadas para la frecuencia cardaca. Esto es lo que se ha hecho en la
Figura 9.4: se ha trazado la recta comn para ambos grupos y resulta claro que los respectivos
puntos no difieren en su altura con respecto a la recta, y se superpondran si se los deslizara
a lo largo de la misma. En la comparacin de diversas variables, el ajuste para factores que
pueden afectarlas y dificultar la interpretacin de los resultados es uno de los recursos ms
tiles del anlisis estadstico.
9.5. Regresin lineal y curvilinear. Transformaciones
Si bien es frecuente que las relaciones entre dos variables correspondan a puntos que
tienen tendencia a distribuirse a lo largo de una lnea recta, en otras oportunidades la observacin del grfico de dispersin sugiere que los puntos se hallan mejor representados por
lneas curvas. En estos casos la relacin entre las variables dependiente e independiente no es
lineal, y la expresin general y = a + bx ya no la describe en forma apropiada. En estos casos
es frecuente que una o ambas variables puedan ser re-expresadas mediante un cambio de escala, de modo que la nueva relacin entre ellas sea lineal. Estos cambios de escala se conocen
como transformaciones y han sido comentados en 4.8. Tpicamente consisten en expresar
las variables como su logaritmo, su inversa o bien una potencia (que para un exponente = 1/2
es la raz cuadrada de la base). Cuando esto es efectivo, las variables transformadas exhiben
entre s una relacin lineal y pueden ser analizadas por los mtodos corrientes que se han
visto hasta aqu y que se incluyen en los paquetes estadsticos.
Frecuentemente ocurre que la desviacin de la linearidad exhibida por los datos es poco
marcada y, en estos casos, la regresin lineal con la variable original puede resultar preferible por su simplicidad y porque en general, la interpretacin de los datos en sus unidades de
medida habituales resulta ms sencilla y directa. No obstante, si el ajuste lineal de los datos
transformados resulta en un incremento significativo del coeficiente de determinacin r, ser
en general aconsejable trabajar con los mismos. Por lo dems, en los casos en que las variables
x e y se hallan relacionadas en forma no lineal, puede ser importancia en la investigacin el
tratar de determinar el significado biolgico de la relacin curvilinear entre aqullas. Acerca
de las transformaciones en regresin lineal puede consultarse Ingelfinger, 1994.
[ 281 ]
10.1. Introduccin
El anlisis de la varianza comprende un conjunto de tcnicas entre cuyas principales aplicaciones est la comparacin de medias muestrales en los casos en que los datos se hallan
clasificados en ms de dos formas o grupos. En este sentido, las tcnicas conocidas como de
anlisis de la varianza constituyen extensiones de los procedimientos para la comparacin de
pares de muestras vistos en secciones anteriores. Aqu se expondrn los conceptos bsicos en
los que dichas tcnicas se fundamentan. As como existen muchas formas de obtener y disponer
los datos de los diversos tipos de estudio, hay tambin un gran nmero de modelos para su anlisis. Sin embargo, debe tenerse en cuenta que los lineamientos generales para la comparacin
de medias, contraste de hiptesis, interpretacin de los estadsticos de prueba y de los niveles
de significacin obtenidos, son los ya vistos en las Secciones 6 y siguientes. En el anlisis de la
varianza, lo que aumenta es el nmero de hiptesis y pruebas que se evalan simultneamente
en un mismo conjunto de datos y por lo tanto, la complejidad de los procedimientos y de los
clculos numricos, que en general requieren de programas para su computacin.
Como se ver, estas tcnicas analizan la variabilidad de los datos separndola segn sus
fuentes de origen, que son la variabilidad de los individuos dentro de cada grupo, y la variabilidad entre los distintos grupos en los que se clasifican los datos. La variabilidad entre los
grupos se expresa por la variabilidad entre sus medias, y si sta es mayor que la observada
entre los individuos que los integran, se puede concluir que deben existir diferencias entre las
medias de los grupos estudiados. La variabilidad se evala mediante varianzas obtenidas de
las muestras, y de ah el nombre de este conjunto de procedimientos, que a pesar del mismo
estn dedicados a la comparacin de medias.
Por lo dems, el anlisis de la varianza, al permitir la comparacin de cada una de tres
o ms medias muestrales con todas las dems, da origen a comparaciones mltiples, que
aumentan las posibilidades de anlisis y a la vez implican limitaciones que deben tenerse en
cuenta al interpretar los resultados. Este tema se comentar con algn detalle en 10.3.
10.2. Anlisis de un factor. Tcnica para la comparacin de varios grupos
En lo que sigue se describirn los elementos bsicos hallados en el modelo conocido como de un factor, donde se analiza una determinada variable o factor, como puede ser la
glucemia o el peso corporal, en muestras o grupos provenientes de una poblacin con media
[ 282 ]
dias grupales y a aceptar la existencia de diferencias significativas entre ellas, que podrn
adjudicarse a diferencias entre los grupos en relacin a sus distintos niveles o tratamientos.
De esta manera, la variabilidad total de los datos puede descomponerse en la variabilidad
dentro de los grupos y la variabilidad entre los grupos. Esta ltima se calcula a partir de
las medias muestrales x i , mientras que la variabilidad dentro de los grupos se estima como
el agregado de la variabilidad en cada uno de stos. La variabilidad dentro de cada grupo
se calcula con respecto a la media del mismo, con lo que la eventual variacin entre las medias no tiene influencia en esta estimacin. En el caso de existir diferencias entre las medias
de los grupos, sus medias muestrales x i presentarn un grado mayor variabilidad que el
esperado por efectos del azar, y la variabilidad entre los grupos agrandar la variabilidad
total s de los grupos considerados en su conjunto, sin afectar la variabilidad dentro de los
grupos (o sea, sin afectar la variabilidad dentro de cada uno de los grupos). As, la razn
entre la variabilidad entre los grupos y dentro de los grupos se agrandar, dando idea de
las diferencias existentes entre las medias.
La variabilidad total del conjunto de datos se calcula a partir de las desviaciones de cada
elemento de cada grupo, de la media comn para todos los grupos, y es en realidad la varianza muestral de todos los grupos reunidos en uno solo. Se puede luego calcular la variabilidad
entre los grupos (entre las medias de los grupos) y restndola de la variabilidad total, obtener
la variabilidad dentro de los grupos. Como ya se ha dicho, si la variabilidad entre los grupos,
en comparacin con la variabilidad dentro de los grupos, excede determinados valores, se
est en condiciones de afirmar que existen diferencias significativas entre las medias de los
distintos grupos en estudio, no explicables por las fluctuaciones del azar. La comprobacin
de tales diferencias es el objeto principal de este modelo de anlisis de la varianza.
En todas estas tcnicas, la variabilidad se mide como sumas de cuadrados (esto es, desviaciones de la media elevadas al cuadrado, como las que forman el numerador de las varianzas, 2.5.2). Se cumple que:
Suma de cuadrados total = suma de cuadrados entre los grupos + suma de cuadrados dentro
de los grupos.
Cada suma tiene asociada cierta cantidad de grados de libertad en relacin al nmero y
forma de agrupacin de los datos y, dividiendo las sumas por sus respectivos grados de libertad se obtienen los llamados cuadrados medios, que en realidad son varianzas (el cuadrado
medio total es la varianza muestral de todos los casos, tal como se calcula en 2.5.2). En un
modelo con k grupos de n elementos cada uno, donde n k = N es el nmero total de datos,
los grados de libertad dentro de los grupos se calculan como N k, y los grados de libertad
entre grupos, como k 1.
Aqu aparece el punto ms importante de toda la tcnica: debido al diseo del anlisis,
si no hay fuentes de variabilidad extra entre los grupos (diferencias entre las medias), el cuadrado medio entre grupos (s entre) y el cuadrado medio dentro de los grupos (s dentro)
estimarn una misma varianza de poblacin y no sern muy diferentes entre s. Pero si hay
fuentes de variabilidad que afecten a los grupos y sus medias, el cuadrado medio entre grupos aumentar con respecto al cuadrado medio dentro de los grupos, que se mantendr sin
cambios como un estimador de , con lo cual la razn (s entre) / (s dentro) se incrementar
en mayor o menor grado. El cociente de varianzas
[ 284 ]
(s entre) / (s dentro) = F
(10.1)
sigue la llamada distribucin F, que se halla tabulada segn los grados de libertad del numerador y del denominador, proporcionando la probabilidad P de que un valor F sea excedido
por error de muestreo en el caso en que las varianzas entre y dentro de los grupos estimen la
misma magnitud .
La hiptesis nula es que las distintas medias muestrales x i no difieren significativamente entre s y que las diferencias observadas entre medias se deben al azar del muestreo.
El cociente se forma siempre con el mayor s en el numerador, de modo que F nunca es
menor que 1. El caso que interesa es aquel en que el mayor cuadrado medio es s entre, sealando una posible diferencia significativa entre las medias. Los grados de libertad de los
cuadrados medios se calculan como se expuso ms arriba, y mediante los mismos se busca en
las tablas de F la probabilidad asociada con el valor muestral hallado en el anlisis. Lo visto
hasta aqu se ilustrar con un ejemplo para aclarar ciertos aspectos de inters del procedimiento, dejando a un programa de estadstica la tarea realizar los clculos numricos.
A fin de simplificar los conceptos en todo lo posible, se da una tabla con el peso en kilogramos de tres grupos de adultos del sexo masculino con diferentes condiciones clnicas. Los
grupos se rotulan A, B y C. Cada grupo consta de 10 individuos. Sus medias figuran en la
ltima fila.
Grupo
Medias
Grupo B
Grupo C
Grupo D
86
89
101
92
84
66
100
101
64
93
95
87
87
100
73
111
94
66
104
97
72
96
65
70
84
75
53
102
99
77
95.5
89.9
72.9
Grados de libertad
Suma de Cuadrados
k1=2
2784.8
1392.4
10.39
0.0004
Dentro
N k = 27
3616.9
134.0
Total
N 1 = 29
6401.7
Entre
Los grados de libertad entre y dentro de los grupos son iguales a 3 1 = 2 y 30 3 = 27
respectivamente. En la tercera columna puede comprobarse que las sumas de cuadrados entre
[ 285 ]
y dentro de los grupos suman el total de cuadrados. Dividiendo las sumas de cuadrados por
sus respectivos grados de libertad, se obtienen los cuadrados medios, que son las varianzas
entre y dentro de los grupos. El cociente entre los cuadrados medios entre y dentro de los
grupos, 1392.4 / 134 es igual a 10.39, que es el valor muestral del estadstico F. Este es el
estadstico de prueba de la hiptesis nula de igualdad de medias grupales.
Segn tabla, para 2 y 27 grados de libertad, la probabilidad asociada con F igual o mayor que 10.39 es P = 0.0004. El cuadrado medio entre los tres grupos es significativamente
mayor que el cuadrado medio dentro de los grupos, con lo que se descarta la hiptesis nula
de varianzas iguales, y dado que el cuadrado medio entre grupos representa la variabilidad
entre las medias muestrales, se debe descartar la hiptesis nula de medias muestrales iguales. Se acepta automticamente la hiptesis alternativa de diferencias entre las muestras, en
particular entre sus medias. Surge entonces el problema de averiguar entre qu muestras, A,
B, y C, se encuentran las diferencias significativas entre las medias. Como se comprender,
las diferencias significativas podran darse entre cada una de las medias o bien slo entre
algunas de ellas. Las tres posibles comparaciones son A y B, A y C, B y C. En estos casos se
habla de comparaciones mltiples, y la diferencia hallada ms arriba puede radicar en mayor
o menor grado en los diferentes pares de muestras pasibles de ser comparados. Existen varios
procedimientos adecuados, que pueden obtenerse en forma inmediata de los programas de
anlisis estadstico y detectan los pares de medias entre los que las diferencias pueden ser
consideradas significativas, proporcionando asimismo su nivel P de significacin. Pero antes
de enumerar los ms empleados se comentar el tema ms general de las comparaciones repetidas o mltiples en estadstica.
10.3. Comparaciones mltiples
Las comparaciones mltiples aparecen frecuentemente en el trabajo con muestras, y es
necesario estar al tanto de ciertas caractersticas que les imprimen a las pruebas de hiptesis.
El hecho fundamental en las comparaciones mltiples radica en que an en el caso en que
dichas comparaciones fueran realizadas entre grupos donde no existen diferencias significativas, por ejemplo comprobando pares de medias de entre varios grupos provenientes de un
mismo universo, siempre existe la probabilidad de hallar diferencias significativas entre algunos de esos pares, simplemente por azar (6.6). Cuando se adopta un nivel de significacin
P = 0.05, las comparaciones mltiples producirn conclusiones errneas en alrededor de uno
de cada veinte ensayos realizados. La probabilidad de resultados errneos se relaciona con
el nivel de significacin adoptado al realizar las comparaciones o lo que es lo mismo, con la
magnitud del error de tipo alfa esperado, y en general no habra precauciones especiales que
tomar si las comparaciones se limitaran estrictamente a aquellas para las cuales fue diseado
el experimento y donde es razonable esperar resultados. Sin embargo, en la bsqueda de conclusiones interesantes o potencialmente tiles, es frecuente realizar todas las comparaciones
posibles entre grupos de muestras esperando obtener diferencias significativas que, en todo
caso, se procuran explicar una vez encontradas. Estos procedimientos de rastrillaje o dragado (dredging), muy empleados en la produccin de resultados, tienen el serio inconveniente
mencionado ms arriba de la obtencin de una cierta cantidad de resultados significativos
producidos por azar.
[ 286 ]
Si bien restringir las comparaciones a los grupos de inters ayuda a minimizar el problema, la solucin no es completa y cabe imaginar circunstancias en las cuales aparezcan
diferencias significativas inesperadas pero de gran importancia para el tema en estudio. Una
manera de hacer menos probable la aparicin de diferencias significativas debidas al azar, es
adoptar niveles de significacin ms altos al llevar a cabo comparaciones mltiples. Por otra
parte, se han desarrollado varios mtodos para realizar este tipo de comparaciones en grupos
de muestras, que tienen la propiedad de ser ms conservadores que la comparacin de los
mltiples pares de medias posibles mediante la reiteracin de pruebas de significacin estadstica independientes. Sin embargo, si la comparacin entre pares de grupos se realiza eligiendo
los pares segn su importancia en el diseo del experimento y con una hiptesis previa, esto
es, evitando el rastrillaje sistemtico, la diferencia entre un par de medias puede evaluarse
mediante su error estndar y la distribucin t, como se ver en el siguiente ejemplo.
Ejemplo 10 (continuacin)
Si se eligen dos medias de entre un grupo de muestras donde se ha determinado el cuadrado medio o varianza entre y dentro de los grupos, tal como se ha mostrado en la primera
parte del ejemplo, se puede poner a prueba la hiptesis nula de medias iguales mediante el
estadstico t, que se calcula como el cociente entre la diferencia de las medias y su error estndar, tal como se hizo en 7.2.
El error estndar de la diferencia se obtiene a partir del cuadrado medio dentro de los
grupos, s dentro, que toma el lugar de s en la ecuacin (7.2). Con esto, y si el nmero de
elementos n es igual para todas las muestras, (7.3) se convierte en:
ES diferencia = s dentro (2 / n)
(10.2)
(10.3)
A versus C:
B versus C:
y son ambas altamente significativas. Por lo tanto, de los tres pares de medias posibles, hay
dos que difieren en forma significativa y uno que no lo hace.
Debe notarse que el ES diferencia es el mismo para todas las comparaciones, ya que se trata
de un estadstico calculado a partir de todos los grupos.
La posibilidad de utilizar una nica estimacin del ES diferencia para todo el conjunto de
grupos, permite calcular la diferencia mnima que deber haber entre dos medias cualesquiera
para ser significativa. En el ejemplo, para un nivel de significacin P = 0.05, el valor de t para 27
grados de libertad (dentro de los grupos, ver antes) es segn tablas igual a 2.052 y por lo tanto,
para que una diferencia se considere significativa en ese nivel, tendr que ser igual o mayor a
2.052 veces el ES diferencia, o sea mayor que 2.052 5.18 = 10.63. Esta es la llamada diferencia
significativa mnima (LSD o least significant difference) y cualquier diferencia igual o mayor
ser significativa para el nivel de confianza adoptado (en este caso 0.05). Puede verse por inspeccin visual que esa diferencia es superada por la de los grupos A versus C y B versus C, mientras que la diferencia entre A y B es menor y por lo tanto no significativa. Un procedimiento
para chequear la significacin de un conjunto grande de diferencias consiste en disponerlas en
forma creciente o decreciente y comenzar la evaluacin por los valores extremos. Si la diferencia
resulta significativa se procede hacia los valores interiores, y una vez que una diferencia resulta
no significativa, los restantes pares comprendidos ya no necesitan ser chequeados.
Sin embargo, al aumentar los grupos aumentan los pares de datos que se pueden formar,
y para k grupos hay un total de pares igual a k (k1). Al comparar los pares por el mtodo
del error estndar de la diferencia como se hizo en el ejemplo, y al aumentar la cantidad de
comparaciones, aparece el problema de las comparaciones mltiples y debe evitarse el riesgo de obtener un exceso de comparaciones significativas a expensas de pares que difieren
por azar. Con el objeto de obtener pruebas de significacin que reduzcan dicho riesgo, se
han diseado, como se ha mencionado ms arriba, una variedad de mtodos que tienen la
caracterstica de ser ms conservadores, de modo que al evaluar un conjunto de grupos con
la misma media universal , cuyas medias muestrales difieren slo por error de muestreo, la
probabilidad de obtener un resultado significativo no exceder el nivel de significacin que el
test invoca. Los principales son los de Bonferroni, Newman-Keuls, Scheff y Tukey. Con el
mtodo de Bonferroni, el nivel de significacin que se desea evaluar se divide por el nmero
de comparaciones a realizar. Si por ejemplo se realizan 3 comparaciones, como en el ejemplo
visto antes, aceptndose un nivel de significacin P = 0.05, para que cualquiera de las comparaciones pueda ser declarada significativa en ese nivel, deber alcanzar una P = 0.05 / 3
= 0.016. En el ejemplo anterior las dos diferencias detectadas como significativas lo siguen
siendo de acuerdo al mtodo de Bonferroni, pues en ambas es P < 0.016. Sin embargo, este
mtodo, aunque fcil de realizar, tiene el inconveniente de tornarse excesivamente conservador al aumentar el nmero de comparaciones y disminuir mucho el valor de P requerido para
poder afirmar que una diferencia es significativa. Es posible que en general deban preferirse
los otros mtodos arriba mencionados. Todos ellos estn disponibles en los mens de los
programas de estadstica.
[ 288 ]
dent para muestras apareadas. De este modo, es el procedimiento a elegir cuando se tienen
tres o ms muestras originadas en un mismo grupo de individuos, tpicamente, resultados
a lo largo de varios tratamientos o en varios momentos de la evolucin de una determinada
enfermedad. La variabilidad debida a las distintas modalidades de comportamiento de los
diferentes individuos queda excluida de la varianza residual contra la cual se realizan las
comparaciones de las varianzas entre grupos.
Cuando en el modelo de dos factores ambos corresponden a tratamientos o condiciones experimentales bajo el control del experimentador, el correspondiente diseo recibe el
nombre de factorial de r filas por c columnas o factorial r c. En estos casos existen dos
tratamientos, uno con r y otro con c dosajes o modos de administracin. Se dice que un tratamiento presenta r niveles y el otro c niveles. La disposicin de los datos es la misma que en la
tabla del Ejemplo, con c columnas correspondientes al tratamiento con c niveles, y r filas correspondientes a los r niveles del otro tratamiento. La diferencia fundamental con el modelo
de bloques randomizados est en que ahora el segundo factor es otro tratamiento controlado
por el investigador.
Los diferentes mtodos de anlisis de la varianza se hacen ms complejos a medida que
los modelos experimentales se van haciendo ms complicados, y el objetivo de este incremento en la complejidad es aumentar la eficacia de los anlisis y la capacidad de aislar y
cuantificar fuentes de variacin de los datos que agreguen informacin relevante acerca de las
poblaciones muestreadas. Se obtiene as una variedad de diseos o modelos experimentales,
en cuyo examen no se entrar en esta oportunidad y pueden consultarse en Armitage y Berry,
1994.
10.4.1 Interaccin
Un hecho conocido en el campo de la biologa es que en ocasiones, la aplicacin simultnea de dos tratamientos o intervenciones sobre un mismo objeto de estudio, produce un
efecto mayor que el que se podra esperar de la simple suma de los efectos de cada tratamiento aplicado en forma individual. Esto se expresa a veces como potenciacin de los efectos
y puede verse algunas veces entre dos antibiticos o entre dos frmacos empleados con un
mismo objeto. En otras oportunidades, el efecto resulta menor que el esperado de la suma de
los efectos individuales de cada tratamiento, y en estos casos se habla de atenuacin o cancelacin de los mismos. El fenmeno puede llegar a detectarse mediante el anlisis estadstico
de los datos, recibiendo el nombre de interaccin.
Para obtener una nocin de sus aspectos estadsticos, considrese un diseo factorial de
dos tratamientos, con los resultados dispuestos en una tabla con c columnas correspondientes
a los c niveles de un tratamiento A, y r filas correspondientes a los r niveles de un tratamiento
B. Supngase que hay una observacin para cada posible combinacin de los niveles de A y
B, o sea para cada celda de la tabla. Si en estas circunstancias alguna de las observaciones
en las celdas presentara un valor llamativamente diferente del resto (mucho mayor o mucho
menor), el investigador estara autorizado a sospechar la presencia de interaccin entre los
correspondiente niveles de los dos tratamientos. Sin embargo, con una observacin por celda,
la interaccin queda confundida y sumada con la variabilidad entre filas y entre columnas,
y no existe forma de ponerla en evidencia. En estos casos, obteniendo varias observaciones
[ 290 ]
o rplicas por celda, puede llegar a separarse la variabilidad entre las medias de las distintas
celdas, de la variabilidad entre las filas y la variabilidad entre las columnas. De este modo, la
eventual presencia de interaccin entre determinados niveles de las filas y columnas, puede
llegar a ponerse en evidencia mediante el examen de la variabilidad entre las medias de las
celdas. Esto aumenta la complejidad del modelo, y la variabilidad residual con la que se realizan las comparaciones debe ser re-calculada a partir de la variabilidad dentro de las celdas,
una vez aislada la variabilidad entre las mismas. Afortunadamente, los paquetes estadsticos
corrientes evitan los clculos numricos extensos y proporcionan distintos modelos de anlisis basados en diferentes estructuras de los datos. En esta seccin slo se han procurado delinear y resumir las ideas bsicas en las que se funda el conjunto de tcnicas conocidas como
anlisis de la varianza.
[ 291 ]
11.1. Generalidades
Muchas veces hay asociacin entre ms de dos variables y existe la posibilidad de expresar una de ellas en funcin de las dems. Una forma de hacerlo consiste en una extensin del
mtodo de la regresin para un par de variables x e y. En este caso habr ms de una variable
independiente, cuyos valores determinarn a la variable dependiente y de acuerdo con una
ecuacin de regresin mltiple. Varias x son as utilizadas simultneamente para explicar los
cambios de la y. Las distintas variables x1, x2 , xi , suelen llamarse variables independientes
y tambin predictores o covariables. Se ha sealado que como muchas veces dos o ms de
las xi estn correlacionadas entre s y por lo tanto no son estadsticamente independientes,
la expresin variable independiente debera evitarse. Sin embargo su uso est aceptado, en el
sentido de que cada xi puede condicionar en parte los valores que adopta y.
En lneas generales, gran parte de los conceptos vistos con respecto a la regresin simple de
una sola x, se mantienen para la regresin mltiple. Con la introduccin de ms de una variable
independiente, muchas veces es posible aumentar la precisin de las estimaciones de la variable
dependiente, lo cual se explica porque cada variable independiente aporta informacin para
dicha estimacin, hecho que se traduce en una reduccin de la variabilidad residual (la que
permanece inexplicada por la regresin). Desde ya, una de las aplicaciones de la regresin
mltiple es el aumento de la precisin en la prediccin de una variable dependiente.
11.2. La ecuacin de regresin mltiple
La forma general de la ecuacin de regresin mltiple estimada a partir de los datos es:
Y = a + b1x1 + b2x 2 + + bixi + + bnxn
(11.1)
donde bi son los coeficientes de regresin mltiple o de regresin parcial de Y en xi. En forma
anloga a lo ya visto para la regresin lineal simple, estas ecuaciones se calculan para conjuntos de datos (muestras) donde se han medido la variable dependiente y las n variables independientes xi. Mediante el procedimiento de cuadrados mnimos se obtienen los coeficientes
a y bi con los que se formula la ecuacin correspondiente al conjunto de datos. Posteriormente, estas ecuaciones pueden ser utilizadas en sus varias aplicaciones, sustituyendo las x por
valores elegidos, para obtener el valor esperado o predicho de la variable dependiente y. Cada
[ 292 ]
[ 294 ]
to de variables independientes x1, x2 , xn). Como para r en el caso de una sola x, R mide
la proporcin de la variabilidad total de las Y explicada por la regresin. Sin embargo, hay
una diferencia con el caso de la regresin simple y es que, en la regresin mltiple, R informa
acerca del valor global de la funcin de regresin pero no indica cul o cules de las x son las
que contribuyen significativamente a predecir la variable dependiente. Es as que an en el
caso ms simple de dos variables independientes, x1 y x2 , R no seala si ambas o slo una de
las xi son las que aportan a la regresin. Esta informacin se puede obtener de los coeficientes
de regresin mltiple, bi , cuya significacin frente a cero se evala para cada xi frente a su
error estndar, mediante la distribucin t. De lo dicho se desprende que la informacin que
da R es poco detallada y deben examinarse los coeficientes de regresin mltiple para estimar la importancia de cada variable independiente. Tambin puede evaluarse la magnitud del
cambio producido por el agregado de una variable independiente, a travs de las variaciones
experimentadas por R. Estas pueden ser o no significativas, y en el primer caso, el grado de
incremento de R permite conocer la proporcin de varianza de la variable independiente Y,
explicada por la variable independiente introducida en ltimo trmino. De manera anloga
puede evaluarse el efecto del borrado de variables independientes.
Ejemplo 11 (continuacin)
En la regresin de la masa ventricular izquierda (MVI) en el ndice de Sokolow del ejemplo anterior, el coeficiente de correlacin entre ambas variables es r = 0.35, y su cuadrado o
coeficiente de determinacin es r = 0.12. Esto significa que slo un 12% de la variabilidad de
la variable dependiente MVI es explicada por la regresin en el ndice de Sokolow. Si entonces
se agrega el peso como nueva variable predictora de la MVI, se obtiene la segunda ecuacin
del ejemplo anterior, donde cada coeficiente contribuye a explicar parte de la variabilidad de la
MVI. Para esta ecuacin con dos variables independientes se tiene R = 0.72 y R = 0.52, lo que
expresa que el 50% de la variabilidad total de la MVI queda explicada por la regresin mltiple. En este caso, la variacin de la MVI alrededor de los valores predichos por la ecuacin de
regresin para cada par de valores de Sokolow y peso, es la mitad de la que existe alrededor de
la media de MVI aislada. Queda todava un 50% de la variabilidad sin explicar, esto es, como
variacin residual alrededor de los valores predichos por la regresin mltiple. En general, el
agregado de nuevas variables independientes como pudieran ser la edad y el sexo, tender a
agrandar el valor de R, que por construccin nunca puede superar el valor de 1.
Puede verse que al agregar la variable peso, el coeficiente de regresin de Sokolow se modifica, as como el valor de la constante. Esto se explica por el hecho de que ambas variables
predictoras contribuyen a la estimacin de la variable independiente. Tambin puede notarse
que la variabilidad de la Y explicada por la regresin aumenta del 12% al 52% al agregar el
peso, lo que seala la importancia de sta variable en la regresin (corroborando esta afirmacin, en la muestra estudiada, la correlacin entre MVI y peso corporal es igual a 0.67,
mucho mayor que la observada entre MVI y Sokolow).
El agregado de variables independientes nunca har descender el coeficiente de determinacin R y en general tender a aumentarlo, aunque la variable introducida pueda tener poco
significado en la interpretacin de los cambios generados en la variable independiente. Por
este motivo se suele utilizar el coeficiente R ajustado para el nmero de variables indepen[ 295 ]
como en el primer caso, pero cada vez que agrega una nueva, chequea todos los coeficientes
de regresin, ya que una variable significativa en una etapa, puede dejar de serlo cuando se
agrega otra que la reemplaza y la vuelve no significativa. Esto remite al problema sealado
ms arriba acerca del significado biolgico o mdico de cada variable, que debe ser tambin
un criterio decisivo para la inclusin y el retiro de las variables independientes. Esto debe
hacerse de acuerdo no slo con el grado de significacin estadstica, sino tambin de acuerdo
con la importancia mdica o biolgica de cada variable dentro del material en estudio. Se
mencionarn brevemente algunos aspectos relacionados.
11.5. Colinearidad. Variables reemplazantes o proxy
La situacin conocida como colinearidad o multicolinearidad ocurre cuando dos o ms
variables predictoras se hallan altamente correlacionadas entre s. La consecuencia, que slo
se enuncia, es que sus respectivos coeficientes de regresin tendrn errores estndar muy
grandes y tendern a producir resultados no significativos, pudiendo obtenerse conclusiones
y comparaciones errneas. La colinearidad es frecuente y puede esperarse cuando dos variables estiman un mismo fenmeno, por ejemplo si se incluyen como medidas antropomtricas
la longitud de la pierna y del antebrazo, o el nivel plasmtico de dos metabolitos cercanamente emparentados, situaciones en que es de esperar altos coeficientes de correlacin entre las
variables independientes (en estos casos las variables involucradas no son estadsticamente
independientes aunque conserven la denominacin, consagrada por el uso).
Muchas veces, al incluir dos variables predictoras que juegan un rol similar y se hallan
correlacionadas entre s, slo una de las dos presenta un coeficiente de regresin significativo.
En tal caso, si se retira la variable que result significativa, se suele comprobar que la otra adquiere significacin estadstica y pasa a cumplir la funcin de la que ha sido eliminada. Las dos
variables independientes se sustituyen una a otra. En estas circunstancias se tiende a considerar
como la ms importante, aqulla que retiene la significacin estadstica cuando se ensayan
conjuntamente. Sin embargo esto no es necesariamente as, ya que como se ha mencionado,
aparte de la capacidad de estimar la variable dependiente, es necesario evaluar la importancia
de las variables por su significado en el contexto del estudio, que no est relacionado en forma
obligatoria con la fuerza de su asociacin con la variable dependiente. Tambin puede ser que
ambas variables sean importantes y necesarias para el estudio, y en este caso, las posibilidades
son no incluirlas en la misma ecuacin o bien, si las variables son de la misma naturaleza, como
pueden ser las longitudes de dos segmentos corporales, emplear su promedio.
Otra eventualidad es que la variabilidad explicada por la regresin sea compartida por
las dos variables predictoras de modo tal que ambas se tornen no significativas en el modelo.
Si en un caso as se opta por suprimir directamente las dos variables, puede caer significativamente la suma de cuadrados de la regresin y deteriorarse la capacidad de prediccin de
la variable dependiente y toda la calidad del estudio. Algo anlogo puede ocurrir con grupos
de dos o ms variables que de por s no se revelan significativas en la regresin y que, al ser
retiradas en conjunto, provocan una cada significativa de R. Esto se explica porque estando
correlacionadas, la supresin de cualquiera de ellas es suplida por las restantes, pero al eliminarse todo el conjunto no quedan variables que proporcionen la informacin que aportaba el
grupo suprimido.
[ 297 ]
Como se acaba de ver, en una regresin mltiple cabe la posibilidad de que variables
predictoras correlacionadas se reemplacen entre s en una ecuacin de regresin. Esto se conoce con el trmino proxying, hablndose en tal caso de variables proxy, palabra inglesa que
significa reemplazar o actuar en lugar de. Si bien esto suele ser inconveniente, el reemplazo
entre variables con un significado parecido y correlacionadas entre s puede aprovecharse
para tener una idea del efecto de alguna variable inaccesible o de difcil obtencin, mediante
el empleo de una variable proxy. Por ejemplo, se puede estimar la severidad de un cuadro
anginoso por la cantidad de pastillas de nitritos consumidas. Por otra parte, las variables
proxy pueden presentar los inconvenientes de la colinearidad y, entre otras cosas, tender a
cancelarse mutuamente o presentar coeficientes de regresin no significativos a pesar de ser
importantes dentro del sistema de variables en estudio.
Por ltimo, debe tenerse en cuenta que es posible encontrar correlacin entre variables
que no presentan un nexo lgico claro, y donde una tienda a reemplazar a otra sin que sea evidente o an conjeturable el motivo del fenmeno. En estos casos es aconsejable profundizar
la bsqueda de los fundamentos tericos que hagan explicable en trminos lgicos la relacin
hallada y, hasta tanto esto no se logre, abstenerse de adelantar conclusiones aventuradas. Si
una variable no tiene cabida lgica en el escenario del estudio, no debera ser incluida en las
conclusiones sin ms reparos.
Existen indicadores de colinearidad sobre los que no se entrar en detalles, que se hallan
incluidos en los programas estadsticos corrientes, programas que tambin suelen alertar
sobre la presencia de colinearidad en los datos. Por lo dems, la colinearidad suele hacerse
evidente por el comportamiento conjunto de variables que en forma aislada, son importantes
y significativas. En algunas oportunidades en que la colinearidad surge como un problema
computacional, es posible redefinir la variable problema mediante transformaciones que eliminen o reduzcan la colinearidad (ver Armitage y Berry, 1994).
11.6. Regresin con variables independientes binarias o indicadoras (dummy variables)
En los estudios de regresin, como en otros campos de la estadstica, frecuentemente
se desea analizar los datos separadamente en distintos subgrupos como sexo masculino o
femenino, diabticos y no diabticos, presin arterial sistlica mayor o menor que 140 mm
Hg, etc. Estos criterios de clasificacin constituyen variables binarias o dicotmicas, y si se
introducen en la ecuacin de regresin mltiple debidamente codificadas, pueden ahorrar la
necesidad de llevar a cabo dos regresiones por separado, como una para hombres y otra para
mujeres, o una para hipertensos y otra para no hipertensos. Cuando se emplean con esta
finalidad, suelen denominarse variables indicadoras o dummy. Introduciendo una variable
indicadora z cuyos dos valores posibles sean 0 y 1, se tiene que la ecuacin de regresin mltiple ajustada a los datos se puede escribir:
Y = a + dz + b1x1 + b2x 2 + + bnxn
(11.2)
cuando z = 1
cuando z = 0
que slo difieren en que, en el grupo en el cual la variable indicadora vale 1 (cuando la condicin que indica est presente), la cantidad d se suma a la estimacin de Y.
Si por ejemplo, la variable z se refiere a la presencia de hipertensin arterial, se puede
llamarla HTA y definir z = HTA = 1 en los hipertensos, y z = HTA = 0 en los no hipertensos.
El correspondiente coeficiente de regresin mltiple d, permanecer sin cambios (d 1) en los
hipertensos, y se anular (d 0) en los dems individuos. El mtodo puede hacerse extensivo a
variables que admiten ms de dos estados, como por ejemplo peso normal, sobrepeso y obesidad, con lo que las comparaciones posibles aumentan. En lo que sigue se vern algunos aspectos
relativos a la introduccin de una variable binaria en un modelo de regresin mltiple.
Ejemplo 11 (continuacin)
Se desea evaluar el efecto de la presencia de hipertensin arterial en las estimaciones de
la masa ventricular izquierda (MVI) del ejemplo anterior. Creando la variable binaria HTA
y definindola como HTA = 1 en los hipertensos y HTA = 0 en los restantes individuos, hallando la nueva estimacin de los parmetros de la regresin se obtiene:
MVI = -35 + 1.73 ndice de Sokolow (mm) + 2.06 peso (kg) + 29 HTA
siendo 29 el coeficiente de regresin parcial d, de la MVI en la variable indicadora HTA.
El programa estadstico informa que, al igual que los otros dos coeficientes, el ltimo es
tambin altamente significativo frente a cero (p < 0.0001). De las unidades empleadas para
medir la MVI resulta que la dimensin del coeficiente es gramos. Cada vez que HTA = 1, el
ltimo trmino ser igual a 29 1 = 29, lo que expresa que a la masa calculada mediante el
ndice de Sokolow y el peso, se deben sumar 29 gramos. Por el contrario, si se trata de un
individuo no hipertenso, la variable HTA vale 0 y su producto con el coeficiente d = 29 se
anula, de modo que no hay nada que aadir al valor de la MVI calculada en base al ndice
de Sokolow y peso. Los individuos no hipertensos constituyen as el grupo de referencia, a
cuyas estimaciones hay que sumar el valor del coeficiente de regresin para la variable HTA
cuando se trata de un individuo hipertenso. Como se ve, la regresin con una variable independiente binaria genera dos grupos, correspondientes a dos regresiones, una para cada
estado de la variable binaria.
En el ejemplo, el nuevo valor de R es 0.59, ligeramente mayor que el de 0.52 obtenido
para el ndice de Sokolow y el peso corporal antes de introducir la variable HTA. Hay una
ligera mejora en la precisin de las estimaciones de la MVI al considerar hipertensos y no
hipertensos por separado. Este leve aumento en la suma de cuadrados debida a la regresin,
que se refleja en el incremento de R, no depende de los valores del ndice de Sokolow y el peso
de cada individuo, y as, para cualquier par de valores de Sokolow y peso, la MVI debe ser
incrementada en unos 29 gramos si el individuo es hipertenso, y no hacer agregados en caso
contrario.
[ 299 ]
11.7. Interaccin
Al clasificar una muestra en dos o ms niveles o estratos segn una variable discreta d,
puede suceder que las respuestas de la variable dependiente Y a los cambios de una variable
independiente continua X, sean de diferente magnitud segn se evalen en los distintos estratos en los que se ha clasificado la muestra. Cuando esto ocurre se dice que entre las variables d y X existe interaccin. En el ejemplo considerado hasta aqu, puede interesar saber si
la relacin entre Sokolow y MVI es la misma en presencia que en ausencia de hipertensin
arterial, esto es, si entre las variables Sokolow y HTA existe interaccin. Otro tanto puede
preguntarse acerca de las variables peso y HTA.
En general, un modo de evaluar la presencia de interaccin en un modelo como el que
nos ocupa, es calcular el producto de las variables implicadas para cada uno de los casos
de la muestra, creando una nueva variable que se denomina trmino de interaccin. Si su
coeficiente de regresin mltiple resulta estadsticamente significativo, puede esperarse interaccin entre las variables en cuestin. Por ejemplo, si se desea saber si existe interaccin
entre el peso corporal y la hipertensin arterial, debe calcularse el producto peso HTA para
cada individuo de la muestra. Esta nueva variable se introduce junto con las dems variables
independientes y se evala el modelo resultante.
Para comprender el procedimiento, considrese el caso limitado a la variable binaria
HTA y la variable continua peso, como predictores de la MVI. El trmino de interaccin ser
(HTA peso). La ecuacin que estima la MVI ser entonces:
MVI = a + b1 peso + b2 HTA + b3 (HTA peso)
Si el coeficiente b3 resulta estadsticamente significativo se est autorizado a deducir la presencia de interaccin entre peso y HTA. Si bien en la muestra del Ejemplo 11 dicho coeficiente no fue significativo y no se pudo comprobar interaccin, en lo que sigue se muestran los
fundamentos del procedimiento. Cuando HTA = 0, los dos ltimos trminos de la ecuacin
anterior se anulan, y sta se reduce a:
MVI = a + b1 peso
En tanto, cuando HTA = 1, se tiene que (b2 HTA) = b2 , y (b3 [HTA peso]) = b3 peso,
y consecuentemente, en los hipertensos la ecuacin debe re-escribirse:
MVI = a + b1 peso + b2 + b3 peso
= a + (b1 + b3) peso + b2
con lo cual se observa que el coeficiente de regresin del peso resulta igual a (b1 + b3), mientras
que en los no hipertensos es igual a b1. Esto equivale a decir que el peso estimar la MVI con
distintos coeficientes en hipertensos y en no hipertensos, y la interpretacin ser que existe
interaccin entre hipertensin y peso cuando se trata de estimar la MVI. Como se ha dicho,
el requisito es que el coeficiente del trmino de interaccin ( b3) resulte estadsticamente significativo, pues en caso contrario, se elimina de la regresin y la interaccin no se confirma.
[ 300 ]
[ 301 ]
bras, el valor que toma E para los diversos valores del colesterol plasmtico, podra interpretarse como una medida de la probabilidad de la enfermedad E para los correspondientes valores
del colesterol plasmtico.
Figura 12.1. Recta de regresin lineal ordinaria ajustada para una variable dependiente binaria E ( = enfermedad cardiovascular) en funcin del los niveles de colesterol. Los valores
predichos por la recta de regresin pueden llegar a ser mayores que 1 o menores que 0.
Sin embargo, el propsito de interpretar la variable dependiente E como la estimacin
de una probabilidad, empleando la regresin lineal ordinaria, se encuentra enseguida con
limitaciones. En efecto, en la Figura 12.1 se observa que hacia sus extremos, esto es para
valores relativamente altos o bajos de colesterol, la recta de regresin lineal predice valores de
E mayores que 1 o menores que 0 (negativos), lo cual hace imposible aceptarlos como valores
plausibles para una probabilidad. Adems, hay otros inconvenientes de ndole terica en los
que no es necesario entrar, pero suficientemente importantes como para impedir el empleo de
la regresin lineal ordinaria para la estimacin de las probabilidades de una variable binaria
en funcin de variables independientes.
Sin embargo, la idea de hallar a partir de los datos muestrales algn tipo de funcin de las
variables independientes que estime, no el valor real de la variable dependiente binaria sino
sus probabilidades, ha dado origen a la llamada regresin logstica. La regresin logstica,
cuya variable dependiente es siempre binaria o dicotmica, permite determinar la existencia
de relaciones entre los valores de las variables independientes y la probabilidad de ocurrencia de la variable dependiente. En la Figura 12.2 se ilustra la forma en que se distribuyen
las probabilidades de E estimadas mediante regresin logstica, en funcin de los niveles del
colesterol, para los mismos datos de la Figura 12.1.
[ 303 ]
Puede observarse que las probabilidades de E, en ordenadas, se extienden en forma continua entre 0 y 1, y tambin, que los valores bajos de colesterol se asocian con probabilidades de
E prximas a 0 y a la inversa, los valores muy altos se asocian con probabilidades prximas a
1, pero en ningn caso los valores se extralimitan, y el rango de los valores de la probabilidad
de E queda siempre comprendido entre 0 y 1. As, el modelo de regresin logstica resulta
adecuado para describir las probabilidades de una variable dependiente binaria. Dada su importancia como tcnica estadstica, se esbozarn muy someramente los fundamentos tericos
en que se basa.
12.2. Aspectos tericos y significado de la regresin logstica
Uno de los problemas que plantea la estimacin de probabilidades en variables binarias, es
que la relacin entre dichas probabilidades y sus variables predictoras no es lineal. Es as que en
el caso de la enfermedad cardiovascular (E) y el colesterol, puede esperarse una relacin ms o
menos lineal entre la probabilidad de E y los valores del colesterol cercanos al medio de la escala, pero en cambio, con valores muy altos, donde la probabilidad de E ya est muy elevada, no
debe esperarse que un aumento de 20 o 30 mg/dl de colesterol, digamos entre 350 y 370 mg/dl,
tenga mucho efecto en aumentar la morbilidad, ya de por s muy alta en este extremo. Lo mismo
puede decirse de colesteroles muy bajos, donde debe esperarse que la probabilidad de E vare
muy poco al pasar de 150 a 170 mg/dl, siendo en ambos casos muy baja. De modo que la grfica
que represente en forma realista las probabilidades de E, no debera ser una lnea recta sino
tener una forma como se muestra en la figura 12.2, donde se observa que la pendiente se hace
cada vez menor a medida que se alcanzan los valores extremos de la variable independiente,
cuando la variacin de la probabilidad ante estos valores se hace proporcionalmente menor que
[ 304 ]
en el centro de la distribucin. En la tarea de linearizar estas relaciones se ha desarrollado la regresin logstica, calculndose sus parmetros a partir de conjuntos de individuos donde cada
uno aporta una o ms variables independientes (por ejemplo, colesterol, glucemia, tabaquismo)
y asimismo el estado de la variable dependiente (E = 1, o E = 0). Se esbozarn los procedimientos
en el ejemplo que nos viene ocupando. Ya se ha visto que hallar una recta de regresin por el
mtodo de mnimos cuadrados es inadecuado para describir probabilidades, ya que fcilmente
predecir valores mayores que 1 y menores que 0. En cambio, en la regresin logstica, se halla
una ecuacin lineal de la forma y = a + bx, donde x corresponde al valor de la variable independiente (el colesterol) pero, mediante una elaboracin matemtica, en lugar de la probabilidad de
E (que no puede representarse por una recta), la variable dependiente y expresa el logaritmo de
los odds de la variable E, tambin llamado logit, de donde proviene el trmino regresin logstica. El ncleo de la regresin logstica consiste precisamente en la obtencin de las ecuaciones
lineales que estiman logits, lo que se logra mediante procedimientos especiales que difieren de
los empleados en la regresin lineal ordinaria o de mnimos cuadrados vista en secciones anteriores. Obtenidos los logits, cuyo significado es poco o nada intuitivo, es posible pasar a los
odds y probabilidades de E. Estas probabilidades son las que se han graficado en la curva de la
Figura 12.2, y se obtienen de los correspondientes logits. Contra lo que podra suponerse, esta
ltima tarea no es complicada.
En principio, los programas estadsticos calculan la funcin lineal a + bx, caracterizada
por los parmetros a y b, que proporciona los logits de la variable dependiente E a partir de
la variable independiente x (colesterol). Lo ya expresado puede escribirse:
Logit i = ln (odds i) = ln [Pi / (1 Pi)] = a + b xi
(12.1)
[ 305 ]
mente a la probabilidad de presentar E con solo recordar que P = odds / (odds+1) (3.4):
P (E) = 0.15 / (0.15 + 1)
= 0.13 o 13%.
que es la probabilidad estimada para el caso en cuestin. La significacin estadstica del
coeficiente de regresin mltiple b, a partir del cual y de los valores del colesterol se deducen
logits, odds y probabilidades, se prueba con los mtodos apropiados y la interpretacin de los
resultados es la tarea ms importante y delicada que resta (ver prrafos siguientes). Es comn
obtener ecuaciones de regresin logstica para ms de una variable independiente, como pudieran ser en el ejemplo el colesterol, los triglicridos y la glucemia.
El logaritmo de los odds (logit) est dado, como se ha visto, por una expresin lineal
que puede extenderse indefinidamente sobre el eje de las x, pudiendo adoptar valores negativos o positivos arbitrariamente grandes. Ahora bien, los odds, estando dados por e elevado
a distintos exponentes, podrn tener valores positivos ilimitadamente grandes pero nunca
menores que cero, como puede comprobarse fcilmente con una calculadora de mano. Esto
concuerda con el concepto de odds como P / (1P), siendo P siempre positiva y no mayor que
1 ni menor que 0. Finalmente, al convertir odds en probabilidades mediante la frmula P =
odds / (odds+1), nunca se obtendrn valores superiores a 1, ya que el denominador es siempre
una unidad ms grande que el numerador. Por lo tanto, al convertir logits en odds se establece un piso en 0, y al pasar de odds a probabilidades se coloca un techo en 1, con lo que
la curva de probabilidades toma necesariamente la forma sigmoidea caracterstica de la Fig.
12.2, que se extiende entre 0 y 1 y ya no presenta los inconvenientes vistos cuando se intent
ajustar a los datos del colesterol una recta de regresin lineal ordinaria.
El mtodo para obtener la ecuacin que da logits como funcin de las variables independientes y posibilita todo el desarrollo terico subsiguiente, se conoce como de mxima
verosimilitud (maximum likelihood), y estima los parmetros de las funciones de regresin
logstica como aqullos que tienen la mxima probabilidad de producir los datos observados
en las muestras. Este mtodo, extensamente empleado en estadstica, difiere del mtodo de
los cuadrados mnimos u OLS (ordinary least squares) en que se fundan las tcnicas vistas
en las secciones 9 y 11, mencionadas como regresin OLS u ordinaria. Sus aspectos tericos quedan fuera del alance del texto. En lo que sigue, se intentar aclarar en lo posible la
interpretacin de los resultados y algunas aplicaciones de la regresin logstica corrientes en
medicina.
12.3. Significacin de los resultados de la regresin logstica
La significacin de los coeficientes de regresin logstica se prueba en forma anloga a
otros estadsticos, en particular a los coeficientes de regresin ordinaria vistos en las Secciones 9 y 11, siendo la hiptesis nula que el correspondiente parmetro de poblacin es igual a
cero y las diferencias observadas se han debido al azar del muestreo. Sin embargo, en el caso
de la regresin logstica las pruebas no son tan seguras como en el de la regresin ordinaria y
exigen mayores precauciones, en particular tratndose de muestras pequeas. En este sentido, los valores de P obtenidos en las pruebas de significacin de los respectivos coeficientes,
[ 306 ]
no siempre guardan una relacin estrecha con la fuerza o la importancia de una variable en
el modelo. Un estadstico de prueba para los coeficientes de regresin es el de Wald, igual al
cuadrado del cociente entre el coeficiente de regresin logstica y su error estndar, que tiene
una distribucin chi-cuadrado con un grado de libertad. Se halla incluido en los paquetes
estadsticos corrientes. Existen otros mtodos que apuntan a asegurar la validez de los hallazgos, en relacin a limitaciones como el tamao de las muestras.
Como ya se ha dicho, la estimacin de los coeficientes de regresin logstica se basa en
una tcnica llamada de mxima verosimilitud, que utiliza para el clculo una funcin llamada con el mismo nombre (maximum likelihood function) y que permite no solamente obtener
los logits sino tambin evaluar en forma global el grado de ajuste del modelo resultante
a los datos muestrales. Esto permite a su vez calibrar la importancia de cada variable en el
resultado de la regresin, observando el grado de cambio en el ajuste global de la regresin
luego de introducir o retirar la variable en cuestin (el caso anlogo en la regresin ordinaria
consiste en observar los cambios en el coeficiente de correlacin mltiple R con el agregado
o retiro de variables). Esta es otra forma de evaluar la significacin de los coeficientes de regresin logstica. Como se ve, existen numerosas alternativas para hacerlo, lo que indica que
no hay un procedimiento nico y directo, y analizar los resultados requiere alguna experiencia, as como cierto conocimiento previo del material estudiado. Lo dicho debe hacer tomar
precauciones ante la obtencin de conclusiones apresuradas o sin un anlisis cuidadoso de su
significado en el contexto de la investigacin (ver Pampel, 2000).
12.4. Algunas propiedades de la regresin logstica
Como se ha dicho, la regresin logstica proporciona ecuaciones con ciertas analogas
a las de regresin lineal ordinaria o de mnimos cuadrados tratadas en secciones anteriores,
donde la significacin estadstica de los coeficientes de regresin expresa la importancia de la
correspondiente variable independiente en la determinacin de la probabilidad de la variable
dependiente binaria. En el caso de la regresin logstica, las correspondientes ecuaciones consisten en logits, expresiones lineales en funcin de las variables independientes, que es comn
convertir en odds o en probabilidades para facilitar su interpretacin. Como se ha dicho, en
general es preferible trabajar con muestras no demasiado pequeas.
La regresin logstica presenta ms cuestiones de interpretacin que la regresin lineal
ordinaria. En la seccin 9 examin el coeficiente de regresin del peso en la talla para un
grupo de adultos de ambos sexos, y se mencion que en un experimento dado haba resultado igual a 1.14 (kg / cm), lo que significa que por cada centmetro de aumento en la estatura
se espera un aumento promedio del peso igual a 1.14 kg. En este punto es importante notar
que este aumento de aproximadamente 1 kg de peso por cm de estatura, es esperable dentro
de todo el rango de estaturas incluido en el anlisis, es decir, tanto para una persona de alta
como para una de baja estatura. En otras palabras, puede esperarse un incremento del peso
igual a 1.14 kg tanto si la estatura pasa de 150 a 151 cm como si lo hace de 195 a 196 cm
(este hecho es estadstico y su ajuste a la realidad biolgica no interviene aqu). No ocurre lo
mismo para las probabilidades predichas por los logits en la regresin logstica, donde para
cambios en los valores ms extremos de la variable independiente (en el ejemplo, el colesterol)
se esperan variaciones menos marcadas de las probabilidades que las que se observan en el
[ 307 ]
centro de la distribucin. As, se vio que un individuo con 210 mg/dl de colesterol tena 0.13 o
13% de probabilidades de enfermedad bajo las condiciones simuladas por el ejemplo; ahora,
si el colesterol aumenta en 10 mg/dl, a un nivel de 220 mg/dl, la nueva probabilidad de E se
calcula en 0.31 o 31%, con lo cual se ha duplicado largamente. En cambio, un individuo con
un colesterol en el extremo alto de la distribucin, por ejemplo 250 mg/dl, tendr una probabilidad de E estimada en 92%, y si se en este punto el colesterol se incrementa en 10 mg/dl, a
260 mg/dl, la nueva probabilidad ser igual a 97%, con lo que habr aumentado en poco ms
del 5% respecto del nivel que tena para 250 mg/dl. Esto se nota claramente inspeccionando
la curva de probabilidades en la figura 12.2, ms empinada en el centro y aplanada hacia los
extremos (no se olvide que en ningn caso podr situarse por encima de 1 o por debajo de
0). Como se ve, en regresin logstica los resultados en trminos de probabilidades u odds,
sern distintos segn se calculen en el centro o en la periferia de los posibles valores de la
variable predictora o, lo que es equivalente, segn el nivel de probabilidad P de la variable
dependiente a partir del cual se estimen los cambios. La relacin entre niveles de colesterol y
probabilidad de E no es lineal. No se entrar en las diversas cuestiones que aparecen en este
punto, mencionndose slo la conveniencia de hacer las determinaciones cerca del centro de
las distribuciones, aunque existen numerosos mtodos de abordaje para stos y otros tpicos
relativos a la interpretacin de los resultados de la regresin logstica.
Como en la regresin mltiple ordinaria, en regresin logstica las variables independientes pueden ser ms de una, y en lneas generales, muchos conceptos similares se aplican
a ambos tipos de regresin. Sin embargo, hay aspectos de importancia en los cuales los dos
mtodos difieren. El ms importante radica en que, como en la regresin logstica el valor de
cualquier variable independiente X1 condiciona el valor P de la variable dependiente, y este
valor condiciona a su vez, como se vio en el prrafo anterior, el efecto que sobre l pueda
tener una segunda variable independiente X 2 , un cambio en X1 modificar la influencia de
X 2 sobre la variable dependiente. Por ejemplo, con valores muy altos de probabilidad de E,
condicionados por niveles elevados de colesterol plasmtico (X1), cualquier cambio en una
segunda variable independiente (X 2) tendr un efecto sobre dicha probabilidad, menor que el
que cabra esperar cuando la probabilidad de E se halla en sus valores medios.
La regresin logstica puede tambin llevarse a cabo con variables independientes de
tipo binario, como por ejemplo las que resultan de codificar distintas caractersticas de los
datos como el gnero, factores de exposicin o de riesgo y cualquier otra circunstancia que
permita clasificar los datos en dos categoras (en realidad, la tcnica puede extenderse a
variables discretas con ms de dos estados, permaneciendo uno de stos como referencia a
partir del cual se comparan los restantes). As, el sexo puede ser codificado como variable
binaria independiente asignando el 1 a mujeres y el 0 a varones. Con esto, el coeficiente para
el gnero, bg, se anula cuando se multiplica por 0 (hombres) y vale bg cuando se multiplica
por 1 (mujeres). La diferencia entre ambos resultados refleja las diferencias esperadas en la
variable dependiente, expresadas en logits, que se pueden transformar fcilmente en odds o
en probabilidades. Nuevamente, deber elegirse el nivel de las otras variables independientes
o bien de la variable dependiente, donde evaluar el efecto de sexo a travs de su coeficiente bg,
pues los efectos no sern los mismos en diferentes niveles de aqullas.
[ 308 ]
L x=1 = a + b 1 = a + b
L x=0 = a + b 0 = a
Odds x=1 = e a + b
Odds x=0 = e a
Como se aprecia, L1 L 0 = b, o sea que la diferencia entre los logits para x = 1 y x = 0, es igual
al valor del coeficiente b de la variable independiente x. Como L1 y L 0 son logaritmos de
odds, y la diferencia entre los logaritmos de dos nmeros es el logaritmo del cociente de esos
nmeros, la diferencia entre L1 y L 0 ser el logaritmo del cociente de odds. En smbolos:
L1 L0 = ln (Odds x=1 / Odds x=0)
y como L1 L 0 = b, el coeficiente de regresin de la variable binaria b es el logaritmo de la
razn de odds u odds ratio (OR) para los valores 1 y 0 de la variable independiente. Este
hecho es de gran utilidad en el anlisis estadstico y vincula la regresin logstica con otras
tcnicas que manejan odds, como el clculo del riesgo relativo en los estudios de tipo casocontrol (ver Seccin 16).
[ 309 ]
En 16.6 se analiza un estudio de tipo caso-control donde se determina el odds ratio
(OR) para el infarto de miocardio en presencia (x = 1) y ausencia (x = 0) de dislipemia, obtenindose el valor 2.70. Introduciendo los mismos datos en un programa de regresin logstica, se obtiene la ecuacin:
logit (infarto) = 1.40 ( 0.993 dislipemia )
donde 0.993 es el coeficiente b de la variable dislipemia. Como se demostr ms arriba, este
coeficiente es el logaritmo del OR entre los valores 1 y 0 de dislipemia. Por lo tanto, el OR se
obtiene tomando el antilogaritmo de 0.993:
OR = e 0.993 = 2.70
y el resultado es el mismo que se obtiene mediante el anlisis directo de la Tabla 16.1
En forma anloga a lo ya visto, cuando la variable predictora es continua, la diferencia
entre los logits para un incremento en una unidad de la variable predictora, es el logaritmo
del OR de la variable dependiente entre los dos valores de la predictora. Por lo dems, la
regresin logstica permite el manejo eficiente de modelos con distintas variables en estudio,
siendo un mtodo de anlisis multivariado de gran utilidad para abordar muchas situaciones
que se presentan en la investigacin mdica.
Con esto se han procurado delinear en forma muy esquemtica los fundamentos y las posibles aplicaciones de la regresin logstica. Si bien la complejidad de los clculos est solventada
en los paquetes estadsticos corrientes, las posibilidades y limitaciones inherentes a estas tcnicas deben tenerse siempre presentes para obtener conclusiones suficientemente slidas.
[ 310 ]
13.1. Introduccin
Existen mtodos que permiten la evaluacin de diversas hiptesis, en especial en pruebas
de significacin estadstica entre muestras, sin necesidad de asumir un tipo determinado de
distribucin de los datos, como podran ser la distribucin normal, la binomial o cualquier
otra. Esto significa que dichos mtodos operan sin necesidad de estimar los parmetros de
las poblaciones de donde provienen las muestras (varianza, desvo estndar), y por este motivo son conocidos como mtodos no-paramtricos (distribution-free methods). Con estos
mtodos, no slo son innecesarias las estimaciones de parmetros de poblacin, sino que
stos no intervienen en las pruebas de hiptesis.
En general, los mtodos no-paramtricos se utilizan cuando la presuncin de no-normalidad de los datos es fuerte, o cuando de ser cierta, pudiera tener consecuencias de importancia en los clculos. Su principal utilidad son las pruebas de significacin estadstica, ya que al
no estimar parmetros son menos tiles para estudiar las caractersticas de la distribucin de
una variable. Por lo tanto, se utilizan para comparar muestras, pero como se ver, no comparan sus medias, varianzas u otros parmetros, es decir, no toman en consideracin de qu
tipo de distribucin se trata en cada caso.
En ocasiones, no slo puede ser incierto el tipo de distribucin de los datos, sino que stos
pueden carecer de escalas de medicin adecuadas, y en estos casos ha demostrado utilidad
proceder a su evaluacin comparativa, sin adjudicarles medidas sino posiciones o rangos
dentro del conjunto. As, al evaluar del efecto de varios analgsicos, stos pueden ser clasificados segn su eficacia relativa respecto de los otros, en una escala de eficacia ascendente
o descendente. Otro tanto ocurre al clasificar la intensidad del del dolor anginoso de uno a
diez, o al graduar la capacidad funcional segn la informacin proporcionada por el paciente. Si bien es difcil contar con unidades precisas para la medicin del dolor o la capacidad
funcional segn escalas subjetivas, la ordenacin de las variables (analgesia, intensidad del
dolor, capacidad funcional) segn la magnitud de las distintas observaciones, suele ser eficaz
y permitir comparaciones entre distintos grupos sin ser necesario que los nmeros o rangos
asignados a cada individuo se distribuyan segn una funcin de probabilidad conocida. En
estas circunstancias tienen aplicacin los mtodos no paramtricos.
Si bien los mtodos no paramtricos tienen la ventaja de requerir menos trabajo de clculo que los dems mtodos basados en estimaciones de los parmetros de las poblaciones, y
[ 311 ]
en este sentido se consideran mtodos rpidos, los recursos de computacin con los que
actualmente se cuenta han hecho que lo sencillo y rpido del clculo pase a segundo plano y
as, la principal utilidad de los mtodos no paramtricos son los casos en donde no se puede
llegar a conocer el tipo de distribucin subyacente en las muestras, o bien no existen escalas
adecuadas para las mediciones y, en cualquier caso, la estimacin de parmetros en los que
basar los clculos no es factible.
13.2. Pruebas para datos apareados.
En estas pruebas la hiptesis nula propone que la distribucin es simtrica alrededor de
un valor central arbitrario, por ejemplo cero, y se utilizan con variables que pueden oscilar
alrededor de ste, tomando tanto valores positivos como negativos. Esta situacin es tpica
de la comparacin entre pares de datos obtenidos de una misma muestra antes y despus de
una determinada intervencin o tratamiento, donde la hiptesis nula a plantear es que el tratamiento no tiene efecto y por lo tanto las diferencias entre cada par de datos deben oscilar
alrededor de cero, con desviaciones en uno u otro sentido (positivas y negativas) en nmero
aproximadamente igual y de similares magnitudes. Supngase que se ensayan a ciegas dos
analgsicos, durante una semana cada uno, en 10 pacientes, y que al final del ensayo se pide
a cada paciente que informe cul de las dos semanas fue ms confortable (las drogas A y B
se deberan administrar aleatoriamente en la primera o segunda semana, y con un intervalo
entre ambas, para evitar en lo posible el arrastre de los efectos de un perodo al otro). Los
resultados pueden ser: A mejor que B, B mejor que A y A y B iguales. (los casos A y B
iguales no se toman en cuenta pues no proporcionan informacin en un sentido u otro). La
hiptesis nula es que, sin considerar los empates, los casos A mejor que B y B mejor que
A tienen las mismas probabilidades, o sea P(A mejor que B) = P(B mejor que A) = 0.5.
En el ejemplo, para 10 pacientes se esperan 5 casos a favor de A y 5 a favor de B (si hubiera
empates, simplemente no se cuentan y se contina el anlisis con el resto de los datos).
Supngase que para 8 pacientes result A es mejor que B y para los 2 restantes B es mejor
que A. Estos valores se apartan de los esperados por hiptesis nula, que son 5 para cada caso. Con ayuda de la distribucin binomial, haciendo p = q = 0.5 (iguales probabilidades para
A mejor y A no mejor) pueden determinarse las probabilidades exactas de obtener 8
respuestas a favor de A, y tambin las probabilidades en los casos an ms extremos: 9 respuestas a favor de A y 10 respuestas a favor de A. Un detalle importante: para que la prueba
sea a 2 colas, deben considerarse los resultados extremos tanto para los casos en que A es
mejor que B como para aqullos en que B es mejor que A, que corresponden a 8, 9 y 10
respuestas a favor de B, o sea 2, 1 y 0 respuestas a favor de A. La suma de las probabilidades
extremas para 8, 9 y 10 resultados a favor de A, ms las opuestas, en el otro extremo: 2, 1, y
0 resultados a favor de A, expresa la cantidad de veces en que deberan esperarse resultados
iguales o ms extremos que los encontrados, si no hubieran en el universo diferencias entre
las probabilidades a favor de A y a favor de B. Esta prueba se conoce como test del signo, y
en el ejemplo arroja P = 0.11 (como se ve, hay ms del 10% de probabilidades de obtener un
resultado igual o ms extremo a favor de una u otra droga).
En los casos en que el nmero de observaciones es grande, la prueba de la hiptesis nula
puede realizarse aproximando la distribucin binomial por la normal, mediante los procedi[ 312 ]
Individuo
Puntos A
Puntos B
A es mejor
AB
|AB|
Rango
Si
6
2
4
9
Si
No
2
7
2
7
2
5
3
4
No
Si
No
Se observa que si bien 3 casos favorecen a A y 3 casos a B, en los casos en que B es mejor
que A, la diferencia en valor absoluto es mayor que cuando A supera a B (cuando B supera a A,
lo hace por un promedio de 6.7 puntos, mientras que cuando A supera a B, la diferencia media
es de 3 puntos). Ordenando las diferencias en forma creciente por su valor absoluto | A B |, y
adjudicndoles un nmero de orden o rango de menor a mayor, se ve que los rangos ms altos
tienden a asociarse con los casos en que la droga B fue mejor que A. Este comportamiento, que
no sera detectable por el test del signo (ya que hay igual nmero de observaciones a favor de
cada droga), puede ponerse a prueba calculando la significacin de la diferencia entre las sumas
de los rangos para A y B, que debera esperarse fueran iguales o muy similares si ambas drogas
manifestaran los mismos efectos. La prueba se conoce como test de los rangos con signo de
Wilcoxon (signed rank sum test). Los valores crticos de las sumas de rangos para los distintos
niveles de P, se hallan calculados en forma exacta y tabulados para nmeros relativamente
pequeos de casos. Para muestras con mayor nmero de observaciones existen aproximaciones
mediante la distribucin normal, que no se expondrn aqu (ver Armitage y Berry, 1994). En el
ejemplo, las sumas de rangos son, segn la ltima columna, 1+2+4 = 7 para A y 3+5+6 = 14 para
B, y si bien la diferencia no resulta significativa (consultando tablas), de continuar la tendencia
en favor de B, podra esperarse que con un mayor nmero de casos se pudiera demostrar su
significacin estadstica. El test de los rangos con signo tiene as la ventaja de tomar en cuenta
la magnitud de las diferencias entre los pares de observaciones y no slo su signo. Ntese de
paso, que el desarrollo del test no necesita de ninguna presuncin sobre el tipo de distribucin
subyacente en las poblaciones estudiadas. Como para el test del signo, el test equivalente en la
teora normal, es el test t de Student para datos apareados (7.3).
[ 313 ]
Existen varios procedimientos equivalentes destinados a probar la diferencia o desplazamiento entre la magnitud de las observaciones en X e Y, que se basan en el ordenamiento
de las observaciones de acuerdo a su magnitud. Cada observacin recibe as un nmero de
orden o rango, de donde proviene el nombre de algunas de las pruebas. Si las poblaciones X
e Y no difieren entre s, los rangos de las observaciones xi y yj en las respectivas muestras, no
deberan a su vez exhibir grandes diferencias, y en esto se basan las pruebas que se mencionan
a continuacin. El equivalente de estas pruebas en la teora normal es el test t para muestras
no apareadas o independientes (7.2).
El test de la suma de rangos de Wilcoxon (Rank sum test) asigna un nmero de orden, de
menor a mayor, a las observaciones de las muestras a comparar, tomadas conjuntamente. Luego procede a sumar los nmeros de orden o rangos dentro de cada muestra. La hiptesis nula
es que, siempre que los grupos sean del mismo tamao, la suma los rangos debe ser igual o muy
[ 314 ]
semejante en ambos grupos. En cambio, si las observaciones tienden a tener valores mayores
en una de las muestras, la correspondiente suma de los rangos tambin tender a ser mayor
en esa muestra y ser una evidencia en contra de la hiptesis nula y a favor de una diferencia
entre ambos grupos. Considrense por ejemplo las siguientes observaciones correspondientes a
la fraccin de eyeccin en dos grupos de individuos, en donde interesa obtener algn grado de
evidencia acerca del aparente predominio de valores ms altos en el grupo X:
Grupo X: 24, 32, 35, 38, 39, 40, 41, 45
Grupo Y: 23, 29, 30, 31, 34, 34, 35, 37
23
24
29
30
31
32
34
34
35
35
37
38
39
40
41
Grupo:
55
X
Rango:
9.5
9.5
11
12
13
14
15
16
Como existe una observacin igual a 35 en cada grupo, a las que les corresponderan
como puede verse arriba los rangos 9 y 10, a cada una se le adjudica el promedio de ambos
rangos, o sea 9.5. En forma anloga se manejan los empates entre ms de dos observaciones idnticas. Ntese que en cambio, si las observaciones idnticas se repiten en un mismo
grupo, no es necesario asignarles un rango promedio: por ejemplo, en el Grupo Y se repite dos
veces el 34, que aparece con los rangos 7 y 8, aportando un total de 15 a la suma de rangos
de Y. Si se adjudicara un rango de 7.5 a cada repeticin, el total sera tambin igual a 15.
Sumando los rangos (y no el valor de las observaciones) para cada grupo y llamando a la
suma T, obtenemos:
T X = 2 + 6 + 9.5 + 12 + 13 + 14 + 15 + 16 = 87.5
Ty = 1 + 3 + 4 + 5 + 7 + 8 + 9.5 + 11 = 48.5
Como comprobacin, la suma de T X y T Y debe ser igual a la suma total de los rangos, o
sea, la suma de los nmeros naturales de 1 a 16, pues hay 16 observaciones en total. La suma
de los primeros n nmeros naturales es igual a n (n+1), lo que para n = 16 es igual a 16
17 = 136. Este valor es idntico al que se obtiene sumando los rangos en cada grupo ( 87.5
+ 48.5 ).
En el ejemplo se observa que los valores correspondientes al grupo X tienen una suma de
rangos mucho mayor que la del grupo Y, lo que sugiere que la hiptesis nula de distribuciones
iguales no es correcta, ya que con igual nmero de casos en cada grupo se esperara que la suma de los rangos para cada uno fuera aproximadamente la misma, o sea la mitad de la suma
total de los rangos, en este caso 136 / 2 = 68. En este ejemplo, las sumas se alejan bastante de
lo esperado. La significacin de las posibles desviaciones, como evidencia para rechazar la
hiptesis nula, se halla calculada y tabulada para diversos tamaos muestrales. Para el caso
del ejemplo, se encuentra en tablas que para nX = nY = 8 casos por grupo, P = 0.05 cuando la
menor de las dos sumas, T X o bien T Y, es 49. Como en nuestro caso T Y = 48.5, se concluye
[ 315 ]
que un desplazamiento en los rangos como el observado es altamente improbable por azar, y
se acepta una diferencia significativa entre los grupos, con un nivel P = 0.05. Desde ya debe
notarse que la hiptesis nula con T X = T Y se aplica en los casos en que cada grupo tiene igual
nmero de observaciones (nX = nY) pues de otra forma, T guarda tambin relacin con el
nmero de casos de cada grupo, ya que a mayor nmero corresponder mayor cantidad de
rangos sumados en T. De todos modos, en las tablas se hallan entradas para nX y nY (denominadas n1 y n2), previstas las posibles diferencias en el tamao de los grupos o muestras a
comparar. El procedimiento de consulta es siempre sencillo y no tiene especial importancia
su descripcin en este lugar. El proceso de clculo en los paquetes estadsticos corrientes es
inmediato y solo requiere la introduccin de las dos series de datos a comparar.
Las tablas corrientes con los niveles de P para diferentes tamaos de muestra han sido
calculadas en forma exacta. Sin embargo, cuando el nmero de casos en cada grupo excede
los tabulados, y si ninguno de los grupos contiene menos de 4 observaciones, puede utilizarse
una aproximacin a travs de la distribucin normal o de Gauss, sobre la cual no se tratar
en este compendio (ver Armitage y Berry, 1994).
Las pruebas de Mann-Whitney y de Kendall son equivalentes a la anterior y examinan
todos los pares que se pueden formar con una observacin del grupo X y otra del grupo Y,
contando las veces en que el mayor valor del par pertenece a X y las veces en que pertenece a
Y. El predominio de uno de los grupos constituye evidencia en contra de la hiptesis nula de
no diferencias entre grupos, favoreciendo la de un desplazamiento entre los valores de sus
observaciones, como el ilustrado en la figura 13.1. Los posibles resultados se hallan tabulados e integran los paquetes estadsticos corrientes.
13.4. Comparaciones entre ms de dos grupos
En el caso de comparaciones entre grupos formados segn un nico criterio de clasificacin con tres o ms niveles, un mtodo empleado es el de Kruskal - Wallis, que es una
generalizacin de pruebas como la de Wilcoxon o Mann-Whitney vistas en el pargrafo
anterior. Un ejemplo de su empleo es la comparacin entre tres o ms grupos de pacientes,
cada grupo adjudicado a un rgimen teraputico diferente (como podran ser dosis crecientes de un mismo frmaco o tambin, frmacos diferentes), cuando las respuestas de inters
no tuvieran distribucin normal y en cambio pudieran ser ordenadas segn rangos. El procedimiento anlogo para variables con distribucin normal, es la comparacin de medias
mediante el anlisis de la varianza de un factor o una ruta, visto en 10.2. El objeto del
anlisis es detectar diferencias significativas en los niveles de la variable en estudio, en la
forma de desplazamientos entre las distribuciones de sus rangos en los distintos grupos.
Bsicamente, el conjunto formado por los individuos de todos los grupos, se ordena de
menor a mayor segn la magnitud de la variable en estudio en cada individuo. A continuacin, a la serie de valores as obtenida se hacen corresponder los rangos constituidos por los
enteros de 1 en adelante. A partir de esta ordenacin, a cada grupo le corresponder la suma
de los rangos de sus componentes, y el anlisis procede en forma anloga al anlisis de la
varianza pero trabajando sobre los rangos y no sobre los valores originales de la variable. Se
obtiene as un estadstico de prueba que tiene una distribucin aproximada a chi-cuadrado,
[ 316 ]
con un grado de libertad menos que el nmero de grupos comparados. La hiptesis nula es
que no existen diferencias entre la magnitud de los resultados para cada grupo. En tal caso,
la suma de los rangos correspondientes tambin ser igual o muy similar en todos los grupos.
En lo que sigue se esboza la disposicin de los datos para su anlisis, que es adems la forma
habitual en la que se ingresan en los programas de clculo estadstico. Los detalles del procedimiento pueden consultarse en Armitagexy Berry, 1994.
Considrense 3 tres grupos, A, B y C, formados por cuatro individuos cada uno y tratados con diferentes concentraciones de un frmaco. El resultado se evala como el tiempo en
das hasta la curacin o la obtencin de determinado criterio que indique la finalizacin del
tratamiento, y es el siguiente:
Grupo A
Grupo B
10
Grupo C
12
15
12
21
Las cuentas de los das para cada individuo, ordenadas de mayor a menor, con su correspondiente rango y el grupo de pertenencia de cada individuo, son los siguientes:
Das
10
12
13
15
21
Rango
4.5
4.5
10
11
12
Grupo
Como existe un empate entre los grupos A y B para las observaciones cuarta y quinta, a
cada una se le adjudica el rango promedio 4.5. Reemplazando cada observacin por su rango,
la distribucin final de los rangos en los grupos es:
Grupo A
Grupo B
Grupo C
10
11
4.5
12
4.5
Esta es la forma habitual de disponer los datos en las hojas de los programas de estadstica. Ntese que se opera con los rangos y no con la variable original (cantidad de das). El
anlisis prosigue en forma similar al anlisis de la varianza para un factor (10.2). Provisto
que los casos en cada grupo no sean menos de cinco, la aproximacin dada por Kruskal
y Wallis es buena y, como se ha mencionado, el estadstico correspondiente se distribuye
segn chi-cuadrado con un grado de libertad menos que el nmero de grupos.
Cuando los datos son originados en unidades experimentales o bloques (10.4), por
ejemplo en individuos que proporcionan una respuesta a cada uno de varios tratamientos,
las respuestas de cada individuo pueden ordenarse en rangos de 1 a t, siendo t el nmero de
[ 317 ]
tratamientos del ensayo. Para evaluar el resultado stos, puede utilizarse el test de Friedman,
que es una extensin del test del signo para muestras apareadas y cuyo anlogo en la teora
normal es el anlisis de la varianza en dos rutas. Este test se halla implementado en los distintos paquetes estadsticos y no se entrar en detalles de clculo. En lo que sigue se muestra
la disposicin de los rangos en este tipo de prueba.
En la tabla se observa que cada individuo proporciona los rangos 1 a 4, segn haya sido
la magnitud de su respuesta a cada uno de los cuatro tratamientos:
Sujeto N
Tratamiento A
Tratamiento B
Tratamiento C
Tratamiento D
4
Esta es la forma habitual de disponer los datos en las hojas de los programas de estadstica. Las magnitudes originales de las respuestas han sido reemplazadas por sus correspondientes rangos. Dado que a cada individuo se le adjudica el mismo nmero de rangos, en este
caso 1 a 4 por haber cuatro tratamientos, la variabilidad entre las filas se reduce a cero y los
efectos se observan entre columnas, o sea entre tratamientos. Los estadsticos de prueba se
obtienen mediante procedimientos anlogos a los vistos en la Seccin 10, y para los detalles
del clculo puede consultarse Armitage y Berry, 1994.
13.5. Correlacin de rangos
En algunas oportunidades en que se desea evaluar el grado de correlacin entre dos
variables x e y, el coeficiente de correlacin lineal r, visto en la Seccin 9, puede no ser adecuado por varias causas, entre otras la no normalidad de las distribuciones de las variables
y la no linearidad de la asociacin entre las stas. En esos casos, si dichas variables pueden
ser ordenadas por rangos, pueden utilizarse mtodos no paramtricos entre los que se cuenta
la determinacin del coeficiente de Spearman, rs. El procedimiento es anlogo al visto en la
Seccin 9 para la determinacin del coeficiente de correlacin r, reemplazndose los valores
muestrales de las x y las y por sus respectivos rangos. Debe por lo tanto adjudicarse rangos,
de 1 en adelante, a las x, y repetirse el procedimiento con las y. Los pares originales de datos
quedan as reemplazados por pares de rangos, y el procedimiento de clculo de rs sigue como
para el clculo de r visto en Seccin 9. La significacin de rs frente a la hiptesis nula ( rs = 0)
se puede obtener en forma aproximada mediante el mismo mtodo que para el coeficiente r, dependiendo tambin de la magnitud de rs y del nmero de pares de la muestra. Asimismo existen
tablas con la significacin de rs frente a cero para distintos tamaos de muestra. Un anlisis ms
detallado de los mtodos no paramdicos puede encontrarse en Wackerly y col., 2002.
[ 318 ]
Figura 14.1. Representacin de los resultados de una prueba diagnstica hipottica. El rectngulo menor representa a los enfermos y el mayor, a los sanos. El rea grisada representa
los tests que resultaron positivos, y el rea clara, los tests negativos. De las respectivas reas
se deduce que los tests positivos resultaron mayora entre los enfermos, aunque hay algunos
individuos sanos con tests positivos. Tambin se aprecia que la mayora de los individuos
sanos presentaron tests negativos, como tambin lo hicieron algunos de los enfermos. VP
verdaderos positivos, VN verdaderos negativos, FP falsos positivos, FN falsos negativos.
A todo esto, es fundamental tener en cuenta que para poder calificar los resultados de
una prueba como verdaderos o falsos, debe existir un procedimiento diagnstico que sirva
para determinar la presencia o ausencia de la patologa investigada con un alto nivel de certeza y actuar como estndar o patrn de referencia. Como se comprender, tales mtodos
de referencia suelen ser menos accesibles y muchas veces no estn disponibles al realizar las
pruebas diagnsticas en el contexto de la prctica clnica, de modo que la condicin de verdaderos o falsos de los resultados obtenidos, muchas veces slo puede ser conocida despus
de obtener nuevas evidencias, como biopsias, resultados quirrgicos, o bien por la evolucin
del cuadro clnico y el agregado de nuevos exmenes al conjunto de datos. El alto nivel de
certeza proporcionado por los mtodos de referencia y en ocasiones por otros datos clnicos,
es el que permite conocer el desempeo de una prueba diagnstica, es decir, cules son las
proporciones de sus aciertos y errores, y as, emplearla sola cuando no se dispone de mtodos
de referencia. Es comprensible que en general no exista una separacin clara entre pruebas
corrientes y mtodos de referencia, pero lo que queda claro es que stos ltimos proporcionan
un nivel de certeza diagnstica en general muy superior a las primeras, que precisamente permite clasificarlas como verdaderas o falsas. En forma muy general, es el caso de los exmenes
bioqumicos frente a la biopsia, o el de la electrocardiografa frente a la cinecoronariografa
o los estudios radioisotpicos de perfusin miocrdica. Sin embargo, el tema es complejo
y presenta aristas mdicas sobre las que no corresponde extenderse, como la pregunta que
surge muchas veces acerca de si la esencia de lo evaluado por una prueba diagnstica y el
correspondiente mtodo de referencia, es en realidad la misma.
De modo que, el comportamiento de las diversas pruebas diagnsticas frente al veredicto
de los mtodos de referencia, permite conocer sus capacidades diagnsticas e interpretar sus resultados en la forma ms correcta posible cuando se las emplea en la rutina mdica sin el apoyo
de dichos mtodos. Tales capacidades diagnsticas son la sensibilidad y la especificidad.
[ 320 ]
(14.1)
o bien
Sensibilidad = VP / total de enfermos en quienes se aplica el test
Si en otros 100 individuos, esta vez sanos, se aplica el mismo test y resulta negativo en
90 casos (verdaderos negativos), se dice que la especificidad del test es del 90%. Los restantes 10 individuos sanos en los que el test resulta errneamente positivo, corresponden a
falsos positivos. La relacin entre el nmero de tests verdaderos negativos (que sealan
correctamente la ausencia de enfermedad) y el total de individuos sanos estudiados, se llama
especificidad del test. Por lo tanto, sta puede expresarse como:
Especificidad = VN / (VN + FP)
(14.2)
o bien
Especificidad = VN / total de sanos en quienes se aplica el test
Como se desprende de lo visto hasta aqu, para conocer la sensibilidad y la especificidad
de un test o prueba diagnstica, sta debe ensayarse en individuos en los que no haya dudas
sobre su estado de salud o enfermedad, de modo de medir la sensibilidad del test en los enfermos y la especificidad en los sanos, sin posibilidad de confundir ambos estados. Una vez
conocidas (estimadas) su sensibilidad y especificidad, recin podr usarse el test para sus
fines diagnsticos, en individuos cuyo estado de salud o enfermedad sea incierto. De aqu
surge que la sensibilidad y la especificidad de las diversas pruebas diagnsticas se estiman
siempre con respecto a un mtodo estndar o patrn de referencia. Se acepta que el mtodo
estndar no producir resultados errneos. De esta manera, la sensibilidad y especificidad de
las distintas pruebas diagnsticas, como marcadores humorales o imgenes, se podrn evaluar en individuos para los que tambin se disponga, como se ha mencionado anteriormente,
de informacin diagnstica con alto nivel de certeza, entre la que se cuenta el resultado de
los mtodos de referencia. En realidad, estos estndares son tambin pruebas diagnsticas, y
la distinta jerarqua de las mismas es materia de conocimiento mdico. Asimismo, los estndares pueden ser mejorados o modificados al incorporarse nuevos conocimientos y tcnicas
[ 321 ]
en la materia. Por otra parte, si bien la seguridad diagnstica que proporciona un mtodo de
referencia es algo importante y deseable, estos mtodos patrn son en general ms complejos
y costosos que los dems, y muchos de ellos son invasivos y pueden llegar a causar dao.
Estos hechos son los que confieren su importancia al conocimiento de las pruebas diagnsticas alternativas, que por contraste resultan en general ms sencillas, baratas y repetibles.
Tambin es til recordar que los mtodos patrn o estndar, no slo pueden ser costosos, sino
a veces imposibles de obtener, como puede ser el diagnstico de certeza de alguna enfermedad cuando sta se halla en sus estadios iniciales, diagnstico que muchas veces slo podr
lograrse de la historia clnica en estadios ms avanzados, o bien, de la autopsia. En tanto,
la determinacin de la sensibilidad y especificidad de las pruebas diagnsticas permitir su
aplicacin clnica, eventualmente evitando o postergando el empleo de mtodos costosos o
invasivos.
Un test es mejor que otro cuanto ms sensible y especfico, y este criterio permite comparar tests entre s. Sin embargo, no es posible mejorar las dos propiedades a la vez en el mismo
test. Si se desea aumentar la sensibilidad ser necesario disminuir el umbral diagnstico del
test, esto es, exigirle una menor desviacin de la normalidad para tomarlo como positivo. Al
respecto debe notarse que los resultados que producen la mayora de los tests son datos continuos o que permiten gradaciones, con lo cual el valor a partir del cual se considera que un
test es positivo, conocido comnmente como umbral, es una decisin de los investigadores.
Por ejemplo, para aumentar la sensibilidad de la creatinquinasa en la deteccin de la isquemia
miocrdica, sera factible reducir el valor establecido como mximo normal o valor umbral
a partir del cual se considera que la enzima indica isquemia. Sin embargo, la contraparte
inevitable es que al hacer esto, cierta cantidad de individuos normales aunque con valores de
la enzima algo ms altos que los dems, sean incorrectamente clasificados como isqumicos,
cayendo la especificidad de la prueba. Lo inverso ocurre si se trata de obtener tests altamente
especficos, que resultarn en general tan exigentes para dar un resultado positivo, que fallarn en detectar la patologa existente en muchas oportunidades, cayendo en consecuencia la
sensibilidad del test. Para un mismo test, esta interdependencia de la sensibilidad y la especificidad es siempre la misma y es caracterstica del test, siendo lo que permite comparar la
eficacia relativa de distintos tests entre s.
Las estimaciones de la sensibilidad y la especificidad de un test diagnstico dependen
como se ha visto, de los lmites de normalidad adoptados y asimismo, dependern de la
definicin y niveles de severidad de las condiciones investigadas. Una vez establecidas estas
condiciones, la sensibilidad y la especificidad son caractersticas del test. En contraste, es
fundamental notar que la sensibilidad y la especificidad de una prueba diagnstica no
dependen de la proporcin de individuos sanos y enfermos en el grupo en el que se aplica
la prueba. Si la sensibilidad de la prueba es del 90%, detectar la enfermedad en 9 de cada
10 enfermos, o en 90 de cada 100, sin importar la proporcin de enfermos y sanos en la
poblacin estudiada. Como se ver a continuacin, este hecho contrasta con las diferentes
proporciones de resultados correctos que puede rendir una misma prueba segn se aplique a
poblaciones con distintas prevalencias de la enfermedad, esto es, con distintas proporciones
de enfermos y sanos.
[ 322 ]
A. Prevalencia 50 %
Test
Test
( + )
Enfermos
360
40
400
40
360
40
400
400
Sanos
B. Prevalencia 10 %
( )
( + )
()
Enfermos
72
80
Sanos
72
648
720
144
656
800
800
ejemplo con el nmero de verdaderos positivos, por lo que un test cualquiera sorteado entre
los 144 tests positivos, tiene la mitad de las probabilidades de corresponder a un individuo
enfermo y la otra mitad, de corresponder a uno sano. Este resultado, que limita la utilidad del
test para la deteccin de enfermedad, est condicionado por la baja prevalencia de la misma.*
La relacin entre el nmero de individuos enfermos correctamente identificados como tales y
el total de resultados positivos, se llama valor predictivo del test positivo y se expresa:
Valor predictivo de un test ( + ) = VP / (VP + FP)
(14.3)
(14.4)
En el ejemplo en el que la prevalencia de enfermedad es del 10%, y con una prueba con
sensibilidad y especificidad iguales al 90% (Tabla 14.1, B), se observa que se producen 648
verdaderos negativos y 8 falsos negativos, de donde resulta que el valor predictivo de un test
negativo es igual a 648 / (648 + 8) = 0.99 o 99%. Este alto valor predictivo para un test negativo es la contrapartida del bajo valor predictivo (50%) que tiene un test positivo cuando la
prevalencia de la enfermedad es baja. Se ve que la utilidad de una prueba depende, por una
parte, de su sensibilidad y especificidad y por la otra, de la prevalencia de la enfermedad en
la poblacin en estudio. Esto tiene importantes consecuencias prcticas. Se vio que una baja
prevalencia de enfermedad, al implicar una mayora de individuos sanos, favorece la presentacin de falsos positivos, puesto que stos se dan entre los individuos sanos. Esta abundancia
de falsos positivos disminuye la probabilidad de que un test positivo en esa poblacin, sea
verdadero (14.3). De este modo, aunque la sensibilidad y la especificidad de un test sean altas
y no varen, al aplicarlo al diagnstico en una poblacin con baja prevalencia de enfermedad
proporcionar una cantidad de falsos positivos que har poco til la prueba, pues habr que
proseguir con nuevos estudios para separarlos de los verdaderos positivos (enfermos).
14.4. Probabilidad previa y probabilidad posterior a un test. Teorema de Bayes
Cuando un test resulta positivo para una determinada condicin o enfermedad, es inmediato pensar que la probabilidad de padecer dicha enfermedad debe estimarse como ms alta
de lo que se juzgaba antes de realizar el test (en este tipo de situaciones, en que la probabilidad
de la enfermedad no se estima demasiado alta, resulta til una prueba diagnstica, ya que si
la probabilidad antes de la prueba se considerara muy alta, tendra menos sentido realizarla).
* Es fcil comprobar que con sensibilidad y especificidad iguales a 90% como en el ejemplo, si la prevalencia de
la enfermedad cae por debajo del 10%, un test positivo tiene mayor probabilidad de corresponder a un sano que a un
enfermo.
[ 324 ]
Ntese tambin, que para poder aceptar que las probabilidades de enfermedad han aumentado,
deba existir alguna nocin previa sobre las mismas antes de hacer el test. Al respecto, se habla
de probabilidades pre-test y post-test. El teorema de Bayes permite utilizar las probabilidades
pre-test estimadas o aceptadas para una determinada enfermedad, y los resultados de un test
orientado al diagnstico de la misma, del que se conocen su sensibilidad y su especificidad,
para estimar una nueva probabilidad de enfermedad que incluya la informacin proporcionada
por el test, la que se denomina probabilidad post-test. Aqu se expondrn sucintamente los
conceptos ms bsicos y la posible aplicacin del teorema de Bayes al anlisis de los resultados
de un test, examinando en especial la forma en que se modifican las probabilidades estimadas.
Aunque las diversas pruebas o tests pueden presentar ms de dos resultados, incluyendo series
de valores continuos, y las clases de enfermedad pueden ser varias, la descripcin se limitar
al caso ms simple de dos posibles resultados del test, que se llamarn test positivo (T+) y test
negativo (T), y dos clases posibles de diagnstico, a saber, enfermedad presente (D) y enfermedad ausente (no D). El teorema de Bayes, que admite aplicaciones en varios campos de las
ciencias, en medicina se desarrolla en su forma ms simple a partir de un test T, cuya sensibilidad y especificidad son conocidas, y cuyos dos resultados posibles son, como se mencionara,
positivo o negativo (frecuentemente, a partir de una lnea arbitraria de corte en una prueba que
rinde resultados en una escala continua). Antes de la aplicacin del test, debe tenerse una idea o
existir una estimacin, de la probabilidad de enfermedad para el individuo o caso en cuestin,
que se denomina probabilidad previa o pre-test, P(D). La prevalencia de la enfermedad en la
poblacin es frecuentemente utilizada como probabilidad pre-test.
El teorema se deriva formalmente del clculo de probabilidades esbozado en la Seccin
3, y proporciona la probabilidad de enfermedad, con la condicin de un test positivo. Este
resultado es el valor predictivo de un test positivo visto en el prrafo anterior, que se denomina habitualmente probabilidad post-test y se expresa P(D | T+), que se lee: probabilidad
de enfermedad, dado un test positivo. Su valor est dado en funcin de la sensibilidad y la
especificidad del test, y de la probabilidad de enfermedad pre-test, P(D).
Antes de examinar la ecuacin de Bayes, obsrvese que en trminos de probabilidad condicional, la sensibilidad de un test se define como P(T+ | D) o probabilidad de un test positivo, dada la presencia de enfermedad, y tiene la forma de la ecuacin 14.1. Anlogamente, la
especificidad se define como P(T | no D), que es la probabilidad de un test negativo, dada
la ausencia de enfermedad, y es idntica a la expresin dada en 14.2. Con estas premisas, la
frmula de Bayes corresponde a la siguiente ecuacin:
P(D | T+) = P(T+ | D) P(D) / P(T+ )
(14.5)
donde P(T+ | D), como se dijo, es la sensibilidad del test, en tanto que el numerador completo,
[ P(T+ | D) P(D) ], segn la regla para la multiplicacin de probabilidades resulta ser la probabilidad de (T+ y D), test positivo y enfermedad presente.* En tanto, el denominador P(T+),
es la probabilidad de un test positivo en todo el conjunto de sujetos, sanos y enfermos, que
integran la poblacin, y corresponde a la zona grisada de la figura 14.1. Se ve que la ecuacin
* Recurdese que la regla para la multiplicacin de probabilidades, esto es, para obtener la probabilidad de A y B
ocurriendo simultneamente, es: P (A y B) = P (A) P (B | A) ( 3.3.2).
[ 325 ]
de Bayes divide la probabilidad de test positivo y enfermedad por la probabilidad de cualquier test positivo, haya o no enfermedad. De esta manera, responde a la pregunta: cul
es la probabilidad de que el paciente tenga la enfermedad, si el test resulta positivo? Ahora
bien, a fin de obtener una forma del teorema en funcin de la sensibilidad y especificidad del
test, el denominador debe descomponerse en la suma las probabilidades de test positivo dada
enfermedad, y test positivo en ausencia de enfermedad:
P(T+ ) = [ P(T+ | D) P(D) ] + [ P(T+ | no D) P( no D) ]
(14.6)
de modo que reemplazando P (T+ ) en 14.5, se tiene una versin desarrollada del teorema:
P(D | T+) = P(T+ | D) P(D) / [P(T+ | D) P(D) + P(T+ | no D) P(no D) ]
(14.7)
donde, como se seal ms arriba, P(T+ | D) es la sensibilidad del test, y P(D) la prevalencia o
cualquier estimacin de la probabilidad pre-test. A su vez, P(T+ | no D) es la probabilidad de
obtener un test positivo en ausencia de enfermedad, la cual es el complemento de la especificidad y se puede por tanto escribir (1 especificidad). Por ltimo, P(no D) es el complemento
de la prevalencia P(D) y puede escribirse 1 P(D). Haciendo estas sustituciones el teorema de
Bayes queda expresado como:
P(D |T+) = sensibilidad P(D) / [sensibilidad P(D) + (1 especificidad) (1P(D)] (14.8)
que permite estimar la probabilidad de enfermedad dado un resultado positivo del test, conociendo tres datos: la sensibilidad y la especificidad del test, y la prevalencia de la enfermedad
o probabilidad pre-test.
Ejemplo 14.1.
Se ha informado que la ecocardiografa de esfuerzo tiene una sensibilidad del 68% y una
especificidad del 90% para el diagnstico de enfermedad coronaria (Hirano y col., 2006). De
acuerdo a esto, en cunto puede estimarse la probabilidad de enfermedad coronaria en un
hombre de 40 aos, asintomtico, con un ecocardiograma de esfuerzo positivo (anormal)?
Dejando de lado la exactitud de las estimaciones de la sensibilidad y especificidad del
eco de esfuerzo, el tema crucial es la asignacin de probabilidades pre-test de enfermedad
coronaria al paciente en cuestin, ya que la aplicacin de la frmula de Bayes es sencilla. La
prevalencia de la enfermedad coronaria en la poblacin general puede aceptarse, a los fines
del ejemplo, en alrededor del 7% (Diamond y Forrester, 1979). Aunque es posible tratar de
mejorar la estimacin de las probabilidades pre-test de enfermedad coronaria a partir de
mltiples factores, en particular los llamados factores de riesgo, se mostrar el clculo con
los datos mencionados. Reemplazndolos en 14.8, se tiene:
P(coronariopata | test +) = 0.68 0.07 / [ 0.68 0.07+ (1 0.90) (1 0.07)]
= 0.34
[ 326 ]
con lo que la probabilidad de padecer coronariopata luego de un ecocardiograma de esfuerzo anormal se estima en 34%. Esta sigue siendo una probabilidad no demasiado alta: la
probabilidad de estar sano es an 1 0.34 = 0.66 o 66%. La chance de estar sano, segn la
prueba, es de alrededor de 2 a 1.
Si el paciente en cuestin se presentara con angina atpica, la probabilidad pre-test podra estimarse en alrededor del 50% (Braunwald el al, 2001). En tal caso, la probabilidad
post-test sera igual a
P(coronariopata | test +) = 0.68 0.50 / [ 0.68 0.50 + (1 0.90) (1 0.50)]
= 0.87 u 87%
que es un valor relativamente alto y debera obligar a proseguir los estudios. Por ltimo, si el
paciente se presentara con angina tpica, su probabilidad pre-test rondara, segn la misma
fuente, el 90%, y el lector puede calcular como ejercicio que la probabilidad luego de un
test ecocardiogrfico positivo resulta del 98%, que es un nivel muy alto que se podra decir
prximo a la certeza, aunque teniendo presente que los clculos estadsticos se ajustan a los
datos pero no reemplazan al juicio mdico.
Mediante la aplicacin reiterada de la frmula de Bayes, realizando diversos tests (diferentes entre si), se pueden mejorar las estimaciones. Nuevamente es necesario insistir en la
cautela que se debe tener al aceptar nmeros y porcentajes para el diagnstico de un paciente
determinado.
Un punto crtico que incide mucho en la aplicabilidad de la frmula de Bayes a las situaciones reales, es la estimacin de la probabilidad de enfermedad antes de cualquier test.
Como ya se ha mencionado, una buena medida de la probabilidad pre-test es la prevalencia
de la enfermedad en la poblacin de donde provienen los casos, que es un dato numrico
derivado de la observacin (ver Seccin 16). Sin embargo, no siempre se tienen estimaciones
precisas de la prevalencia, y puede incluso que no sea determinable para las condiciones ms
o menos complejas de un paciente dado. Con frecuencia, aunque existen elementos de juicio
ms o menos claros a favor o en contra de la condicin en estudio, esos conocimientos no
son fcilmente traducibles en probabilidades, que son nmeros, y la probabilidad pre-test
permanece indeterminada. Si bien habr consenso en que un individuo joven y asintomtico
al que se le solicita una prueba ergomtrica debe tener una baja probabilidad de padecer enfermedad coronaria, la probabilidad pre-test estar mucho menos definida si se trata de un
paciente de mediana edad con sntomas dudosos y uno o dos factores de riesgo. En diversos
campos de inters, existen estimaciones de la probabilidad pre-test, elaboradas a partir de
muestras estudiadas con mtodos estndar para decidir la presencia o no de enfermedad,
en determinadas poblaciones. Para su aplicacin en el caso de un individuo en particular,
siempre hay que considerar detalladamente las caractersticas de las poblaciones de donde
fueron derivadas las estimaciones, y determinar si son suficientemente concordantes con las
condiciones del paciente en particular.
[ 327 ]
(14.9)
(14.10)
Se ha visto que el teorema de Bayes expresa la probabilidad post-test o probabilidad de
enfermedad dado un test positivo, P( D | T+), en funcin de la sensibilidad y especificidad del
test. Expresando dicha probabilidad como odds post-test a favor de la enfermedad, puede
demostrarse que (14.8) equivale a:
Odds post-test = odds pre-test likelihood ratio
(14.11)
que es una ecuacin sencilla donde deben reemplazarse las probabilidades por sus odds. A
partir de la probabilidad pre-test P(D), muchas veces estimada a partir de la frecuencia o prevalencia de la enfermedad en la poblacin, se calculan los odds pre-test, P(D) / [1 P(D)]. El
producto de estos odds por el LR corresponde a los odds post-test a favor de la enfermedad,
el resultado de la aplicacin de la frmula de Bayes expresado en odds. El pasaje de odds a
probabilidades convencionales se realiza como en (3.7): P = odds / (odds + 1).
Ejemplo 14.2.
Con los datos del Ejemplo 14.1, el clculo de las probabilidades de enfermedad coronaria
post-ecocardiograma de esfuerzo positivo puede hacerse conociendo el LR del mtodo para
un test positivo, que se ha visto ms arriba que se calcula a partir de (14.9) y para este caso
result igual a 6.8. Este valor es caracterstico para el test, y slo se requiere multiplicarlo por
una estimacin de los odds pre-test a favor de coronariopata, para obtener los odds post-test
segn (14.11).
Se ver el caso del paciente con probabilidad pre-test P(D) = 0.07. Se tiene:
Odds pre-test = P(D) / [1 P(D)]
= 0.07 / (1 0.07) = 0.075
Odds post-test = odds pre-test likelihood ratio
= 0.075 6.8 = 0.51
Probabilidad post-test = Odds post-test / (Odds post-test + 1)
= 0.51 / ( 0.51 + 1) = 0.34
como en el Ejemplo 14.1. Conociendo el LR del mtodo no es necesario emplear la sensibilidad y la especificidad, pues toda la informacin est contenida en aqul.
Se ha visto hasta aqu que la sensibilidad y la especificidad caracterizan a las pruebas
diagnsticas o tests, pero en principio slo predicen la proporcin de tests positivos y negativos que se obtendrn de individuos enfermos y sanos respectivamente. Si adems del resultado del test se tiene una idea de la prevalencia de la enfermedad en la poblacin, que estima la
probabilidad de la enfermedad sin tomar en cuenta el test, es posible mejorar la precisin de
esta estimacin calculando el valor predictivo de un resultado positivo o negativo del mismo.
La ecuacin de Bayes (14.8) proporciona estimaciones del valor predictivo donde es posible
evaluar la contribucin relativa de la sensibilidad y la especificidad de test en los resultados
obtenidos. Finalmente, los likelihood ratios resumen en un solo nmero la relacin entre
sensibilidad y especificidad de un test, y permiten un sencillo clculo de las probabilidades
post-test, con el nico requisito de expresarlas como odds.
[ 329 ]
(14.12)
[ 330 ]
Para obtener una curva ROC completa se necesitan ms puntos, para lo cual hay que
variar el umbral del test de un modo continuo. Como en cualquier determinacin de la sensibilidad y la especificidad de un test, debe contarse con un mtodo estndar que proporcione
los diagnsticos de referencia. La mecnica del procedimiento se esboza a continuacin a
partir de datos presentados por Rodrguez y col, 2004.
En una muestra de 266 individuos de ambos sexos, se ensaya el ndice electrocardiogrfico de Sokolow-Lyon para el diagnstico de la hipertrofia ventricular izquierda (HVI),
pero en vez de hacerse una nica prueba con el valor de corte tradicionalmente aceptado de
35 mm (3.5 mV), se realizan varios ensayos para distintos puntos de corte. Previamente, la
presencia de HVI ha sido detectada con certeza mediante el ecocardiograma (que acta
como mtodo referencia) en 72 individuos, con lo cual hay 266 72 = 194 individuos sin
HVI. Volviendo al ndice de Sokolow-Lyon, tomando como punto de corte 35 mm (de modo
que Sokolow-Lyon 35 mm se considera diagnstico de HVI) se observan 22 resultados positivos, de los cuales 17 corresponden a HVI (verdaderos positivos) y 5 a individuos sin HVI
(falsos positivos). Con este punto de corte, la proporcin de verdaderos positivos detectados
es de tan slo 17 en 72 individuos con HVI, o sea 17 / 72 = 0.24 o 24%, en tanto que la proporcin de falsos positivos es de 5 en 194 individuos normales o sea 5 / 194 = 0.026 o 2.6%.
La proporcin de verdaderos positivos detectados refleja la sensibilidad del test con un punto
de corte en 35 mm, en tanto que la proporcin de falsos positivos, 0.026, corresponde a los
casos donde falla la especificidad, lo que se puede expresar como (1 especificidad). Si
se representan grficamente la fraccin de verdaderos positivos (sensibilidad) y la de falsos
positivos (1 especificidad) se obtiene el punto A de la Figura 14.2. Dado que 0.026 es igual
a (1 especificidad), la especificidad se calcula enseguida en 1 0.026 = 0.974 o 97.4%. Estos
datos concuerdan con la pobre sensibilidad y muy alta especificidad del ndice de Sokolow[ 331 ]
Lyon en el nivel de corte en que es corrientemente utilizado. El punto A es un punto perteneciente a la curva ROC del ndice de Sokolow-Lyon, para la muestra evaluada. Ntese que
para estas determinaciones es indispensable tener un estndar de referencia que proporcione
el veredicto acerca de la presencia o ausencia de la condicin evaluada por la prueba. En el
caso que nos ocupa, el estndar es el ecocardiograma, y la prueba bajo evaluacin, el ndice
electrocardiogrfico de Sokolow-Lyon.
Tomando otro punto de corte para el diagnstico de HVI, por ejemplo Sokolow-Lyon
25 mm, los diagnsticos verdaderos positivos son ahora 47 en 72 o sea 0.65 o 65% mientras
que los resultados falsos positivos son (por pura coincidencia) nuevamente 47, que entre 194
individuos sin HIV indican 47 / 194 = 0.24 o 24% de resultados falsos positivos. Se observa
que al reducir el umbral diagnstico a 25 mm, la sensibilidad del ndice de Sokolow-Lyon
para la HVI aumenta al 65%, pero a expensas de una cada de la especificidad a 1 0.24 =
0.76 o 76%. Estos resultados se traducen en el punto B de la Figura 14.2. Finalmente, vase
que ocurre tomando un valor umbral exageradamente bajo de, digamos, 15 mm. Ahora el
test detecta correctamente (verdaderos positivos) a 70 / 72 = .97 o 97% de los casos de HVI,
pero tambin produce 166 resultados falsos positivos, o sea 166 / 194 = .86 u 86%, lo que
implica que la especificidad ha cado al nivel inaceptable de 1 0.86 = 0.14 o 14%. Este es
el punto C de la Figura 14.2. Los programas de computacin recorren automticamente todos los valores que puede tomar el test en una muestra y para cada punto, realizan clculos
similares a los ya vistos, tomando como referencia los datos proporcionados por el mtodo
estndar, generando las correspondientes curvas ROC.
Puede verse que cunto mayor sensibilidad se obtenga con la menor cantidad de falsos
positivos, o sea, con el menor sacrificio posible de especificidad, la curva ROC se acercar al
ngulo superior izquierdo de la grfica (ntese que dicho ngulo corresponde a sensibilidad
100% y especificidad 100%). Por esta razn una medida de la eficiencia de un test es la
proporcin de rea bajo la curva en relacin al rea total de la grfica (la curva ROC para
un test con 100% de sensibilidad y especificidad, estara formada por los bordes izquierdo
y superior de la grfica, abarcando toda su rea). No se puede decir qu proporcin de rea
bajo la curva corresponde a un test bueno, muy bueno o malo, pero est claro que en general,
cuanto mayor el rea bajo la curva, mayor ser la eficacia del test. En el ejemplo del ndice de
Sokolow-Lyon, el rea es de 0.76 o 76%.
De lo visto hasta aqu, queda claro que una curva ROC proporciona el par sensibilidad especificidad para cada uno de los umbrales que puede adoptar el test, permitiendo
elegir el ms adecuado a las necesidades del investigador. El nivel de especificidad deseado,
que equivale a la proporcin de resultados falsos positivos que se est dispuesto a tolerar,
condiciona el punto de la curva en que se deber trabajar, y este punto tiene asociado un
nivel de sensibilidad que no ser posible superar con el test en cuestin. Si la sensibilidad ha
de ser aumentada, habr que se sacrificar la especificidad desplazndose a la derecha sobre
el eje horizontal, admitiendo una mayor proporcin de resultados falsos positivos, con lo
que tambin aumentarn los verdaderos positivos. Todas las estrategias posibles en materia
de sensibilidad y especificidad pueden ser as evaluadas mediante la inspeccin de la curva
ROC, para elegir la ms conveniente de acuerdo al tipo y finalidad de cada test. En los casos
en los que un diagnstico correcto es muy importante por las consecuencias que implicara
[ 332 ]
[ 333 ]
15.1. Introduccin
El anlisis de la sobrevida se refiere a un conjunto de mtodos destinados a estudiar
la ocurrencia de distintos eventos, entre ellos la muerte, en grupos de individuos seguidos
a lo largo del tiempo, esto es, longitudinalmente. Las llamadas curvas de sobrevida dan la
proporcin de individuos de un conjunto inicial, que se mantiene con vida en diferentes momentos a lo largo de un tiempo de observacin. Son muy utilizadas para tener una imagen
visual de la forma en que la mortalidad afecta a distintos grupos de individuos, por ejemplo
en el seguimiento de distintos tratamientos, en la bsqueda de diferencias que puedan tener
importancia en la futura seleccin de las mejores opciones teraputicas. Se representan en un
sistema de ejes, con el tiempo en las abscisas (x) y la proporcin de sobrevivientes en las ordenadas (y), se inician en tiempo cero y con el 100% de los individuos con vida, presentando
una forma escalonada, descendente hacia la derecha y abajo, a medida que la proporcin de
sobrevivientes disminuye con el tiempo (Fig. 2.4). Los correspondientes datos numricos en
que se originan reciben el nombre de tablas de sobrevida. Estos instrumentos proceden de los
censos, relevamientos destinados a conocer y eventualmente administrar distintos aspectos
de grandes grupos humanos como naciones o ciudades, de los cuales existen referencias histricas ms o menos lejanas. Las tcnicas censales adquirieron un gran desarrollo a partir del
siglo XVIII, pero los adelantos ms importantes en lo relacionado con las ciencias mdicas
datan de las ltimas dcadas, cuando adems recibieron la contribucin del campo del anlisis multivariado. Las curvas de sobrevida son la expresin grfica de toda una elaboracin
terica que permite su clculo numrico, incluyendo los mtodos para la construccin de
modelos matemticos que las representan, las tcnicas para la comparacin de varias curvas
entre s y tambin para la evaluacin de covariables que puedan tener influencia sobre la produccin de los eventos.
A pesar de su nombre, las curvas de sobrevida son aplicables a cualquier condicin o
evento con una probabilidad de aparicin definida, que pueda afectar a conjuntos de individuos. As, son condiciones de inters frecuente la morbilidad o aparicin de una enfermedad,
sus recadas, las intervenciones o reintervenciones quirrgicas, las internaciones y tambin
circunstancias mdicamente favorables como la remisin de determinados procesos o sntomas, etc. Tambin puede interesar el momento en que se alcanza cierto punto sobre una
variable continua, como por ejemplo el momento en que los glbulos blancos descendidos por
[ 334 ]
Debe mencionarse que el complemento de la probabilidad de sobrevida, px, es la probabilidad de bito o evento, qx, igual a (1 px ). No se entrar en detalles de construccin y clculo
de las curvas de sobrevida, pero se sealar que existen varios aspectos que surgen al poner
en prctica un estudio. Quiz el ms importante es el tratamiento de los individuos que por
algn motivo no completan el tiempo de seguimiento establecido. Las dos causas fundamentales son las prdidas de contacto durante el seguimiento (withdrawals) y el fin del protocolo
antes de que algn o algunos individuos hayan cumplido su seguimiento. Estas observaciones
incompletas se refieren frecuentemente como censored observations y hay tcnicas de anlisis para tratar con estos casos sin descartarlos del estudio, que se basan en que el individuo en
cuestin estaba vivo (informacin aprovechable) por lo menos hasta el momento del ltimo
contacto. Sin embargo, y a pesar de que dichas tcnicas son efectivas, la recomendacin es
hacer todo lo posible por no perder ningn caso (Peto y col., 1976).
15.3. Curvas de Kaplan y Meier.
Un punto delicado es la eleccin de los intervalos de tiempo en que se dividir la duracin
total del seguimiento. Si son muy grandes pierde precisin el estudio, y si son muy pequeos
[ 336 ]
el contacto con el paciente en tiempos estipulados y la recoleccin de datos se tornan engorrosos, consumidores de tiempo y costosos. El tema de los intervalos de duracin arbitraria
se evita mediante el mtodo de Kaplan y Meier, que adems proporciona herramientas de
anlisis efectivas y relativamente sencillas en sus lineamientos generales, y se resear a continuacin. Con este mtodo se considera que el tiempo de seguimiento se halla dividido en una
gran cantidad de pequeos intervalos, en general tan pequeos como puedan ser registrados
sin perder exactitud. Como frecuentemente se emplean intervalos de un da, supongamos que
ese es el intervalo elegido. El mtodo procede as: habiendo nj individuos en seguimiento, si
en un da cualquiera se producen dj eventos (uno o ms eventos), la probabilidad de evento
estimada para el tiempo t j es:
q j = d j / n j
(15.1)
(15.2)
l t = p j = [ (n j d j) / n j ]
(15.3)
rales del mismo, que son importantes por dar una idea de la forma en que se realizan las comparaciones. El mtodo consiste en formar un conjunto nico con los datos de los dos grupos
a comparar, digamos A y B, manteniendo la identificacin de cada individuo segn el grupo
al que pertenezca. Supongamos que en un momento los grupos tienen nA = 100 y nB = 50
individuos respectivamente, y ese da se producen 3 eventos en el conjunto de ambos grupos.
La expectativa lgica bajo la hiptesis nula de no diferencia en incidencia de eventos entre los
grupos, es que 2 de los tres eventos ocurran en el grupo con 100 individuos, y el restante en
el grupo con 50 individuos, esto es, que la incidencia de eventos sea proporcional al nmero
de individuos de cada grupo. Esta es la base del mtodo, y si los eventos se presentan en cantidades proporcionales al tamao de cada grupo, no habr diferencias entre lo observado y lo
esperado. Pero si en cambio los eventos acontecen de otra forma, por ejemplo los 3 eventos en
uno de los grupos, o 2 eventos en el grupo ms chico y 1 en el ms grande, se tienen evidencias en contra de la hiptesis nula. Cada vez que se producen uno o ms eventos, se compara
el nmero observado en cada grupo con el esperado de acuerdo a la cuanta del respectivo
grupo. A lo largo de todo el estudio, se suman los eventos observados (O) y esperados (E) en
cada uno de los grupos, obtenindose las sumas OA y E A en el grupo A, y las sumas OB y E B
en el grupo B. El estadstico
(15.4)
(15.5)
se conoce como hazard ratio y es una expresin del riesgo relativo de evento en el grupo A
respecto del B.
La significacin estadstica del riesgo relativo h frente a la hiptesis nula de riesgos iguales (h = 1), se calcula mediante (15.4) y se obtiene en los paquetes estadsticos corrientes.
Como se ha visto, el anlisis de la sobrevida puede realizarse mediante diversos mtodos y en distintos mbitos. En medicina son muy comunes los estudios de seguimiento de
grupos o cohortes, muchas veces para evaluar diferencias entre grupos sometidos a distintas
intervenciones teraputicas pero tambin con otros objetivos, como evaluar la evolucin de
distintos padecimientos, o de enfermedades estratificadas segn distintos factores de riesgo.
El mtodo de Kaplan y Meier es uno de los de eleccin para analizar la sobrevida en cohortes,
y una de las pruebas de significacin ms empleadas es el logrank test. Existen otras semejantes, como la de Wilcoxon, que asimismo se obtienen en los paquetes de computacin de uso
corriente.
15.5. Mtodos paramtricos
El estudio del tiempo de sobrevida puede hacerse postulando una distribucin de probabilidades para el mismo, y estimando sus parmetros a partir de los datos de las muestras o
grupos de individuos. Es decir, se elige una frmula o modelo matemtico que se espera que
[ 338 ]
describa la forma de transcurrir el tiempo de sobrevida, y a partir de los datos reales de los
grupos se estiman los parmetros correspondientes a la distribucin previamente elegida.
De esta forma, el modelo como funcin del tiempo, describe la sobrevida observada en los
distintos grupos, en forma anloga a lo que hace una ecuacin de regresin cuando estima
la variable independiente. Dichos modelos de la sobrevida permiten una serie de inferencias
y comparaciones, as como la introduccin de mtodos multivariados a fin de controlar los
efectos de diversas covariables, siendo el tiempo la variable en funcin de la cual se expresan
las caractersticas de la sobrevida. La estimacin de los parmetros de dichos modelos se
realiza en general por el mtodo de mxima verosimilitud (maximum likelihood), que no es
dado examinar aqu. Como estas tcnicas son relativamente complejas, slo se comentarn
las caractersticas ms importantes de los mtodos paramtricos y la interpretacin de sus
resultados, en especial lo que se refiere al mtodo semi-paramtrico de Cox.
Mediante los mtodos paramtricos, se pueden construir distintas funciones F( t ) que
describen la proporcin de eventos que se van acumulando a lo largo del seguimiento hasta
cada instante t, o sea en funcin del tiempo. Siendo que una funcin F( t ) da cuenta de la proporcin de eventos, la proporcin de sobrevivientes hasta cada instante t, estar dada por la
funcin S( t ) = 1 F( t ). Por ejemplo, si F( t ) indica que a los t das de seguimiento los eventos
alcanzan al 15% del grupo original, se tendr que S( t ) = 1 0.15 = 0.85 u 85%, corresponde
a la proporcin de de sobrevivientes hasta ese instante. S( t ) se denomina funcin de sobrevida (survivor function) y su representacin grfica es similar a las curvas de sobrevida vistas
anteriormente, aunque en este caso deriva de un modelo matemtico ajustado a los datos (Fig.
15.2). Hay diversos modelos de sobrevida y una forma de describirla es a travs de la llamada
funcin de riesgo (hazard function), que relaciona el riesgo de muerte en un instante t, con la
proporcin de sobrevivientes hasta ese mismo momento.
Figura 15.2. Funcin de sobrevida para = 0.02, unidades de tiempo arbitrarias.
La probabilidad de sobrevida en un instante o tiempo t a partir del comienzo del seguimiento, est dada por la funcin f ( t ), llamada funcin de densidad de probabilidad del tiempo de sobrevida. Su integral, F ( t ), describe la proporcin de muertes o eventos producidos
hasta el instante t, y guarda con f ( t ) relaciones anlogas a las de las funciones de densidad y
de distribucin de probabilidad vistas en 4.6.1. Como ha sido mencionado, la funcin S( t )
= 1 F( t) se llama funcin de sobrevida, y su valor establece la proporcin de sobrevivientes
hasta el momento t. Por ltimo, el cociente
[ 339 ]
( t ) = f ( t ) / S ( t )
(15.6)
se conoce como funcin de riesgo (hazard function) y puede expresarse como la probabilidad
de que, habiendo sobrevivido hasta el instante t, se produzca el evento en el instante siguiente.
Existen varios modelos para ( t ), el ms sencillo de los cuales corresponde a = constante. En este caso, se demuestra que la funcin de sobrevida toma la forma
S ( t ) = e t
(15.7)
cuya grfica para = 0.02 se observa en la Figura 15.2. Sin embargo, el asumir invariable a
travs del tiempo no se considera totalmente satisfactorio y se han elaborado otros modelos,
como los de Weibull y Gompertz, en los que la funcin de riesgo se modifica en funcin del
tiempo (Armitage y Berry, 1994).
15.6. Mtodo de los riesgos proporcionales
El estudio de la sobrevida en un grupo, solamente en funcin del tiempo y sin considerar
otras condiciones que pudieran modificarla, presenta un inters limitado. En contraste, resulta muy importante la posibilidad de obtener modelos de la sobrevida que la representen, no
slo en funcin del tiempo sino tambin de otras variables individuales como pueden ser la
edad, condiciones patolgicas, tratamientos recibidos, resultados de mtodos diagnsticos,
etc. Esto expande los alcances del mtodo al control de mltiples variables y de sus interrelaciones, permitiendo estimar la llamada tasa de riesgo (hazard rate) relacionada con dichas
variables. La funcin ( t ) queda expresada como ( t, x ), donde x representa las distintas
covariables x1, x2 , xn. Los datos son as analizados en relacin al tiempo y a las n covariables. La expresin general de la funcin de riesgo puede luego escribirse:
( t, x ) = 0 e x
(15.8)
[ 340 ]
riesgo relativo = e x
(15.9)
siendo x = 1x1 + 2x2 + + nxk una regresin mltiple de las distintas covariables, cuyos
coeficientes se obtienen mediante el procedimiento de estimacin conocido como de mxima verosimilitud. Reemplazando las x por sus valores numricos y exponenciando en e, se
obtiene la estimacin del riesgo para un individuo con ese arreglo particular de los datos. En
el caso de una variable independiente dicotmica puede obtenerse el riesgo relativo entre los
dos estados posibles de la misma, como por ejemplo diabetes presente y diabetes ausente, tratamiento 1 y tratamiento 2, etc. Este mtodo, en que el riesgo para cada conjunto de variables
se considera independiente del tiempo, y relativo con respecto al valor que tomen las covariables, se conoce como mtodo de los riesgos proporcionales de Cox (proportional hazards).
A fin de ilustrar el procedimiento, considrese el caso del seguimiento de una cohorte
en la que una variable independiente binaria, codificada como normal = 0 o alterada = 1,
exhibe al final del estudio un coeficiente b = 1.2, que resulta estadsticamente significativo.
Reemplazando el valor 1.2 en la frmula (15.9), se obtiene:
con lo que la estimacin para la variable en estado normal queda como valor de referencia y
el riesgo relativo resulta 3.32 veces mayor en los pacientes con la variable alterada.
Como el modelo de Cox no toma en cuenta el tiempo, no permite hacer predicciones con
respecto al tiempo de presentacin de los eventos, sino estimar el riesgo que implica cada
cambio en las covariables con respecto al conjunto de los datos. Estas son estimaciones del
riesgo relativo. Como se ha visto, cada coeficiente mide el cambio en el riesgo relativo por
cada incremento en una unidad de la variable correspondiente. En el caso de una variable
dicotmica, como se vio ms arriba, el cambio en una unidad implica el cambio de estado de
la variable, pero el mtodo tambin puede aplicarse a variables continuas, y cuando hay diferentes predictores independientes constituye un efectivo modelo de regresin mltiple para
la estimacin de los riesgos relativos, siempre bajo el presupuesto de que el efecto del tiempo
es el mismo para todos los individuos considerados. El grado de significacin estadstica de
los coeficientes de regresin as como sus lmites de confianza, se obtienen de los paquetes
estadsticos corrientes.
[ 341 ]
16.1. Generalidades
En forma general, la epidemiologa trata de la distribucin de la enfermedad en las poblaciones. As, uno de los temas principales de la epidemiologa es lo concerniente a la presencia de
enfermedad y a la aparicin de nuevos casos, llamadas respectivamente prevalencia e incidencia. Otro inters de la epidemiologa es el estudio de la gama de factores que pueden interactuar
con la presentacin de las enfermedades, entre los que se cuentan los ambientales, biolgicos,
socioeconmicos, etc. Un tipo importante son los factores mdicos, que incluyen las distintas
intervenciones teraputicas. Todos estos factores se llaman exposiciones. A los sujetos que entran en relacin con esos factores se los suele denominar expuestos.
En general, muchos de los mtodos de la estadstica prestan utilidades para abordar los
problemas de la enfermedad en las poblaciones, pero hay algunos especialmente aptos para
adaptarse a las situaciones tpicas de la epidemiologa, que como se entender, son mtodos
de tipo esencialmente observacional o descriptivo, en contraste con los procedimientos
experimentales o de laboratorio, donde las cosas se disponen y an se provocan, a criterio
del investigador. As, los estudios epidemiolgicos se ocupan de observar y dar cuenta del
panorama espontneamente proporcionado por la enfermedad, describiendo su modo de
aparicin, permanencia, duracin, propagacin y modificacin por diversas exposiciones.
En cambio, los estudios experimentales seleccionan el material de estudio, actan sobre l
mediante todo tipo de intervenciones, lo modifican y evalan los cambios provocados, tal
como ocurre en el ensayo de drogas o en el trabajo con animales o preparados de laboratorio.
Con todo, la distincin entre estudios descriptivos y experimentales no es neta, y hay situaciones que comparten caractersticas, como pueden ser los estudios de grandes muestras de
poblaciones en las que se ensayan distintas teraputicas, donde las tcnicas del seguimiento
suelen emplear los mtodos tpicos de la epidemiologa, y el hecho de administrarse un tratamiento controlado tiene que ver con las intervenciones experimentales.
Existen dos mtodos especialmente apropiados para el estudio de la enfermedad en poblaciones: el seguimiento de cohortes o grupos a lo largo del tiempo, y los estudios de tipo
caso-control. La primera variedad se refiere con cierto detalle en la Seccin 15, y tiene caractersticas que muchas veces la haran de eleccin, aunque no siempre su puesta en prctica es sencilla, y no hay forma de obviar el tiempo de seguimiento requerido. En tanto, los
estudios caso-control, que constituyen un mtodo propio de los estudios epidemiolgicos,
[ 342 ]
tambin presentan recursos de diseo y clculo que los hacen tiles, y sern examinados en
lo que sigue.
16.2. Prevalencia e incidencia
La prevalencia mide la frecuencia de una enfermedad existente en la poblacin en el
momento del estudio, y est dada por la razn
P = nmero total de casos / nmero total de poblacin
(16.1)
en el momento en que se hace su determinacin. Se expresa como casos por cien, por mil,
etc, segn su magnitud. Si en una poblacin hay 2 casos de una determinada enfermedad por
cada 100 individuos, la prevalencia ser de 0.02 o, expresado en porcentaje, 2%. El trmino
prevalencia no slo se aplica a enfermedades, sino a cualquier condicin o evento que pueda
estar presente o ausente en una poblacin. As, se habla corrientemente de la prevalencia de
distintos factores de riesgo para enfermedad, y tambin de caractersticas como el gnero o
el color del cabello, etc.
La incidencia mide la tasa de ocurrencia de nuevos casos de enfermedad en una poblacin durante un tiempo determinado, y se expresa como
I = nmero de casos nuevos / poblacin en riesgo
(16.2)
de contraerla que un individuo del ltimo grupo. El cociente entre la incidencia de enfermedad en dos grupos se llama riesgo relativo (RR) o razn de riesgos (risk ratio):
RR = I1 / I 2
(16.3)
(16.4)
DR = I expuestos I no expuestos
(16.5)
pleta cuando se conoce la incidencia del proceso en estudio en al menos uno de los grupos
que se comparan. Resulta evidente que si el riesgo de enfermedad es menor en los individuos
expuestos, como puede ser el caso si la exposicin se refiere a un tratamiento efectivo, (16.5)
proporcionar valores negativos. Este detalle formal no impide entender los resultados como
una reduccin del riesgo asociada a la exposicin.
Se ha visto en la Seccin 8, que en circunstancias donde el tiempo de presentacin de
los eventos no es el objeto principal de la investigacin, como en el estudio de la mortalidad
hospitalaria por endocarditis infecciosa en individuos con y sin insuficiencia renal, el riesgo y
el riesgo relativo pueden estimarse a partir de la proporcin de casos en los distintos grupos.
Cabe agregar que en estos casos tambin la diferencia de riesgo puede estimarse como la diferencia entre las proporciones de individuos afectados en los grupos expuesto y no expuesto,
lo cual puede expresarse como la diferencia en la mortalidad, por cada 100 individuos.
16.4. Nmero necesario a tratar
Se ha mencionado que las distintas teraputicas pueden ser consideradas exposiciones.
En tal sentido, los diversos estudios clnicos suelen comparar los efectos de diferentes tratamientos entre s, o con placebo. Dichos ensayos clnicos participan de muchas de las caractersticas de los estudios epidemiolgicos, en particular en lo que se refiere la observacin
de grupos de individuos sometidos a distintas exposiciones teraputicas, y la estimacin del
riesgo de presentar diversos eventos relacionados con la patologa estudiada. En estos casos,
es frecuente que los tratamientos reduzcan la incidencia de la enfermedad o de sus complicaciones, y en tales circunstancias el riesgo relativo entre el tratamiento y el rgimen alternativo
ser menor que 1, mientras que la diferencia de riesgo indicar el exceso de enfermedad o
eventos en los individuos no tratados.
Una medida muy empleada del xito de un tratamiento deriva de la diferencia de riesgo,
que en el caso de un tratamiento beneficioso puede entenderse como el exceso de enfermedad
en el grupo no tratado, y tambin, como el nmero de individuos que han evitado la enfermedad en el grupo tratado, siempre con referencia al nmero de individuos-ao evaluado. En
estas circunstancias puede aceptarse que si el tratamiento present una DR a su favor de 5
pacientes / 1000 individuos-ao, debern tratarse 1000 / 5 = 200 individuos durante un ao
para tener la expectativa de evitar la enfermedad en uno de tales individuos. Si la DR fuera
igual a 20 pacientes / 1000 individuos-ao, deberan tratarse 1000 / 20 = 50 individuos durante un ao para salvar de la enfermedad a uno de ellos. Estas cantidades se conocen como
nmero necesario a tratar (NNT) y como se ve, son la inversa de la diferencia de riesgo:
NNT = 1 / DR
(16.6)
En forma anloga al NNT, en el caso de efectos adversos de la teraputica puede calcularse el nmero necesario para daar, que expresa el nmero de individuos que deben recibir
el tratamiento para que uno de ellos experimente un efecto adverso. La utilidad principal de
este indicador reside en la evaluacin de efectos colaterales indeseables cuando interesa administrar el tratamiento por los beneficios derivados de sus efectos principales.
[ 345 ]
(16.7)
Existen otras expresiones del riesgo atribuible, entre ellas una que permite calcularlo en
funcin del riesgo relativo para el factor del que se trate (RR), y de la proporcin o prevalencia
del factor en la poblacin (PF):
Riesgo atribuible = [PF (RR 1)] / [ 1 + PF (RR 1) ]
(16.8)
Esta frmula es til cuando no se dispone de estimaciones de las incidencias de la enfermedad, que requieren el seguimiento en el tiempo, pero en cambio puede estimarse el riesgo relativo entre expuestos al factor y no expuestos. Esta situacin es caracterstica de los estudios
caso-control, que se examinarn en el prrafo siguiente.
16.6. Estudios caso-control
En los estudios de tipo caso-control se evala la asociacin entre enfermedad y exposicin a factores diversos, mediante la comparacin de un grupo de individuos que padecen la
enfermedad, casos, y un grupo de referencia libre de ella, controles. El objetivo es estimar si la
exposicin a un determinado factor influye en la incidencia de la enfermedad en estudio. Un
ejemplo de una serie de exposiciones o factores lo constituyen los llamados factores de riesgo
cardiovascular, como la hipertensin, diabetes, dislipemia, tabaquismo, etc. Como se ha dicho,
el aspecto que interesa estimar es la incidencia de enfermedad cuando un factor est presente y
cuando no lo est: si la incidencia aumenta en presencia del factor, el grado de aumento del riesgo se podr medir mediante el cociente de las incidencias en presencia y en ausencia del mismo,
que es el riesgo relativo visto anteriormente. Una forma natural de estimar el riesgo relativo es
seleccionar un grupo de individuos con el factor en cuestin y otro libre del mismo, y seguirlos
en el tiempo contando las veces que aparece la enfermedad en cada grupo. Este tipo de estudio,
el seguimiento de cohortes, se aborda en la Seccin 15, siendo su principal limitacin requerir
tiempos en general prolongados. Ahora bien, en los estudios de tipo caso-control, tanto la presencia de enfermedad como de exposicin, se investigan a partir de historias clnicas o archivos,
o bien realizando las correspondientes investigaciones diagnsticas en el momento del estudio.
Primeramente se eligen individuos de los que se sabe fehacientemente que presentan la enferme[ 346 ]
dad (casos) o que no la presentan (controles), y recin entonces se determina quines se hallan
y quines no se hallan expuestos al factor en consideracin. Es llamativo que, a pesar de no
contarse con estimaciones directas de la incidencia de la enfermedad, pues no hay seguimiento,
estos estudios proporcionen estimaciones suficientemente buenas del riesgo relativo, tambin
conocidas como riesgo relativo aproximado, y en esto radica su importancia. El desarrollo de
un estudio caso-control se expondr y comentar a continuacin.
En un trabajo dirigido a examinar la asociacin del infarto de miocardio con el uso de
contraceptivos (Dunn y col, 1999), se compar un conjunto de 448 mujeres que lo haban
presentado, con otro de 1728 mujeres de edad similar y sin antecedentes de infarto. Los
diagnsticos se obtuvieron en forma retrospectiva a partir de historias clnicas y entrevistas
con mdicos tratantes y pacientes. Varios factores de riesgo fueron considerados en el mismo
estudio, y en la Tabla 16.1 se muestran los datos relativos a la proporcin de dislipemia en
casos y controles, dispuestos en una tabla de 2 2.
Tabla 16.1. Tabla de 2 2. Clasificacin de casos (infarto de miocardio) y controles segn la
presencia de dislipemia, en 2176 mujeres de 16 a 44 aos de edad (Dunn y col, 1999).
CASOS
CONTROLES
Dislipemia
34
51
Total
85
No dislipemia
414
1677
2091
Total
448
1728
2176
De la tabla se obtiene la proporcin de casos y de controles expuestos a la dislipemia,
pero no las incidencias de infarto de miocardio en las mujeres dislipmicas (ya que no hay un
seguimiento en el tiempo y tanto casos como controles se han obtenido en forma independiente). As, 34 / 448 = 0.076 o 7.6%, es la proporcin de los infartos expuesta a la dislipemia,
y 51 / 1728 = 0.03 o 3.0%, es la proporcin de controles con dislipemia, con lo cual se conoce
la proporcin de dislipemia en casos y controles, pero no se sabe con qu frecuencia tender a
presentarse el infarto de miocardio en presencia y en ausencia de dislipemia, es decir, la tabla
no proporciona la incidencia de infarto en presencia y en ausencia de dislipemia, sino ms bien
el porcentaje de dislipemia encontrado en infartos y controles. Ahora bien, si casos y controles
se hubieran obtenido mediante el muestreo aleatorio de una poblacin extensa, sin elegirlos
por el diagnstico, la proporcin de casos de infarto de miocardio entre mujeres con dislipemia
podra servir para estimar el riesgo de infarto en ese grupo, y anlogamente, la proporcin de
infarto entre mujeres normolipmicas permitira tener una estimacin aproximada el riesgo de
infarto en ausencia de dislipemia, procediendo como en 8.4. El cociente entre ambos riesgos
resultara entonces una estimacin del riesgo relativo de padecer infarto de miocardio en dislipmicos y normolipmicos. Sin embargo y a pesar de que casos y controles no han sido obtenidos por muestreo aleatorio de poblaciones, es un hecho interesante y til que el riesgo relativo
pueda derivarse con suficiente exactitud de estudios caso-control, donde casos y controles han
sido obtenidos en nmero arbitrario, y muchas veces, a partir de distintas bases de datos. El
procedimiento para el anlisis de un estudio caso-control se describe a continuacin, para lo
cual es conveniente representar los casos como en la Tabla 16.2.
[ 347 ]
CONTROLES
Total
Dislipemia
a+c
No dislipemia
b+d
Total
a+b
c+d
(16.9)
Por motivos tericos, en los estudios caso-control debe usarse una aproximacin a (16.9), en
donde los casos, a y b, son suprimidos del denominador. La expresin se transforma as en la
razn de los odds u odds ratio (OR):
OR = (a / c) / (b / d)
(16.10)
= (a d) / (b c)
(16.11)
En forma anloga a lo ya visto para el risk ratio, el OR es el cociente entre los odds de
infarto en dislipmicos y en no dislipmicos. Esta nueva estimacin del riesgo relativo por
medio del odds ratio resulta aceptable mientras el nmero de casos (enfermedad) sea relativamente pequeo en comparacin con los controles, cosa que por otra parte es frecuente en
estudios epidemiolgicos.
A fin de demostrar que la ecuacin (16.10) expresa el OR en funcin de las frecuencias de
casos y controles, obsrvese que si la probabilidad de infarto en el conjunto dislipemia est
dada por a / (a + c), su complemento (1 probabilidad) debe ser igual a c / (a + c), ya que a y c
se refieren a las dos nicas posibilidades, infarto y no infarto. Recordando que odds = probabilidad / (1 probabilidad), los odds de infarto en el grupo dislipemia estarn dados por a / (a
+ c) dividido por c / (a + c), lo que es igual a a / c, el numerador de (16.10). En forma anloga,
los odds de infarto en el grupo no expuesto resultan iguales a b / d, que es el denominador de
(16.10).
En este punto debe enunciarse un hecho fundamental, en cuyo anlisis no cabe profundizar aqu (ver Armitage y Berry, 1994, e Ingelfinger y col, 1994), que permite estimar con
suficiente exactitud el riesgo relativo (RR) an cuando no se conozcan las incidencias de la
enfermedad en los grupos expuesto y no expuesto, y no se cumpla la exigencia de muestreo
aleatorio de la poblacin de inters: en los estudios de caso-control, el odds ratio, expresado
[ 348 ]
como (a/c) / (b/d) (datos dispuestos como en Tabla 16.2), es una estimacin del riesgo relativo de enfermedad (RR) entre individuos expuestos y no expuestos.
El enunciado afirma que obteniendo conjuntos de casos y controles, la proporcin de individuos expuestos al factor en estudio en cada uno de ellos, permite estimar con suficiente exactitud
el riesgo relativo de enfermedad entre expuestos y no expuestos. Este hecho es interesante, ya
que a partir de muestras arbitrarias de casos y controles se llega a estimar el riesgo de enfermedad de acuerdo a la exposicin, y fundamenta la validez de la estimacin del riesgo relativo en
los estudios de tipo caso-control. Es notable que sus resultados se hallen de acuerdo con los que
proporcionan los estudios de seguimiento de cohortes, an cuando los estudios de caso-control
no provienen del muestreo aleatorio de poblaciones, sino que casos y controles han sido seleccionados en nmero arbitrario, frecuentemente a partir de distintas fuentes de datos.
Prosiguiendo el examen del infarto en la dislipemia, reemplazando en (16.10) se obtiene
el odds ratio:
OR = (a / c) / (b / d) = (34 / 51) / (414 / 1677) = 2.70
que es una expresin del riesgo relativo de infarto de miocardio en presencia de dislipemia,
respecto de los individuos sin dislipemia, obtenida del odds ratio.
16.7. Odds ratios y estimaciones del riesgo relativo
En este lugar debe remarcarse que el odds ratio es un estimador muy utilizado del riesgo
relativo, no solamente en los modelos caso-control que nos ocupan, sino tambin en otras
reas como la regresin logstica y algunas tcnicas del metanlisis. Sin embargo, se ha visto
ms arriba que el clculo del odds ratio implica una aproximacin a la expresin del riesgo
relativo (16.9), que resulta simplificada por la supresin de los casos en el denominador. Con
todo, la estimacin del riesgo relativo mediante el odds ratio es inevitable en estos estudios,
dado que el riesgo no puede ser obtenido mediante la ecuacin (16.9) porque entre otros motivos, casos y controles han sido obtenidos en cantidades arbitrarias fijadas por el investigador.
Afortunadamente y como ya se ha mencionado, las estimaciones del riesgo relativo mediante
el odds ratio son suficientemente precisas mientras el nmero de los casos sea pequeo con
relacin a los controles, cosa que por otra parte es frecuente en los estudios epidemiolgicos.
De todos modos, el odds ratio tender siempre a proporcionar estimaciones del riesgo relativo
ms extremas que las reales, por lo cual a veces es denominado riesgo relativo aproximado.
Por otra parte, existe una gran cantidad de modelos estadsticos donde el riesgo relativo
puede calcularse, tanto mediante la ecuacin (16.9), como mediante el odds ratio. As, en la
Seccin 8 se vio que un conjunto de individuos con endocarditis infecciosa present distinto
riesgo de mortalidad segn existiera o no insuficiencia renal asociada (ver Tabla 8.1). El riesgo relativo se calcul segn (8.9), que es una expresin equivalente a la (16.9), obtenindose
RR = 1.63. Si con los mismos datos se procede ahora a obtener el odds ratio, el lector podr
comprobar que el resultado es 1.99, con lo que el riesgo relativo estimado es algo mayor que
el obtenido mediante la ecuacin que toma en cuenta los totales marginales. Esta sobrestimacin producida por el odds ratio hace aconsejable emplearlo con precaucin en las estimaciones del riesgo relativo, pues si el nmero de casos no es pequeo en comparacin con
los controles, se apartan excesivamente del mismo. Como ya se ha observado en la Seccin
[ 349 ]
8 a propsito de los pacientes con endocarditis, si se estima el riesgo relativo de los pacientes
sin insuficiencia renal con respecto a los que la presentan, el cociente se invertir y se tendr
RR = 1 / 1.63 = 0.61, que al ser menor que cero denota una menor mortalidad en el grupo
sin enfermedad renal. En este caso, el odds ratio tambin se invertir y ser igual a 1 / 1.99
= 0.50, ahora subestimando el riesgo relativo. Es decir, el odds ratio proporciona siempre
valores ms extremos que el riesgo relativo, al que sobrestima cuando ste es mayor que 1, y
subestima cuando es menor que 1.
Sin embargo, el odds ratio es una expresin sencilla y suficientemente segura del riesgo
relativo si se toman en cuenta las restricciones numricas para su clculo. Por lo dems, el
odds ratio, que relaciona los odds a favor de un suceso entre dos grupos, es de por s una
medida de la probabilidad y aparece en distintas reas de la teora estadstica, como se ha
mencionado ms arriba. En 12.5 se tratan algunos aspectos relacionados con su rol en la
regresin logstica.
Es interesante anotar aqu que el OR es el mismo si se calcula a lo largo de las filas segn
la exposicin, que si se calcula a lo largo de las columnas, segn se trate de casos o controles.
Esta simetra explica que el OR sea el mismo si se calcula para los casos (infarto) respecto
de expuestos y no expuestos, que si se calcula para la exposicin (dislipemia) en casos y
controles. Puede decirse que el OR es una medida de asociacin entre las dos variables de la
tabla, y numricamente es irrelevante con respecto a cul de stas se calculen los odds. Tambin puede verse en (16.11), que el OR puede calcularse de la tabla en forma muy sencilla,
multiplicando en cruz y dividiendo los productos (por lo que suele denominarse cross ratio).
16.8. Evaluando la significacin estadstica del odds ratio
De no haber diferencias entre los odds, el OR para el estudio caso-control ser igual a 1,
y como estima el riesgo relativo de enfermedad (infarto) en presencia de exposicin (dislipemia), un OR = 1 significar que la expectativa de enfermedad es la misma tanto en presencia
como en ausencia del factor de riesgo o exposicin. En el ejemplo, un OR = 2.70 como el
obtenido ms arriba, significa que una paciente dislipmica tiene chances de desarrollar un
infarto en razn de 2.70 a 1 con respecto a los controles normolipmicos. Si en (16.11) se
invierten numerador y denominador, se obtiene un OR = 1 / 2.70 = 0.37, que expresa las
chances de infarto en el grupo sin dislipemia con respecto al grupo dislipmico, y por ser menor que 1, seala un efecto protector de los lpidos normales con respecto a la dislipemia.
Para evaluar la significacin estadstica de un odds ratio, se debe poder demostrar que difiere
significativamente de 1, que es el valor de la hiptesis nula. Una forma habitual de presentar
los resultados de la prueba de significacin en este tipo de estudios, es dar los lmites de
confianza superior e inferior del OR hallado, y rechazar la hiptesis nula siempre que el 1
quede por fuera de dichos lmites.
El clculo de los lmites de confianza para el valor del OR estimado, que son los lmites
para el riesgo relativo, es algo complejo porque los odds no estn normalmente distribuidos y
debe trabajarse con sus logaritmos naturales, que tienen una distribucin aproximadamente
normal y permiten aprovecharla para calcular los lmites asociados al nivel de confianza
deseado. Como en otras oportunidades, los lmites se calculan para un nivel de confianza
elegido, por ejemplo del 95%, lo que implica un nivel de significacin P = 0.05.
[ 350 ]
En el ejemplo, los lmites de confianza del 95% para OR = 2.70, son 1.73 y 4.22. Como
con los datos del ejemplo la probabilidad del OR de exhibir valores por fuera de esos lmites
es de slo el 5%, se acepta que el OR hallado difiere significativamente de 1 y se rechaza la
hiptesis nula, afirmndose que el riesgo de padecer un infarto de miocardio es significativamente mayor en las mujeres expuestas a la dislipemia, con un nivel P 0.05. A continuacin
se da una breve resea, a modo de ilustracin, de uno de los mtodos para el clculo de los
lmites de confianza para el OR, aunque stos pueden obtenerse directamente de los paquetes
estadsticos corrientes.
Clculo de los lmites de confianza para el odds ratio muestral
Dado que como se mencion, el logaritmo de los odds tiene distribucin aproximadamente normal, se trabaja con el logaritmo natural del odds ratio, ln (OR). En esta nueva
escala, la varianza del logaritmo del OR es:
(16.12)
(16.13)
y los lmites de confianza para el 95% se aproximan mediante la distribucin normal tomando z = 1.96, siempre sobre la transformacin logartmica:
y para volver a los valores originales, deben obtenerse los correspondientes antilogaritmos:
[ 351 ]
Sanos
Test positivo
68
10
78
Test negativo
32
90
122
Totales
100
100
200
[ 352 ]
Totales
de donde el odds ratio se obtiene como (68 90) / (32 10) = 19, que es un valor muy grande
a pesar de la apenas moderada sensibilidad de la prueba. Por ltimo, de la Tabla 14.1 puede
calcularse fcilmente, multiplicando en cruz y dividiendo segn (16.11), que un test con sensibilidad y especificidad iguales al 90% implica un odds ratio igual a 81. Estos altos requerimientos para poder clasificar los individuos como sanos o enfermos con aceptable exactitud,
explican porqu los niveles de asociacin entre enfermedad y factores de riesgo detectados en
muchos estudios epidemiolgicos, si bien permiten relacionar enfermedad y factor, no son suficientes para clasificar a los individuos segn su estado de salud o enfermedad. En resumen,
si bien los factores asociados con mayor riesgo de enfermedad ayudan al conocimiento de la
misma y a su eventual prevencin y tratamiento, para actuar eficazmente como marcadores
de enfermedad deben exhibir odds ratios mucho mayores que los habitualmente requeridos
para demostrar asociacin. En otras palabras, el logro de los estudios epidemiolgicos de
establecer asociaciones significativas entre enfermedades y factores de exposicin, permite
en forma indudable aumentar los conocimientos y recursos mdicos, inclusive en el rea
preventiva; sin embargo, para la deteccin de la enfermedad y la clasificacin eficaz de los individuos segn su presencia o ausencia, son necesarios pruebas o tests que rindan odds ratios
mucho mayores que los habitualmente manejados en los estudios corrientes de exposicinenfermedad. La evaluacin de tales pruebas debe realizarse con los mtodos adecuados, que
se describen en la seccin 14.
16.10. Combinaciones de tablas pertenecientes a varios subconjuntos. Mtodo de Mantel
y Haenszel
En oportunidades, un mismo estudio de tipo caso-control puede llevarse a cabo en diferentes grupos de pacientes o en diferentes subconjuntos de un grupo mayor (por ejemplo, en
varones y mujeres por separado), y muchas veces se desea obtener una estimacin global del
riesgo relativo para el conjunto que resulta de acumular todos los datos. Dentro de los mtodos disponibles para tal objeto, el de Mantel-Haenszel es particularmente utilizado, entre
otras cosas, por su buena tolerancia cuando las frecuencias en algunos de los subgrupos son
relativamente pequeas (Mantel y Haenszel, 1959). Consiste en calcular los trminos (ai di)
y (bi ci) para cada subgrupo i, de la misma forma que en los estudios con un grupo nico
(16.11), y acumularlos como sigue para obtener el riesgo relativo del grupo amalgamado:
RR = (ai di / ni) / (bi ci / ni)
(16.14)
son otra cosa que factores de exposicin como los vistos hasta aqu, pero cuyos efectos muchas veces son ajenos a los objetivos de la investigacin y cuya influencia sobre los resultados
de la misma en general se procura eliminar. Asimismo, al evaluar la influencia de un factor de
riesgo en la presentacin de una determinada enfermedad, es conveniente que otros posibles
factores (cofactores) como la edad, el sexo o la eventual presencia de distintas condiciones
fisiolgicas o patolgicas, se hallen distribuidos en forma similar en casos y controles, de
modo de balancear sus posibles efectos sobre ambos grupos. El procedimiento general es
procurar que casos y controles sean lo ms similares que sea posible en lo que se refiere a la
presencia de los factores cuya influencia se desea evitar. Un mtodo eficaz es elegir para cada
caso, un control que presente los mismos factores cuyos efectos sobre los datos se desean
neutralizar. En general, el emparejamiento o matching de casos y controles puede realizarse
para cualquier variable, en especial la edad, el sexo y aqullas condiciones que puedan tener
relevancia en la presentacin de la enfermedad en estudio, y as alterar las relaciones entre la
enfermedad y la exposicin de inters. Esto facilita el hallazgo de diferencias significativas,
atribuibles al factor de exposicin que se est investigando en cada oportunidad. A cambio
de esta ventaja, el emparejamiento renuncia a obtener informacin acerca de las variables
para las cuales se lleva a cabo: si los controles se eligen de la misma edad y sexo que los casos,
la influencia de estas dos variables en la incidencia de la enfermedad no podr ser evaluada
en el estudio.
Como se comprende, el emparejamiento de casos y controles segn ciertas variables, es
importante cuando esas variables estn asociadas a las enfermedades o a las exposiciones.
Por ejemplo, al estudiar la importancia de la exposicin a ciertos inhalantes en la incidencia
de enfisema pulmonar, puede ser importante aparear casos y controles segn sean o no fumadores, ya que esta condicin por s misma puede afectar la incidencia del enfisema pulmonar.
Este modelo, que permitir detectar con mayor eficacia los efectos de dichos inhalantes en el
enfisema, tendr como precio renunciar a obtener informacin acerca de la importancia del
tabaquismo en el enfisema pulmonar. Al respecto, cabe suponer que esta informacin es ya
conocida por los investigadores o, en todo caso, que no es el objeto del estudio. Asimismo,
una variable puede estar asociada con determinadas exposiciones de importancia y por ejemplo, la posesin de encendedores puede hallarse asociada con el hbito del cigarrillo, de modo
que la interpretacin de los resultados es siempre un punto crucial.
Debe tambin mencionarse un lmite para este tipo de procedimientos, y es que pueden
llevar a la subdivisin excesiva de los datos agotando el nmero de casos necesario en cada
clase para la obtencin de resultados consistentes. Adems, la necesidad de elegir casos y controles con las mismas caractersticas segn las cuales se realiza el emparejamiento, en general
limita las posibilidades de llevarlo a cabo para ms de unos pocos factores.
Para proceder con este tipo estudios, una vez apareados los casos y los controles, es
posible tabular cada par de acuerdo a la presencia o ausencia de exposicin en sus dos integrantes. Por lo tanto, en cada par de caso y control se podr dar: caso expuesto-control
no expuesto, caso no expuesto-control expuesto, ambos expuestos, ambos no expuestos
(Tabla 16.3).
[ 354 ]
Casos no expuestos
Controles expuestos
Total
c
Controles no expuestos
Total
z = | s t | / ( s + t )
(16.16)
donde z se distribuye como una variable normal estandarizada cuya probabilidad se obtiene
de las tablas de la distribucin normal. El numerador es la diferencia en valor absoluto, entre
los casos discordantes observados en s y en t, mientras que el denominador es la raz cuadrada
de su suma. Se recordar que para un nivel de significacin P = 0.05, z = 1.96, que es el valor
que debe alcanzar el test para resultar significativo en dicho nivel.
16.12. Variabilidad muestral, sesgo, factores de confusin y exposiciones
Los estudios de tipo caso-control vistos en los prrafos anteriores constituyen una clase
importante de estudio epidemiolgico, cuyo potencial puede extenderse al estudio del efecto
de distintos tratamientos, entendidos como exposiciones. En forma general, las causas que
pueden afectar la interpretacin de los resultados de los distintos procedimientos de inferencia estadstica y por lo tanto, los de los estudios caso-control, son la variabilidad muestral,
la presencia de diversos tipos de sesgo, y factores relacionados con las variables en estudio,
mencionados ms arriba como exposiciones y tambin llamados factores de confusin. La
variabilidad muestral, traducida en el llamado error de muestreo, es comn a los distintos
procedimientos que involucran muestras: su manejo se realiza a travs de distintos instrumentos orientados a limitarla y acotarla, algunos de los cuales han sido ya esbozados, como
[ 355 ]
el diseo de las muestras y la estimacin de intervalos de confianza mediante los procedimientos de inferencia estadstica (Seccin 6). Como en todas las reas de la inferencia estadstica, el problema de las comparaciones mltiples tiene la misma importancia y el mismo
potencial para producir un aumento de resultados significativos cuando la hiptesis nula es
en realidad verdadera, por lo que debe ser siempre tenido en cuenta (ver 10.3).
Por sesgo o tendencia se entiende una distorsin o desviacin sistemtica de los resultados
obtenidos, respecto de los correspondientes valores en la poblacin estudiada, y es frecuente
mencionarla con la palabra inglesa bias. Existen mltiples causas para su presentacin en los
estudios clnicos, y en los estudios de tipo caso-control puede originarse, entre otras posibilidades, al seleccionar los controles en poblaciones que no son comparables con aquella de la
que se obtuvieron los casos, en el diferente registro de las exposiciones en casos y controles,
o en errores en la clasificacin de casos y exposiciones. Por ejemplo, en pacientes con enfermedades cardiovasculares, es ms probable que las exposiciones conocidas como factores de
riesgo sean investigadas con ms profundidad que en controles cuyas historias provengan de
un consultorio de clnica general. De esta forma, la relacin entre la proporcin de expuestos
en el grupo cardiolgico y en los controles puede aparecer aumentada, por haber sido menos
investigada en los ltimos.
Con el trmino factores de confusin (confounding variables) se denominan aquellos
factores o variables que estn asociados a la vez con la enfermedad y con la exposicin, y
pueden de esa forma contribuir a la asociacin entre stas. Estos son los factores que frecuentemente requieren consideracin especial en los estudios caso-control y pueden hacer
necesario el emparejamiento o matching para controlarlos (ver ms arriba). A la par de su
tratamiento formal mediante tcnicas estadsticas como la estratificacin de las muestras y
el matching, el juicio mdico es fundamental en la interpretacin de los resultados. El sedentarismo puede estar asociado a una mayor incidencia de coronariopata (enfermedad), pero
tambin a una mayor tendencia a fumar y a un mayor grado de obesidad (exposiciones), de
donde resulta difcil adjudicar su parte como causa de enfermedad a cada uno de los distintos
factores, y si la evaluacin se centra en el rol del sedentarismo, el tabaco y la obesidad podrn
resultar factores de confusin. Como enseguida se comprende, la confusin por efecto de diversos factores puede ser notablemente complicada y tambin recproca, y por lo tanto difcil
de discernir en cada escenario clnico en particular.
Segn ha sido ya mencionado, la subdivisin de las muestras en estratos y la posibilidad
de matching se hallan limitadas en los estudios caso-control por la disminucin de casos en
cada estrato y por las dificultades para obtener controles que emparejen con los casos una
gran cantidad de factores de confusin. En general, slo ser posible comparar un factor o
exposicin de inters, y solamente se podrn controlar unos pocos factores relacionados. En
tanto, el hecho de que los estudios caso-control proporcionen estimaciones del riesgo relativo
basadas en odds, los emparenta con las tcnicas de la regresin logstica vistas en la Seccin
12, que permiten estimar el riesgo como variable binaria en funcin del logaritmo de los odds
o logit. En estos casos, introduciendo los distintos factores de inters entre las variables predictoras, el odds ratio para cualquiera de ellas se puede calcular de la ecuacin de regresin
(Seccin 12). Otros mtodos como la regresin mltiple y el mtodo de riesgos proporcionales de Cox, vistos en las secciones 11 y 15 respectivamente, resultan tiles para tratar de aislar
[ 356 ]
y evidenciar los efectos de los diferentes factores sobre distintos modelos orientados a estimar
el riesgo. Estos y otros mtodos multivariados, ayudan a remover los efectos de algunas variables para observar el de las restantes, controlando los efectos las aqullas y superando
las posibles limitaciones de los modelos caso-control.
Cuando la variabilidad muestral, los posibles sesgos y los factores de confusin han sido
controlados y pueden an detectarse efectos estadsticamente significativos relacionados con
las exposiciones en estudio, se tienen los resultados de inters para la investigacin. De este
modo podr afirmarse la asociacin de los diversos factores de exposicin, con las enfermedades o condiciones estudiadas.
Por ltimo, debe insistirse en que las consideraciones mdicas respecto de los hechos en
estudio son al menos tan importantes como los mtodos utilizados para el anlisis. El establecimiento de conexiones de causa-efecto entre los hechos observados pertenece al juicio de
los investigadores y est fundado en los conocimientos existentes acerca de tema en estudio.
Como en todas las aplicaciones de la estadstica, asociacin y correlacin no implican causalidad, y una asociacin fuerte entre un factor de exposicin y la incidencia de una determinada enfermedad no garantiza por s sola la existencia de una relacin causal entre exposicin y
enfermedad. Por otra parte, si existen motivos fundados para suponer la existencia de una relacin entre un determinado factor y una situacin clnica, la investigacin no debera abandonarse tras un estudio negativo, ya que puede deberse a insuficiente potencia de la prueba,
o a factores de confusin o sesgo, introducidos en el modelo. Solo el juicio mdico fundado
en un conocimiento slido de la materia investigada podr decidir acerca de las conclusiones
ms correctas y el camino a seguir.
Referencias
Afifi AA, Clark V. Computer-aided Multivariate Analysis. 3rd ed. Boca Raton, Florida: Chapman &
Hall/CRC; 1999.
Altman DG, Matthews JNS. Interaction1: heterogeneity of effects. BMJ 1996; 313: 486.
Altman DG, Bland JM. Generalization and extrapolation. BMJ 1998; 317: 409-410.
Altman DG, Machin D, Bryant TN, Gardner MJ (ed.). Statistics with Confidence: Confidence Intervals
and Statistical Guidelines. 2nd ed. London: BMJ Books, 2000.
Armitage P, Berry G. Statistical Methods in Clinical Research. 3rd ed. Oxford, England: Blackwell Science Ltd; 1994.
Baker SG. The central role of receiver operating characteristic (ROC) curves in evaluating tests for the
early detection of cancer. J Natl Cancer Inst 2003; 95: 511-515.
Bland M. An Introduction to Medical Statistics. 3rd ed. Oxford, UK: Oxford University Press; 2006.
Braunwald E, Zipes D, Libby P. Heart Disease. 6th ed. Philadelphia: W.B. Saunders Company; 2001.
Cox DR, Snell EJ. Analysis of Binary Data. 2nd ed. London, England: Chapman & Hall; 1992.
Diamond GA, Forrester JS. Analysis of probability as an aid in the clinical diagnosis of coronary artery
disease. NEJM 1979; 300: 1350-1358.
Diamond GA, Forrester JS. Clinical trials and statistical verdicts: probable grounds for appeal. Ann
Intern Med 1983; 98: 385-394.
[ 357 ]
Dixon WJ, Massey FJ, Jr. Introduccin al Anlisis Estadstico. 2da ed. Mexico: Libros McGraw Hill;
1973.
Dunn N, Thorogood M, Faragher B, de Caestecker L, MacDonald TM, McCollum C, Thomas S, Mann
R. Oral contraceptives and myocardial infarction: results of the MICA case-control study. BMJ
1999; 318: 1579-1583.
Feinstein AR. Clinical Biostatistics. 1st ed. St. Louis, Mo., USA: The C.V. Mosby Company; 1977.
Florey C du V. Sample size for beginners. BMJ 1993; 306: 1181-1184.
Freiman JA, Chalmers TC, Smith H, Jr., Kuebler RR. The importance of beta, the type II error and
sample size in the design and interpretation of the randomized control trial. Survey of 71 negative
trials. NEJM 1978; 299: 690-694.
Glantz SA. Biostatistics: how to detect, correct and prevent errors in the medical literature. Circulation
1980; 61: 1-7.
Gorry GA, Pauker S, Schwartz WB. The diagnostic importance of the normal finding. NEJM 1978; 298:
486-489.
Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC)
curve. Radiology 1982; 143: 29-36.
Harrel FE, Jr., Lee KL, Pollock BG. Regression models in clinical studies: determining relationships
between predictors and response. J Natl Cancer Inst 1988; 80: 1198-1202.
Hirano Y, Uehara H, Nakamura H, Ikuta S, Nakano M, Akiyama S, Ishikawa K. Efficacy of Ultrasound-assisted Stress Testing Using a Hand-carried Ultrasound Device for Diagnosis of Coronary
Artery Disease. J Am Soc Echocardiogr 2006; 19:536-539.
Hoel PG. Introduction to Mathematical Statistics. 5th ed. New York: Wiley; 1984.
Ingelfinger JA, Mosteller F, Thibodeau LA, Ware JH. Biostatistics in Clinical Medicine. 3rd ed. New
York: McGraw - Hill, Inc; 1994.
Kattan MW. Judging new markers by their ability to improve predictive accuracy. J Natl Cancer Inst
2003; 634-635.
Leung WC. Balancing statistical and clinical significance in evaluating treatment effects. Postgrad Med
J 2001; 77: 201-204.
Levy D, Labib SB, Anderson KM, Christiansen JC, Kannel WB, Castelli WP. Determinants of sensitivity
and specificity of electrocardiographic criteria for left ventricular hypertrophy. Circulation 1990;
81: 815-820.
Lusted LB. Decision-making studies in patient management. NEJM 1971; 416-424.
Mantel N, Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J
Nat Cancer Inst 1959; 22: 719-748.
Menard S. Applied Logistic Regression Analysis. Sage University paper series on quantitative applications on social sciences. 2nd ed. Thousand Oaks, CA.: Sage Publications, Inc.; 2000.
McPherson K. Statistics: the problem of examining accumulating data more than once. NEJM 1974;
501-502.
Markush RE. Levins attributable risk statistic for analytic studies and vital statistics. Am J Epidemiol
1977; 105: 401-406.
Matthews JNS, Altman DG. Interaction 2: compare effect sizes not P values. BMJ 1996; 313:808.
Matthews JNS, Altman DG. Interaction 3: how to examine heterogeneity. BMJ 1996; 313: 862.
Metz CE. Basic principles of ROC analysis. Semin Nucl Med 1978; 8: 283-298.
[ 358 ]
Modenesi JC, Ferreirs ER, Swieszkowski S, Nacinovich FM, Corts C, Cohen Arazi H, Kazelian L, Varini S, Ciruzzi M, Casab JH, en representacin investigadores EIRA-II. Predictores de mortalidad
intrahospitalaria de la endocarditis infecciosa en la Repblica Argentina: resultados del EIRA-II.
Rev Argent Cardiol 2005; 73: 283-290.
Mood AM, Graybill FA. Introduccin a la Teora de la Estadstica. 4 ed. Madrid: Aguilar; 1978.
Pampel F. Logistic Regression. A Primer. 1st ed. Thousand Oaks, CA.: Sage Publications, Inc.; 2000.
Passik CS, Ackermann DM, Pluth JR, Edwards WD. Temporal changes in the causes of aortic stenosis: a
surgical pathologic study of 646 cases. Mayo Clin Proc 1987; 62:119-23.
Pepe MS, Janes H, Longton G, Leisenring W, Newcomb P. Limitations of the odds ratio in gauging the
performance of a diagnostic, prognostic, or screening marker. Am J Epidemiol 2004; 159: 882890.
Peto R, Pike MC, Armitage P, Breslow NE, Cox DR, Howard SV, Mantel N, McPherson K, Peto J, Smith
PG. Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design. Br J Cancer 1976; 34: 585-612.
Peto R, Pike MC, Armitage P, Breslow NE, Cox DR, Howard SV, Mantel N, McPherson K, Peto J, Smith
PG. Design and analysis of randomized clinical trials requiring prolonged observation of each patient. II. Analysis and examples. Br J Cancer 1977; 35: 1-39.
Ransohoff DF, Feinstein AR. Problems of spectrum and bias in evaluating the efficacy of diagnostic tests.
NEJM 1978; 299: 926-930.
Rifkin RD, Hood WB, Jr. Bayesian analysis of electrocardiographic exercise stress testing. NEJM 1977;
297: 681-686.
Rodrguez ML, Dizeo C, Selva H, Brito M, Nordaby RA, Campo A, Garca Guiaz CA, Machado RA.
En presencia de valvulopata el ECG tiende a subestimar la masa ventricular izquierda: un resultado
de la fibrosis intersticial? Rev Argent Cardiol 2004; 72 (sup 3): 149.
Schroeder LD, Sjoquist DL, Stephan PE. Understanding Regression Analysis: An Introductory Guide.
1st ed. Newbury Park, CA: Sage Publications, Inc.; 1986.
Snedecor GW, Cochran WG. Mtodos Estadsticos. 5a ed. Mexico: Compaa Editorial Continental,
S.A.; 1970.
Talfryn H, Oakley D, Crombie IK, Tavakoli M. When can odds ratios mislead? BMJ 1998; 316: 989991.
Tukey JW. Some thoughts on clinical trials, especially problems of multiplicity. Science 1977; 198: 679684.
Turner JC. Matemtica Moderna Aplicada. Probabilidades, Estadstica e Investigacin Operativa. 1st
ed. Madrid: Alianza Editorial S.A.; 1974.
Vickers AJ, Altman DG. Analysing controlled trials with baseline and follow up measurements. BMJ
2001; 323: 1123-1124.
Wackerly DD, Mendenhall W, III, Scheaffer RL. Estadstica Matemtica con Aplicaciones. 6a ed. Mexico: Thomson; 2002.
Weissler AM. A perspective on standardizing the predictive power of noninvasive cardiovascular tests by
likelihood ratio computation: 1. Mathematical principles. Mayo Clin Proc 1999; 74: 1061-1071.
Weissler AM. A perspective on standardizing the predictive power of noninvasive cardiovascular tests by
likelihood ratio computation: 2. Clinical applications. Mayo Clin Proc 1999; 74: 1072-1087.
Zhang J, Yu KF. Whats the relative risk? JAMA 1998; 280: 1690-1691.
[ 359 ]
[ 360 ]