Está en la página 1de 357

La investigacin

en medicina
Bases tericas y prcticas
Elementos de Bioestadstica

La investigacin
en medicina
Bases tericas y prcticas
Elementos de Bioestadstica

Ricardo J. Esper

Rogelio A. Machado

Profesor Titular de Medicina, Universidad de Buenos Aires. Profesor Titular de Cardiologa, Universidad del Salvador, Buenos Aires. Consultor
en Cardiologa, Hospital Militar Central, Buenos
Aires. Ex-Presidente, Sociedad Argentina de Cardiologa. Ex-Presidente, Fundacin Cardiolgica
Argentina. Ex-Presidente, InterAmerican Heart
Foundation, Dallas, Texas, USA. Ex-InterAmerica
Representative, Executive Board, World Heart
Federation, Ginebra, Suiza. Fellow, American
College of Cardiology. Fellow, American Heart

Profesor Titular de Semiologa Cardiovascular y


Ecocardiografa, Carrera de Cardiologa, Universidad del Salvador, Buenos Aires. Docente de
Bioestadstica, Carrera de Cardiologa, Universidad del Salvador. Departamento Cardiovascular,
Servicio de Cardiologa, Hospital Militar Central,
Buenos Aires. Jefe Laboratorio de Ecocardiografa, Hospital Fancs, Buenos Aires. Miembro Titular, Sociedad Argentina de Cardiologa.

Association

Esper, Ricardo

La investigacin en medicina: bases tericas y prcticas. Elementos de bioestadstica /
Ricardo Esper y Rogelio Machado. - 1 ed. - Buenos Aires: La Prensa Mdica Argentina, 2008. 360 p.; 25 x 18 cm.

ISBN 978-950-9250-25-3

1. Investigacin en Medicina 2. Bioestadstica. I. Machado, Rogelio. II. Ttulo.


CDD 610.7

2008, Prensa Mdica Argentina


ISBN 978-950-9250-25-3
Queda hecho el depsito que marca la ley 11723.
Libro de edicin argentina
Impreso en la Argentina
Printed in Argentina

Impreso en mayo de 2008, en Ghione Impresores S. R. L.


Gaebeler 602-618, Lans Oeste
ghioneimpresores@hotmail.com

A Alcira, Andrea y Claudia


A Isabel, Sole y Santi

ndice

Prlogo: Investigar y comunicar: habilidades esenciales del mdico


Prefacio
Co-autores

11
13
15

I. La Investigacin en el campo de la Medicina

19

Guillermo Jaim Etcheverry

Captulo 1. El conocimiento. Conocimiento humano e investigacin. El mtodo cientfico. Fuentes del conocimiento: observacin y experimentacin. Induccin y deduccin. Teoras e hiptesis. Prueba de una hiptesis. Los mtodos en las ciencias de la naturaleza.

Patricio F. Jacovella, Ral A. Borracci, Rodolfo J. Giuliano
Captulo 2. Leyes Cientficas. Extensiones y lmites del conocimiento cientfico

Rodolfo J. Giuliano

30

II. Comunicacin de los Resultados

37

Captulo 3. Como escribir un manuscrito para su publicacin



Andreas Wielgosz
Captulo 4. La revista cientfica: criterios editoriales para evaluacin de artculos mdicos.

Enrique Fisman y Alexander Tenenbaum
Captulo 5. Qu es y como se elabora una monografa cientfica?

Daniel J. Pieiro
Captulo 6. Qu es un trabajo de Tesis de Doctorado?

Roberto E. P. Sica
Captulo 7. La comunicacin oral de la investigacin cientfica. Una herramienta para transmitir conocimiento.

Ricardo J. Esper y Antonio Paragano

III. Desarrolos Modernos en las Ciencias Mdicas


Captulo 8.

Captulo 9.

Metaanlisis
Luis Alcocer
Qu es la cardiologa basada en la evidencia?
Salim Yusuf y Rafael Daz
[ 9 ]

21

39

45
51
58

75
89

91
105

IV. Anlisis del Conocimiento y Herramientas para su Validacin


Captulo 10. Lectura crtica de la literatura cientfica.

Daniel Fernndez-Bergs y Antonio Paragano
Captulo 11. Delimitacin de un rea de investigacin. Anlisis de los conocimientos
existentes y elaboracin de nuevas cuestiones.

Eduardo B. Arribalzaga
Captulo 12. Comit de tica e Investigacin Clnica.

Luis Mara Ziehr, Rubn F. Iannantuono, Jos Luis Cacharrn

V. El mdico como Docente y Comunicador Pblico


Captulo 13. Investigacin en Educacin Mdica.

Alberto Alvs de Lima
Captulo 14. Cmo hablar con los medios. El supermercado de la salud.

Nora Br

VI. Elementos de Bioestadstica


Referencias

1. Introduccin

2. Conceptos bsicos

3. Frecuencia y probabilidad de un suceso

4. Distribuciones de probabilidades

5. Muestreo. El desvo estndar de la media o error estndar

6. Inferencia estadstica

7. Comparaciones entre dos medias muestrales. La distribucin t

8. Comparaciones entre proporciones

9. Correlacin y regresin

10. Anlisis de la varianza

11. Regresin mltiple

12. Regresin logstica

13. Mtodos no paramtricos

14. Pruebas diagnsticas

15. Anlisis de la sobrevida

16. Enfermedades en las poblaciones

[ 10 ]

121

123

143
155
165

167
175
181
182
185
187
201
209
226
232
250
257
268
284
294
304
313
321
336
344

Prlogo
Investigar y comunicar: habilidades esenciales del mdico

no de los aportes fundamentales de los mdicos a la disciplina que cultivan es el de


generar nuevos conocimientos. En esta tarea se refleja su capacidad intelectual para
descubrir nuevas regularidades en la naturaleza pero ella tambin depende, en no menor
medida, de la tcnica que pone al servicio de una observacin rigurosa. Es entonces cuando
interviene su habilidad para comunicar lo que ha encontrado, interactuando con sus colegas
en ese proceso dialctico en el que se sustenta el avance cientfico.
En trminos ms generales, la actividad del mdico est estrechamente relacionada con
su capacidad para comunicarse con pacientes, familiares y colegas. Por eso, dicha habilidad
debera constituir uno de los objetivos esenciales de todo programa de formacin profesional.
Lamentablemente, esto no es as ya que se considera que la capacidad de comunicacin no
requiere entrenamiento para su desarrollo. De esta manera advertimos que muchos profesionales que carecen de esa habilidad, debido a su educacin previa o al mbito en el que se
desenvolvieron, encuentran serias dificultades en el ejercicio de su actividad cotidiana.

Vinculado a esa dificultad en la comunicacin est el desafo que enfrentan los mdicos
cuando se ven obligados a presentar, tanto de manera oral como escrita, los resultados de sus
investigaciones experimentales o clnicas. En estas ocasiones quedan tambin en evidencia
las dificultades de todo tipo que acechan a los profesionales quienes, en la mayor parte de los
casos, no han sido debidamente preparados para realizar una lectura crtica de los resultados
de las investigaciones realizadas por otros, carecen de las herramientas estadsticas esenciales
como para poder llegar a conclusiones vlidas a partir de sus propias observaciones o experiencias y no manejan las tcnicas que les permitan comunicar sus hallazgos a sus colegas.
Las instituciones educativas, tanto durante la formacin de grado como en el posgrado, dedican escasos esfuerzos a dotar de esas herramientas esenciales a sus alumnos, en aquellos
contados casos en los que lo hacen.
Ese importante vaco es el que viene a ocupar esta interesante obra de los Profesores
Ricardo Esper y Rogelio Machado quienes, recurriendo a la colaboracin de destacados especialistas locales y extranjeros, encaran prcticamente todas las cuestiones de inters para
quien se proponga investigar en el campo de la medicina y, sobre todo, comunicar a otros el
resultado de su labor. Varios captulos generales se ocupan de analizar la naturaleza del mtodo cientfico y el carcter de las leyes as como de la formulacin clara de las cuestiones que
sern motivo de estudio. Se jerarquiza la recoleccin de informacin acerca del conocimiento
[ 11 ]

existente sobre un determinado problema como paso previo a la elaboracin de nuevas hiptesis a ser investigadas. La lectura crtica de las publicaciones cientficas, requisito imprescindible para quien intenta realizar un nuevo aporte al conocimiento, es motivo de especial
anlisis.

Uno de los rasgos fundamentales de este libro reside en la completa y gil descripcin de
los elementos bsicos de la bioestadstica, cuyo dominio resulta imprescindible ya que en sus
tcnicas se basa cualquier anlisis serio de los hallazgos de la investigacin cientfica.
En lo que respecta a la comunicacin de los resultados, se describe la manera de encarar
la redaccin de un manuscrito para ser publicado as como las expectativas de los editores de
las revistas en las que se realizar esa publicacin. Tambin se analizan los procedimientos
apropiados para redactar una monografa o enfrentar la nada sencilla tarea de planear, llevar
a cabo y presentar una tesis de doctorado. No se descuida tampoco el importante aspecto
de la exposicin oral de los resultados y se describe el aporte que a su difusin realizan las
nuevas tecnologas de la comunicacin y la informacin.
Especial atencin se presta en el libro a la naturaleza de los distintos tipos de ensayos clnicos as como a las tcnicas empleadas para su evaluacin individual y de conjunto, como es
el caso de los meta-anlisis, atendiendo tambin a la presentacin del importante movimiento
conceptual generado en la medicina contempornea a partir de los resultados de los estudios
clnicos: la medicina basada en la evidencia.
El hecho de que la actividad del mdico est ntimamente ligada a su vocacin de compartir con los dems sus conocimientos, hace que la labor docente resulte inseparable de la
tarea asistencial o de investigacin. Por este motivo, se ha incluido un captulo dedicado al
estudio de las tcnicas que permiten realizar investigaciones en el campo de la educacin
mdica y compartirlas con los colegas luego de someter a un anlisis riguroso los resultados
obtenidos mediante las innovaciones educativas. Asimismo, puesto que la interaccin del
mdico con la sociedad ha adquirido una creciente importancia en las ltimas dcadas, se justifica ampliamente la inclusin de un captulo sobre el periodismo mdico ya que esa relacin
con la prensa masiva no har sino incrementarse en el futuro, cimentando as un vnculo que
es hoy esencial para la medicina en sus actividades de prevencin, diagnstico, tratamiento y
rehabilitacin.
En sntesis, es esta una obra oportuna que brindar una eficaz compaa a los profesionales que aspiren a realizar tareas de investigacin y comunicar sus resultados de manera
apropiada. Por la trascendencia de los temas que aborda as como por los conocimientos y
experiencia de quienes los desarrollan, este manual sobre la investigacin en medicina, est
llamado a convertirse en una herramienta indispensable para los mdicos y otros profesionales de la salud que quieran internarse por el apasionante sendero que siempre representa la
bsqueda de nuevos conocimientos.
Guillermo Jaim Etcheverry
Profesor Titular de Biologa Celular e Histologa, Facultad de Medicina, Universidad de Buenos Aires.
Ex-Decano, Facultad de Medicina, Universidad de Buenos Aires.
Rector, Universidad de Buenos Aires, 2002 - 2006

[ 12 ]

Prefacio
Tu verdad? No, la Verdad,
y ven conmigo a buscarla
Antonio Machado.
Proverbios y Cantares

l continuo crecimiento de las reas de inters de la medicina y el vertiginoso incremento


de sus recursos tcnicos y metodolgicos, tanto en lo relativo a las ciencias bsicas como
en lo que concierne a la medicina asistencial, han aumentado manifiestamente la complejidad
de la investigacin mdica en las ltimas dcadas. En tal sentido, el auge de los estudios clnicos aleatorizados, los grandes estudios conjuntos o mega ensayos, el metanlisis, el concepto
aceptado universalmente de basarse en la evidencia, y el notable desarrollo de los mtodos
y modelos de la estadstica, son algunos de los factores que, juntamente con los avances tecnolgicos y un intercambio y difusin cada vez ms activos de los conocimientos entre todos
los estratos de la sociedad, han situado a la investigacin en un escenario dominante dentro
del quehacer mdico.
En relacin con esto, el desarrollo de las hiptesis de trabajo a travs de la seleccin del
material y los mtodos adecuados, el tratamiento estadstico de los resultados y su interpretacin, su discusin y, por ltimo, la obtencin de conclusiones, reconocen y en general se
atienen, a lineamientos generales bien establecidos y a requisitos, tanto tericos como formales, aceptados por la comunidad cientfica. Estos lineamientos y directrices, que no pretenden
restringir la iniciativa y creatividad de los investigadores, tienden sin embargo a respaldar
la validez general de los trabajos y a asegurar su comunicacin exitosa y su integracin al
extenso y creciente bagaje de los conocimientos de la medicina actual. As, desde la bsqueda
de la informacin preexistente hasta la redaccin final de un trabajo para su sometimiento a
la aprobacin por pares para su publicacin, es conveniente que en cada una de las etapas en
su elaboracin, sean utilizados los criterios ms adecuados y las tcnicas ms eficaces, para
poder as contener y dar forma a los hallazgos realizados y a las ideas de los autores.
Este texto reconoce entre sus antecedentes, la reiterada comprobacin por parte de los
editores, del aumento del nmero de las consultas que han venido recibiendo a diario de parte
de los mdicos ms jvenes, en particular residentes y cardilogos en el inicio de sus carreras,
respecto de la forma de encarar la lectura y la interpretacin de los trabajos cientficos y,
adems, acerca del modo de dar forma y llevar a cabo esfuerzos de investigacin originales.
Esta ltima inquietud, motivada generalmente por una afinidad individual con este tipo de
tareas, est tambin, muchas veces, estimulada por las exigencias crecientes de los diversos
mbitos del quehacer mdico, no solamente las universidades sino tambin los hospitales, las
sociedades mdicas y la propia comunidad, que ms que nunca se interesa por la fundamen[ 13 ]

tacin y la solidez de las propuestas que la medicina le ofrece a sus integrantes. Hemos podido
comprobar que, junto con el nmero, ha aumentado tambin la complejidad de las preguntas
dirigidas al mdico con mayor experiencia. Esto es particularmente evidente cuando las consultas se orientan hacia aspectos particulares como, por ejemplo, la interpretacin del diseo
de estudios clnicos de cierta complejidad, las posibilidades y limitaciones de los distintos
modelos de anlisis estadstico aplicado, y la lacitud de extender las conclusiones a distintas
poblaciones. Esta mayor necesidad de acceder a los niveles en los que se funda la obtencin
del conocimiento en medicina, muy ostensible en los mdicos jvenes, es probablemente un
fenmeno de validez general que abarca a toda la comunidad de los integrantes de las ciencias
mdicas. Los grandes avances de la medicina, facilitados por los avances tecnolgicos y fundados en importantes desarrollos tericos, no hacen ms que reforzar el inters general por
los aspectos bsicos de la investigacin mdica.
Para el presente texto, los editores han solicitado y han tenido el privilegio de obtener, la
colaboracin de un conjunto de personalidades de las ciencias mdicas internacionalmente
reconocidas, que han permitido iluminar desde varios ngulos las ilimitadas facetas de ese
todo que es la investigacin cientfica en el campo de la medicina. De ellos es el mrito de la
obra, y a ellos se dirige el agradecimiento de los editores, a quienes por su parte, les ha tocado organizar los captulos de manera de permitir desplegar en forma sucesiva los diferentes
escenarios propuestos por los autores. Llegue tambin nuestro agradecimiento a los colegas
y amigos que, de una u otra forma, nos ayudaron en la concrecin del trabajo, y a los Dres.
Juan Carlos y Sebastin Bag, cuyo apoyo result esencial para su llegada a buen puerto.

Los elementos de bioestadstica compilados al final de la obra hallan su justificacin en el
deseo de los editores de invitar al lector ajeno a la materia, a transponer los umbrales de una
disciplina tan imprescindible como en general poco familiar para el mdico que no ha tenido
un acercamiento previo a sus ideas y mtodos.

Los editores esperan que el producto de su trabajo pueda ser de alguna utilidad para
aquellos que se hallan comprometidos con la investigacin en medicina, y que la lectura del
libro les proporcione al menos una parte del placer que ellos han tenido en elaborarlo. Y recuerde el lector que para ser exitoso no tiene que hacer cosas extraordinarias, simplemente
hacer cosas ordinarias, pero extraordinariamente bien.
Ricardo J. Esper
Rogelio A. Machado

[ 14 ]

Co-autores

Luis Alcocer
Jefe del Servicio de Cardiologa del Hospital General de Mxico. Profesor Titular de Medicina (Cardiologa) y del
Curso de Especializacin en Cardiologa, Facultad de Medicina, Universidad Nacional Autnoma de Mxico.
Investigador Titular de los Hospitales de Referencia e Institutos Nacionales de Salud de Mxico.

Alberto Alvs de Lima


Director de Capacitacion, Instituto Cardiovascular de Buenos Aires. Co-Director, Carrera de Especialista en Cardiologa, Universidad de Buenos Aires. Profesor Adjunto de Medicina, Universidad del Salvador, Buenos Aires.
Master en Educacin Mdica, Universidad de Maastricht, Holanda

Eduardo Benigno Arribalzaga


Profesor Regular Adjunto de Ciruga, Universidad de Buenos Aires. Profesor Titular de Bioestadstica, Universidad Austral, Buenos Aires. Profesor Titular de Biotica y Humanismo Mdico y Profesor Titular de Metodologa
de la Investigacin, Universidad de Ciencias Empresariales y Sociales. Editor Jefe, Revista Argentina de Ciruga.
Secretario de Redaccin, Archivos de Bronconeumonologa, Espaa.

Nora Br
Periodista cientfica. Editora de la Seccin Ciencia y Salud del diario La Nacin. Miembro de la Academia Nacional de Periodismo.

Ral Alfredo Borraci


Magster, Biologa Molecular, Fundacin Favaloro INGEBI. Profesor Invitado, Metodologa de la Investigacin,
Escuela de Medicina, UCES. Coordinador, Curso Anual de Postgrado, Asociacin Argentina de Ciruga. Coordinador, Metodologa y Estadstica, Curso de Especialista en Cardiologa UBA-SAC. Director Asistente, Comit
Editorial, Revista Argentina de Cardiologa. Director, Area de Investigacin, Sociedad Argentina de Cardiologa.
Coordinador, Comit de Biotica, Sociedad Argentina de Cardiologa

Jos Luis Cacharrn


Mdico Especialista en Cardiologa. Jefe, Seccin Eco-Doppler Cardaco, Policlnica Bancaria. Docente, Ctedra de Farmacologa, Facultad de Medicina, Universidad de Buenos Aires. Profesor Adjunto de Farmacologa,
Carrera de Cardiologa, Universidad del Salvador, Buenos Aires.

[ 15 ]

Rafael Daz
Instituto Cardiovascular de Rosario. ECLA Argentina

Ricardo Jorge Esper


Profesor Titular de Medicina, Universidad de Buenos Aires. Profesor Titular de Cardiologa, Universidad del
Salvador, Buenos Aires. Consultor en Cardiologa, Hospital Militar Central, Buenos Aires . Ex-Presidente, Sociedad Argentina de Cardiologa. Ex-Presidente, Fundacin Cardiolgica Argentina. Ex-Presidente, InterAmerican
Heart Foundation, Dallas, Texas, USA. Ex-InterAmerica Representative, Executive Board, World Heart Federation, Ginebra, Suiza. Fellow, American College of Cardiology. Fellow, American Heart Association

Daniel Fernndez-Bergs
Doctor en Medicina, Universidad Complutense de Madrid, Espaa. Mdico Cardilogo Universitario, Universidad del Salvador, Buenos Aires, Argentina. Mdico Cardilogo Adjunto, Seccin de Cardiologa, Departamento
de Medicina Interna, Hospital Don Benito Villanueva, Badajoz, Espaa. Presidente, Comisin de Investigacin
de la Sociedad Extremea de Hipertensin Arterial y Otros Factores de Riesgo Cardiovascular. Miembro, Grupo
Tcnico de Cardiopata Isqumica del Plan Integral de Enfermedades Cardiovasculares de Extremadura.

Enrique Fisman
Profesor de Cardiologa, Facultad de Medicina Sackler, Universidad de Tel-Aviv, Tel-Aviv, Israel. Profesor Honorario de Cardiologa, Facultad de Medicina, Universidad del Salvador, Buenos Aires, Argentina. Presidente,
Fundacin de Investigacin en Diabetologa Cardiovascular, Holon, Israel. Editor en Jefe, Cardiovascular Diabetology, Londres, Gran Bretaa

Rodolfo Jos Giuliano


Mdico Tocogineclogo. Jefe de la Unidad Alto Riesgo Obsttrico del Hospital de Clnicas Jos de San Martn,
Buenos Aires. Profesor Regular Adjunto, Biotica y Humanismo Mdico. UCES. Universidad de Ciencias Empresariales y Sociales, Buenos Aires. Director, Escuela de obstetricia - FASGO: Federacin Argentina de Sociedades
de Ginecologa y Obstetricia

Rubn F. Iannantuono
Vicepresidente 1, Comit Independiente de Etica para Ensayos en Farmacologa Clnica de la Fundacin de
Estudios Farmacolgicos y de Medicamentos (FEFyM). Docente Adscripto de Farmacologa, Facultad de Medicina, Universidad de Buenos Aires. Ex Subdirector, Carrera de Mdico Especialista en Farmacologa, Facultad
de Medicina, Universidad de Buenos Aires.

Patricio Fernando Jacovella


Profesor, Universidad de Belgrano. Subdirector, Carrera de especialista en Cirugia Plstica, Unidad academica
Clnicas.

Rogelio Alberto Machado


Profesor Titular de Semiologa Cardiovascular y Ecocardiografa, Carrera de Cardiologa, Universidad del Salvador, Buenos Aires. Docente de Bioestadstica, Carrera de Cardiologa, Universidad del Salvador. Departamento
Cardiovascular, Servicio de Cardiologa, Hospital Militar Central, Buenos Aires. Jefe Laboratorio de Ecocardiografa, Hospital Fancs, Buenos Aires. Miembro Titular, Sociedad Argentina de Cardiologa.

[ 16 ]

Antonio Paragano
Cardilogo Universitario, Universidad de Buenos Aires. Mdico, Internacin y Unidad Coronaria, Departamento Cardiovascular, Servicio de Cardiologa, Hospital Militar Central, Buenos Aires. Instructor de Residencia
en Cardiologa, Departamento Cardiovascular, Servicio de Cardiologa, Hospital Militar Central, Buenos Aires.
Miembro, Comit Institucional de Revisin de Ensayos Clnicos (CIREC), Hospital Militar Central, Buenos Aires.
Docente, Carrera de Cardiologa, Universidad del Salvador, Buenos Aires. Docente, Facultad de Medicina, Universidad de Buenos Aires. Miembro Adherente, Sociedad Argentina de Cardiologa.

Daniel Jos Pieiro


Profesor Titular Regular de Medicina Interna, Universidad de Buenos Aires. Vicepresidente de la Sociedad Interamericana de Cardiologa (2007-2008). Mdico del Hospital de Clnicas Jos de san Martn, Universidad de
Buenos Aires. Ex-presidente de la Sociedad Argentina de Cardiologa (2005)

Roberto Ernesto Pedro Sica


Profesor Titular Consulto de Neurologa. Facultad de Medicina. Universidad de Buenos Aires. Jefe, Divisin
Neurologa. Hospital Ramos Meja Buenos Aires. Responsable de la Secretara de Ciencia y Tcnica. Facultad de
Medicina. Universidad de Buenos Aires.

Alexander Tenenbaum
Profesor Asociado de Cardiologa, Facultad de Medicina Sackler, Universidad de Tel-Aviv, Tel-Aviv, Israel. Secretario General, Fundacin de Investigacin en Diabetologa Cardiovascular, Holon, Israel. Editor en Jefe, Cardiovascular Diabetology, Londres, Gran Bretaa. Director de Investigacin, Instituto de Rehabilitacin Cardaca,
Centro Mdico Sheba, Tel-Hashomer, Israel.

Andreas Wielgosz
MSc, MD, PhD. Professor of Medicine and Community Medicine & Epidemiology. University of Ottawa, Ontario,
Cnada. Editor-in-Chief, Prevention and Control. Official Journal of the World Heart Federation, Ginebra, Suiza.

Luis Mara Ziehr


Presidente, Comit Independiente de Etica para Ensayos en Farmacologa Clnica de la Fundacin de Estudios
Farmacolgicos y de Medicamentos (FEFyM). Director, Carrera de Mdico Especialista en Farmacologa, Facultad de Medicina, Universidad de Buenos Aires. Ex Profesor Titular de Farmacologa, Facultad de Medicina,
Universidad de Buenos Aires.

Salim Yusuf
Heart and Stroke Foundation of Ontario Research Chair, Ontario, Canada. Senior Scientist of the Canadian
Institute of Health Research. Director of Cardiology and Professor of Medicine, McMaster University, Hamilton
Health Sciences, Hamilton, Canada.

[ 17 ]

I. La Investigacin en el campo de la Medicina

El conocimiento
Captulo 1

Conocimiento humano e investigacin. El mtodo cientfico.


Fuentes del conocimiento: observacin y experimentacin. Induccin y deduccin.
Teoras e hiptesis. Prueba de una hiptesis.
Los mtodos en las ciencias de la naturaleza.


Patricio F. Jacovella,


Ral A. Borracci,

Rodolfo J. Giuliano

1. El conocimiento
Es importante diferenciar los conceptos de conocimiento e informacin. Conocimiento
es lo que se sabe. Cuando el conocimiento permite tomar decisiones se transforma en informacin. Para resolver problemas en medicina es necesario tener acceso a la informacin y
procesarla adecuadamente.1,2
La epistemologa es un rama de la filosofa que se encarga de los problemas que rodean a
la teora del conocimiento. Sus principales problemas son la posibilidad del conocimiento, su
origen o fundamento, su esencia o trascendencia y el criterio de verdad. 3
Todo conocimiento es una relacin entre el sujeto que conoce y el objeto que es conocido.
La relacin de un determinado conocimiento no puede estudiarse dejando de lado al sujeto y
al objeto. La epistemologa como ciencia, estudia la relacin entre el sujeto y el objeto y todos
los problemas que esa relacin plantea.

2. La ciencia
La ciencia es el conocimiento ordenado y mediato de los seres y sus propiedades por
medio de sus causas.
El saber cientfico no aspira a conocer las cosas superficialmente, sino que pretende entender sus causas, porque de esa manera se comprenden mejor sus efectos. Se distingue del
conocimiento espontneo por su orden metdico, su sistema y su carcter mediato.
Para conocer las cosas a fondo es necesario utilizar la razn y observar ms detenidamente los procesos. Las caractersticas de dedicacin ordenada, constante y metdica diferencian
al conocimiento cientfico del comn.
La ciencia es descriptiva, explicativa, definitoria, etc., investiga qu son las cosas, como
actan, cmo se relacionan, cundo, cmo, dnde, por qu. La ciencia es un conjunto de
[ 21 ]

conceptos y propiedades que convergen en un objeto, y que contiene datos, explicaciones,


principios generales y demostraciones acerca de ste.
Las ciencias pretenden establecer leyes basadas en conceptos generales, en las caractersticas en comn de las cosas y en lo que se repite en los fenmenos.
La filosofa busca conocer los principios ms profundos de las cosas, mientras que las
ciencias particulares buscan las causas ms prximas.
Se puede concluir entonces que la ciencia es el conjunto unificado de conocimientos e investigaciones, de carcter objetivo, acerca de las relaciones entre los hechos, que se descubren
gradualmente y que se confirman por mtodos de verificacin definidos.

3. El conocimiento cientfico
El conocimiento cientfico es un saber crtico, fundamentado, metdico, verificable, sistemtico, unificado, ordenado, universal, objetivo, comunicable (por medio del lenguaje cientfico), racional, provisorio y que explica y predice hechos por medio de leyes.2-4
El conocimiento cientfico es crtico porque intenta distinguir lo verdadero de lo fa1so. Se
distingue por justificar sus conocimientos y dar pruebas de sus verdades. Al demostrar que
es cierto, queda fundamentado.
El investigador sigue procedimientos planificados segn un orden y un mtodo. Fundamenta sus conocimientos mediante observacin, investigacin y prueba. De esta manera la
investigacin cientfica es planificada.
Se considera verificable ya que siguiendo los pasos descriptos en un trabajo cientfico,
otro investigador puede reproducir la experiencia.
Es sistemtico porque en cada etapa, los nuevos conocimientos se integran al sistema,
relacionndose con los que ya existan.
Es un saber unificado porque no busca un conocimiento de lo singular y concreto, sino el
conocimiento de lo general y abstracto, o sea aquello que las cosas tienen de idntico y permanente.
Es universal porque es vlido para todas las personas sin reconocer fronteras ni determinaciones de ningn tipo, no vara con las diferentes culturas.
Es objetivo porque es vlido para todos los individuos y no solamente para uno determinado. Es de valor general y no de valor singular o individual. Pretende conocer la realidad
tal como es, y la garanta de esta objetividad son sus tcnicas y sus mtodos de investigacin
y prueba.
Es comunicable mediante el lenguaje cientfico, que es preciso, comprensible para cualquier sujeto capacitado, quien podr obtener los elementos necesarios para comprobar la
validez de las teoras en sus aspectos lgicos y verificables.
Es racional porque la ciencia conoce las cosas mediante el uso de la inteligencia, de la razn.
El conocimiento cientfico es provisorio porque la tarea de la ciencia no se detiene, prosigue sus investigaciones con el fin de comprender mejor la realidad. La bsqueda de la verdad
es una tarea abierta.
La ciencia explica la realidad mediante leyes, que son las relaciones constantes y necesa[ 22 ]

rias entre los hechos. Son proposiciones universales que establecen en qu condiciones sucede
determinado hecho, por medio de ellas se comprenden hechos particulares. Tambin permiten adelantarse a los sucesos, predecirlos. Las explicaciones de los hechos son racionales,
obtenidas por medio de la observacin y la experimentacin.
En sntesis se pude decir que la ciencia busca explicar la realidad mediante leyes que permiten predicciones y aplicaciones prcticas mediante tecnologa.
El conocimiento cientfico es un saber objetivo que se estructura en sistemas verificables,
obtenidos mediante mtodos especficos (mtodo cientfico) y comunicados en un lenguaje
propio con reglas precisas.

4. El mtodo cientfico
Se puede definir investigacin como un sistema de actividades intelectuales y manuales
destinado a la produccin de informacin, con el fin de resolver problemas.
En las ciencias, se aceptan informaciones que han sido producidas bajo un conjunto de
normas mundialmente aceptadas. Al conjunto de normas se lo conoce como mtodo cientfico.
La metodologa de investigacin es una disciplina derivada de la lgica y tiene como
objeto de estudio el sistema de normas llamado mtodo cientfico.4
Se puede concluir que mtodo o proceso cientfico es un conjunto de prcticas utilizadas
y ratificadas por la comunidad cientfica como vlidas a la hora de proceder con el fin de exponer y confirmar sus teoras. Las teoras cientficas, destinadas a explicar de alguna manera
los fenmenos que observamos, pueden apoyarse o no en experimentos que certifiquen su
validez.
4.1. Etapas del mtodo cientfico:
1) Observacin: es la aplicacin de los sentidos a un objeto o fenmeno, para estudiarlos
tal como se presentan en la realidad.
El primer paso del mtodo cientfico tiene lugar cuando se hace una observacin a propsito de algn evento o caracterstica del mundo. Esta observacin puede inducir una pregunta
sobre el evento o caracterstica. 3 Por ejemplo, un da un observador puede dejar caer un vaso
de agua y observar como se hace aicos en el piso cerca de sus pies. Esta observacin puede
inducirle la pregunta, Porqu se cay el vaso?
2) Induccin: es la accin de extraer el principio particular a partir de determinadas
observaciones.
3) Hiptesis: es el planteo a resolver
Tratando de contestar la pregunta, un cientfico formular una hiptesis o conjetura a
propsito de la respuesta a la pregunta. En el ejemplo del vaso hay varias posibles hiptesis,
pero una de ellas podra ser que una fuerza invisible (gravedad) tir el vaso al suelo. 3
4) Experimentacin: es la prueba de la hiptesis
De todos los pasos en el mtodo cientfico, es el que verdaderamente separa la ciencia
de otras disciplinas. Para comprobar o refutar una hiptesis, el cientfico disear un ex[ 23 ]

perimento para probar esa hiptesis. A travs de los siglos, muchos experimentos han sido
diseados para estudiar la naturaleza de la gravedad.
5) Demostracin de la hiptesis: refutacin de la hiptesis
6) Tesis: conclusiones
Una comn percepcin sobre la ciencia, aunque errada, es que la ciencia define la verdad. La ciencia no define la verdad, ms bien define una manera de pensar. Es un proceso
en el cual se usan experimentos para contestar preguntas. A este proceso se lo denomina el
mtodo cientfico y comprende los pasos citados. 3

5. El mtodo cientfico aplicado a la medicina


A los fines prcticos, en investigacin mdica se pueden dar diferentes tipos de problemas relacionados: descriptivos, de correlacin, de comparacin y de explicaciones causa
efecto.
La descripcin de un caso o de un cierto nmero de casos puede ser suficiente motivo
como para presentar o publicar un estudio. Simplemente se presentan las coordenadas de
tiempo y espacio y se describe lo que se hizo.
Los estudios de correlacin, como su nombre lo indica, asocian variables como por ejemplo la variacin del pulso con el aumento de la temperatura corporal. Mediante frmulas
adecuadas se establece si existe correlacin entre las series estudiadas.
En el caso de comparacin, se analizan resultados y se comprueba si existen o no diferencias significativas como para inferir discrepancias y similitudes.
Para estos tipos de problemas de investigacin, se usa el mtodo estadstico.
En las explicaciones causa efecto, la investigacin es ms detallada y plantea hiptesis.
En estos casos se pone en prctica el mtodo hipottico deductivo.

6. Teoras e hiptesis
Desde el punto de vista cientfico, si se acepta que un sistema es un conjunto de partes que
interactan entre s, una teora es un sistema de hiptesis. 2
Hiptesis es un planteamiento o supuesto que debe ser comprobado o refutado siguiendo
las normas establecidas por el mtodo cientfico Tiene, como condicin imprescindible, que
debe ponerse a prueba.
En general, en un trabajo de investigacin cientfica se plantean dos hiptesis mutuamente excluyentes: la primera es llamada hiptesis nula (H0) y la otra usualmente se conoce como
hiptesis alterna (H1). El procesamiento de los datos, segn la metodologa de investigacin
diseada, mostrar cul de las dos hiptesis se comprueba como cierta, de manera que slo
sta se incorporar al conocimiento que la investigacin aporta a la ciencia.1,2,4

[ 24 ]

7. Mtodo hipottico deductivo


De acuerdo con lo expuesto por Castiglia, 2 ms detalladamente, el mtodo hipottico
deductivo permite mediante los siguientes pasos realizar la comprobacin de la hiptesis:
1) Formular una hiptesis
2) Suponer que es verdadera
3) Deducir cuales sern las consecuencias observacionales.
4) Establecer los criterios de corroboracin o refutacin: si las consecuencias de la observacin se producen en los hechos se debe corroborar; si en cambio las consecuencias de la
observacin no se producen en los hechos, se debe refutar.
5) Establecer si las consecuencias observacionales se producen en los hechos.
6) Tomar la decisin: corroborar o refutar la hiptesis.
Ms especficamente, en un modelo de toma de decisiones, es necesario hacer uso de
pruebas estadsticas para aceptar o rechazar una diferencia en un resultado.
Segn lo visto, la prueba de H0 dice que no hay diferencia bajo la premisa que la diferencia entre la muestra y la poblacin estudiadas se debe al azar. Es decir que por ejemplo, no
hay diferencias entre los dos grupos estudiados.
Si se pone un ejemplo de complicaciones graves en medicina, en cualquier entorno a
manera ilustrativa, aceptar la hiptesis de nulidad o no poder rechazarla, significa aceptar
que la diferencia no existe. Es necesario y muy importante decidir el nivel de aceptacin de
una hiptesis segn la gravedad del caso. Siempre se debe calcular el riesgo de equivocarse y
emplear la estadstica como herramienta imprescindible.1
Los problemas de investigacin cientfica del tipo causa-efecto hacen uso del planteamiento de hiptesis. 2
Para resolver problemas de relacin causa-efecto es necesario seguir tres pasos:
1) Construir una teora explicativa
2) Verificar (contrastar) la teora
3) Formular conclusiones
En sntesis, las hiptesis son proposiciones provisionales y exploratorias sobre la veracidad o falsedad de un concepto, una teora o un modelo con un alcance de trabajo de investigacin por simulacin y con mtodos de campo o de laboratorio.

8. Los mtodos en las ciencias de la naturaleza


La palabra ciencia deriva de science, y es un trmino introducido por Whewell en 1840
para reemplazar a la llamada filosofa de la naturaleza. Esta cercana de la ciencia con la
filosofa permiti que Albert Einstein (1879-1955) comentara que la ciencia es como un reloj
cuyo mecanismo se halla en una caja negra inviolable, y del que slo podemos ver el movimiento de las manecillas. En consecuencia la ciencia estara constituida por las hiptesis que
[ 25 ]

se elaboran para explicar el movimiento de esas manecillas, y aunque la explicacin fuera


verdadera, nunca podra conocerse el mecanismo real por el cual funciona el reloj.
La ciencia, como una explicacin finita de la realidad, se asienta en tres principios no
demostrables llamados de inteligibilidad, objetividad y dialctica. Cuando se hace ciencia
sobre la naturaleza se asume que sta puede ser entendida, o sea que es inteligible. De todas
formas, la naturaleza podra tambin tener fenmenos azarosos que la hicieran no entendible.
Por su parte, el postulado de objetividad indica la separacin entre la mente investigadora y el
objeto de conocimiento observado o analizado. Sin embargo, esta independencia de la ciencia
sobre el objeto de estudio podra ser difcil de aceptar si se considera la ineludible influencia
entre el observador y lo observado. Por ltimo, el principio dialctico permite exponer el conocimiento cientfico a la refutacin por medio de nuevas experiencias u observaciones.
En realidad los mtodos de la investigacin cientfica dependen de la perspectiva filosfica del conocimiento. Las dos corrientes principales que fundamentan la adquisicin y el
desarrollo del conocimiento son la positivista lgica y la corriente naturalista, que dan lugar
a paradigmas de investigacin diferentes. Un paradigma es un conjunto de formas que orienta la perspectiva que el investigador tiene sobre la investigacin o el estudio que desarrolla.
De acuerdo a la filosofa positivista, la realidad se percibe como nica e invariable, o sea
que existiran hechos objetivos que pueden ser descubiertos con independencia del investigador. Desde este punto de vista, los fenmenos naturales y humanos podran ser previsibles y
controlables. Estos hechos fundamentan el esfuerzo cientfico para adquirir la habilidad de
predecir y controlar dichos fenmenos. Por contrapartida, la filosofa naturalista sostiene que
la realidad no es nica sino mltiple, y que se descubre a travs de un proceso dinmico en el
cual el investigador interacta con el entorno y obtiene un conocimiento relativo o contextual.
En este caso los fenmenos no seran ni nicos ni previsibles, y el observador constituira otro
factor de influencia sobre la realidad del entorno. En consecuencia no existira una independencia absoluta entre el observador y lo observado, lo que pondra en tela de juicio el principio
cientfico de objetividad. A partir de estas dos perspectivas filosficas surgen dos mtodos de
investigacin tradicionales conocidos como cuantitativo y cualitativo. El mtodo de investigacin cuantitativo se basa en la filosofa positivista, y est fundado en la observacin de hechos
o acontecimientos objetivos que surgen con independencia del observador. Este ltimo emplea
un proceso sistemtico de recoleccin de datos observables y cuantificables, disminuyendo la
aparicin de sesgos. El mtodo se basa fundamentalmente en la objetividad, la prediccin, la
generalizacin de los resultados y el control de los fenmenos. Su objetivo final es desarrollar
un conocimiento de tipo valorativo. Por su parte, la investigacin basada en el mtodo cualitativo se fundamenta en la filosofa naturalista, y es tpica de los estudios sociales que tienen
en cuenta los contextos histricos y culturales en el que se desarrollan los fenmenos. El investigador que aplica el mtodo cualitativo observa, describe e interpreta el fenmeno como
se presenta, sin intentar controlarlo como en el caso del mtodo cuantitativo. En resumen el
fin de este mtodo es desarrollar un conocimiento descriptivo e interpretativo, en lugar de
uno valorativo. Aunque estos dos mtodos proponen modos diferentes de abordar la realidad,
ambos se interrelacionan y se complementan en la investigacin actual.
La medicina se nutre de diferentes ciencias para llevar a cabo su cometido de lograr una
mejor comprensin de la salud y la enfermedad mediante la observacin, la comparacin, la
[ 26 ]

experimentacin, el anlisis, la sntesis y la conceptualizacin. Esta parfrasis de una definicin de ciencia nos induce a pensar que la medicina est hecha de ciencias, y en consecuencia
comparte los mismos mtodos cientficos. Pero la verdad es que la definicin de ciencia ms
amplia que podamos hallar, con seguridad dejar afuera gran parte de lo que es la medicina.
El filsofo y matemtico Gottfried W. Leibniz, nacido en Leipzig en 1648 (cincuenta aos
despus de Descartes) concibi a la ciencia como un cuerpo doctrinal que poda ser conocido sistemticamente y con un alto grado de certeza, y la contrapona o bien a la opinin,
que slo implica un grado de certeza menor, o bien al arte, que involucra una prctica ms
que una doctrina. Atenerse a sta ltima definicin obliga en consecuencia a separar de la
ciencia mdica los aspectos prcticos y tcnicos vinculados con su arte. Despus de sta aclaracin podra escudriarse en los mtodos de la ciencia que la medicina utiliza. En primer
lugar se debera analizar si existe un nico mtodo cientfico, ya que a la biologa (y de all
la medicina) puede considerrsela una disciplina con autonoma cientfica y acreedora a su
propio mtodo, o bien una ciencia que comparte las reglas y metodologa de la fsica.
La corriente denominada fisicalismo comprime a la biologa en el marco conceptual
de la fsica. Su origen formal podra remontarse a Galileo (1564-1642) en cuya poca nicamente exista la mecnica como ciencia y la matemtica como su necesaria aliada. Para
su poca hasta 350 aos despus, el libro de la naturaleza estaba escrito en el lenguaje de la
matemtica, y este modelo de ciencia sobrevive an para muchos. El papel dominante de la
fsica y la matemtica en la ciencia obtuvo el apoyo de figuras como Isaac Newton (16421727) e Immanuel Kant (1724-1804) quien lleg a afirmar que solo hay ciencia genuina,
en la medida que contenga matemtica, a pesar que su Crtica del juicio (1790) tuvo un
xito limitado para intentar explicar la naturaleza en base a los principios newtonianos. En
los ltimos 100 aos ha habido cierta liberalizacin de esta corriente llamada fisicalismo, y
a pesar de su incontrovertible aporte, muchos autores modernos consideran que el mtodo
cientfico de la fsica no es el ms adecuado para una disciplina como la biologa, de la cual
depende la medicina.
Ernest Mayr (1904-2005) fue mdico y bilogo, evolucionista, y ha sido reconocido
como el Darwin del siglo XX. Este cientfico y filsofo postul que cualquier enfoque
de una filosofa de la biologa basado fundamentalmente en la lgica y la matemtica
ms que los conceptos especficos y particulares de la biologa resultar insatisfactorio,
y plante una serie de consideraciones sobre la autonoma cientfica de la biologa (2004).
En particular, demostr que algunas ideas fisicalistas (de la fsica) no eran aplicables a la
biologa. Por ejemplo desde los pitagricos y Platn, el concepto tradicional de diversidad
del mundo se planteaba con la existencia de una cantidad limitada de eide o esencias,
que consistan en clases o tipos netamente delimitados (tipologa o esencialismo). Bajo
esta concepcin, los miembros de una misma clase eran idnticos, constantes y separados
con precisin de los miembros de otro tipo o esencia. La idea central del racismo se basa
en estas diferencias de grupos tnicos humanos que se hallaran netamente separados en
clases distintas. Darwin fue quien rechaz este pensamiento tipolgico propio de la fsica
y emple en consecuencia un concepto completamente diferente denominado actualmente
poblacional, que admite las variaciones dentro de las clases, como ocurre ciertamente en
las poblaciones de seres vivos.
[ 27 ]

Otra idea de la fsica no aplicable enteramente al estudio de los seres vivos es el llamado
determinismo, que no deja espacio para la variacin o los hechos fortuitos. El matemtico
y fsico francs Pierre Laplace (1749-1827) se ufanaba de que el conocimiento completo del
mundo actual permitira predecir el futuro sin limitacin en el tiempo. Este concepto claramente determinista, no puede sostenerse actualmente ante la perspectiva de la nueva teora
de los sistemas dinmicos o del caos en el que una mnima variacin en las condiciones
iniciales hacen impredecible el desenvolvimiento futuro de una variable. La refutacin del
determinismo estricto y de la posibilidad de prediccin absoluta permite la aceptacin de la
variacin y de los fenmenos aleatorios tan comunes en la biologa.
Finalmente, otras de las clsicas ideas fisicalistas se refiere al denominado reduccionismo.
Este explica que la resolucin de un problema se obtiene a partir de la particin y reduccin del
sistema a sus componentes ms pequeos. Esta divisin, junto con la determinacin de la funcin de cada elemento, permitira explicar el problema. La realidad es que a partir de la teora
de los sistemas, el estudio de los seres vivos admite que stos estn compuestos por elementos y
relaciones que se pierden si se reduce el sistema a sus partes, y que en consecuencia el todo pasa
a ser mucho ms que la suma individual de las partes que lo componen. El estudio ms moderno
de los denominados autmatas celulares permite demostrar que no es posible inferir el comportamiento de unidades simples en cuanto al desarrollo de propiedades emergentes a partir de la
interaccin de estas unidades. Es as que la estructura de los tejido vivos no puede explicarse
enteramente si se los reduce a sus componentes celulares; la interaccin de estas ltimas generan
caractersticas emergentes no inferibles a partir del estudio celular individual.
Hasta aqu se pueden resumir una serie de conclusiones sobre los mtodos de las ciencias
de la naturaleza. Por un lado la tipologa que asume la invariabilidad de los tipos o clases se
reemplaza por el pensamiento poblacional que admite pequeas variaciones entre los elementos o seres de la misma clase. En segundo lugar el estudio de la naturaleza admite el uso del
caos determinista y el azar en lugar de un determinismo rgido. Y por ltimo se complementa
el reduccionismo o anlisis individual de las partes con el pensamiento sistmico o de anlisis
sinttico para la comprensin de los sistemas vivientes en conjunto y de las propiedades emergentes a partir de elementos constitutivos simples.
Tanto la rama de la biologa que estudia la evolucin como la medicina clnica asistencial
que indaga la historia de la enfermedad, requieren de otro mtodo que podra llamarse narrativa histrica. La biologa evolucionista debe recrear la historia pasada con los datos del
presente, o con aqullos que pueda recoger en la actualidad, y as construir una narracin que
explique el fenmeno de la evolucin. De la misma forma, el oficio de un mdico consiste en
escuchar, narrar y construir historias a partir del relato de los hechos mdicos referidos por
el paciente. De la misma forma, los signos que recoge el mdico, reflejan una foto del estado
actual que necesita ser reconstruido hacia atrs a la manera de un detective.

Referencias
1. Arribalzaga EB, Borracci RA, Giuliano RJ, Jacovella PF: El artculo cientfico: del papiro
al formato electrnico. Buenos Aires, Magster Eos, 2005
[ 28 ]

2. Castiglia VC: Principios de investigacin biomdica. (Segunda Edicin). Buenos Aires,


R. Primavera. 1995
3. Klimovsky G: Las desventuras del conocimiento cientfico. Una introduccin a la epistemologa. Buenos Aires, A-Z editora, 1997.
4. Tarski A: Introduccin a la lgica y a la metodologa de las ciencias deductivas. (Tercera
Edicin). Madrid, Espasa Calpe, 1977
5. Fortn MF. El proceso de investigacin: de la concepcin a la realizacin. Mxico, McGraw-Hill Interamericana, 1999
6. Mayr E. Por qu es nica la biologa. Consideraciones sobre la autonoma de una disciplina cientfica. Buenos Aires, Katz Editores, 2006
7. Doval HC. A qu llamamos ciencia y por qu la biologa es una ciencia autnoma. Rev
Argent Cardiol 2007; 75: 79-83

[ 29 ]

Captulo 2

Leyes cientficas

Extensiones y lmites del conocimiento cientfico

Rodolfo Jos Giuliano

a ciencia es un estilo de pensamiento y accin, que ha avanzado a travs del tiempo


sorteando un sinfn de contratiempos. Sus grandes revoluciones han sido el hallazgo y
la explicacin de los sucesos naturales, la formulacin de teoras y el desarrollo de nuevas
tecnologas. Por lo tanto, en la ciencia, como sucede ante toda creacin humana, debemos
distinguir el trabajo -investigacin- de su producto final, el conocimiento.
Toda investigacin cientfica arranca con la percepcin de que el conocimiento disponible es insuficiente para manejar determinados problemas.
El conocimiento previo con que se inicia un proyecto de anlisis es conocimiento ordinario, no especializado, y solo una parte de l es cientfico; o sea que el conocimiento cientfico
es aquel que se ha obtenido mediante el mtodo de la ciencia y puede nuevamente someterse
a prueba, enriquecerse y, llegado el caso, superarse mediante el mismo mtodo.
La idea central de la antropologa griega fue el hombre como naturaleza csmica. El cristianismo luego distingui la nueva realidad humana: la trada compuesta por cuerpo, cosmos y
espritu. As lo admitieron casi todos los pensadores de occidente hasta finales del siglo XVIII.
A partir de ah la civilizacin recibi la doble influencia de la religin y de la filosofa.
Las historia de las grandes revelaciones cientficas estuvieron asociadas a nombres ilustres como Aristteles, Pitgoras, Leonardo, Galileo, Newton y extremando la idea kantiana de la Ilustracin en que el hombre deba hacer su vida atenido no mas que a su propio
entendimiento, los sabios del siglo XIX fueron los protagonistas de un nuevo naturalismo
antropolgico que orientaron sus mentes a un pluralismo filosfico dispar: evolucionismo,
positivismo y eclecticismo.
Descartes, en los albores del modernismo, haba establecido que la verdadera ciencia era
demostrable segn el modelo de las matemticas y edific la filosofa racionalista tomando
como criterio bsico las ideas claras y distintas.
El racionalismo cartesiano tena una actitud cautelar que no solo llevaba a admitir falencias en nuestro propio conocimiento, sino que admita como racional sus propios lmites. La
razn era una fuerza nica, infalible y omnipotente:

nica, por que tena sentido de identidad en todos los hombres y todos disponan de
ella en igual medida
[ 30 ]

infalible, porque no era susceptible de errar


omnipotente, porque extraa de si misma su material y sus principios fundamentales

De un modo especial la gnoseologa renunciaba a la esencia del conocimiento sin que


ello significara una negacin manifiesta, pues la filosofa moderna se instalaba de a poco en
el pensamiento, la conciencia y la razn, lo que provocaba un desajuste progresivo entre el
conocimiento y la realidad.
En el siglo XVIII naca el empirismo de Locke, llevado hasta sus ltimas consecuencias
por David Hume, quienes basaron sus teoras en la experiencia.
Ambos afirmaron que el lmite del conocimiento era realmente la experiencia y que ninguna ciencia podra extenderse ms all de esa frontera o establecer principios que no se
fundieran dentro de esa jerarqua.
Con el advenimiento de la ilustracin se continu con el concepto de que el lmite del
conocimiento era la prueba, la demostracin. Voltaire, en El filsofo ignorante deca: Hay
que haber renunciado al sentido comn para no estar de acuerdo en que nada sabemos en el
mundo, si no es por la experiencia.
Sin embargo, nadie como Kant advirti sobre los lmites del conocimiento e intent salvar la contradiccin en su Crtica de la razn pura de 1871.
Tomando como principio los enunciados cartesianos, teoriz sobre el conocimiento objetivo y afirm que el conocimiento cientfico se apoyaba sobre bases ciertas, que estaba
construido por conceptos y leyes a priori independientes de la experiencia y que proporcionaran el escenario donde se ubicaran los datos de esa experiencia.
Con la formulacin de las geometras no eucldeas y la enunciacin de la teora de la
relatividad, a fines del siglo XIX y principios del XX, la idea de la fsica newtoniana perdi
la vigencia que Kant le atribua. En realidad, las leyes cientficas no seran ni verdaderas ni
falsas, sino simplemente convenciones o estipulaciones avaladas por sus consecuencias.
El surgimiento del racionalismo crtico, enunciado por Karl Popper en 1934, sostuvo que
las teoras jams podran justificarse o demostrarse porque la experiencia nunca accedera a
demostrar la verdad. Por lo tanto toda teora que contradijera la experiencia debera considerarse falsa.
As como nunca estaramos seguros de alcanzar la verdad, en ocasiones podramos
detectar el error.
Segn la doctrina popperiana el conocimiento, por ser conjetural, progresara gracias a
la deteccin de errores y las teoras siempre seran hiptesis o conjeturas que jams alcanzaran la condicin de verdad. Naca, pues, el falsacionismo.
A fines del siglo pasado, en 1974, Donald Campbell enunci la epistemologa evolucionista, que consista en abordar la problemtica del conocimiento bajo la perspectiva de la
evolucin biolgica.
Segn esta corriente, nuestro conocimiento corresponde a la realidad porque descendemos de otros seres, que a travs de la evolucin desarrollaron capacidades perceptivas e
ilustrativas adaptadas al entorno.
[ 31 ]

Las ideas bsicas del racionalismo crtico y de la epistemologa evolucionista se fundieron ampliamente en la mentalidad de nuestros das, aunque muchas alarmas suenan con el
objeto de despertar ese conocimiento aletargado, que afrontara nuevas instancias difciles
de resolver.
Segn P. W. Atkins, profesor de fsica y qumica de la Universidad de Oxford, somos meros productos del mundo fsico. La fsica est a punto de explicarlo todo, incluso la creacin
del universo a partir de la nada, sin necesidad de recurrir a un Dios creador.
Atkins no es el nico ser que anticipa el final de la fsica fundamental. Otros tericos ya
describen un presunto final de la ciencia. Seguramente nada de ello ocurrir porque la ciencia
experimental contina marchando por la ruta que los genios, como Newton, trazaron lejos
de cualquier extravagancia.
El siglo XX adems produjo, sobre el fin de su primera mitad, una de las grandes conmociones del saber mundial con el advenimiento de la informtica.
La concepcin de la informtica gener una revolucin tal, que la filsofa Esther Diaz la
equipar con el impacto histrico que produjo la enunciacin heliocntrica de Coprnico.
Ese itinerario histrico, que an transcurrimos, se inici con la telemtica cuando el gobierno de Estados Unidos convoc a una serie de distinguidos investigadores de lite, para que
indagaran en tecnologas apropiadas que mantuvieran comunicaciones rpidas y eficientes.
La preocupacin del gobierno central era ms que apremiante. La Unin transitaba simultneamente por dos guerras entre Oriente y Occidente y necesitaba mantener contactos
instantneos entre las metrpolis americanas y los remotos campos de batalla.
Esa conjuncin explosiva entre tecnociencia y poltica exterior dio vida a una de las criaturas artificiales mas inquietantes de la historia de la humanidad, la computacin, y con ella
un nuevo paradigma de la ciencia: la globalizacin cientfica.
Actualmente, la robustez digital posibilit que se liberaran las frmulas de la fisin del
tomo y comenzaran las prcticas atmicas, las nuevas ecuaciones fsicas que concibieron
los viajes interplanetarios y las investigaciones biolgico-digitales que culminaron con la
ingeniera gentica, entre otros.
Fedoseev y Pjaro en nuestros das, plantean que el proceso del conocimiento transcurre
por tres etapas:


La acumulacin y elaboracin de datos obtenidos mediante procesos empricos.


La construccin y elaboracin de la teora sobre la base de la compilacin y tratamiento de los datos empricos obtenidos.
La explicacin de los datos empricos conocidos, la deduccin de predicciones a partir de los nuevos datos con la colaboracin de la teora elaborada y la confirmacin
de la teora por el material emprico.

Como se ha visto, no se puede hablar de ciencia sin recurrir a la filosofa de la ciencia,


entendida como un nivel de razonamiento y no como una disciplina acadmica.
La percepcin, la intuicin y la lgica que fueron las tres armas esgrimidas por el hombre
para dominar la naturaleza, son los instrumentos en que se basa el mtodo cientfico y, en
alguna medida, toda teora se asienta en la combinacin de las tres.
[ 32 ]

Sin embargo no se puede conjeturar sobre el mtodo si se desconoce la ley. Pero, qu es


ley? qu es ley cientfica?
Ley objetiva - Ley cientfica
El trmino ley no tiene un uso fijo sino que es un signo ambiguo que designa varios juicios. No nos interesa definir ahora el concepto jurdico de ley, sino las acepciones relevantes
que son tiles para la ciencia pura y aplicada.
Segn Mario Bunge se designa como ley o ley objetiva o pauta nmica a un patrn objetivo de una clase de hechos: cosas, acontecimientos, procesos.... O sea; cierta relacin o red
de relaciones constantes que se cumplen realmente en la naturaleza, las conozcamos o no.
Por lo tanto una ley es un objeto extraconceptual que se sita en la realidad.
Ley cientfica es una proposicin cientfica confirmada que afirma una relacin constante entre dos o mas variables cada una de las cuales representa, parcial e indirectamente,
una propiedad de sistemas concretos, es decir es una regla y norma constante e invariable
de las cosas, nacida de la causa primera o de las cualidades y condiciones de las mismas.
Por lo tanto, toda ley cientfica no deja de ser una hiptesis confirmada que refleja una
pauta objetiva y su lugar central en las ciencias es el fin capital de toda investigacin cientfica: el descubrimiento de pautas o regularidades.
Dice Bunge que hay tantas clases de leyes cientficas como puntos de vista o criterios de
clasificacin queramos adoptar y si tienen niveles cualitativos diferentes tendrn un nivel
dispar de integracin.
Como cada uno de esos niveles se distingue por tener variables y leyes propias, las relaciones objetivas entre las mismos se explican por leyes interniveles.
En cambio se define como leyes intranivel a aquellas que relacionan variables de igual
estatura cientfica.
Las leyes intranivel contienen las siguientes variables de una investigacin cientfica:

Biolgicas (vg: reproduccin de los seres vivos - fotosntesis)

Fsicas (vg: intensidad del sonido - transmisin de la luz)

Qumicas (vg: funcin hormonal - accin enzimtica)

Sociolgicas (vg: divisin de clases - clasificacin del trabajo)

Psicolgicas (vg: la psique - el vnculo)

Las leyes interniveles se agrupan en:



Biofsicas y bioqumicas

Psicofsicas y psicoqumicas

Psicobiolgicas

Sociofsicas

Sociobiolgicas

Sociopsicolgicas
[ 33 ]

Psicobiofsicas
Sociobiofsicas
Sociopsicofsicas
Sociopsicobiolgicas
Sociopsicobiofsicas

Si un mtodo es un procedimiento que sirve para tratar un conjunto de problemas, el mtodo cientfico es en consecuencia una sistematizacin u orden que define el conocimiento
del saber y lo diferencia de otros tipos de conocimientos.
La filosofa de la ciencia lo delinea como todo fenmeno que es aceptado por el sentido
comn y por ende por la comunidad cientfica y la sociedad toda. Por su naturaleza debe
carecer de subjetividad. En consecuencia, cada mtodo especial es relevante para algn estadio particular de la investigacin cientfica, y si el mtodo general de la ciencia es un procedimiento que se aplica al ciclo entero de la investigacin en el marco de cada problema, la
finalidad del mtodo cientfico ser establecer la diferencia que existe entre la ciencia y la no
ciencia.
Aunque se lo asocia ecumnicamente con todas ellas, bsicamente suele aplicarse en las
llamadas ciencias naturales (biologa, fsica, qumica,...) en contraposicin con las ciencias
humanas (economa, poltica,...) que se rigen por la dialctica, el funcionalismo, el estructuralismo, la hermenutica y el mtodo fenomenolgico entre otros.
Los tres procedimientos esenciales que reciben genricamente la denominacin de mtodo cientfico son: inductivo, deductivo e hipottico-deductivo o de contrastacin de hiptesis.
El primero crea leyes desde la observacin de los hechos, mediante la generalizacin del
comportamiento observado. Dira que es ms representativo de las ciencias empricas.
El segundo aspira a obtener conclusiones a partir de premisas mediante el uso de la lgica
pura. Es el mtodo axiomtico propuesto por Aristteles como el mtodo cientfico ideal y es
propio de las ciencias formales.
Ambos encierran elementos filosficos subyacentes, se valen de la lgica y marchan en
ambos sentidos: de lo particular a lo general y viceversa.
Por ltimo el hipottico-deductivo o experimental, que generalmente no plantea problemas porque su validez surge de los resultados obtenidos del contraste de las propias pruebas.
Sin embargo se destaca su carcter predominantemente intuitivo ya que necesita contrastar sus conclusiones tanto para ser validado como rechazado.
Como se puede observar la metodologa de la ciencia est llena de matices segn la corriente filosfica perseguida.
Para Mara Jos Molina el rbol del conocimiento cientfico respondera al siguiente
algoritmo.

[ 34 ]

METODOLOGA DE LA CIENCIA
- ETAPAS I.- PASOS DEL MTODO CIENTFICO.

Planteamiento

Argumentacin

Lgica

Intuicin

Creatividad (Jump o salto)

Conclusin y proposicin de la teora

II.- PROCEDIMIENTOS DE CONTRASTACIN DE UNA TEORA.


Experimental (Verificacin o Falsacin)

Sentido Comn (Galileo - Pop up autnomo)

III.-ACEPTACIN. (Sociologa de la Ciencia)


Comunidad cientfica

Sociedad en su conjunto

Referencias
1. Artigas M. Los lmites del lenguaje cientfico. En: Ortz JM (ed). Veinte claves para la
nueva era. Madrid, Rialp 1992; pp 113-131
2. Bunge M. La investigacin cientfica. Mxico, Siglo veintiuno editores 2000; pp: 7, 265,
283-289, 299, 315.
3. Daz E. El desafo de las investigaciones disciplinarias e interdisciplinarias, articuladas
con una pedagoga del orden y del caos-2005. www.estherdiaz.com.ar
4. Daz Narvez VP, Calzadilla Nez A., Lpez Salinas H. Una aproximacin al concepto
del hecho cientfico. Cinta de Moebio- Facultad de Ciencias Sociales. Chile, Universidad
de Chile 2005, n 22
5. Espinosa Padierna LE. Tecnologa y educacin. Integracin del conocimiento o fragmentacin cultural? . www.redespecialweb.org/congreso6.htm
6. Hartmann N. Metafsica del conocimiento. Buenos Aires, Editorial Losada 1957; pp:
208
7. Ibez JJ. Las teoras cientficas segn Karl Popper: La falsabilidad. weblogs.madrimasd.org/universo/archive/2007/02/1059009.aspx
8. Lan Entralgo P. Conocimiento cientfico del hombre Seccin II. In Historia de la Medicina. Barcelona, Salvat 1979 pp: 418-463
[ 35 ]

9. Magnus D. Down the primrose path competing epistemologies in early XX century biology. In: Creath R, Mainchistein J (eds). Biology & epistemology. Cambridge, Cambridge University Press 2000
10. Molina MJT. Globalizacin cientfica. Nuevos paradigmas de la ciencia. www.molwick.
com/es/mtodos-cientficos
11. Pjaro D. La formulacin de la hiptesis. Cinta de Moebio- Facultad de Ciencias Sociales. Universidad de Chile. 2002 n 15.

[ 36 ]

II. Comunicacin de los resultados

Captulo 3

Cmo escribir un manuscrito


para su publicacin

Andreas Wielgosz

scribir un artculo mdico que sea considerado adecuado para su publicacin luego de
su revisin o arbitraje por pares (peer review) requiere una estrategia clara y efectiva.
Tambin requiere una cuidadosa atencin a los detalles. Las exigencias cada vez mayores
y la gran competencia por publicar, en particular en las revistas ms calificadas, hacen de
lograr la aceptacin un verdadero desafo. Generalmente, la tasa de aceptacin suele ser
menor del 50%, con un 20 a 25% de trabajos rechazados an sin haber ingresado en la
fase de arbitraje por pares. Los autores exitosos tienen una forma sistemtica de encarar
la tarea y este captulo delinea los pasos que deberan darse, juntamente con indicaciones
tiles, para facilitar el procedimiento. Tambin da una visin de algunos de los errores
ms comunes en que se suele incurrir y de cmo evitarlos. La satisfaccin no solo debera
provenir de la contemplacin del trabajo en prensa, sino tambin del esfuerzo realizado en
su elaboracin.
Hay varios tipos de comunicaciones que pueden aparecer en un peridico mdico, incluyendo trabajos originales de investigacin, artculos de revisin o puesta al da de distintos
temas, comentarios editoriales, comunicaciones breves, casustica, comentarios de libros y
cartas al editor. La mayora de los comentarios que siguen se referir al artculo original de
investigacin, aunque los mismos principios se aplican a otros tipos de trabajo en general.
Aunque pueden existir beneficios secundarios en publicar, tales como elaborar una lista de
publicaciones para promover o facilitar la obtencin de fondos para la investigacin, etc.,
la ms importante de las motivaciones debera ser el poder comunicar hallazgos, conceptos
e ideas. En este sentido, es til considerar el manuscrito como un medio de comunicacin,
como si se refiriera una historia.
La clase de audiencia y la facilidad con la cual dicha audiencia podr ser alcanzada, estn determinadas en gran parte por la eleccin de la revista. Generalmente, el mayor alcance
se obtiene publicando en ingls en una revista Norteamericana o Britnica. Si el objetivo es
llegar a colegas que se hallen trabajando en el mismo campo, entonces quizs lo ms apropiado sea un peridico de la subespecialidad. Desde ya, el tema del trabajo debe estar en
consonancia con las metas y objetivos de la revista elegida. Si quedara alguna duda respecto
de la eleccin, lo mejor es contactar al editor. Esto puede tener el beneficio adicional de interesar al editor en el artculo propuesto y lograr que aguarde ansiosamente su envo. En caso
[ 39 ]

contrario, el editor podr ahorrarle un tiempo valioso dirigiendo el envo a una revista ms
acorde con el mismo.
Muchos autores eligen una publicacin en base al factor impacto, el cual depende de que
la revista se halle indexada. El factor impacto es una medida de la frecuencia con la cual los
artculos de una revista en particular son citados por autores que escriben en las dems revistas indexadas. Esto es llevado a cabo por el Instituto para la Informacin Cientfica (Institute
for Scientific Information), que sigue las citas por un perodo de tres aos. Aunque existe un
consenso general en que las citaciones frecuentes de un artculo son indicativas de su calidad
e importancia, este no es siempre el caso. De esta forma, cierta controversia rodea la significacin atribuda a los factores de impacto.1
La eleccin de una publicacin especfica debera surgir tempranamente en el proceso
de escritura porque determinar el formato y el estilo que debern adoptarse. Los requerimientos de estilo son publicados por las revistas al menos una vez al ao, aunque en algunos
casos pueden encontrarse en todos los nmeros y tambin se pueden conseguir en Internet.
Luego, el primer paso crtico es delinear la estructura del artculo en ciernes de acuerdo a los
requerimientos de la revista en la cual se intenta publicarlo.
La mayora de las publicaciones tienen requerimientos similares, con artculos originales
limitados a alrededor de 3.000 a 4.000 palabras, ms un resumen de alrededor de 250 palabras. La primera pgina es la del Ttulo, que tambin incluye un ttulo breve de alrededor
de 40 a 90 caracteres, que puede ser utilizado para bsquedas computarizadas. Los autores
estn listados en esta pgina, en ciertos casos con sus correspondientes grados y afiliaciones acadmicas. Un autor, tpicamente el primero, es identificado como corresponsal y la
informacin para su contacto es provista tanto para correspondencia durante el proceso de
arbitraje como para la publicacin definitiva del artculo. Nadie ms debera mantener la
comunicacin con la oficina editorial. Finalmente, en la primera pgina deberan inclurse
varias palabras clave (key words) destinadas a facilitar las bsquedas computarizadas que
podrn conducir a la identificacin del artculo. La terminacin de la primera pgina puede
ser pospuesta hasta el final, aunque el acuerdo acerca de la autora y orden de los autores es
mejor que sea abordado tempranamente.
El siguiente item es el Resumen. Muchas, aunque no todas las revistas, requieren un
resumen estructurado. 2 Este requisito debera estar includo en las instrucciones para los autores. Algunas revistas no lo especifican, dejando la cuestin a la discrecin de los autores. Un
resumen estructurado es ms probable que sea advertido y examinado, lo cual favorece que el
artculo sea ledo. En 1987, los Annals of Internal Medicine introdujeron como un requisito
los resmenes estructurados, con los siguientes sub-enacabezamientos: Objetivo, Diseo,
Campo (Setting), Pacientes, Intervencin, Mediciones, Resultados Principales y Conlusiones.
En 1996 fue agregado a la lista Antecedentes (Background) y en 2004, Limitaciones.
Algunos autores escriben primero el resumen, con el fin de servir como un bosquejo para
el resto del trabajo. Esto puede llegar a perturbar la escritura y causar mucha frustracin en
la medida en que el autor intenta resumir el artculo antes de que est concluida su redaccin.
Lo mejor es dejar el resumen para el final, lo que a su vez permite que las mejores frases o
enunciados para resumir el trabajo sean copiados y pegados directamente desde el artculo
terminado.
[ 40 ]

El artculo propiamente dicho comienza con una Introduccin. Su objetivo es proveer la


informacin de fondo que explicar porqu fue emprendido. La introduccin debera asimismo precisar los temas especficos que el trabajo apunta a tratar y el porqu los investigadores
desearon llevarlo a cabo. Debera comunicar el entusiasmo que motiv a los investigadores,
de manera de generar inters por parte de los lectores. La introduccin no est dirigida a ser
una revisin de la literatura, lo cual es un error comn en investigadores que transforman
esta seccin en una larga polmica. Una buena estrategia es comenzar con una perspectiva
general y entonces hacer foco en el problema o las preocupaciones especficas, juntamente
con una explicacin del emprendimiento.
La seccin Mtodos desafa al escritor a proveer, tan sucintamente como sea posible, la
informacin necesaria acerca de lo realizado, de manera que pudiera ser potencialmente reproducido por otros. No es necesario incluir en la descripcin de los mtodos cada etapa emprendida, juntamente con los errores cometidos y las correcciones aplicadas. Esta seccin requiere
un equilibrio entre insuficiente y demasiada informacin. Si muchos de los detalles del enfoque metodolgico empleado para conducir el estudio son crticamente importantes, debera
considerarse la posibilidad de un artculo separado acerca de la metodologa del estudio. Los
resultados pueden entonces ser redactados en otro artculo, con solamente una referencia a
los mtodos, que habrn sido previamente descriptos y publicados. Como alternativa, pueden
agregarse uno o ms apndices delineando los detalles metodolgicos. Cuando las limitaciones
en las palabras son motivo de preocupacin, un diagrama puede ser de utilidad.
La seccin Mtodos tiene frecuentemente sub-encabezamientos para organizar el flujo de
informacin que deberan ser utilizados generosamente. Un error comn es revelar y/o discutir
los resultados en la seccin mtodos. A veces los autores se sienten compelidos a explicar la
eleccin de determinados mtodos o a recordar la secuencia de eventos, por ejemplo los hallazgos que condujeron a la siguiente eleccin de mtodos. Sin embargo, esto debera evitarse. Es
suficiente explicar que despus que fueron obtenidos los resultados de la Etapa A se llev a cabo
la Etapa B, reteniendo los detalles de los resultados de la Etapa A hasta la seccin Resultados.
Si el estudio requiriese aprobacin tica, esto debera ser mencionado identificando la
institucin que revis el proyecto y emiti la aprobacin. De la misma manera, deberan ser
descriptos los pasos destinados a asegurar la confidencialidad para con el paciente. Tambin
es importante identificar cualquier producto con derechos de propiedad.
Los resultados son la parte sobresaliente del trabajo. Aqu tambin es importante ser
sucinto pero claro y preciso. Los autores son a menudo desafiados por un gran volumen de
datos que desean presentar. Las tablas y figuras pueden proveer informacin que evita repeticiones en el texto. Bastar entonces simplemente con resaltar en palabras los principales datos de inters. Los datos deberan ser presentados en una secuencia lgica, siguiendo el curso
temporal de los mtodos. La atencin al detalle es muy importante en la seccin resultados.
Una tabla o un grfico deberan explicarse por s mismos, lo cual subraya la importancia de
una leyenda bien redactada.
Queda ms all de los lmites de este captulo discutir los variados errores en la presentacin de los datos, particularmente en los grficos, tales como conectar datos puntuales con
una lnea continua, errores que a menudo surgen en esta seccin. La inclusin de un buen
estadgrafo en la preparacin de tablas y grficos contribuye a evitar estos problemas.
[ 41 ]

La Discusin proporciona la oportunidad de explicar los hallazgos y de examinar con


mayor profundidad las controversias con las que los hallazgos puedan relacionarse. Las Limitaciones deberan ser abordadas anticipndose a los argumentos que los revisores o comentaristas puedan llegar a proponer. Esta seccin finaliza tpicamente con recomendaciones
y planes futuros o sugerencias para subsiguientes investigaciones, en especial si no ha sido
requerida una seccin Conclusiones en forma separada.
Siguen los Agradecimientos. Aqu deberan ser reconocidas todas las personas que puedan
haber colaborado en cualquiera o todas las etapas del trabajo cientfico, pero en un nivel que
no alcanza para considerarlas coautoras. De la misma manera, las instituciones y agencias que
proporcionaron soporte a la obra deberan ser identificadas y agradecidas. Es tambin una
buena prctica enviar una copia del artculo publicado a aqullos que han sido includos en los
Agradecimientos, junto con una carta de cobertura reiterando el agradecimiento.
Las Referencias bibliogrficas constituyen la ltima parte del manuscrito. Es muy importante la aceptacin y cumplimiento del formato requerido. Cualquier desacuerdo entre los nmeros del texto y las referencias listadas arroja una impresin muy desfavorable sobre todo el
manuscrito, de modo que es imperativo un cuidadoso chequeo y re-chequeo. El uso apropiado
de las referencias es una habilidad que se perfecciona con la prctica. La cita de una referencia
acerca de conocimientos ampliamente aceptados es tan poco agradable como la omisin de
referencias a informacin especfica relacionada con cuestiones acerca de la evidencia existente
para sostener las proposiciones enunciadas. Un error no poco comn es proveer como referencia un libro o artculo que a su vez relata o menciona la referencia original. La nica prctica
aceptable es suministrar la referencia original. Por supuesto, listar una referencia original significa que el artculo ha sido ledo y considerado relevante por el autor del manuscrito. Una
referencia es listada una sola vez, y el mismo nmero de referencia es luego repetido si sta es
citada nuevamente en el manuscrito. La extraccin de texto de los trabajos de otros autores sin
reconocer la fuente es plagio. Esta es una falta grave, desgraciadamente no infrecuente. Muchos
editores tienen a su disposicin sistemas electrnicos que buscarn el texto de frases o prrafos
previamente publicados. El plagio no es tomado en forma ligera.
Habiendo preparado el manuscrito en el formato requerido con la contribucin de los
coautores, el prximo escaln es solicitar comentarios de colegas imparciales, preferiblemente
aqullos con experiencia en la redaccin de artculos publicados. Tal solicitud debera ser preanunciada, para dar al colega elegido la oportunidad de confirmar que desea y est en condiciones de leer el borrador y aportar una crtica constructiva. A menudo, en este punto y habiendo
ya invertido un tiempo considerable preparando el manuscrito, el autor se halla impaciente por
enviarlo para su publicacin. Sin embargo, esta revisin provisoria es indispensable y puede ser
ampliamente remunerativa, resultando finalmente en un acortamiento del tiempo hasta la publicacin. Dado que lo buscado es una crtica, sta debera ser aceptada cortsmente, usando el
juicio para discernir el desacuerdo en el estilo del desacuerdo en el fondo. Si son recomendados
cambios sustanciales, deberan ser atendidos y seguidos por una nueva solicitud de revisin.
Estas medidas preliminares conducen al manuscrito ms cerca de su aceptacin.
Una vez que existe un consenso entre coautores y serviciales colegas en que el manuscrito
est listo, su envo para publicacin debera tener lugar sin demoras. Ms y ms publicaciones
instruyen a los autores para enviar sus trabajos en forma electrnica. Este proceso realmente
[ 42 ]

acelera la revisin del manuscrito y permite a los autores seguir el progreso de su envo. Un
sistema tal, hecho accesible por la Editorial Elsevier, es utilizado para los artculos enviados
a Prevention and Control, publicacin oficial de la Federacin Mundial del Corazn (World
Heart Federation). Todo el proceso de remisin electrnica requiere atencin a los detalles y
es recompensado por la confirmacin del recibo, que es enviada por e-mail al autor corresponsal. Sea que el envo del manuscrito tenga lugar electrnicamente o bien tradicionalmente, por correo postal, puede ser aadida una carta o mensaje para el editor. Esta es una buena
prctica, particularmente para sealar los mritos especiales que el artculo pueda tener, sean
stos lo novedoso de la investigacin o sus hallazgos significativos. Si hubiera existido una
comunicacin previa con el editor, debera ser mencionada.
En este punto, el destino del artculo est en manos de la oficina editorial. El editor decidir si el artculo es relevante y si merece la revisin o arbitraje por pares. El rechazo en esta
instancia puede ser cuestionable, en particular si no se da ninguna explicacin, como no sea
el apresurado comentario de que se reciben muchos artculos y solamente unos pocos pasan
por el proceso de arbitraje. A veces el editor puede ser persuadido si se sealan cualidades
nicas, que seran de gran inters para los lectores y que an podran aumentar el prestigio
de la revista, un argumento irresistible para muchos editores.
Si el manuscrito atraviesa la revisin por pares y los revisores recomiendan el rechazo, es
importante estudiar cuidadosamente las crticas. Los revisores tienden a enfocar tres aspectos de los manuscritos: legibilidad, relevancia y metodologa. En tanto la carta de rechazo
puede sonar como un repique fnebre para el trabajo enviado, todava puede ser emprendido
un nuevo envo, puntualizando al editor en el mensaje que acompaa, porqu es importante
ver el artculo publicado en esa revista en particular y qu pasos se han dado para mejorarlo.
Lo peor que puede ocurrir es otro rechazo, en tanto que es posible una reconsideracin. Si se
entiende que el arbitraje no ha sido imparcial, quiz llevado a cabo por un colega rival, tales
preocupaciones deberan ser comunicadas al editor. Solo unos pocos peridicos identifican a
el/los revisores con completa transparencia. Aunque pueden haber sido propuestos algunos
revisores, no hay garantas de que hayan aceptado la solicitud de revisar el manuscrito, ni an
de que el editor los haya contactado. Solicitar otra revisin no est fuera del caso. Es lo mejor
evitar reaccionar ante un rechazo con cargos emocionales de incompetencia y declaraciones
de nunca ms remitir artculos a esa revista. Despus de un rechazo definitivo, la alternativa
a un reenvo es la remisin del manuscrito a otra revista, pero solo despus de que los comentarios de los revisores hayan sido tomados en consideracin y las mejoras necesarias hayan
sido realizadas. La perspectiva del revisor siempre debera ser considerada. 3 La experiencia
de ser uno mismo un revisor, es muy til para escribir buenos artculos. Ofrecerse para actuar
como revisor es altamente recomendable.
Una vez que los comentarios de los revisores hayan sido atendidos, es de esperar que el
editor deje la puerta abierta para el reenvo del manuscrito. Esto debera realizarse tan rpido
como sea posible. La mayora de las revistas tienen un lmite de tiempo tal que luego de 6 o
12 meses, un artculo reenviado es tratado como un nuevo envo y atraviesa una nueva revisin independiente. An un reenvo en tiempo no es necesariamente devuelto a los rbitros
originales. El editor tiene la potestad de solicitar a los rbitros originales o a nuevos rbitros,
la revisin del manuscrito ya revisado.
[ 43 ]

El reenvo debera ser acompaado por una carta. Cada punto debera ser tratado por separado, elegante y claramente. Si existiera un desacuerdo con uno o ms de los comentarios realizados por los rbitros, las razones deberan ser explicadas. Por otra parte, las crticas vlidas
deberan ser aceptadas con reconocimiento y atendidas, sealndose los cambios realizados.
Una vez que el artculo es aceptado, el paso final implica la revisin de las pruebas de
galera previas a la publicacin. Las pruebas de galera estn compuestas en su aspecto final.
Los encargados de la publicacin slo permiten correcciones menores, en general para salvar
errores en el deletreo o la puntuacin. El agregado de frases o los cambios mayores resultan
engorrosos para el proceso y estn fuertemente desaconsejados, cuando no prohibidos. Una
respuesta rpida a este punto es tambin mandatoria porque el artculo se halla en camino a
una prxima publicacin, con tiempos estrictos, de modo que los retrasos no son tolerados.
Tambin en esta instancia, al autor le es tpicamente requerido firmar la transferencia de los
derechos de autor (copyright) a favor del editor, y decidir si ordena reimpresiones (reprints)
adicionales del artculo. La mayora de los peridicos ofrecen un nmero limitado de reprints
en forma gratuita. Pueden haber costos por el agregado de fotografas en color, aunque esto
tambin vara segn los editores.
Finalmente el artculo aparece impreso y es tiempo de celebrar. Quiz entonces pueda considerarse el escribir otro artculo. Las preparaciones para el prximo artculo deberan comenzar
tempranamente, mientras la investigacin est an en marcha. La introduccin y la seccin mtodos pueden ser redactadas an antes que los resultados estn disponibles. En tanto la mayor
parte de la redaccin es realizada por un solo individuo, algunos manuscritos son preparados por
varios redactores, cada uno contribuyendo con una seccin. Esto requiere de un autor principal
que ser responsable de asegurar cierta uniformidad de estilo. Indudablemente, la experiencia de
haber escrito varios artculos facilita todo el proceso. Como ha sido mencionado anteriormente,
la experiencia de ser rbitro resulta una ayuda. Hay tambin talleres y cursos accesibles para
principiantes y para aqullos que desean mejorar sus capacidades para la redaccin de artculos.
Es de esperar que el lector haya sido estimulado y alentado por este captulo a involucrarse en la
escritura mdica y que sea recompensado por la satisfaccin que proviene de ver su trabajo en
forma impresa para beneficio de los colegas, en el presente y en el futuro.

Referencias
1. Seglen PO. Why the impact factor of journals should not be used for evaluating research.
BMJ 1997; 314: 497-502.
2. Nakayama T, Hirai N, Yamazaki S, Naito M. Adoption of structured abstracts by general medical journals and format for a structured abstract. J Med Libr Assoc. 2005; 93(2):
237242.
3. Provenzale JM, Stanley RJ. A systematic guide to reviewing a manuscript. Am J Roentgenol. 2005; 185(4): 848-854.

[ 44 ]

Captulo 4

La revista cientfica: criterios editoriales


para evaluacin de artculos mdicos


Enrique Fisman

Alexander Tenenbaum

a historia de los criterios editoriales para la evaluacin cientfica de las publicaciones mdicas se remonta a una reunin que tuvo lugar en Canad, unas tres dcadas
atrs. Un pequeo grupo de editores de revistas mdicas generales se reunieron de manera informal en Vancouver, Columbia Britnica, en 1978, para establecer guas para el
formato de los manuscritos enviados a sus revistas. El grupo lleg a ser conocido como el
Grupo de Vancouver. Sus requisitos para los manuscritos, incluyendo los formatos de las
referencias bibliogrficas, desarrollados y adaptados mas tarde por la Biblioteca Nacional de Medicina de los Estados Unidos, fueron publicados por primera vez en 1979.1 El
Grupo de Vancouver se ampli y evolucion hasta convertirse en el Comit Internacional
de Editores de Revistas Mdicas (International Committee of Medical Journals Editors
- ICMJE). Con el transcurso del tiempo el ICMJE ha ampliado gradualmente sus atribuciones y mbito de incumbencia. El mismo dej de ser meramente tcnico, incluyendo y
centrndose en la actualidad en los principios ticos relacionados con la publicacin en
revistas biomdicas.
Aunque las primeras revistas cientficas datan de la primera mitad del siglo XVII, el
comienzo oficial del proceso de arbitraje se dio inici mas de un siglo despus, cuando en
1753 la Royal Society of London tom la responsabilidad formal de evaluar los textos recibidos para publicacin. 2 La necesidad de organizar y seleccionar el material que luego sera
publicado, conllev el surgimiento de los dos actores principales en el proceso de evaluacin:
el editor cientfico, representado por el Secretario de la Sociedad encargado de organizar la
revista, y los evaluadores, representados por el Consejo de la Sociedad. La difusin masiva
de esta prctica se produjo a partir de la segunda mitad siglo XX, despus de la II Guerra
Mundial, debido al enorme crecimiento del nmero de investigaciones, a la fragmentacin de
la ciencia en subdisciplinas y al desarrollo de terminologas especficas. 3
As surgi el embrin del sistema de evaluacin de la produccin cientfica por los miembros de la comunidad profesional especfica, identificado como sistema de arbitraje o de revisin por pares. El mismo implica el uso sistemtico de rbitros para determinar la aceptacin
o el rechazo de los manuscritos que aspiran ser publicados. Este sistema no surgi de forma
pronta y acabada. Como parte institucional integrante de la ciencia, ha ido evolucionando
como respuesta a los problemas concretos con que se enfrentan los cientficos en el proceso
[ 45 ]

de desarrollo de la investigacin y como subproducto de la emergente organizacin societaria de los cientficos. La transformacin del manuscrito original, es decir el texto redactado
pero sin la competente evaluacin de los pares, en una publicacin, o sea en un manuscrito
legitimado por el resguardo de la valoracin crtica de los pares mediante la evaluacin institucionalizada y firmada por revisores competentes, se convierte as en una parte inseparable
del proceso cientfico.4,5
Nuestra modesta experiencia personal como editores comienza en el ao 2002. Como
cardilogos clnicos, nuestro inters se haba centrado en aos anteriores en investigar diversos aspectos de la interfaz entre diabetes y enfermedades cardiovasculares. La creciente relevancia del tema nos llev a pensar que sera importante fundar una revista especficamente
dedicada al mismo, y as naci Cardiovascular Diabetology.6
En cuanto a nosotros, nos vimos sbitamente ubicados del otro lado de la barricada.
De nuestro rol de autores, obvia y naturalmente ansiosos de ver publicados nuestros trabajos
(y preferentemente con rapidez y en revistas de buen nivel), pasamos al rol de editores, encargados de decidir que trabajos de nuestros colegas nos veremos obligados a rechazar, y cuales
sern publicados y en que condiciones. Describiremos a continuacin nuestra experiencia al
respecto. La misma comprende la concepcin acerca de la esencia de una revista cientfica y
los criterios que hemos adoptado o elaborado para cumplir nuestra tarea de editores.

La revista cientfica
Que es una revista cientfica? La UNESCO entiende a la revista como una publicacin
peridica que presenta especialmente artculos cientficos, escritos por autores diferentes, e
informacin de actualidad sobre investigacin y desarrollo de cualquier rea de la ciencia.
Tiene un nombre distintivo, se publica a intervalos regulares, por lo general varias veces al
ao, y cada entrega est numerada o fechada consecutivamente. Su componente bsico, el
artculo cientfico, es un escrito en prosa, de regular extensin, publicado como una contribucin al progreso de una determinada ciencia o arte.7 Bsicamente, la definicin de una
revista cientfica en general, y mdica en particular, est dada por su funcin y puede basarse
en los dos criterios estipulados por Greene,8 que establecen que las funciones de una revista
pueden resumirse como el doble propsito de servir de memoria de la ciencia y constituir, al
mismo tiempo, un medio de divulgacin de los resultados de la investigacin para la comunidad cientfica y para la sociedad. En ciertos casos, cuando se trata de revistas sumanente
prestigiosas, las mismas pueden establecer parmetros para la evaluacin de la produccin
cientfica de los investigadores y sus instituciones. En otros trminos, implementan criterios
de calidad para la programacin, realizacin y divulgacin de la investigacin.
Los autores, revisores y editores constituyen el tro imprescindible para el funcionamiento
adecuado de una revista cientfica. El editor es el responsable de mantener la calidad de la revista. Su obligacin principal es garantizar que los manuscritos que aspiran a ser publicados sean
evaluados de la forma correcta, es decir con total objetividad, sin interferencias y sin ningn
tipo de prejuicio a favor o en contra de la aceptacin de determinado artculo. El editor no debe
escoger a los revisores para obtener resultados preconcebidos. Adems de su responsabilidad
[ 46 ]

final en la toma de decisin, el editor debe ser una especie de mediador entre los autores y los
revisores fomentando as una mayor comunicacin e interaccin entre los mismos.
Actualmente, en el aspecto prctico, una revista cientfica moderna debe cumplir con
una serie de requerimientos profesionales y tcnicos para poder ser considerada como tal.
1. Poseer un ISSN (International Standard Serial Number- Nmero Internacional Normalizado de Publicaciones Seriadas), que es el cdigo internacional de identificacin de las
publicaciones seriadas (revistas, peridicos, boletines, anuarios, series de monografas, etc.).
El ISSN est constituido por los caracteres ISSN seguidos de dos grupos de cuatro cifras
cada uno separados por un guin. Son asignadas secuencialmente, independientemente del
pas de origen y del idioma empleado por la revista. El nmero es otorgado por el International Centre for the Registration of Serial Publications, con sede en Pars, que acta bajo
los auspicios de la Organizacin de las Naciones Unidas para la Educacin, la Ciencia y la
Cultura (UNESCO).
2. Tener un Comit Editorial. El mismo debe estar integrado por personalidades de trayectoria cientfica reconocida, una especie de herederos de los miembros del Consejo de la Royal
Society of London. Es importante que todos los miembros del Comit Editorial sean investigadores activos, pues queda implcito que slo los mismos estn capacitados para evaluar, hacer
indicaciones, emitir opiniones y sugerir correcciones sobre el trabajo de sus colegas. La funcin
de este comit es crucial, porque, an en el caso de revistas altamente especializadas, los editores no necesariamente estn siempre en condiciones de poder establecer claramente y sin riesgo
de equivocacin, la naturaleza del aporte cientfico de un trabajo dado. Los miembros del comit que actan como revisores generan, en franca colaboracin con los editores, un proceso
dinmico de intercambio de ideas, un fructfero dilogo con autores.
3. Tener un editor o grupo de editores. Continuando la comparacin hecha en el punto
anterior, ellos seran los herederos del Secretario de la Royal Society of London. En consecuencia, se ocupan de los aspectos acadmicos y usualmente estn asociados a Universidades
y Centros de Investigacin. Los editores no deberan ejercer actividades relacionadas con la
administracin, produccin o distribucin de la revista.
4. Tener una entidad editora (publisher) de ndole acadmica o comercial, encargada
de las cuestiones administrativas y financieras destinadas a procurar los recursos econmicos
para garantizar la publicacin regular de la revista.
5. Poseer un sitio en Internet (URL Uniform Resource Location) que permita el acceso
al texto completo de los artculos publicados, en caso de que la revista opte por la poltica
de acceso abierto a la informacin o, en caso contrario, al menos a los resmenes de dichos
artculos.
6. Tener direccin postal y electrnica e instalaciones que permitan rpida comunicacin
telefnica o va fax entre los editores por una parte y los autores, miembros del Comit Editorial y revisores externos por la otra.
7. La cobertura temtica de la revista y sus especficas reas de inters deben estar claramente mencionadas.
8. Tener tabla de contenido que permita localizar a un autor o tema especficos y leer los
resmenes de todos los artculos.
[ 47 ]

9. Dar explcitamente la afiliacin institucional de la revista y de sus editores responsables.


10. Estar indexada en bases de datos que contengan un subrogante de la fuente primaria
que permita localizarla. Estas bases estn esencialmente representadas por las de temtica
general de la Biblioteca Nacional de Medicina de los Estados Unidos (PubMed y su complementaria Medline) y Scirus, y por las ms especficas Orphanet, Clinical Trials, Genetic and
Rare Disease Information Centre y numerosas ms.
11. Tener la numeracin de los fascculos. La misma debe ser correlativa y no debe confundirse con la numeracin del volumen.
12. Tener paginacin.
Los dos ltimos puntos son vlidos exclusivamente para las revistas que tienen tambin
versiones impresas. Las revistas electrnicas llevan solo nmero de volumen (usualmente
anual) y nmero de artculo, careciendo de fasciculacin y paginacin.
Finalmente, adems de los doce puntos mencionados, la obtencin de factor de impacto constituye una importante aspiracin de toda revista cientfica. El proceso suele llevar
varios aos, y no siempre es coronado por el xito. El factor de impacto es un ndice bibliomtrico que empez a ser considerado como instrumento de evaluacin de las publicaciones cientficas a partir de la dcada del 60 por Eugene Garfield,9 director del Institute for
Scientific Information (ISI) en esa poca. Fue concebido como forma de clasificar y evaluar
las revistas incluidas en la base. Slo las publicaciones indexadas en el ISI son consideradas
para el clculo del factor de impacto que es realizado mediante la divisin del nmero de
veces en que los artculos de una revista son citados en un ao determinado en revistas indexadas por el ISI, por el nmero de estudios publicados por la revista durante los dos aos
anteriores.10 El motivo de coger dos aos es que es el tiempo promedio a partir del cual se
calcula que un trabajo circula plenamente en la comunidad cientfica y puede ser utilizado
y citado.11

El proceso de decisin
Cual es el proceso de decisin que lleva a la publicacin de un artculo cientfico? Para
efectuar la evaluacin del mismo utilizamos un modelo que contiene preguntas especficas
que sirven de base para determinar su posible aceptacin. Deben considerarse dos aspectos:
el contenido y la estructura. En cuanto al contenido, las preguntas del modelo esencialmente
se refieren a: a) originalidad de la contribucin; b) la importancia del artculo en su rea; c)
empleo de la metodologa adecuada; d) validez de los mtodos estadsticos utilizados. En
cuanto a la estructura, debe examinarse: e) la precisin idiomtica; f) el respeto a la forma
de presentacin clsica de un artculo mdico (introduccin, material y mtodo, resultados,
discusin); g) la claridad de las tablas y figuras; h) la relevancia y actualizacin de las referencias bibliogrficas.
Si se utiliza una metodologa inapropiada no se est haciendo ciencia; los resultados carecern de todo valor. Por otra parte, presentan los datos reportados la calidad suficiente para
[ 48 ]

ser interpretados en contextos objetivos? Los resultados justifican las conclusiones obtenidas por los autores? Estas son preguntas que debemos formularnos frente a cada artculo.
Como norma practicamos la mencionada evaluacin dos veces. La primera, antes de
enviar el manuscrito a miembros del Comit Editorial y/o revisores externos (decidiendo en
la misma oportunidad a quienes solicitar la evaluacin externa del manuscrito, conforme a la
respectiva subespecialidad de los revisores), y la segunda, luego de haber recibido la opinin
de los mismos.
Luego de balancear todos los elementos implicados, se arriba a la decisin que puede ser:
a) rechazar el trabajo; b) publicarlo slo despus de revisiones mayores; c) publicarlo despus
de revisiones menores; d) publicarlo sin revisin. La decisin, una vez tomada, se comunica
inmediatamente a los autores, acompaada de los comentarios pertinentes de revisores y
editores.
Con respecto a este sistema de revisin por pares, debemos hacer algunas salvedades.
A pesar de su amplia difusin y aceptacin, que evidencian sus grandes ventajas, el sistema
sufri una serie de crticas, motivadas por las distorsiones de su uso. 3 Se ha destacado: a)
la propensin positiva o negativa a ciertos temas por parte de los revisores o editores que
puede introducir distorsiones adicionales a la publicacin, debido a conflictos de intereses
y/o enfrentamientos personales, intereses comerciales, etc; b) la evaluacin aumenta innecesariamente el tiempo entre la presentacin del manuscrito y su publicacin; c) es posible que
en la decisin intervengan elementos prejuiciados relativos a autores pertenecientes o supuestamente identificados con minoras tnicas, sexuales, ideolgicas, religiosas o nacionales.
Para hacer frente a estas posibles distorsiones, se han introducido diferentes mecanismos
y procedimientos a fin de evitarlas o minimizarlas. Se acostumbra solicitar declaraciones de
compromiso de los revisores; enviar cuestionarios con criterios orientadores para el anlisis;
utilizar un mayor nmero de rbitros; efectuar anlisis cruzados entre las recomendaciones
de los mismos a fin de posibilitar el control de unos sobre otros; garantizar a los autores la
posibilidad de responder o refutar los comentarios de los revisores por intermedio del editor,
quien debe as propiciar un dilogo respetuoso y profesional entre el autor y el evaluador.
Adems de estos requisitos, consideramos que es importante garantizar el carcter confidencial del proceso. Los grados de confidencialidad del sistema de arbitraje varan en las
diversas revistas desde los muy hermticos a los muy abiertos. En este ltimo caso, autores
y evaluadores se conocen; en el otro los rbitros son annimos y tambin desconocidos los
nombres de los autores. En la mayora de las ocasiones los evaluadores conocen a los evaluados, y es muy poco frecuente que ocurra lo contrario.4, 12 En nuestra revista6 hemos optado
por un sistema semicerrado, que suministra a los revisores el privilegio de no revelar su identidad, a menos que ellos mismos opten por hacerla pblica.
Finalmente, quisiramos mencionar uno de los problemas clsicos que suelen presentarse
en las revistas cientficas impresas. Se da el caso de un manuscrito que a pesar de su originalidad y de estar bien redactado, de sus objetivos claros y relevantes, de los mtodos adecuados,
del anlisis de los datos correcto, etc., no pueda ser aceptado para publicacin. Ello sucede por
haber sido clasificado por alguno de los revisores como de escasa prioridad. Este problema se
refiere al elevado costo de las pginas publicadas y existe en casi todas las revistas prestigiosas
internacionales. Sus consecuencias son frustrantes para los autores, para quienes entonces re[ 49 ]

sulta difcil o incluso imposible publicar trabajos meritorios. Estas dificultades y otras similares
irn desapareciendo a medida que los avances tecnolgicos induzcan a la mayora de las revistas a adoptar el modelo electrnico como vehculo principal de publicacin.

Referencias
1. The Vancouver style. Lancet 1979; 1(8113): 428-431.
2. Frederiksson BK (ed.). A century of science publishing. IOS Press, Omaha, Nebraska,
USA, 2001.
3. Spinak E. Diccionario enciclopdico de bibliometra, cienciometra e informetra. Caracas, Venezuela, UNESCO, 1996.
4. Pessanha C. Editorial criteria for the evaluation of scientific literature. Seminario sobre
Evaluacin de la Produccin Cientfica. Proyecto SciELO, So Paulo, Brasil, marzo 4-6,
1998.
5. Zuckerman HQ, Merton RK. Patterns of evaluation in science: institutionalization,
structure and functions of the referee system. Minerva 1971; 9(1): 66-100.
6. http://www.cardiab.com/
7. http://portal.unesco.org/
8. Greene JL. El dilema del editor de una revista biomdica: aceptar o no aceptar. Seminario sobre Evaluacin de la Produccin Cientfica. Proyecto SciELO, So Paulo, Brasil,
marzo 4-6, 1998.
9. http://www.garfield.library.upenn.edu/
10. Amin M, Mabe M. Impact factors: use and abuse. Perspectives in Publishing (Elsevier)
2000, 1: 1-6.
11. Benavent RA, Valderrama Zurin JC, Gonzlez de Dios J, de Granda Orive JI, MiguelDasit A. El factor de Impacto: Un polmico indicador de calidad cientfica. Rev Esp Econ
Salud 2004; 3: 5.
12. Jones AH, McLellan F (eds.). Ethical Issues in Biomedical Publication. The Johns Hopkins University Press; Baltimore, Maryland, USA, 2000.

[ 50 ]

Captulo 5

Qu es y como se elabora una monografa


cientfica?

Daniel Jos Pieiro

Quidquid discis, tibi discos (Aquello que aprendes, lo aprendes para ti)
Gaius o Titus Petronius Arbiter, Satyricon 46.8 (c. 27 d.C. - 66 d.C.)
se puede hacer una tesis digna, an hallndose en una situacin difcil, causada por
discriminaciones recientes o remotas. Se puede aprovechar la ocasin de la tesis (.) para
recuperar el sentido positivo y progresivo del estudio, no entendido como una cosecha de
nociones, sino como una elaboracin crtica de una experiencia, como adquisicin de una
capacidad buena para la vida futura para localizar los problemas, para afrontarlos con
mtodo, para exponerlos siguiendo ciertas tcnicas de comunicacin
Humberto Eco.
Cmo se hace una tesis. Tcnicas y procedimientos de estudio,
investigacin y escritura. Gedisa, Barcelona, 2001.

a elaboracin de una monografa cientfica es una tcnica pedaggica dentro del proceso de
aprendizaje en el rea cognoscitiva, que tiene por objeto estimular el pensamiento crtico.
Este trabajo intelectual requiere el empleo de un sistema cientficamente organizado (mtodo),
de desarrollo progresivo, que permite al alumno profundizar un tema y ejercitar una tcnica,
que ofrece un resultado concreto (el informe) y que facilita una evaluacin objetiva.

Definicin
Una monografa (mono: uno; grapho: escribir) es un trabajo cientfico escrito, producto
de la investigacin bibliogrfica, que estudia en forma exhaustiva un tema (problema) claramente delimitado, que lo desarrolla en forma lgica, y cuyo objetivo final es transmitir el
resultado de la citada investigacin. El informe constituye un documento, resultado de esa
investigacin exploratoria, seria y amplia, que emplea como fuente la bibliografa y como
mtodo la bsqueda y el anlisis bibliogrfico.

Etapas para la realizacin de una monografa cientfica


Eleccin del tema
Planificacin
[ 51 ]

Bsqueda bibliogrfica
Tcnica de la bsqueda
Evaluacin, anlisis, interpretacin y sntesis de la bibliografa
Nueva bsqueda bibliogrfica
Redaccin del informe
1. Eleccin del tema
Para la eleccin del tema es aconsejable que ste responda a las preguntas que se efectan
a continuacin, con el fin de que quede indicado:
El tema es un problema cientfico?
Para qu realizar el trabajo? Porqu elegir ese tema y no otro?
Qu se espera obtener?
El tema es de inters prctico o terico para el autor y para la comunidad cardiolgica?
(Criterio de inters)
Se puede acceder a la informacin para la realizacin de la monografa? (Criterio de
viabilidad).
2. Planificacin
Cunto tiempo se emplear aproximadamente para ejecutar cada uno de los pasos de la
ejecucin de la monografa?
De qu bibliografa provisoria se dispone?
Cules sern los subtemas o epgrafes en que se va a dividir la monografa?
Planifique su trabajo con tiempo, slo esto le permitir hacer una lectura crtica de
la bibliografa y presentar un informe que muestre su capacidad de anlisis. Sea flexible
en la asignacin de los plazos para cumplir las diferentes etapas. Considere la posibilidad
de demoras o imprevistos. Se sugiere dividir el tiempo de la siguiente manera: bsqueda
bibliogrfica 20%, anlisis bibliogrfico 40%, elaboracin del informe 30%, ajustes
10%.
3. Bsqueda bibliogrfica
Proceso durante el cual se busca una respuesta al problema (tema) en trabajos cientficos
publicados en relacin con el mismo, accesibles al investigador.
Se consideran dos tipos de trabajo cientficos:
Tipo I, de verificacin indirecta (libros, manuales, normas, publicaciones peridicas de
revisin, revisiones, monografas).
Tipo II, artculos originales.
4. Tcnica de la bsqueda
En caso de revistas cientficas:
Listar todos lo autores, pero si el nmero excede los seis (6) escribir los seis seguidos de
et al. (sin comillas). Apellido de los autores seguidos por las iniciales de sus nombres sin necesidad de poner puntos. Los autores separados por coma, y punto despus del ltimo autor.
Nombre del trabajo cientfico y punto. Revista abreviada de acuerdo al Index Mdico Inter[ 52 ]

nacional, y seguido el ao, punto y coma, volumen, dos puntos, y nmero de pgina inicial y
final separados por un guin. Ejemplo:
Esper RJ, Nordaby RA, Vilarino JO, Paragano A, Cacharron JL, Machado RA. Endothelial dysfunction: a comprehensive appraisal. Cardiovasc Diabetol. 2006; 5:4-23.
En caso de libro, manual, norma o monografa:
Listar todos los autores, pero si el nmero excede los seis (6) escribir los seis seguidos de
et al. (sin comillas). Apellido del o los autores seguidos por las iniciales de sus nombres sin
poner puntos. Los autores separados por coma, y punto despus del ltimo autor. Ttulo del
captulo del libro y punto. La preposicin inglsa In y dos puntos, nombre del editor/es seguido por las iniciales del/los nombres, entre parntesis (Ed o Eds, segn corresponda), punto.
Ttulo del libro y punto. Ciudad de publicacin y coma, editorial y coma, ao de edicin y
coma, nmero de edicin si corresponde (ej: 5ta Ed) y dos puntos, pgina inicial y final del
captulo separados por guiones. Ejemplo:
Esper RJ, Vilario JO. La disfuncin endotelial. In: Esper RJ (Ed). Aterotrombosis en
el tercer milenio. Barcelona, Prous Science 2004: 49-83
Se accede a la informacin en forma directa o indirecta, mediante la solicitud de copias,
separatas u otros mtodos electrnicos (modem). Se clasifica provisionalmente el material
bibliogrfico consignado el tema, subtema al que corresponda de acuerdo a la organizacin
de la monografa proyectada en la planificacin.
Consulte con un bibliotecario, quien es un profesional especialmente dedicado al manejo
de la informacin bibliogrfica. Considere que la informacin generalmente est en una base
de datos. Recuerde que la cita que no se encuentra en una biblioteca puede encontrarse en
otra. Su bibliotecario puede indicarle en que biblioteca encontrar cada revista. Durante la
bsqueda, no distraiga su atencin con artculos que pueden ser de su inters pero que no se
relacionan con el tema de la monografa. Tenga presente que los artculos originales tienen
un valor cientfico mayor que los trabajos de verificacin indirecta. Dado que son escasas las
publicaciones nacionales que estn citadas en el Index Mdico o en las bases de datos comunes, consulte la bibliografa nacional, en particular la Revista Argentina de Cardiologa (Rev
Argent Cardiol).
5. Evaluacin, anlisis, interpretacin y sntesis de la bibliografa
Se lee el material de corrido y luego, en forma detenida, analizando y subrayando las
ideas principales y las secundarias, para lo que se aconseja usar colores distintos.
Se deben dividir los artculos con que se cuenta segn la importancia que tienen para la
redaccin de cada captulo de la monografa. Se evalan los aspectos formales y metodolgicos del trabajo. Se registra la informacin pertinente a la monografa en una ficha, mediante
un resumen. Se ordena en forma definitiva el material bibliogrfico, consignando tema y
subtema al que corresponda, de acuerdo a la organizacin de la monografa proyectada en
la planificacin.
[ 53 ]

Se analizan, evalan e interpretan las coincidencias y discordancias del material analizado, formulan opiniones propias, nuevas hiptesis y desarrollos futuros posibles y deseables.
Esta etapa de la realizacin de la monografa es la ms trascendente y creativa. Quizs usted
perciba que sus conocimientos sobre metodologa de la investigacin no son suficientes para
encarar con xito la tarea, probablemente sea el momento adecuado para estudiar alguno de
los textos, para consultar a los tutores de la monografa o para realizar algunos de los cursos
dedicados a esta disciplina.
6. Nueva bsqueda bibliogrfica
La realizacin de una segunda bsqueda bibliogrfica, luego de haber analizado toda
la informacin obtenida al comienzo del trabajo, permite un conocimiento ms profundo y
una actualizacin del tema elegido, teniendo en cuenta que para este momento ha pasado la
mayor parte del tiempo de la elaboracin de la monografa.
7. Redaccin del informe
Se redacta el informe como un documento cientfico, teniendo en cuenta el contenido y
la forma (Presentacin, ortografa, semntica, y sintaxis).
Las partes del informe son:
Portada
Introduccin
Material y mtodos
Resultados (en uno o ms captulos)
Discusin
Conclusiones
Bibliografa
Tablas, figuras
Agradecimiento
Cada una de las partes comienza en hoja aparte. Las pginas se numeran en forma correlativa en el ngulo superior o inferior derecho.
El trabajo se presenta redactado con espacio simple, aunque puede hacerse a doble espacio o 1 espacios, segn el deseo del redactor, con letras nmero 10-12, en papel blanco,
tamao carta; 219 x 279 mm, u 8 1/2x11, con mrgenes de por lo menos 30 mm en los
mrgenes superior e izquierdo, y 20 mm en el inferior y derecho, empleando una sola cara
del papel.
La portada consta de un encabezamiento con Ttulo, autor/es, ttulos cientficos de los
autores, centro/s en donde se realiz la monografa o donde se desempea/n el/los autores,
la universidad que avala el curso, direccin postal, incluidos telfonos y e-mail (si lo tuviere),
ao de realizacin.
La introduccin consiste en el planteo del tema elegido, los fundamentos para su eleccin, objetivos, inters y viabilidad del mismo, consideraciones sobre trabajos anteriores y
plan de la monografa.
En el material y mtodo se consigna la tcnica de la bsqueda y el anlisis bibliogrfico.
[ 54 ]

En particular, se describe la delimitacin del campo y el periodo investigado, los mtodos


de registro, el acceso a la informacin, el anlisis, evaluacin, interpretacin y sntesis de la
bibliografa y los problemas y limitaciones en la bsqueda y el anlisis.
En resultados se describen los datos obtenidos en la bsqueda bibliogrfica, desde la
resea histrica hasta los artculos ms actualizados.
En la discusin se analizan, evalan e interpretan las coincidencias y discrepancias encontradas en el material investigado. Se formulan opiniones propias, nuevas hiptesis y desarrollos futuros posibles y deseables.
En las conclusiones se expone, en forma sinttica, la respuesta actual ms completa y las
perspectivas a los problemas planteados en la introduccin.
La bibliografa se presenta numerando las citas en forma correlativa, siguiendo el orden
en que son mencionadas por primera vez en el texto. Las citas se identifican en el texto, tablas y pies con nmeros arbigos entre parntesis, o bien letras de superndice ms pequeas
al finalizar la oracin, despus de un punto. Cuando son dos o ms las citas se separan por
comas. Si son nmeros correlativos se indican el primero y el ltimo separados por un guin.
Las citas se expresan siguiendo los criterios expuestos en el tem 4.
Las tablas y figuras se presentan insertadas en el texto, con ttulo y notas al pie. Las
tablas se identifican en el texto con nmeros romanos precedidos por la palabra tabla, y las
figuras con nmeros arbigos precedidos por la expresin Fig. entre parntesis, al finalizar
la oracin, despus del punto. Las tablas y figuras se numeran en forma independiente y correlativa, siguiendo el orden en que son mencionados por primera vez en el texto. Cuando se
emplea una abreviatura en una tabla o figura, sta debe explicitarse con el trmino o expresin completos en la nota al pie, salvo que se trate de abreviaturas aceptadas universalmente
como una unidad de medida comn del Sistema Internacional de Unidades.
Al final de la monografa se puede agregar una parte de agradecimientos (si correspondiere) por la colaboracin institucional, ayuda tcnica, colaboracin intelectual o apoyo
financiero o material si hubiera existido.
Emplee un lenguaje claro, sencillo, conciso, exacto y preciso. Utilice, en general, la tercera persona singular o plural del presente del indicativo. Cuando emplee por primera vez una
abreviatura, sta debe ir precedida del trmino o expresin completos, salvo que se trate de
una unidad de medida comn. Exprese las unidades de medida de acuerdo al Sistema Internacional de Unidades (SI). (en francs: http://www.bipm.fr/fr/si/; en espaol: http://edison.upc.
edu/units/SIcas.html; en ingls: http://physics.nist.gov/cuu/Units/)
Una vez concluida la redaccin de la monografa, entrguela a un lego para ver si la
entiende. Si la entiende, est bien redactada. Entonces, vuelva a escribirla empleando la mitad
de las palabras.
Recuerde que la presentacin de la monografa es la culminacin de una ardua tarea y debe ser digna del esfuerzo que usted realiz durante el proceso del elaboracin de la misma.

[ 55 ]

Referencias
1. Qu es una monografa? http://www.sagg.org.ar/docs/monografia.doc. (consulta: 23
de junio de 2007)
2. Aramburu EJ. Gua para la confeccin de la monografa. http://www.geocities.com/enriquearamburu/ETE/guia.html (consulta: 23 de junio de 2007)
3. Cassany D. La cocina de la escritura, Barcelona, Anagrama, 1995.
4. Cichanowski E. Pautas para la monografa. http://www.mailxmail.com/curso/vida/pautasmonografia. (consulta: 23 de junio de 2007)
5. Cmo realizar una monografa. http://www.exactas.unlpam.edu.ar/academica/carreras/
enfermeria/documentacion/comorealizarunaMONOGRAF%CDAII.PDF. (consulta: 23
de junio de 2007)
6. Diccionario de la Lengua Espaola de la Real Academia Espaola 22. Edicin. http://
www.rae.es (consulta: 23 de junio de 2007)
7. Eco U. Cmo se hace una tesis. Tcnicas y procedimientos de estudio, investigacin y
escritura, Barcelona, Gedisa, 2001.
8. Entrez PubMed. http://www.ncbi.nlm.nih.gov/sites/entrez?db=pubmed. (consulta: 23 de
junio de 2007).
9. Harvey G. Cmo se citan las fuentes. Madrid, Nuer, 2001.
10. http://en.wikipedia.org/wiki/Monograph. (consulta: 23 de junio de 2007)
11. International Committee of Medical Journal Editors Uniform Requirements for Manuscripts Submitted to Biomedical Journals: Sample References. http://www.nlm.nih.gov/
bsd/uniform_requirements.html. (consulta: 23 de junio de 2007).
12. International Committee of Medical Journal Editors. Uniform Requirements for Manuscripts Submitted to Biomedical Journals: Writing and Editing for Biomedical Publication
(Updated February 2006). http://www.icmje.org/. (consulta: 23 de junio de 2007)
13. La Monografa. http://www.bibliotecasvirtuales.com/biblioteca/Articulos/monografia.
asp .(consulta: 23 de junio de 2007)
14. Le Systme international dunits (SI). http://www.bipm.fr/fr/si/. (consulta: 23 de junio
de 2007)
15. Nubiola J El taller de la filosofa. Una introduccin a la escritura filosfica. Pamplona,
Eunsa, 1999.
16. Pieiro D. Qu es y cmo se elabora una monografa cientfica? SAC Informa. Diciembre 1994 - Enero 1995:18-20.
17. Requisitos de Uniformidad para Manuscritos Presentados a Revistas Biomdicas. (Estilo
Vancouver). http://www.um.es/eglobal/normas/vancouver.pdf (consulta: 23 de junio de
2007).
18. Roldn AF. Cmo hacer una monografa. http://www.fiet.com.ar/articulo/monografia_
roldan.doc (consulta: 23 de junio de 2007)
19. Sistema internacional de unidades. Versin en castellano para Espaa. http://edison.upc.
edu/units/SIcas.html. (consulta: 23 de junio de 2007)
20. The NIST Reference on Contstants, Units, and Uncertainty. http://physics.nist.gov/cuu/
Units/. (consulta: 23 de junio de 2007)
[ 56 ]

21. Torregrosa M. Cmo se hace una tesis doctoral. http://www.unav.es/gep/Metodologia/


TesisDoctoral.html. (consulta: 23 de junio de 2007)
22. Torregrosa M. Metodologa de la investigacin. http://www.unav.es/gep/Metodologia/
PaginaPrincipal.html. (consulta: 23 de junio de 2007)
23. Uniform requirements for manuscripts submitted to biomedical journals. International
Committee of Medical Journal Editors. N Engl J Med. 1997 Jan 23;336(4):309-15.
24. Vanni MJ. Qu es una monografa? http://www.monografias.com/trabajos7/mono/mono.shtml (consulta: 23 de junio de 2007).

[ 57 ]

Captulo 6

Qu es un trabajo de Tesis de Doctorado?

Roberto Ernesto Pedro Sica

Introduccin
Escribir un captulo en el que pretendo decir qu es un trabajo de tesis de doctorado, cmo
se lo enfoca y cmo se lo lleva adelante no es una tarea sencilla para alguien que est familiarizado con solo una muy pequea parte del conocimiento, como es mi caso. Es ello una limitante
de importancia, puesto que una tesis de doctorado puede versar sobre cualquier aspecto del
saber. Las diversas formas del conocimiento hacen que existan particularidades para cada una
de ellas que condicionan, al menos parcialmente, la modalidad que adoptar el trabajo.
Sin duda, una tesis que versara sobre un momento dado de la historia argentina, por ejemplo
el estudio de las razones que hicieron que San Martn regresase al Ro de la Plata, diferir en su
elaboracin de otra que trate, digamos, el efecto del RNA de interferencia sobre el RNA mensajero que induce la elaboracin de la protena huntingtina. La primera ser una labor de investigacin retrospectiva que se basar en el anlisis de los documentos que puedan existir en relacin
a aquel episodio, en tanto que la segunda se constituir en un estudio prospectivo que emplear
una tcnica establecida y que necesitar del anlisis matemtico-estadstico para la valoracin
de sus resultados. Igual podra decirse de otros temas, como, por ejemplo, las causas ambientales
que llevaron a la aparicin de la msica barroca o cul ser la variacin de la rbita de la tierra
dentro de diez mil aos, prediccin que, tal vez, pueda hacerse sabiendo del comportamiento
de ese fenmeno hasta donde hoy se lo conoce; para resolver lo dicho con respecto a la msica
barroca ser necesario estudiar las costumbres, hbitos y cultura en general de la poblacin
europea, en particular la italiana, del siglo XVII sin olvidar la extravagancia de otras muestras
artsticas que pudieron influir tambin y cuyas primeras manifestaciones aparecieron en Bizancio. Para lo segundo, ser imprescindible la confeccin de un clculo matemtico complejo lo
suficientemente convincente y abarcativo de todas las variables geofsicas, enmarcadas dentro
del sistema planetario en el que se inserta la tierra y en el que tambin se ponderen eventuales
fenmenos accidentales, tal como el impacto de un gran meteorito sobre su superficie.
De todas maneras, y aceptando las limitaciones que acabo de comentar, tratar de escribir las siguientes pginas de forma que puedan ser aplicables a la elaboracin de diferentes
tipos de tesis de doctorado, aunque, indudablemente, los prrafos que siguen estarn teidos
de mi impresin personal que, necesariamente, est condicionada por mi formacin en el rea
restringida del conocimiento que poseo.
[ 58 ]

Luego de entender cul es la debilidad de lo que dir a continuacin, el lector estar en


libertad para decidir continuar o no con la lectura de este captulo. Si no lo hiciere, estara
justificado. Ahora bien, si est decidido a seguir adelante iniciemos, pues, la labor.

Definicin de Tesis de Doctorado


Una tesis de doctorado es un trabajo artstico, humanstico o cientfico que introduce
conocimiento nuevo o modifica sustancialmente el existente en un rea determinada de la
Cultura, entendiendo por Cultura al conjunto del saber, cualquiera sea su ndole.
Puede argumentarse que la definicin dada arriba es aplicable a todo trabajo que sume
una novedad. Es cierto, cualquier investigacin que parta de una hiptesis y la demuestre
cierta es una tesis. Sin embargo, en el mbito universitario se considera tal al escrito que,
de manera pormenorizada y, habitualmente, extensa, conceptualiza un nuevo elemento del
saber.
La aceptacin de esto ltimo permite que su autor exponga en un nico manuscrito una
idea que fue, o es, la directriz de su pensamiento y que pudo, o puede, a lo largo del tiempo
que llev, o lleva, su investigacin haber producido un nmero de trabajos que, si bien se relacionan entre si a partir de la idea central, mantienen su independencia en tanto que analizan
distintos aspectos del mismo problema.

Cul es la razn o cules las razones que hacen que un graduado decida elaborar
un proyecto de tesis de doctorado?
La decisin de llevar adelante un proyecto de tesis de doctorado aparece en cualquier
graduado cuando convergen una serie de razones y circunstancias que naturalmente llevan a
adoptar esa actitud.
Las razones son de ndole variada, la que posiblemente tenga mayor valor es la conviccin del futuro doctorando de haber adquirido conocimiento profundo en relacin a un
aspecto determinado del saber y la suficiente madurez intelectual que le permite suponer que
est en condiciones de incrementar ese conocimiento dentro del rea de inters mediante el
desarrollo de una idea, diferente a todas las anteriores.
Esa idea puede, si su desarrollo resulta exitoso, tener dos efectos, uno de ellos es simplemente agregar nuevas nociones a las ya establecidas y la segunda modificar las concepciones
existentes, reorientando la investigacin.
Ambas actitudes son totalmente aceptables y, segn mi parecer, simtricas en cuanto a
su importancia.
La primera incrementa el saber en un aspecto determinado, en tanto que la segunda cambia el concepto existente hasta entonces; en los dos casos se produce una modificacin de la
realidad objetiva que pasa a ser parte del patrimonio cultural de la especie.
La adquisicin de una idea novedosa en un campo determinado no es casual habitualmente, aunque s es cierto que una circunstancia fortuita puede hacerla evidente en un momento
[ 59 ]

dado; sin embargo quien advierte la novedad debe poseer un caudal suficiente de conocimientos
que le posibiliten verla como tal. Esto es as puesto que no es posible reconocer como diferente
e indito a un fenmeno determinado si no se conoce todo lo previamente hecho en relacin a l
y si no se concluye que el nuevo concepto resulta el corolario actual de ese conocimiento.
La nueva idea puede aparecer como fruto de la meditacin y ser la consecuencia lgica
del razonamiento impuesto al fenmeno en estudio, es esta una actitud deductiva que fluye
armoniosamente en la mente del investigador y lo conduce a la obtencin de una nueva verdad que puede o no estar en acuerdo con lo sabido previamente.
Otra posibilidad es que el azar enfrente al investigador con una conducta insospechada
del fenmeno en estudio. En estas circunstancias, a igual que en la anterior, quien descubre
esa actitud del fenmeno necesariamente debe saber todo lo concerniente a l, puesto que de
otra manera no podra reconocer lo inadecuado de aquella conducta. Esa observacin induce
al investigador hacia la obtencin de una respuesta lgica a aquello que no lo parece y puede,
s, transformarse en la clave que le permita obtener una nocin diferente. Es esta una actitud
inductiva que obliga al observador a modificar todas o parte de sus concepciones previas en
relacin al fenmeno en cuestin en aras de hallar la explicacin que corresponde a la modificacin inesperada de la conducta de ese fenmeno, conducta que le esta sealando una
realidad previamente no sospechada pero, indudablemente, existente.
La segunda razn para llevar adelante un proyecto de tesis de doctorado es, habitualmente, la necesidad de crecimiento acadmico. En la obtencin de posiciones, dentro del mbito
universitario, el ttulo de Doctor adquiere trascendencia puesto que es el de mayor jerarqua
que otorga la Universidad.
Cuando se concibe a la Universidad como a la Institucin que alberga el conocimiento y
que es fuente de conocimiento, la adjudicacin del ttulo de Doctor de la Universidad seala
que ella reconoce en esa persona a alguien que posee la mayor informacin en una parcela
dada de ese conocimiento y que ha sido capaz de ampliarlo o modificarlo.
En ltima instancia reconoce en el Doctor a un exponente mayor de la Cultura, en tanto
se entienda por Cultura el atesoramiento del saber.
Por ello la Universidad supone que quien es Doctor est en las mejores condiciones
para transmitir conocimiento a las generaciones que le siguen y cumplir, de esa manera,
con una de las condiciones bsicas de la especie y que es la transferencia generacional del
saber.
Por esas razones es que quien completa el Doctorado posee ms posibilidades para acceder a cargos docentes jerarquizados y a posiciones de conduccin acadmica.

Qu es una tesis de Doctorado?


Una tesis de doctorado es la labor que significa la demostracin de un hecho no conocido
hasta entonces, e implica la concepcin previa de una hiptesis.
Por ello resultan inseparables los conceptos de hiptesis y tesis en la concrecin de esta
ltima.
[ 60 ]

La primera es una elucubracin terica acerca de la factibilidad de la produccin de un


fenmeno dado que deber surgir como consecuencia de una accin determinada y que est
en lnea con todo el conocimiento previo de ese fenmeno. En ltima instancia este tipo de
razonamiento responde a la lgica aristotlica y debe estar guiado por los mismos principios
que rigen la elaboracin de un silogismo; es, por tanto, un acto esencialmente deductivo. Su
valor es mayor, puesto que condicionar todo el trabajo ulterior. De all que la hiptesis debe
ser cuidadosamente pensada, discutida y contrastada con el conocimiento existente hasta entonces en la porcin del saber que se posee en el rea de la investigacin que se quiere ampliar
o modificar.
La tesis es el intento de demostracin de la hiptesis. Ello implica una labor extensa
que, en ocasiones, ocupa lapsos prolongados. Es esencial que la metodologa elegida para
llevar adelante el trabajo se adecue estrictamente al concepto de la hiptesis, tanto en lo
referente al diseo experimental como en lo que respecta al tipo de tratamiento matemtico
que ser dado a los resultados. La introduccin de desviaciones en uno u otro aspecto puede
conducir a errores insalvables capaces de torcer la investigacin, llevando a conclusiones
no verdaderas.

Cmo se construye un proyecto de tesis de doctorado?


El proyecto requiere varios captulos, aunque la totalidad del escrito no debe ser extremadamente extensa.
El captulo inicial es introductorio; en l el doctorando deber exponer sintticamente
el conocimiento existente hasta ese momento acerca del fenmeno que pretende estudiar;
tambin podr dar los lineamientos generales de su pensamiento personal en relacin con
aquel fenmeno. Documentar este aparte con la bibliografa que considere como la ms
representativa en cuestin.
El segundo captulo es la enunciacin de la hiptesis. Es este, tal vez, el aparte ms esencial del proyecto. La hiptesis debe ser cuidadosamente meditada y ajustada a los postulados
sealados antes.
El tercer captulo es la descripcin del material y del o de los mtodos que emplear durante el desarrollo de su trabajo.
Finalmente, construir la lista de las referencias bibliogrficas que haya citado en el
texto.

Cunto debe ser el tiempo de graduado para que quien est interesado presente el
proyecto de tesis?
El tema del proyecto de tesis de doctorado no aparece de manera casual, sino que es el resultado de la maduracin de una concepcin particular e individual que le permite a alguien
explicar un fenmeno dado. Logrado este propsito, quien interpreta podr suponer que el
[ 61 ]

conocimiento de ese fenmeno es incompleto o no resulta del todo claro, o que la concepcin
corriente que de l se tiene es errada. En cualquiera de estas tres situaciones es aceptable y
lcito que pretenda ya sea incrementar su conocimiento, ponerlo mas en claro o re-orientar
su concepcin; si esto es as le surgir una idea nueva que supondr que llevando adelante
una determinada accin el conocimiento del fenmeno adquirir caractersticas distintas a
las que tiene en ese momento; esta actitud lo conducir a la elaboracin de una hiptesis de
trabajo que se transformar en la base de su futura tesis.
Ahora bien, para que ello suceda, el futuro doctorando deber haber obtenido una larga
experiencia en el rea que le preocupa, adquisicin que, habitualmente, demanda varios aos
de labor en el tema, aos que conducen a que el fenmeno de inters se transforme en una de
sus vivencias. Por ello no es posible suponer que un proyecto de tesis de doctorado sea presentado por alguien recientemente graduado. El tiempo medio que transcurre usualmente entre
la graduacin y la presentacin del proyecto de tesis es de unos diez aos.
Ello implica, tambin, una edad determinada del doctorando que, idealmente, debera
estar entre los 35 y los 45 aos, poca de la vida en la que la maduracin, en todos sus aspectos, se ha completado y en la que la pujanza y persecucin de un objetivo dado tienen la mayor
fuerza.
Sin embargo, pueden existir excepciones a lo comentado en los prrafos precedentes. Puede
suceder que quien se transformar en doctorando sea parte de un equipo de investigacin al
que se haya integrado poco tiempo atrs y en el que cumpla, por ejemplo, el papel de becario,
trabajando sobre un tema que ha sido elegido por otros, habitualmente por su Director de Beca
o por el Jefe de la estructura en la que se desempea, y que ese tema se transforme en el su tesis
de doctorado.
Tambin puede suceder que alguien, con muchos ms de 10 aos de graduado se vea en la
necesidad de doctorarse para poder seguir adelante en su carrera, en este caso es probable que
seleccione un tema en el que ya haya trabajado y del que ya tenga resultados para construir su
tesis; esta ltima opcin transformar a la tesis en un trabajo retrospectivo y no prospectivo
como resultan todas las otras opciones.
Ninguna de las dos posibilidades que suponen los dos prrafos anteriores son las mejores, la primera porque la eleccin del tema puede no tener mayor relacin con la vocacin del
tesista y la segunda porque surge de la necesidad y no de la conviccin de que la tesis significa
una jerarquizacin acadmica que voluntariamente se quiere alcanzar.

Informacin bibliogrfica
Quien haya encontrado el tema que le servir para la confeccin de su tesis de doctorado,
luego de haber sorteado la etapa de elaboracin de la hiptesis, no deber suponer que la
informacin que posee de l es la totalidad de la existente.
La actitud mas razonable del futuro doctorando es creer que su conocimiento es parcial
y que pudo haber habido otro autor que, en circunstancias iguales a las suyas, haya podido
desarrollar ideas similares a las que l ahora tiene.
Esta ltima posibilidad, y la necesidad de conocer todo lo sabido con respecto a la materia
[ 62 ]

que tratar, obligarn al investigador a una exhaustiva y completa bsqueda de la bibliografa


referida al tema de inters y a su lectura. Esa tarea no solo enriquecer aun ms su conocimiento, sino que tambin le posibilitar una mejor apreciacin y comprensin de lo que pretende
hacer.
Dcadas atrs la labor referida arriba era gigantesca y, en oportunidades, abrumadora,
puesto que el futuro doctorando deba visitar un sinnmero de bibliotecas en las que le fuera
posible encontrar las revistas requeridas. Afortunadamente hoy ese trabajo est francamente
facilitado por la existencia de muy extensas bases bibliogrficas a las que el estudiante puede
acceder electrnicamente, mediante el uso de una computadora, desde su domicilio o desde
el laboratorio, hospital o cualquier otro tipo de institucin en la que trabaje. Esta modalidad
de adquisicin de informacin permite obtener, al menos, el resumen del trabajo que se busca;
en ocasiones es posible lograr la versin completa de l gratuitamente cuando la revista en el
que se ha publicado lo permite, en otras el requerimiento es el pago de la copia, un valor que
habitualmente es bastante oneroso.
Despus de finalizada la investigacin bibliogrfica es conveniente que el estudiante seleccione las citas que conciertan el mayor inters para su propsito y reconozca aquellas otras
de bajo o nulo valor. Habitualmente esta tarea necesita del asesoramiento de alguien con mayor experiencia; la intervencin, en este sentido, de quien dirigir su investigacin puede ser
de importante ayuda, puesto que contribuir a darle un sentido lgico secuencial a su lectura
y simultneamente, ahorrar tiempo y dinero.
Para mejor recordar es aconsejable que el estudiante elabore un sistema de fichas en las
que volcar el contenido de cada uno de los trabajos consultados, de manera resumida, y el
valor que le adjudica en relacin a su propsito; esto ltimo puede hacerlo empleando tarjetas
de colores diferentes, segn la importancia del escrito examinado, o dndoles un nmero que
identifique su importancia.
Un esquema de ficha posible es el que se sugiere a continuacin.
Calificacin del trabajo (color de tarjeta o valoracin numrica)

Ttulo del trabajo:

Autores:

Revista, ao de publicacin, volumen, nmero de pgina inicial-nmero de pgina
final:

Resumen (en el que se destaquen el mtodo empleado y los hallazgos bsicos de mayor importancia):
Posee relevancia, tambin, la bsqueda de revisiones que hubieran sido escritas en conexin con el tema. De igual forma tiene valor la consulta de libros relacionados. En ambos
casos su lectura puede dar una concepcin mas holstica del problema y ayudar al estudiante
a conceptualizar mas adecuadamente sus ideas.
Tambin para esto es conveniente que elabore fichas; en el caso de las revisiones puede
servirle la desarrollada arriba agregando solo la palabra revisin entre parntesis luego de
Ttulo del trabajo. En el caso de que se tratare de un libro el tipo de ficha deber cambiar
adoptando un modelo que puede ser as:
[ 63 ]

Titulo del libro:


Ttulo del captulo de inters:
Autor(es) del captulo:
Editor(es) del libro:
Ao de edicin:
Ciudad(es) en la(s) que fue editado:
Editorial:
Nmero de pgina inicial-nmero de pgina final:
Resumen (en el que consten los conceptos de mayor valor en relacin al tema de inters):

Idiomas
En muchos casos la literatura relacionada con el tema en cuestin est escrita en un idioma
que no es el materno del estudiante. Hoy, el idioma de las Ciencias es el Ingls, as como lo fue el
Latn, centurias atrs, para prcticamente todo el conocimiento. Mas an, el Ingls es el idioma
de intercambio epistolar entre quienes desarrollan una misma actividad y hablan lenguas diferentes, y lo mismo sucede en todas las reuniones internacionales de cualquier ndole en las que
las presentaciones orales o escritas, a igual que su discusin, se hacen en esa lengua.
Por ello es imprescindible que el doctorando tenga un adecuado manejo del Ingls de
forma que le permita acceder a toda la literatura escrita en ese idioma. Si bien lo ideal sera
que lo hablase y leyese fluidamente, para la finalidad de su trabajo de tesis es, habitualmente,
suficiente poseer capacidad para su lectura. No resultara as si el estudiante decidiera visitar
laboratorios extranjeros, ubicados en cualquier pas en el que su idioma materno no se hable,
puesto que lo usual es que la comunicacin entre los integrantes de esos laboratorios y sus
visitantes se haga en Ingls.
Es cierto que existen trabajos de valor escritos en otros idiomas; entre ellos el Castellano,
el Alemn, el Japons, el Portugus y el Francs. Sin embargo, todos ellos, casi sin excepcin,
poseen un resumen en Ingls que le permitir al doctorando entender su importancia. Si ese
valor fuese maysculo para la mejor concrecin de la labor en la que est empeado, no le
quedar otro camino que pedir su traduccin a alguien que sepa hacerlo.

Otras fuentes de informacin


Si bien es cierto que lo dicho en el apartado dedicado a la bibliografa tiene el mayor peso
en cuanto a la adquisicin de informacin, ello no excluye otras fuentes que puedan servir al
mismo objetivo.
Ellas son varias.
Es til que el doctorando concurra a reuniones cientficas, o relacionadas con la ndole
de su labor, en las que se discuta el tema de su inters u otros que pudieran estar conectados
con l. En esos encuentros el estudiante podr escuchar las opiniones de otros investigadores
[ 64 ]

con, tal vez, mas experiencia que la de l; podr hacer preguntas a esos investigadores, cuyas
respuestas pueden volver mas claras sus ideas; tendr, en oportunidades, ocasin de observar
prcticas de laboratorio, clnicas, semiolgicas u otras cuyo aprendizaje puede serle de ayuda,
y tendr la posibilidad, hablando con otros, de conocer las dificultades e inconvenientes que
pueda tener la puesta en marcha y desarrollo de un mtodo o de una tcnica dada.
En relacin a lo dicho al final del prrafo anterior es, sin duda, de la mayor utilidad que el
doctorando concurra a otros lugares en los que se trabaje en conexin con su tema de inters.
Estadas cortas, de entre uno y tres meses, en esos otros centros seguramente ampliarn la vivencia que tenga de su proyecto y, posiblemente, lo instruirn acerca de los detalles prcticos
del manejo del mtodo, o de los mtodos, que l mismo debe, o deber, emplear.
Es, tambin, valioso que acepte dar conferencias, participar en ateneos o llevar a delante
seminarios en los que hable del tema que lo ocupa. Ello contribuir a que mantenga actualizada su bibliografa. Puede suceder, tambin, que al preparar una disertacin o participar en
una discusin aparezcan nuevas ideas hasta entonces no previstas.

Importancia de la redaccin
La redaccin del trabajo de tesis de doctorado debe ser hecha en el mejor idioma posible.
Para el caso nuestro, el Castellano que se emplee debe ser absolutamente correcto.
El doctorando cuidar que los tiempos de verbo sean los adecuados al prrafo que est
escribiendo.
Tambin debe ser precisa la puntuacin.
Es conveniente utilizar prrafos cortos.
Es importante el uso de sinnimos que eviten la repeticin de sustantivos y verbos, ello
hace que la lectura sea ms amena.
No debe ser redundante en sus dichos y no debe insistir en una nocin determinada ms
all de lo necesario.
Puede emplear abreviaturas. Cuando lo haga por primera vez, y ellas no sean de uso cotidiano, es menester que las preceda por las palabras completas que esa sigla supone; en esta
primera introduccin la abreviatura ir entre parntesis, por ejemplo Organizacin Mundial
de la Salud (OMS), luego, en lo que sigue del texto, podr usarla sin enmarcarla por parntesis.
En mi criterio resulta prctico que el doctorando exhiba en una pgina, que est situada
al comienzo del escrito principal, todas las abreviaturas que emplear en el texto junto a su
significado. Por supuesto que esto no es necesario para aquellas de uso universal como, por
ejemplo, las relacionadas con el sistema mtrico decimal.
Es conveniente insistir en la redaccin correcta del manuscrito, puesto que cuando no es
as se hace incomprensible, laboriosa, tediosa y frustrante su lectura.
Si bien la tesis de doctorado, en el caso de las Ciencias, es un trabajo cientfico, su desarrollo es algo mas suelto, por decirlo de alguna manera, que el que corresponde a un escrito
enviado a una revista. Es conveniente que la construccin de la tesis de doctorado tenga
algn parecido con una novela, de forma que quien la redacte pueda hacer que el lector
[ 65 ]

transcurra por ella siguiendo los pasos y el razonamiento que conducen a la conclusin de
manera distendida, hacer que el escrito evolucione de un concepto al otro naturalmente,
que no encuentre razonamientos forzados, que no resulte imprescindible volver atrs con
frecuencia para poder entender el prrafo bajo anlisis, que fcilmente pueda acceder a
la comprensin de una abreviatura; en sntesis, que su lectura resulte agradable, fluida y
placentera.
Es experiencia corriente hoy para muchos de quienes juzgan los trabajos de tesis de doctorado que, lamentablemente, existe una buena proporcin de tesistas que emplean un pobre
Espaol, a pesar de que nuestro idioma es el segundo en riqueza de vocablos despus del Alemn. Creo que esto no es anecdtico, sino un defecto grave, sobretodo si se tiene en cuenta
que la falta de recursos idiomticos condiciona la falta o mezquindad de ideas. La razn para
que esto ocurra est en el bajo apetito, que tiene gran parte de los jvenes de hoy dedicados a
las Ciencias, para la lectura de literatura no tcnica. Este defecto nace en la escuela primaria,
no es atendido adecuadamente en la secundaria, y pierde toda posibilidad de solucin en
la Universidad o, al menos, en las facultades ligadas a la enseanza tcnico-cientfica. Probablemente lo que sucede es que la imagen est reemplazando a la palabra, acontecimiento
til cuando se trata de aprender hechos concretos, pero un obstculo para cuando tratan de
relacionarse fenmenos entre si, para lo que es indispensable emplear palabras, emplear la
capacidad de abstraccin y crear ideas.
Otro aspecto que merece ser citado es la abundancia de anglicismos en los textos de las
tesis de doctorado cientfico-tcnicas. Ello es consecuencia del uso de palabras inglsas en el
lenguaje comn de la Ciencia; esto explica su empleo, pero no lo justifica ya que para cada
uno de los vocablos inglses que se utilicen existe una traduccin acorde en Castellano.
Lo dicho arriba hace aconsejable que quien decida embarcarse en un trabajo de tesis de
doctorado posea un lenguaje lo suficientemente rico que le permita expresar sus conceptos
con precisin y claridad. Para ello deber tener una formacin cultural ms extendida que la
que provee el mero asunto tcnico-cientfico en el que trabaja.

Estructura de la Tesis de Doctorado


Luego de haberme referido, en los prrafos anteriores, a los lineamientos generales que
debe respetar un trabajo de tesis de doctorado, quiero, ahora, dedicar el resto de este escrito
a la descripcin de los pasos que debe seguir un proyecto de este tipo.
a) Nacimiento de la idea. Observacin.
Quien decida emprender un proyecto de tesis de doctorado deber ser alguien con alta
capacidad de observacin, tambin de sntesis, y poseer buena imaginacin cuya nica restriccin sea la argumentacin lgica.
Sin duda, reparar en el trabajo propio y en el ajeno y valorar los hechos en relacin a un
fenmeno dado es el primer paso que dar, aun inconscientemente, quien luego se transformar en tesista.
[ 66 ]

Esa observacin deber ser seguida por la sntesis del conocimiento del tema que llevar,
a quien sea el interesado, a concluir en que estado se encuentra el saber relacionado con ese
fenmeno o acontecimiento en ese momento. Llegado aqu, surgir la pregunta que inquirir
qu sucedera con el fenmeno o acontecimiento visto si tal o cual circunstancia se modificara. Es esta pregunta el embrin de la futura tesis.
b) Eleccin del Director
Logrado esto, el futuro tesista buscar a la persona que, con la mayor autoridad posible,
pueda orientar su investigacin. Seleccionar a su Director.
Esta persona, naturalmente, debe ser un idneo en el tema pero, adems de ello, debe
tener vocacin por la enseanza, amplitud de pensamiento, ser receptor de ideas novedosas,
apreciar su posibilidad de verosimilitud y alentar decididamente al investigador cuando ello
suceda o convencerlo de su error cuando ello ocurra.
Fuera de las caractersticas anteriores, quien dirija una tesis debe establecer con el doctorando una relacin de familiaridad que permita a este ltimo acercarse a l cada vez que
necesite de su consejo y ayuda.
El Director debe estar dispuesto a leer crticamente el manuscrito todas las veces que
fuere necesario hasta llegar a su redaccin final.
Debe, igualmente, analizar grficos, tablas y figuras sometindolas, igualmente, a la
crtica hasta que resulten convincentes.
Finalmente, debe cuidar que la bibliografa citada sea la correcta, que no se hayan soslayado trabajos que, eventualmente, pudieran contradecir las conclusiones de la tesis, sino
que hayan sido discutidos y refutados convenientemente. Debe asegurarse que toda cita que
est en el texto figure en la lista bibliogrfica y que en sta no haya citas que no hubiesen sido
incluidas en el texto.
c) Formulacin de la hiptesis
Discutida y aceptada, entre el tesista y el Director, la nueva idea, llega el tiempo de formular la hiptesis.
En prrafos anteriores he tratado de conceptualizar el trmino. Para decirlo de otra manera, bsicamente es entender que es posible introducir una idea diferente que incremente o
modifique el conocimiento de un fenmeno dado, de un hecho acaecido o de una construccin intelectual cualquiera.
Es claro, entonces, que la hiptesis es la consecuencia de la meditacin.
Volviendo a Aristteles, tres razonamientos son posibles; el analgico, que va de lo particular a lo particular; el inductivo, que va de lo particular a lo general y el deductivo, que va
de lo general a lo particular.
De los tres, el habitualmente empleado en Ciencia es el deductivo; es usual que a partir de
todo el saber que se posee acerca de un fenmeno dado sea posible obtener una informacin
novedosa, particular, ms cercanamente relacionada con el ser y el comportamiento de aquel
fenmeno.
[ 67 ]

Sin embargo, el mtodo inductivo es, tambin, aplicable a la Ciencia. No lo es usualmente en el trabajo cotidiano, aunque existen algunos ejemplos que muestran que ello es
factible; Mendeleiev, al elaborar la tabla peridica de los elementos dej espacios en blanco
sugiriendo que all encontraran lugar otros no conocidos entonces, es hoy realidad que
la tabla se ha completado llenando las expectativas de aquel fsico que supuso, o intuy,
la existencia de todos los elementos que componen la Naturaleza. En realidad, si por un
momento se atiende a como han surgido las leyes que gobiernan los fenmenos naturales, necesariamente se arriba a la conclusin de que se lo ha hecho de manera inductiva,
analizando fenmenos particulares que posibilitaron la universalizacin del concepto, es
decir que permitieron la generalizacin de ese conocimiento; vase, por ejemplo, la nocin
de gravedad, aplicable a la manzana que cay sobre la cabeza de Newton y, tambin, al
desplazamiento de sistemas estelares dentro de una galaxia. Es, en definitiva, el sueo de
matemticos y fsicos adquirir, en algn momento, y a partir de los conocimientos parciales
obtenidos, una ley general de la Naturaleza que permita explicar todos y cada uno de los
fenmenos que en Ella se dan; quizs resulte posible algn da; realizable o no, la idea es
muy atractiva.
Habitualmente la hiptesis es el corolario de una deduccin que emplea, como base del
razonamiento, al silogismo. Aceptando que es este el mecanismo de pensamiento que conduce a una determinada conclusin, que es la hiptesis, resulta absolutamente necesario que las
premisas sean verdaderas, para evitar construir una falacia.
El estudiante enunciar su hiptesis de forma que ella sea comprensible por otros idneos
en el tema y tendr que dar las razones que lo llevaron a la elaboracin de la propuesta.
d) Presentacin de los objetivos
Sin duda que el objetivo mayor del trabajo de tesis de doctorado es la demostracin de la
hiptesis.
Sin embargo, pueden, en el camino, fijarse otros objetivos menores en relacin a la magnitud del primero. Esos otros objetivos, que constituyen pasos necesarios en la consecucin
del de mayor valor, pueden ser nombrados en este aparte del proyecto y, llegada la ocasin,
descriptos con la extensin necesaria en el trabajo final.
La enumeracin de los objetivos menores o secundarios en el proyecto primero no invalida
la posibilidad de que el tesista encuentre otros datos novedosos, capaces de aparecer en el decurso de su labor, y que con ellos haga igual que con los que hubiere previsto inicialmente.
e) Materiales y Mtodos
Es este un captulo de la tesis de doctorado, tanto en el proyecto inaugural como en el
trabajo ltimo, que requiere la mayor atencin del estudiante y de su Director.
El material debe ser cuidadosamente seleccionado. En los trabajos en los que se utilicen
seres vivos, cualquiera sea la especie, el investigador deber individualizar pormenorizadamente las caractersticas que identifican al animal o al humano que emplear en sus experimentos, deber describir los controles que utilizar y propondr el nmero de sujetos que
[ 68 ]

integrar cada una de las muestras en las que se dividir el material. En relacin a este ltimo
aspecto ver que el total de individuos que forme cada muestra sea tal que permita efectuar
un clculo estadstico cuyos resultados sean convincentes.
Tanto en el empleo de animales de laboratorio como de humanos, el investigador deber
cuidar que el trato dado a ellos se ajuste a los postulados ticos vigentes, incluyendo el eventual sacrificio de los animales de laboratorio, si ello fuese pertinente a los fines de la investigacin. Por ello resultar imprescindible que cada proyecto posea el aval del Comit de tica
de la Institucin en la que la labor ser llevada a cabo.
En el caso en el que se convocaren humanos para la investigacin, cualquiera fuere el
procedimiento al que se les sometiere, el investigador deber obtener del interesado o de su
responsable mas cercano, cuando el directamente involucrado no estuviere en condiciones de
juzgar su participacin, el consentimiento expreso, firmado, en el que el sujeto de la experiencia, o su responsable, acepta ser parte del estudio. Para ello el investigador les informar
detalladamente el propsito de la experiencia, las eventuales incomodidades a las que puede
enfrentarse y los efectos indeseables que el estudio podra acarrearle. Tambin dejar taxativamente dicho que estar dispuesto a interrumpir la investigacin y liberar al participante si
ste lo solicitare; de igual manera, se comprometer a no dar a publicidad la identificacin de
las personas que accedieran al estudio.
Resulta respetuoso y recomendable que, cuando se tratare de humanos y una vez finalizada la investigacin, el responsable de ella informe a cada uno de los participantes, de manera individual, los resultados y conclusiones obtenidos en el estudio, empleando un lxico
que resulte comprensible para el interlocutor.
En lo que se refiere a los mtodos, tendrn que ser enunciados en el proyecto inicial y
exhaustivamente descriptos en el trabajo final; para cada uno de ellos se establecer su finalidad.
De esta forma, quien lea y juzgue el manuscrito de la tesis, podr hacerse una idea cabal
de los objetivos que ha perseguido el investigador al usar tal o cual procedimiento tcnico.
f) Tratamiento de los resultados
Este aspecto es clave en el desarrollo del trabajo. Resulta conveniente que el estudiante
conforme una base de datos con sus resultados; idealmente la disposicin que se les de a ellos
debera permitir el clculo en cualquier momento del desarrollo y, naturalmente, al concluir
la labor.
Existen hoy, comercialmente, muy diferentes esquemas de base de datos, para distintos
propsitos, que posibilitan el clculo y la graficacin de los resultados obtenidos; el tesista
debe seleccionar aquella que mejor se acomode a sus requerimientos. Tambin es posible que
el estudiante disee una base que abarque todas sus necesidades; para ello sus conocimientos
de programacin y computacin deben ser los adecuados.
Ordenados de la mejor manera que cupiere a los objetivos del estudio, el tesista elegir
el tipo de tratamiento matemtico-estadstico que les dar. Es por ello que su versacin en
Estadstica debe ser alta. Ello le posibilitar seleccionar el clculo que mejor muestre lo que
ha obtenido.
[ 69 ]

El tipo de tratamiento que se le dar a los resultados puede ser esbozado en la presentacin del proyecto inaugural y debe ser ampliamente justificado en el escrito final. No necesariamente la sugerencia hecha inicialmente debe coincidir exactamente con el tipo de clculo
que, en definitiva, se usar; es aceptable que el devenir de la investigacin modifique la concepcin previa y sea otro el clculo necesario que mejor se ajuste a los resultados.
Distinta es la actitud cuando el investigador trabaja de manera ciega, sin conocer si est o
no modificando las circunstancias con su intervencin y cul es el resultado que eso provoca.
Sucede esto en trabajos en los que se ensaya, por ejemplo, el efecto de un frmaco sobre una
patologa determinada, partiendo de la hiptesis que supone que la composicin molecular
de la droga en ensayo es capaz de interferir alguno de los pasos metablicos que llevan a la
instalacin de determinada dolencia. En estas circunstancias, el investigador se reunir con sus
resultados recin al finalizar la totalidad de la experiencia. Es ms, en este tipo de diseo experimental es conveniente que otra persona, ajena a la investigacin, sea quien haga el tratamiento
de lo observado.
g) Resultados
Es este el eje y el captulo mas importante del trabajo. Lo es porque los resultados son
tal como se muestran, no pueden modificarse a voluntad, son independientes de las ideas,
razonamientos, interpretaciones que de ellos se haga y sensaciones que ellos provoquen en
quien los ha logrado.
Los resultados son hechos permanentes, son parte de la realidad y parte de la verdad.
Las discusiones y conclusiones que induzcan pueden o no ser ciertas; sin embargo, nada de
ello los cambia.
Es la experiencia de todos que una observacin dada puede ser vista de una manera en un
momento determinado y de otra en alguna oportunidad siguiente. En Neurologa, una rama de
la Medicina Clnica, un ejemplo es el de la enfermedad denominada Miastenia Gravis, en ella
la reduccin de la amplitud del potencial de accin muscular evocado por el estmulo elctrico,
repetido a alta frecuencia, del nervio dirigido a un msculo determinado, fue tomado como
argumento para sostener el origen pre-sinptico de la dolencia, es decir de ubicacin en la terminal axnica de la fibra nerviosa que alcanza a las clulas musculares, concepto que se mantuvo
hasta los aos 60 y que sostena que aquella cada de amplitud era debida a disminucin o
alteracin molecular de la acetilcolina, que es el intermediario sinptico en la transmisin neuromuscular, y que se aloja en el nervio; en esa dcada se demostr cabalmente que la falla en la
transmisin neuromuscular era de origen post-sinptico, localizado en la clula muscular y no
en la terminal nerviosa, entendiendo, entonces, que el comportamiento referido del potencial
muscular era la consecuencia de la disminucin de receptores a la acetilcolina en el msculo; a
pesar de estos vaivenes en la interpretacin, la conducta del potencial muscular frente al estmulo elctrico repetido a frecuencia elevada permaneci inmutable.
Por ello los resultados deben exhibirse prolija y detalladamente, de manera objetiva
y clara, aceptando que si bien han logrado su existencia gracias al investigador, unas vez
aparecidos se independizan de l para pasar a formar parte del conocimiento, parte de la
Cultura.
[ 70 ]

No es aceptable que, al describir los resultados, el autor sugiera interpretaciones de ellos,


que deber guardar para la discusin. Tampoco es aceptable que condicione al lector diciendo
que tal o cual fenmeno muestra una determinada tendencia sin que ello est basado en valores estadsticos que lo sustenten. Cuando estas cosas suceden, el lector avezado comprende
que el autor, tal vez apasionado, est tratando de ver en sus resultados lo que desea ver y, por
tanto, ha perdido la objetividad. Es til recordar, aunque suene superfluo, que quien busca la
verdad tiene la obligacin de aceptar los hechos tales como son, a pesar de que muchas veces
ello contradiga sus expectativas iniciales.
La manera mas razonable de exhibir los resultados es empleando tablas, grficos y figuras, poniendo en ellas todos los datos necesarios como para que el lector est en condiciones
de repetir el clculo si as lo quisiere. Otra ventaja de la mostracin de tablas y grficos es
que cuando los nmeros son dados en el texto el lector los olvida rpidamente y su bsqueda,
cuando la lectura ha progresado ms all, se hace laboriosa; mucho mas sencillo es recurrir
a las tablas nuevamente.
De todas formas, el autor debe cuidar que el nmero de tablas, grficos y figuras que
presente no abrumen al lector. Ver como combinar datos, para que varios de ellos ingresen
en la misma tabla o grfico.
Nunca el autor repetir en el texto valores que ya estn graficados o en tablas, enviar al
lector a ellos cuando resultare necesario.
Las figuras, cuando existan, sern ejemplos representativos del fenmeno en estudio. En
lneas generales, unas pocas figuras bastan para que quien lee se forme una idea adecuada del
comportamiento del fenmeno en investigacin.
El autor reparar en que cada figura tenga un nmero y un ttulo, que cada grfico tambin
lo posea y que igual ocurra con las tablas. En el caso de los grficos y las figuras es usual que
exista una leyenda explicativa al pie. Si en cualquiera de los tres tipos de demostracin existieran abreviaturas no aclaradas previamente en el texto, ellas lo sern al pie de la mostracin.
h) Discusin
En este aparte el autor dar su interpretacin del comportamiento del fenmeno que ha
sido el objeto de su estudio.
Har esto en primer lugar; luego cotejar esa interpretacin con otras que pudieran existir en la literatura, destacando la originalidad de la suya. En el anlisis de la literatura deber
incluir tanto las ideas que fortifiquen su postura como aquellas otras que puedan debilitarla
o que, definitivamente, contradigan su posicin; buscar como refutar a estas ltimas, dando
razones convincentes para que pueda ser aceptado.
Finalizado este segmento de la discusin, el autor destacar su posicin intelectual frente
al hecho analizado y lo har tratando de enmarcar esa posicin dentro del conocimiento
corriente que del fenmeno se tuviere en ese momento.
En ningn caso volver a repetir lo que dijo en la introduccin al hablar de la literatura relacionada. Si fuera necesario citar parte de ella, enviar al lector a la pgina correspondiente.
Encontrar algo diferente y explicarlo es uno de los atributos privativos de nuestra especie.
Es de destacar que un nuevo conocimiento se universaliza inmediatamente, hace mayor nues[ 71 ]

tro saber y se transforma en Cultura. De esto debe tener conciencia el autor y si su conviccin
es que su interpretacin puede no ser lo suficientemente slida, debe dejar espacio como para
que ingresen visiones diferentes de sus resultados.
Dado que la discusin tiene cierta proporcin de subjetividad, es del todo aconsejable
que el tesista la someta al anlisis crtico de su Director antes de introducirla definitivamente en el texto. La crtica del Director deber ser frrea, tratando de poner en claro las
eventuales debilidades y contradicciones que pudieran tener los dichos del tesista. No es de
mala prctica pedir a otro investigador, fuera del Director, que lea el escrito y obtener de l
su impresin. Todo ello har que el autor redacte nuevamente la discusin; la nueva versin
deber seguir los pasos de la precedente y, as, hasta que tanto el autor como el Director
estn convencidos de haber obtenido un relato en el que los argumentos hayan logrado la
suficiente solidez que les permita ser aceptados por la comunidad universitaria en cuyo
mbito ser presentado.
Es, de todas formas, inteligente suponer que, con el avance de las ideas, la interpretacin dada a los resultados por el autor puede ser modificada por otros en el futuro; de
all que la propuesta que se haga deba ser presentada como una verdad relativa y, tal vez,
provisoria.
i) Conclusiones
Este aparte es, habitualmente, de corta extensin. Consiste en unos pocos prrafos en los
que se hace claro y preciso el nuevo hallazgo y su eventual valor en el desarrollo de las ideas
relacionadas con el tema en estudio.
El autor tendr presente que aunque lo encontrado sea del mayor aprecio, nunca es la
respuesta final al problema en el que esa observacin se inserta, solo un paso ms en la dilucidacin de su conocimiento.
j) Resumen
Esta pieza del escrito es de importancia y apela a la capacidad de sntesis del autor. En el
resumen deber decir, en pocas lneas, lo que resulta conceptual de todo lo dicho. La estructura del resumen deber ser idntica a la del manuscrito principal.
Su objetivo es dar al lector la idea central de la investigacin hecha, como fue concebida,
que herramientas se usaron para explorarla, cules fueron los resultados de mayor vala y a
qu conclusiones ellos condujeron.
No necesariamente este aparte debe ir al final del texto mayor, puede precederlo. Yo creo
que es mejor esto ltimo, puesto que quien lo lee sabr, anticipadamente, que es lo que le
aguarda en el resto del manuscrito.
k) Bibliografa
Es absolutamente imprescindible que toda la bibliografa citada integre la lista bibliogrfica.
[ 72 ]

Esa lista puede confeccionarse por abecedario, tomando el apellido del primer autor del
trabajo o captulo de libro o libro. Tambin puede hacrsela por orden de aparicin en el texto. Es preferible esta ltima modalidad, ya que hace ms suelta la lectura.
Es conveniente que, en el texto principal, la cita figure como el nmero que tiene en la
lista bibliogrfica. Ello es preferible a la insercin dentro del manuscrito mayor, entre parntesis, del nombre de los autores, ao, etc; esta forma de individualizacin bibliogrfica
entorpece la lectura, acta como un distractor y la vuelve laboriosa.
La forma de citacin seguir las normas internacionales para las publicaciones peridicas. El modelo de ficha sugerido arriba se ajusta a ello.
No deben incluirse en la lista citas que no hayan sido referidas en el texto principal.
l) Apndices
Hay autores que crean apndices para mostrar hechos que, usualmente, se conectan con
la idea central de manera tangencial. En general no agregan demasiado al pensamiento gua
del trabajo y lo que puedan aportar puede ser incluido en el escrito mayor.
En mi concepto, la mayor parte de las veces ellos son innecesarios. Ms aun, yo creo que
desvalorizan el trabajo. Resultan un esfuerzo adicional para el lector y pueden desviar la lnea
de pensamiento que sigue el escrito principal.
Creo que no es recomendable su introduccin en un trabajo de tesis de doctorado.
m) ndice
Es conveniente introducir un ndice en el que se detalle la ubicacin de cada uno de los
apartes o captulos de los que consta el escrito. Es aconsejable que sea lo mas analtico posible, de forma que en cada captulo figuren los distintos puntos que lo integran.
Es tambin conveniente que se lo exhiba en el comienzo del manuscrito; su lectura, a
igual que lo que sucede con el resumen, podr dar al lector una apreciacin general de las
pretensiones del autor.

Colofn
He tratado de dar las ideas y herramientas generales de lo que, creo, debe ser un trabajo
de tesis de doctorado.
Es cierto que mi experiencia est limitada a los escritos mdicos y biolgicos y que ello
constituye una restriccin de ideas de la que, lamentablemente, no puedo escapar.
Sin embargo, quizs, lo dicho a lo largo de este captulo pueda ser de utilidad, al menos
parcial, para cualquier estudiante dispuesto a emprender la denodada labor que implica llevar adelante un proyecto de tesis de doctorado.
Tal vez, quien lea estas pginas pueda adoptar algunos de los conceptos dados en beneficio de su tarea. Si me enterase de ello estara muy complacido.

[ 73 ]

Lecturas sugeridas
1. Alonso M. Ciencia del lenguaje y arte del estilo. 1953. Editorial Aguilar. 3 Edicin.
Madrid.
2. Eco U. Cmo se hace una tesis. 2006. Editorial Gedisa. 8 Edicin. Barcelona.
3. Fishbein M. Medical writing. 1957. Editorial McGraw-Hill Company. Nueva York.
4. Lasso de la Vega J. Cmo se hace una tesis doctoral. 1958. Editorial Mayfe. 2 Edicin.
Madrid.
5. Lejarraga H. Cmo confeccionar un proyecto de tesis. 2006. Curso Virtual. Facultad de
Medicina Virtual. Facultad de Medicina. UBA.
6. Moroney MJ. Facts from figures. 1960. Editorial Penguin Books. 3 Edicin. Londres.
7. Wikinski JA, Usubiaga JE, Hernndez HH. El trabajo cientfico. 1977. Editorial Diafrag. Buenos Aires

[ 74 ]

Captulo 7

La comunicacin oral de la investigacin


cientfica. Una herramienta para transmitir
conocimiento.


Ricardo J. Esper

Antonio Paragano

n los ambientes cientficos, los conocimientos se divulgan para buscar la verdad, y no


para imponer la verdad del investigador. Por lo tanto, deben presentarse de manera que
no estn influenciados por la subjetividad o emotividad del presentador ni con recursos que
puedan tergiversar la percepcin del auditorio. De esta forma, el oyente dispondr de condiciones adecuadas para analizar los conceptos de la manera ms ecunime posible, interpretar mejor los resultados y podr llegar a una discusin objetiva y ms provechosa al momento
de las conclusiones.
Por otra parte, con la globalizacin tecnolgica, los conocimientos universalmente aceptados por la comunidad cientfica suelen perder vigencia rpidamente, porque se actualizan
en forma vertiginosa e ininterrumpida. Adems, la difusin de la creciente cantidad de informacin implica un tiempo por dems excesivo para su exposicin, contingencia que obliga a
los oradores a emplear tiempos muy cortos y sin intervalos para su comunicacin. Esta forma
de presentacin acotada y sinttica puede no captar la atencin constante de los oyentes o
no despertar inters, y hasta fastidiar por lo rutinaria o montona. Es por ello que los expositores recurren a un sinnmero de tcnicas para proporcionar una comunicacin atractiva,
placentera y que cautive a la audiencia.
Sin embargo, un poema, ledo por dos poetas, puede llegar a enternecer en forma diferente. La misma partitura musical interpretada por dos directores de orquesta puede emocionar
de distinta manera. Hasta un canto gregoriano, entonado con mayor o menor pasin, puede
exaltar o deprimir a la audiencia. Los cientficos tienen personalidades dismiles, algunos
son extremadamente serios y circunspectos y otros espontneamente demostrativos. Unos se
expresan en voz baja y sin gesticular, otros modulan constantemente el volumen de su voz y
se mueven en el estrado con amplias excursiones de sus brazos y manos.
Todas estas consideraciones tienen por objeto hacer saber al lector que, a diferencia de
la presentacin escrita, no hay un estilo definido y universal para la comunicacin oral de un
logro cientfico. Entonces, cmo alcanzar el adecuado equilibrio entre la rigurosidad cientfica
y la presentacin amena y agradable? En otras palabras, cmo lograr el punto medio entre la
austera divulgacin del conocimiento, como se acostumbraba en los claustros universitarios a
comienzos de la edad moderna, y la magia de los espectculos musicales de Broadway?
[ 75 ]

La efectividad de una presentacin oral depende de la habilidad del orador para comunicarse con la audiencia. Cada aspecto de la presentacin debe orientarse a captar la atencin del espectador y facilitar la comprensin de la informacin expuesta. Este captulo se
enfocar en el proceso que conlleva la presentacin de los resultados de un trabajo o informe
cientfico, y en la forma de comunicarse eficazmente con la audiencia. Son pautas o consejos
para evitar caer en excesos o actitudes inadecuadas, intentado que las presentaciones tengan
cierta atmsfera de homogeneidad, facilitando el entendimiento y forjando el ambiente para
la discusin provechosa.

La comunicacin oral de la investigacin cientfica


Los pasos a seguir para la presentacin oral de los resultados se pueden dividir, en una
forma prctica, en cuatro fases: 1) la elaboracin del resumen, 2) la confeccin del material
grfico, 3) la presentacin formal, y 4) la discusin de los resultados obtenidos.
1. La elaboracin del Resumen
El material a presentar debe ajustarse exactamente al trabajo o informe cientfico original, pero como el tiempo de exposicin suele ser escaso, es conveniente elaborar un resumen.
Una regla prctica muy difundida es recordar que el resumen a presentar tiene que contener
todo lo que dice el trabajo, y el ttulo debe expresar todo lo que dice el resumen. Tenga en
cuenta que la lectura de una pgina tamao carta (21,59 cm x 27.94 cm, u 8 x 11) con
letras de tipo 12 y a doble espacio, requiere entre 3 y 4 minutos para su lectura, segn la velocidad del lector.
Deca Gracin que lo bueno, si breve, dos veces bueno. Una vez escrito el resumen a
presentar hgalo leer por alguien que no tenga relacin con el mismo, ni con su temtica o
especialidad. Si el lector lo entiende es porque es claro y est bien escrito. Entonces, vuelva a
escribirlo con la mitad de las palabras.
Se inicia con el ttulo, que se aconseja sea atrayente e interesante. Asumir que si concita
la atencin muchos escogern esa exposicin intrigados por la curiosidad que le despert el
ttulo.
Enumerar a los coautores, agregando a las personas que verdaderamente participaron en
su concepcin, e indicar el servicio, departamento, hospital o centro de referencia donde se
realiz el trabajo cientfico.
Comience con una breve resea que justifique la hiptesis de trabajo, luego enuncie los
objetivos de la investigacin, la metodologa utilizada, los resultados y las conclusiones. Considerando las limitaciones en el espacio y/o el tiempo para su presentacin, debe ser capaz
de transmitir la relevancia del problema y la razn del estudio en pocas palabras o lneas.
Exponga con precisin la hiptesis que pretende probar y describa claramente sus objetivos.
Un acpite importante es el correspondiente a material y mtodos. Debe contener informacin acerca del diseo, las caractersticas de la poblacin estudiada, las variables en
estudio, aspectos del proceso de recoleccin de datos y seguimiento, la estimacin del tamao de la muestra y la descripcin de la estadstica empleada. Probablemente, parte de esa
informacin no es prioritaria, y es lgico concentrarse en presentar slo los datos relevantes
[ 76 ]

y vinculados con el objetivo de la investigacin. Exponga fielmente la informacin que responde a la hiptesis y a los objetivos planteados o que ser utilizada en las conclusiones, y
debe hacerlo an cuando obrara en contra de la tesis inicial o no se obtuvieran valores con
significacin estadstica.
Finalmente, la conclusin debe ser concisa, reflexiva y respaldada por los resultados del
estudio. Comentar el o los elementos ms notables y sugerir recomendaciones. No aada
conclusiones que no se ajustan a los resultados, tampoco extenderlos a otras situaciones que
no son estrictamente las del estudio.
Atae al presentador establecer los puntos cruciales correctos, ya que las personas no
retendrn ms de unos pocos datos significativos, comunquelos eficazmente y lograr que
los oyentes consigan recordarlos. No pretenda que la audiencia decida qu es lo importante,
asegrese que ellos consideraran relevantes los mismos conceptos que usted. Una forma de
lograrlo es comenzar comentando las conclusiones de la ltima diapositiva, y enfatizar los
puntos esenciales para facilitar la presentacin. Cada palabra hablada, y cada palabra escrita
en las diapositivas debe ser importante y relacionada con los objetivos.
2. Medios visuales y material grfico
Un viejo dicho expresa que una imagen puede ms que mil palabras, y es una verdad
indiscutible. Para que la presentacin se desarrolle de manera didctica y prominente es
absolutamente vlido recurrir a los recursos tcnicos disponibles, como la proyeccin de
diapositivas, videos, pelculas u otro tipo de material, siempre y cuando se amolden a normas
de prudencia. En diversas encuestas se observ que una conferencia sin proyecciones habitualmente capta la atencin del 20% al 30% del auditorio, y asciende hasta un 75% cuando
se acompaa de material grfico o visual. Asimismo, el proyectar imgenes borrosas, con inadecuada combinacin de colores, desorganizadas e inclusive excesivas, conducen al fracaso
de la exposicin y hasta cuestionan la profesionalidad del presentador.
Rutinariamente las presentaciones actuales se almacenan en un CD o en una memoria
removible con terminal USB (llamados habitualmente pen-drive, memory-drive, thumbdrive, flash-drive, etc.) y simplifican el traslado del material al sitio de exposicin. Lo ideal,
cuando es posible, es copiar los datos en el disco duro, lo cual agiliza considerablemente
la presentacin. En muchas convenciones se pide que los archivos de clips sean enviados
electrnicamente antes de la reunin, en este caso asegrese llevar una copia de respaldo,
con un formato de medios de comunicacin que la computadora aceptar (CD, disquete,
USB flash drive, etc.). El manejo de los medios visuales puede realzar la calidad de una
presentacin, aunque la efectividad de cualquier presentacin no depende exclusivamente
de la calidad del material visual. La proyeccin de imgenes, cifras, frases o procedimientos
fija los conceptos con mayor claridad y refuerza e ilustra la informacin transmitida por
el orador.
La conferencia debe mantener el foco en la comunicacin de los objetivos y no desviarse especialmente hacia los efectos tecnolgicos. La habilidad del presentador para comunicarse con la audiencia puede conducir a presentaciones muy efectivas, a veces sin
disponer de medios visuales. Lo contrario no es verdadero, no importa cun sofisticados
son estos recursos, si un presentador hace un pobre trabajo al comunicarse con la audien[ 77 ]

cia, la presentacin se opacar. El empleo de la tecnologa puede ser un contratiempo en la


exhibicin, y suele ocurrir cuando el expositor no est completamente familiarizado con
su funcionamiento.
Ni el individuo ms experimentado es capaz de improvisar una presentacin en horas.
Prepare personalmente el material y con la debida antelacin, estime el nmero de diapositivas que puede necesitar y distribuya la informacin que quiere proporcionar en un nmero
razonable de ellas. Una buena regla es dedicar un mnimo de tiempo para cada diapositiva,
no mayor de un minuto, aunque esto puede ser variable. Piense en el tamao de la sala y la
audiencia posible, si no tiene un fondo establecido para sus diapositivas busque uno que sea
agradable y que no interfiera con la lectura del mensaje.
No confe en la apariencia de la presentacin en la pantalla de su computadora, probablemente cuando la proyecte su aspecto cambiar, y es aconsejable experimentar antes de
exponerla. Utilice un tipo de letra claro y de tamao adecuado para facilitar su lectura, aproveche todos los espacios que le proporciona la diapositiva, pero no abuse de la informacin
que coloca en ellas. Incorpore el material grfico que estime conveniente (fotos, grficos,
tablas, etc.), pero recuerde que no son adornos, nicamente son tiles cuando componen
una imagen interesante. Las tablas deben tener un ttulo claro, ponga especial cuidado en las
cifras, sumas, porcentajes, etc.
Los grficos deben mostrar una tendencia definida, seleccione el ms adecuado para la
expresin de los resultados (barras, columnas, etc.). Utilice pocas palabras por lnea y pocas
lneas por diapositivas, aquellas con demasiada informacin y, por consiguiente, letra pequea y frases apretadas, no son legibles y atentan contra la atencin del oyente.
Las proyecciones (diapositivas)
La diapositiva o proyeccin es siempre un apoyo del expositor, y se las suele clasificar como de reafirmacin, ampliacin y complementacin. Cuando el expositor describe la imagen
que se proyecta, est reafirmando lo que se observa. Por el contrario, si oralmente ampla lo
que se proyecta es porque est profundizando lo que expresa la imagen. Y si agrega informacin que la imagen no muestra o no permite deducir, est complementando la imagen. Pueden
existir variantes, como la forma negativa de la reafirmacin, cuando se contrasta con la imagen lo que se expone, tal el caso de aconsejar no fumar y mostrar a un individuo fumando.
Tambin se suele diferenciar las diapositivas segn el contenido consista en textos o
grficos, y para la elaboracin de cada una de ellas existen ciertas reglas o consejos que han
persistido en el tiempo y que es conveniente tener en cuenta.
Diapositivas de texto
No ms de 7 palabras por rengln y no ms de 7 renglones por proyeccin. Eluda las
proyecciones llenas de nmeros y frases que el espectador no alcanza a ver por el tamao y
por carecer de tiempo para leer toda la imagen.
Prefiera no transmitir ms de una idea por proyeccin.
El texto se debe poder leer desde la parte final del auditorio.
No ms de una diapositiva por minuto, para dar tiempo a la lectura del texto. Esta
regla ha perdido un poco su vigencia, y se puede admitir un nmero mayor, especial[ 78 ]

mente de imgenes sin lectura. Pero evite dar demasiada informacin, el espectador
no podr captarla.
Tamao y tipo de las letras. No demasiado pequeas que no se puedan leer desde una distancia considerable, segn las dimensiones del local y de la pantalla de
proyeccin, ni demasiado grandes que haga incmoda o hasta molesta su lectura.
En cuanto al tipo de letras, las computadoras ofrecen una infinidad de ellos, y se
aconseja utilizar los de lectura fcil y clara, aunque en algunos casos y para destacar
conceptos se recomienda emplear tipos diferentes al del texto principal.
Prefiera las proyecciones horizontales a las verticales. Estas ltimas por lo general
dejan parte de las mismas fuera de la pantalla.
Considere los contrastes. El contraste entre el color de las letras y el fondo de la diapositiva es un elemento de suma importancia, porque facilita o dificulta la lectura.
Existe una escala de contrastes de colores que optimizan este hecho, y que de mayor
a menor son los siguientes:

Letras negras sobre fondo blanco

Letras blancas sobre fondo azul.

Letras negras sobre fondo amarillo.

Letras blancas sobre fondo negro.

Letras rojas sobre fondo blanco.

Letras verdes sobre fondo blanco.

Letras blancas sobre fondo rojo.

Letras amarillas sobre fondo azul obscuro, etc.
El presentador seleccionar el contraste que permita la mayor legibilidad segn su parecer. No es aconsejable un fondo con texturas complejas u policrmicas, ya que atenta contra
la concentracin en lo esencial y puede resultar tedioso.
Hoy da, con los recursos de los programas de computacin, estas reglas han perdido
parte de su vigencia, especialmente con la superposicin de leyendas, las imgenes animadas,
la sumatoria de imgenes, rtulos, etc., a medida que la exposicin con diapositivas avanza.
Es aconsejable emplearlos, pero siempre con la premisa de no generar una exposicin donde
es ms importante la imagen que el mensaje.
Diapositivas de grficas
Los grficos cobran singular importancia en la presentacin de los resultados y existen
mltiples opciones y combinaciones posibles de los mismos. Los clsicos son los de barras, de
torta, de lnea, etc. Cada uno se utiliza segn lo que se quiera expresar, pero es aconsejable
no manejar ms de 7 barras o 7 divisiones de la torta, y deben rotularse en unidades o porcentajes muy claros y contrastantes.
Es aconsejable que en las grficas figuren los valores de las coordenadas y/o de las barras
o partes de la torta, para evitar al expositor tener que especificarlos. El tiempo de atencin del
auditorio en una grfica raramente sobrepasa los 30 segundos, a partir de los cuales la curva
de atencin comienza a decrecer. Por lo general la atencin en una grfica de mala calidad,
complicada o de difcil comprensin no pasa de unos pocos segundos. En 30 segundos el
[ 79 ]

expositor solo podr decir entre 50 y 70 palabras. Luego, es aconsejable programar la exposicin oral sobre esa grfica en esa cantidad de palabras y de tiempo.
Lo habitual es combinar en las proyecciones texto y grficas. En la actualidad, los investigadores cuentan con el apoyo de los profesionales de diseo y las posibilidades de los
programas de computacin, asociacin muy efectiva para lograr presentaciones de calidad.
No dejar de consultarlos, ellos son creativos y saben como transmitir un concepto.
Pster (Cartel)
El pster, otro medio de apoyo visual, surgi como una necesidad para permitir una
mayor cantidad de presentaciones en las sesiones cientficas. Habitualmente no son tan valoradas por el autor como una presentacin oral. Sin embargo, el mayor tiempo de exposicin y
la posibilidad de discutir los resultados con los espectadores pueden provocar un gran inters
y resultar de mayor divulgacin. La discusin ms personal que puede generarse entre los
autores, los revisores y los lectores del pster presentes en el lugar, suele ser muy provechosa
y enriquecedora.
El pster introduce una variedad de ilustraciones que permite presentar el trabajo con
claridad. Debe combinar la parte escrita y grfica con un diseo agradable y legible, y su tamao debe facilitar la lectura desde una distancia prudencial. La informacin volcada debe
contener los mismos puntos que la presentacin con diapositivas: ttulo, autores, objetivo,
etc. Evite incorporar demasiados datos, dispngalos en orden y destaque visualmente los
elementos clave.
Imprevistos
Pero suponga el presentador que se ha cortado la luz, no dispone de micrfono ni de medio de proyeccin. O que los inconvenientes suceden en forma menos trgica, como un proyector de diapositivas daado, se interrumpe solamente el micrfono o, lo que es ms comn,
falla la computadora o la insercin de la memoria. Deber usted declinar la presentacin?
Puede hacerlo, pero quizs no tenga otra oportunidad hasta varios meses despus, tiempo
en que probablemente otro investigador presentar un estudio muy semejante al suyo y le
quitar primaca. Asimismo, puede mal interpretarse y verse como un desprecio al auditorio
que ha asistido a orlo. Mejor improvise una presentacin parcial, empleando sus mejores
condiciones pedaggicas e histrinicas.
Aydese con un pizarrn y tiza, y hasta con alguna humorada para elevar el estado de
nimo de los presentes. Al usar el pizarrn hay datos claves que se pueden escribir en l,
nombres cientficos, una frmula o un resultado numrico importante. Esto contribuye a
mantener la atencin, ayuda a la comprensin y ofrece un tiempo extra para analizar lo
que se expres en palabras. Siempre se debe contar con recursos para salir del mal trance,
y el mejor instrumento es la experiencia del presentador. Entienda que todo material sirve
de apoyo, y que lo relevante es el discurso y su trasfondo. No hay muchas oportunidades
para presentar su experiencia y demostrar sus habilidades cientficas y comunicativas, no
las desperdicie!

[ 80 ]

3. La presentacin oral
Elaborar una presentacin para una reunin local, nacional o interdisciplinaria no es
momento para apresurarse, una exposicin efectiva requiere de ensayo. La espontaneidad es
un nmero infinito de posibilidades entrenadas. Practicar le otorga al expositor la oportunidad de medir cunto tiempo tomar la exposicin, planear las pausas en el momento oportuno y familiarizarse con las diapositivas, tratar de memorizar y recitar la conferencia no es
la forma de presentar. Ensayar le permitir modificar la presentacin al instante, segn las
necesidades o ante una pregunta de la audiencia. Si se admiten preguntas durante la presentacin, podr fcilmente saltar adelante o atrs por las diapositivas, demostrando conocer la
informacin contenida en ellas y reforzando la evidencia para las respuestas.
El ensayo debe incluir probar el equipo que va a usar y crear un plan de apoyo, por si deja
de operar. Practique la presentacin en voz alta, expresndose diferente cada vez. Puede ser
de ayuda hacerlo frente a los coautores o, mejor an, en un ateneo de su servicio. Sus colegas
pueden proveer informacin honesta acerca del contenido, colores y/o cualquier defecto en
los grficos. An con las mejores intenciones, pocas presentaciones estn realmente acabadas. Tmese el tiempo necesario para encontrar la imagen que destaque su exposicin, y
reemplace a la imagen que no lo har. Agregue contenido actualizado y haga la presentacin
interactiva. Intente tener acabado el borrador bastante tiempo antes de la fecha tope, y use el
tiempo extra para mejorarlo.
Depender de notas para trabajar o emplear largas pausas para componer pensamientos
desva la atencin y afecta la calidad de la presentacin. No es recomendable la lectura de
notas, o debe hacerse con moderacin, los buenos conferencistas rara vez las necesitan. Gastar tiempo leyndolas puede convencer a la audiencia que el presentador no est preparado.
Es posible que un presentador hable lentamente, otros hablan y se mueven muy rpido por
las diapositivas. Por regla general, cada diapositiva merece al menos 10 segundos, y ninguna
debera superar 1 o 2 minutos. Si toma ms tiempo para cubrirla, probablemente es mejor
rehacer el contenido en dos diapositivas.
Disponga de una vestimenta adecuada al lugar y el foro de presentacin, no se acicale
o atave excesivamente. Puede ocurrir que un atuendo inadecuado o inslito conduzca a la
desatencin o, lo que es peor, al sentimiento de menoscabo, y que entonces el auditorio no se
concentre en la meta ms importante que es el aspecto cientfico. Lo aconsejable es utilizar
una indumentaria que no desentone con el medio en que se encuentra, pero nunca estar mal
con el clsico saco y corbata.
En ese momento, usted es el centro de las miradas, aparezca lo ms natural y relajado posible. Recuerde, nadie sabe ms del tema que usted. Si puede escoger, elija la parte izquierda
del auditorio, la explicacin del material audiovisual ser ms lgica, es la forma en que se lee
nuestro idioma. Comunicar la presentacin con pasin y confianza le aadir credibilidad al
mensaje, y la audiencia reconocer esas emociones.
Al mostrar imgenes, oriente a la audiencia hacia el punto relevante, proporcineles el
tiempo suficiente para asimilar la informacin y permitir conjeturar las conclusiones. Muchos oradores se apresuran a travs de las diapositivas, hacen declaraciones que aluden a
conclusiones en las imgenes, pero no explican o sealan claramente esas conclusiones. Una
tcnica que ayuda al auditorio a comprender mejor las diferencias es mostrar un ejemplo
[ 81 ]

normal, seguido de uno que no lo es. Exprese claramente las diferencias entre los dos, es un
error dejar a la audiencia que establezca la conexin entre ellos.
Considere cmo va a sealar los puntos importantes en una diapositiva, las herramientas
disponibles como el puntero de lser o el cursor del ratn, pueden ser efectivas si se emplean
adecuadamente. Es frecuente que el presentador no dirija el haz de luz sobre el elemento
que desea sealar, sino que lo mueva displicentemente en forma circular, oval o totalmente
asincrnica tratando de englobar mltiples reas o, lo que es peor, no sealando ninguna en
especial. Esto no resulta til, sino ms bien distrae y hasta puede llegar a ser desagradable.
El contenido de las diapositivas es explicativo y dirigido a la audiencia y no al orador,
que no debe leerlas. Es conveniente afrontar en direccin a los presentes y no a la proyeccin.
Adems no corresponde disculparse dentro de la presentacin, si una diapositiva ser difcil de
comprender no debera ser presentada. A veces las preguntas pueden ser ms importantes que la
presentacin real, piense y adelntese a las preguntas que podran manifestarle. Al replicar mire
a todos los oyentes, ya que todos pueden tener la misma duda. Evite elogiar algunas consultas y
no otras, adems, trate todas las cuestiones e interrogadores con el mismo respeto.
Contestar las dudas que le plantea el auditorio no debe ser un problema si ha sabido
transmitir las ideas esenciales, las preguntas suelen ir dirigidas a aclarar y ampliar alguno
de los puntos clave de su charla. Si no sabe la respuesta no intente responder con evasivas o
invenciones, mejor transmitir al interlocutor el inters por tratar de darle contestacin en un
futuro o, simplemente, admitir su desconocimiento al respecto. Suministrar toda la informacin, positiva o negativa, para que los dems puedan juzgar con ecuanimidad el valor de su
trabajo, no exponga informacin sesgada tratando de orientar el juicio de los presentes.
El aprendizaje es un proceso dinmico que requiere de la participacin activa de los presentes. Desde tiempos inmemoriales la clase profesoral ha sido una tcnica de instruccin ampliamente respetada. Sin embargo, en nuestros das una conferencia para transmitir informacin o
como mtodo de enseanza puede considerarse igualmente igualmente primordial. La presentacin oral debe orientarse para incluir la participacin de los oyentes, despertar su curiosidad,
motivarlos a aprender y pensar, en resumen, lograr ms que lo que puede cualquier libro o
publicacin.
El clima de la conferencia es importante, los factores que perturban la voluntad de atencin de la audiencia deterioran la comprensin. Un ambiente seguro y relajado facilita el
entendimiento. El orador, intencionalmente o involuntariamente, puede modificar el clima
emocional y debe comprometerse para lograr un contexto con estas caractersticas.
La interaccin informal con la audiencia, con el humor apropiado, ayuda a establecer
un clima que conduce al aprendizaje. Muchos autores recurren a alguna ancdota o hecho
inusual para llamar la atencin, inclusive, alguna cita o una gracia que causa hilaridad entre
los presentes. Esto despierta a un auditorio un tanto esttico y motiva su inters. Manejar
prudentemente una cantidad correcta de humor puede contribuir al mutuo entendimiento
con la audiencia. Est bien salirse ocasionalmente de la letra, no es un recurso desdeable,
pero con la precaucin de no ser ofensivo ni chabacano, ni hacer que la presentacin se recuerde por el imprevisto y no por la esencia cientfica.
Es aconsejable llevar las imgenes de la conferencia en la computadora personal, en un
CD o memoria electrnica, pero siempre con un duplicado. Examinar antes de la presen[ 82 ]

tacin las imgenes a proyectar para evitar inconvenientes, recordar que los programas de
computacin se renuevan muy frecuentemente, por ello consultar si los programas de la computadora a utilizar son compatibles con el formato que el presentador dispone.
Por sobre todas las cosas, respetar los tiempos. Todos los investigadores estn convencidos que sus hallazgos son de mxima importancia y que van a cambiar los destinos de
Occidente. Pero a todos se les da la misma cantidad de tiempo para su presentacin, por lo
general de 10 minutos o, a lo sumo, 15 minutos. Superado este lmite se reduce el tiempo de
los siguientes expositores, o el de las preguntas y respuestas. Es necesario que se entrene lo
suficiente como para asegurar de terminar en tiempo. Ms de una vez, los encargados de
cronometrar la exposicin, por lo general el presidente o secretario de mesa, truncan la comunicacin en el tiempo justo y el presentador se ve perjudicado por no haber expuesto las
conclusiones o el comentario ms importante.
Es necesario recalcar que el principiante debera ensayar la presentacin varias veces en
presencia de sus colegas para habituarse al medio, a las formas y al tiempo. Ellos le aconsejaran sobre todo aquello que pueda mejorar y optimizar, inclusive hacerle preguntas que
podran surgir luego desde el auditorio y prepararse para ello. Solo despus de mucho tiempo
y amplia experiencia podr exponer sin temores ni mayores errores.
Los mensajes publicitarios tratan de captar la atencin en pocos segundos, y es un ejemplo importante que debemos tener en cuenta porque aunque dispongamos de un plazo mayor
para presentar nuestro trabajo, tenemos un mnimo de tiempo para atraer la atencin. De no
hacerlo, por mucho que hablemos no conseguiremos ser eficaces en nuestro objetivo. Para
cumplir con esta recomendacin debemos comenzar la presentacin de manera original y
atractiva, utilizando los recursos de la narracin oral (vista, voz, cuerpo, manos y pies).
Nuestra presencia ante la audiencia tendr un impacto en su reaccin para lo que sigue, el
orador debe estar cmodo y controlado, o al menos transmitir esa impresin. La cabeza debe
estar en alto con la barbilla arriba, actitud que da la impresin de tener el mando. Los brazos
cruzados en el pecho se ven como un signo de defensa. Si uno esta sentado, enderezarse en la
silla manteniendo la columna recta, los pies en el suelo y las manos extendidas sobre la mesa.
Los gestos son un refuerzo visual para las ideas y las palabras enunciadas, dirjase a la audiencia con movimientos que cautiven la atencin. Es ms cmodo atender a un conferencista
dinmico que escuchar a alguien que est detrs de un podio con los brazos cruzados. Use gestos
amplios y envolventes, nunca emplee ademanes rpidos y espasmdicos. Los gestos ms efectivos
son extensiones naturales de uno mismo y deben ser variados, la repeticin puede ser molesta.
Algunos modales, como apuntar con el dedo o el puo cerrado, son amenazadores. Evite
poner las manos en los bolsillos, use las palmas de la mano abiertas hacia el pblico, incline la
cabeza y sonra para enfatizar aquello que expone. No permanezca durante un perodo prolongado detrs del podio, separa al orador de la audiencia y se percibe como lejano. Alcance a los
presentes fsicamente, aumentar la atencin e inters, y alentar a las preguntas y respuestas.
Los oradores efectivos hacen contacto visual con el pblico y advierten sus reacciones,
aburrimiento, entusiasmo, etc. Para hacer el contacto visual correcto debe barrer con la
mirada a la audiencia, observe a cada persona unos segundos. Es importante hacerlo, deja
percibir si estn atentos o qu nos indica su lenguaje corporal, se mueven irritados, toman
notas o estn dormidos.
[ 83 ]

Hablar claramente requiere de trabajo y prctica, esto es particularmente cierto si el


orador est hablando en un idioma diferente del materno. Una manera segura de perder la
atencin del pblico es hablar con voz suave y montona, duro trabajo es atender a alguien
que habla de sta manera, muchos de los asistentes no harn el esfuerzo. Para comprometer
al auditorio, debe hablar con un tono natural, seguro e interactivo. Este estilo involucra a las
variaciones en la inflexin de la voz y la velocidad con que se habla, incorporando ocasionalmente pausas. El ritmo debe ser lento, facilitndole al pblico la oportunidad de or y asimilar lo que se dice, hablar demasiado rpido puede fatigar. El orador balbuceante impresiona
nervioso, si mira hacia abajo puede percibirse como un intento de mantenerse alejado de la
situacin. Evite las reiteraciones muletillas, molestan y desvan la atencin hacia eso que se
repite sistemticamente.
Uno puede desconocer sus gestos faciales, como entrecerrar los ojos, fruncir el ceo, o
poner caras extraas que desorientan a la audiencia. Puede ser muy instructivo mirarse en
un espejo, o video grabado, y observar nuestros modos al hablar. No es fcil sonrer y hablar
al mismo tiempo, pero es importante sonrer durante la presentacin, si es congruente con
el mensaje hablado. Nunca obtendremos una segunda oportunidad para cambiar la primera
impresin.
4. La discusin de los resultados obtenidos
Probablemente es el momento ms difcil, sobre todo para los autores noveles. Es el
tiempo donde se capta el inters que ha promovido la exposicin, de responder las dudas y
los comentarios que surgen, discutir aspectos controvertidos y proporcionar informacin
adicional.
Recuerde que se encuentra en un mbito cientfico, entre colegas, y que el objetivo es
debatir. Agradezca los comentarios, los interrogantes y las dudas porque son apreciables,
algunos pueden ayudarle a enriquecer la investigacin actual u otras futuras. De esta experiencia realmente se puede aprender, est tranquilo e intente no estar a la defensiva. Si no sabe
la respuesta a una pregunta, diga que no la sabe y no conjeture acerca de datos adicionales a
menos que usted est absolutamente seguro.
Atienda todas las preguntas, responda gentil y pausadamente, no discuta e intente no
disentir a menos que el punto sealado por el interrogador sea extremadamente importante.
Sea breve, y si el tiempo lo permite agradezca a la mesa, al moderador y al pblico en general
por su atencin, e invtelos a continuar con la discusin posteriormente.
En una reunin cientfica, donde se exponen muchos trabajos en forma ininterrumpida y
a veces simultnea en varios salones, el expositor puede considerarse satisfecho en demasa si
la audiencia, al final del da, recuerda el objetivo y las conclusiones del trabajo presentado.

Tcnicas pedaggicas
Existen algunas tcnicas pedaggicas que pueden ser tiles de conocer cuando se prepara
una clase u otro tipo de exposicin, ya que orientan en como concitar y mantener la atencin
del auditorio.
[ 84 ]

Clnica del rumor


Consiste en hacer salir del aula a 7 de los espectadores presentes y proyectar al resto del
auditorio una diapositiva intrascendente, que puede ser de un paisaje, una escena familiar o
cualquier otro asunto.
A continuacin, se hace pasar al primero de los espectadores que qued afuera y se pide
a alguno de los presentes que le relate lo que ha visto en la proyeccin. Luego, se hace pasar
al segundo espectador de afuera y se pide al primer espectador que vino de afuera que relate
al segundo lo que le contaron que han visto en la proyeccin. Y as sucesivamente hasta llegar
al 7 espectador. El auditorio notar que el primer espectador relata al segundo lo que l interpret de lo escuchado de quien presenci la diapositiva, y el segundo le dir su impresin
al tercero y as hasta llegar al sptimo. Como cada uno de los espectadores cuenta su impresin subjetiva, la realidad se va transformando, pudiendo llegar a tergiversarse la verdadera
imagen de manera tal que despierta la hilaridad de la concurrencia. Al final, se proyecta la
diapositiva original y se muestra a los 7 espectadores que estuvieron afuera que se asombrarn de lo diferente a lo imaginado por ellos.
De no contarse con una proyeccin, se puede suplantar la imagen con el relato de algn
hecho rutinario o acaecido a alguno de los presentes, y continuar de igual manera.
Durante la ejecucin de esta tcnica, cada uno de los presentes interpreta a su manera
lo visto o escuchado, y al relatarlo es habitual que lo module con su punto de vista personal
o su interpretacin subjetiva. Si bien esta tcnica tiene como objeto principal convencer a la
audiencia de la importancia de recurrir a las fuentes de la informacin para no recibirla deformada por la subjetividad del intermediario, es enormemente til para que el presentador la
tenga en cuenta al momento de su exposicin. Debe intentar utilizar las palabras adecuadas y
los ejemplos ajustados para que impidan, o al menos no faciliten, interpretaciones subjetivas
demasiado diferentes de lo que el presentador quiere transmitir, y posibilitar que el mensaje
llegue en su justa realidad.
Otra aplicacin prctica, es convencer al iniciado de la importancia de recurrir a los
trabajos originales para basar sus hiptesis, y no a las revisiones de los temas que, si bien
economizan tiempo y esfuerzo, suelen transmitir el punto de vista subjetivo del autor de la
revisin, y pueden influenciar fuertemente el anlisis de las conclusiones.
Atencin de la audiencia
Consiste en recitar a la audiencia 20 palabras habituales de la conversacin diaria. Despus, se les pide que escriban todas las palabras recordadas sin importar la secuencia. Luego,
el presentador preguntar a la audiencia cuantos de los presentes recordaron cada palabra en
la secuencia original, y tomar nota de ello para graficar esas respuestas en un diagrama de
barras o de lneas con la cantidad de personas que recuerdan cada palabra en las ordenadas.
Observar que la gran mayora evoca con mayor facilidad las primeras y las ltimas palabras,
y recuerda mucho menos las del medio. Esto hace que la curva de evocacin de las palabras
tenga una concavidad superior que expresa que la atencin de la audiencia fue ms importante al inicio y al final. Estos resultados se observan con frecuencia en las audiencias del mundo
Occidental. Contrariamente, en el mundo Oriental, lo habitual es que el nivel de atencin se
mantenga uniforme en todo el tiempo, con una resultante que es bastante horizontal.
[ 85 ]

Esta tcnica fue inicialmente utilizada para conocer el nivel de atencin de la audiencia
durante una exposicin, y es til que el orador la tenga presente para intentar mantener un
nivel uniforme de atencin de la audiencia. Puede alternar con cierta periodicidad frases o
proyecciones que impacten positivamente a la audiencia, concitando una atencin pareja
durante la exposicin. O por lo menos, utilizar los elementos de mayor importancia en forma
escalonada o peridica para despertar inters. Tambin es importante que el orador exprese
la hiptesis del trabajo y los objetivos al principio, cuando la audiencia est ms interesada, y
que sea claro y determinante en las conclusiones al final de la presentacin.

Eplogo
La intencin este artculo fue acercar algunas recomendaciones a los que se enfrentan por
primera vez a un auditorio para difundir informacin cientfica. Es posible que estas consideraciones parezcan intrascendentes, sin embargo, pocas veces se tienen en cuenta y el resultado
de una exposicin se ve innecesariamente disminuido. Hablar en pblico es un arte, algunas
personas parecen haber nacido con las habilidades y el deseo para hacerlo. Sin embargo, la
mayor parte de nosotros necesitamos aprender este arte, trabajando continuamente para
mejorar. Vale la pena el esfuerzo, comunicaremos mejor el conocimiento y provocaremos
un cambio en las actitudes y/o la prctica cotidiana de los oyentes. Este es el resultado que
uno desea cuando se involucra con la investigacin y la educacin mdica. No olvide que la
constancia genera talento.

Material de consulta sugerido


1. Albert T. Winning the publications game. Oxford & New York, Radcliffe Medical Press,
1997.
2. Arribalzaga EB, Borracci RA, Giuliano RJ, Jacovella PF. El artculo cientfico. Buenos
Aires, Editorial Magister Eos, 2005.
3. Biancuzzo M. Developing a poster about a clinical innovation. Part I: Creating the poster. Clinical Nurse Specialist 1994; 8:153-155.
4. Biancuzzo, M. Developing a poster about a clinical innovation. Part II: Creating the
poster. Clinical Nurse Specialist 1994; 8: 203-207.
5. Bradley H. Its show time!. Home Office Computing 1999; 17: 102.
6. Bragshaw E. Slide projection. PC User 1992; 196: 61.
7. Brinko KT. The Practice of Giving Feedback to Improve Teaching: What Is Effective?
J Higher Education 1993; 64:574-593.
8. Cirigliano G, Villaverde J. Dinmica de grupos y educacin. Buenos Aires, Ed. Humanitas, 1985.
9. Collins J. Education Techniques for Lifelong Learning. Giving a PowerPoint Presentation: The Art of Communicating Effectively. RadioGraphics. 2004; 24:1185-1192.
10. Collins J, Mullan BF, Holbert JM. Evaluation of Speakers at a National Radiology Con[ 86 ]

tinuing Medical Education Course. Med Educ Online [serial online] 2002; 7: 17. Available from http://www.med-ed-online.org.
11. Council of Biology Editors. Council of Biology Editors Style Manual. Arlington, VA,
Council of Biology Editors, Inc, 4th Edition, 1978.
12. Cruz Verduit L, Arencibia JR, Prez Fernndez E. Aspectos metodolgicos bsicos para la preparacin y el empleo de las diapositivas. http://www.bvs.sld.cu/revistas/aci/
vol10_4_02/aci030402.htm.
13. Dalal MD, Daver BM. Computer generated slides: a need to curb our enthusiasm. Br J
Plast Sur 1996; 49: 568-571.
14. Estrada CA, Patel Sangnya R, Talente G, Kraemer S. The 10-Minute Oral Presentation:
What Should I Focus on? Am J Med Sci. 2005; 329(6): 306-309.
15. Farrow R. ABC of learning and teaching in medicine: Creating teaching materials. Br
Med J 2003; 326: 921-923.
16. Garity J. Creating a professional presentation. J Intraven Nurs 1999; 22: 81-86.
17. Garson A, Gutgesell HP, Pinsky WW, McNamara DG. The 10-minute talk: Organization, slides, writing, and delivery. Am Heart J 1986; 111: 193-203.
18. Greenhalgh T. Cmo leer un trabajo cientfico. Gua basica de la medicina basada en la
evidencia. Buenos Aires, Volpe/Fox S.A., 2005.
19. Haber RJ, Lingard LA. Learning oral presentation skills: a rhetorical analysis with pedagogical and professional implications. J Gen Intern Med 2001; 16: 308-314.
20. Hewson M, Little M. Giving feedback in medical education. Verification of recommended techniques. J Gen Intern Med. 1998; 13: 111-116.
21. Hoffman M, Mittelman M. Presentations at professional meetings: notes, suggestions
and tips for speakers. Eur J Intern Med 2004; 15: 358-363.
22. Jadoul M. Ten ways to ruin or market your oral presentation. Nephrol Dial Transplant
2001; 16: 2119-2123.
23. Kroenke K. The 10-minute talk. Am J Med 1987; 83: 329.
24. Leddy C. How to effectively present your product. Multichannel News 2001; 22: 44.
25. Maddow CL, Shah MN, Olsen J, Cook S, Howes DS. Efficient communication: assessment-oriented oral case presentation. Acad Emerg Med. 2003; 10: 842-847.
26. Manterola C, Pineda V, Vial M, Grande L. Cmo presentar los resultados de una investigacin cientfica? I. La comunicacin oral. Cir Esp. 2007; 81(1): 12-7.
27. Mecklenburger JA. Emerging technologies for education, beyond the computer revolution. Peabody J Edu 1986; 64: 183-187.
28. Moore Weaver L, Augspurger P, OBrien King M, Proffitt Ch. Insights on the poster
preparation and presentation process. Applied Nursing Res 2001; 14: 100-104.
29. Niamtu J. The power of power point. Plast Reconstr Surg 2001; 108: 466-484.
30. Noguerol Rodiguez B, Gonzalez Lpez S, Sicilia Felechosa A. Uso de la diapositivas en
presentaciones cientficas III: confeccin de diapositivas mediante el ordenador. Periodoncia 1995; 5: 153.
31. Ruhl KL, Suritsky S. The pause procedure and/or an outline: Effect on immediate free
recall and lecture notes taken by college students with learning disabilities. Learning
Disability Quarterly 1995; 18: 2-11.
[ 87 ]

32. Sherbino J, Bandiera G. Improving communication skills: Feedback from faculty and
residents. Acad Emerg Med 2006; 13: 467-470.
33. The eclectic slide. Goverment Computer News 2001; 20: 12.
34. Van Overbeek J. The presentation of scientific papers. Science, new series 1941; 93: 184185.
35. Wikinski JA, Usubiaga JE, Hernandez HH. El trabajo cientfico. Buenos Aires, Editorial
Diagraf, 2da Ed, 1977.
36. Thompson WM, Mitchell RL, Halvorsen RA, Foster WL, Roberts L. Scientific presentation, what to do and what not to do. Invest Radiol. 1987; 22: 244-245.
37. Zorrilla AM. Hablar, escribir, traducir en espaol. Buenos Aires, Editorial Dunken,
2003.

[ 88 ]

III. Desarrollos modernos en las ciencias mdicas

Captulo 8

Metanlisis

Luis Alcocer

Introduccin
Por muchos siglos, el conocimiento mdico se ha basado primordialmente en la observacin cuidadosa de los sntomas y signos de la enfermedad. El mdico clnico educado, ha
practicado desde siempre una semiologa esmerada de los signos recogidos con sus sentidos,
la vista (inspeccin), el tacto (palpacin), el odo (auscultacin y percusin), el olfato y an
el gusto, ms recientemente ampliados por los exmenes de laboratorio y gabinete, que en
ltima instancia amplifican estos sentidos.
El interrogatorio sistemtico de los sntomas ha permitido al mdico vivir las caractersticas propias de la enfermedad manifiesta de su paciente. Usando ambos mtodos, (el
interrogatorio y la exploracin fsica simple y armada), ha elaborado la historia clnica, que
le permite sentar una hiptesis razonable sobre el estado de salud de su paciente, y que sobre
todo sirve de base para la toma de decisiones, que se centran en recomendar o ejecutar medidas para preservar el estado de salud, si este se considera satisfactorio, o a restaurarlo lo
mejor posible si se juzga alterado. Este es el proceso mdico primordial que es empleado hasta
la fecha en la mayora de las acciones mdicas.
El anlisis de la propia experiencia, basada en la senso-percepcin, inici el intento por
conocer la naturaleza propia de la enfermedad, y se aplic en sus orgenes al anlisis de los
resultados de los intentos teraputicos. La medicina se aprenda directamente de otro mdico
experimentado y dispuesto a trasmitir su experiencia personal a sus alumnos. El registro de
las experiencias era personal del Mdico y las primeras publicaciones mdicas se refieren a
descripcin de casos, en forma especialmente de sntomas, signos y sndromes, que se relacionaban con enfermedades especficas: Esa fue la gran poca de los epnimos, pues al descubrir
alguna asociacin el investigador era premiado bautizando con su nombre su descubrimiento. Los investigadores describan las manifestaciones que resultaban propias de entidades
patolgicas, que se comprobaban de preferencia con autopsias y que eran de mayor valor si
resultaban de series de enfermos observados retrospectivamente.
Si clasificamos a la investigacin mdica, desde un punto de vista de jerarquas crecientes en trminos de validez, el primer grupo ms bajo en la escala es, precisamente, el de los
estudios descriptivos, y de ellos los retrospectivos de casos o series de enfermos. Todava es
posible encontrar en las revistas ms modestas estudios retrospectivos de series de pacientes,
[ 91 ]

ahora reforzados los sentidos del mdico con estudios ms o menos elaborados de laboratorio
y gabinete. Algunas revistas tan prestigiosas como el New England Journal of Medicine, an
reportan casos completos, muy bien estudiados y se les considera de un alto valor didctico.
Este mtodo del anlisis del caso es empleado como un mtodo muy actual, por ejemplo en
las grandes escuelas de negocios.
Los estudios de series se completan con estadstica descriptiva. Se refieren fundamentalmente a enfermedades, sndromes o sntomas-signos y en ocasiones a resultados sobre determinado procedimiento, especialmente quirrgico. Su validez es simplemente descriptiva y, en
ocasiones, se intenta justificar su publicacin al limitarlos a un grupo de inters particular,
como por ejemplo: Caractristicas de la enfermedad X en grupo de ciudadanos del pas Y,
en edades de n a p aos.
Los caminos de la intuicin, la fe, la magia y an la percepcin extrasensorial, han sido
utilizados por siglos por la medicina para reconocer, interpretar el sentido e intentar curar
la enfermedad. El mtodo cientfico es el pensamiento que permite al hombre tener una certeza razonable de lo que sus sentidos recogen (Senso) y su mente elabora (Percepcin). Es lo
ms cercano posible a la verdad y es actualmente el nico aceptable para tomar decisiones
sobre el estado de salud-enfermedad de las personas y para preservar, promover o restaurar
su estado de salud, entendido este como tiempo de calidad de vida. El mtodo cientfico
nace formalmente desde el siglo XVII con el pensamiento de Galileo y es un proceso destinado a explicar fenmenos, establecer relaciones entre los hechos y enunciar leyes que
expliquen los fenmenos fsicos del mundo y permitan obtener, con estos conocimientos,
aplicaciones tiles al hombre.
El siguiente nivel de la investigacin mdica emplea el mtodo cientfico en un ms alto
nivel, y nace cuando se comparan las caractersticas de un grupo francamente enfermo con
otro grupo de personas de caractersticas similares, pero sin evidencias de enfermedad. Estos
estudios son llamados Caso-Control y permiten emplear la estadstica no solo descriptiva
sino tambin inferencial, esto es que permiten inferir relaciones.
Es consustancial a la investigacin cientfica el someterse siempre a una prueba de
la verdad, que consiste en evidenciar que cada hecho descubierto pueda ser comprobado,
mediante otros experimentos, por cualquier persona y en cualquier lugar, y en que sus hiptesis son revisadas y cambiadas si no se cumplen. Esto es ya posible en los estudios casocontrol, que son todava vigentes, se emplean para construir hiptesis causa-efecto, aunque
no permiten demostrarlas y son especialmente tiles para el estudio de condiciones muy
raras, en las que es imposible conseguir muestras grandes en nmero de sujetos enfermos.
El siguiente nivel de estudios se llama estudios de cohorte. Consiste en seleccionar un
grupo de personas y seguir en el tiempo la evolucin de su estado de salud. En general se compara la incidencia del evento que se decidi estudiar, entre personas expuestas y no-expuestas
a diversos factores. Los estudios de cohorte se han utilizado de manera clsica para determinar la ocurrencia de un evento especfico en un grupo de individuos inicialmente libres del
evento o enfermedad en estudio.
Permiten estudiar los factores de riesgo para una enfermedad determinada y son la base
de la epidemiologa moderna. Quiz el ms significativo de ellos es el estudio Framingham,
con ms de 50 aos de seguimiento.
[ 92 ]

Hasta este nivel el mtodo que se emplea es la observacin, sin interferir en el proceso,
por lo que podramos decir que estos grupos de estudios estn destinados a conocer la historia natural del proceso salud-enfermedad y su principal producto es la caracterizacin de las
enfermedades y la posibilidad de conocer y evaluar el riesgo.
La experimentacin es un procedimiento mediante el cual se trata de comprobar una
hiptesis, mediante la manipulacin de una o ms variables, manteniendo fijas las otras
conocidas, lo que permite estudiar las relaciones y el peso que estas variables tienen para
el desarrollo del fenmeno en estudio. La experimentacin es fundamental para poder
ofrecer explicaciones causales. La experimentacin en humanos es desafortunadamente
esencial para conocer en especial los efectos benficos e indeseables de los agentes teraputicos. Es por ello que las normas ticas son fundamentales cuando se experimenta
con humanos y deben ser muy estrictas y muy vigiladas en estos estudios. Este tipo de
investigacin se emplea para valorar la eficacia de diferentes terapias, de actividades preventivas o para la evaluacin de actividades de planificacin y programacin sanitarias.
Como en los estudios de cohorte, los individuos son identificados en base a su exposicin,
pero a diferencia de estos, en los estudios experimentales es el investigador el que decide
la exposicin.
Los estudios experimentales son de varios tipos:

Ensayo clnico: Es el estudio experimental ms frecuente. Los sujetos de estudio son
en la mayora de los casos pacientes y se planean para evaluar uno o ms tratamientos
para una enfermedad o proceso. Deben ser comparativos, entre dos o ms grupos en los
que la intervencin debe ser distribuida aleatoriamente. (Principio activo en estudio contra placebo o principio activo en estudio contra tratamiento estndar, o principio activo
en estudio contra otro principio activo conocido). La validez de estos estudios radica
fundamentalmente en que el proceso aleatorio haga los grupos comparables en las variables ms relevantes en relacin al problema a estudiar, con el objeto de poder atribuir
las diferencias en los resultados a la accin de la intervencin practicada. Este tipo de
estudios se emplean desde la investigacin pre-registro de los medicamentos (fases I-III),
hasta las fases post-registro. Tienen posibilidades de diseo muy variado y la muestra estudiada puede ser pequea, 20-100 probandos o hasta los grandes estudios que incluyen
a miles de pacientes, tan en boga actualmente y que son bautizados frecuentemente con
un acrnimo ingenioso.

Ensayos de campo: Tratan con sujetos que an no han adquirido la enfermedad o con
aqullos que estn en riesgo de adquirirla, y estudian factores preventivos de enfermedades
como pueden ser la administracin de vacunas o el seguimiento de dietas.
Ensayos comunitarios: Incluyen intervenciones sobre bases poblacionales amplias. Este
tipo de diseos suelen ser cuasi experimentales (existe manipulacin pero no aleatorizacin),
en los que una o varias comunidades recibirn la intervencin, mientras que otras servirn
como control.
Los estudios experimentales, si tienen un diseo cuidadoso con un tamao muestral
suficiente, un proceso de aleatorizacin adecuado, una intervencin y un seguimiento perfectamente controlados pueden proporcionar evidencias muy fuertes que nos permitan emitir
juicios sobre la existencia de relaciones causales entre variables.
[ 93 ]

Frecuentemente, los estudios clnicos pequeos no alcanzan potencia estadstica para


sacar conclusiones, en especial cuando se intenta, por ejemplo, analizar el efecto que tiene
una intervencin sobre desenlaces muy importantes, como mortalidad o complicaciones
graves, infartos de miocardio, accidentes vasculares cerebrales, etc. Para contestar esta
pregunta se requieren estudios muy grandes y seguimientos por tiempos prolongados, en
general ms de 4 aos, por lo que estos ensayos son muy caros y toman mucho tiempo para
obtener conclusiones slidas. Una alternativa para solucionar estos problemas pueden ser
los metanlisis.

Generalidades sobre los metanalisis


En la literatura de los ltimos aos, nos encontramos frecuentemente con este tipo de
anlisis conjunto de estudios de investigacin y nos ser muy til tener nociones sobre como
se genera e interpreta un metanlisis.
El metanlisis es una evaluacin y sntesis sistemtica, organizada y estructurada, de un
problema de inters, con base en los resultados de varios estudios independientes realizados
sobre este problema. Es un estudio de estudios o epidemiologa de sus resultados.1
El primer metanlisis (no con ese nombre) fue realizado probablemente en 1904 por Karl
Pearson, quien intent superar el problema del reducido poder estadstico de los estudios realizados con muestras pequeas. Se le ocurri que si se acumulan los resultados de un grupo
de estudios similares, se puede alcanzar un tamao mayor de valores y el manejo estadstico
puede mejorar.
El trmino metanlisis fue introducido por Gene V. Glass, 2 un psiclogo de la educacin,
en el ao 1976. Se trata de una tcnica matemtico-estadstica que permite, con una certeza
razonable, analizar en conjunto los resultados de estudios clnicos independientes, con hiptesis y enfoques analticos similares que resulten combinables, practicados en muestras relativamente pequeas, que analizados independientemente muestran resultados no conclusivos sobre
el mismo problema. Relaciona sistemticamente y cuantifica gran diversidad de resultados y
ofrece conclusiones cuantitativas y cualitativas sobre el aspecto estudiado. La idea es que no se
pueden mezclar peras con manzanas, a menos que ambas se consideren como frutas: debido
a que en estudios diferentes las diversas variables dependientes se miden en diferentes escalas,
en el metanlisis la variable dependiente se transforma en una medida del tamao del efecto,
transformndola en una medida estndar equivalente a una diferencia entre las medias o frecuentemente a la relacin de desventajas (relacin de momios o en ingls Odds ratio).
El prefijo meta implica el concepto de junto o paralelo y tambin puede entenderse como
algo que acontece ms tarde que o, simultneamente, con algo que es ms comprensivo que su
precursor. Algunos sinnimos utilizados incluyen: Revisin cuantitativa, sntesis. De hecho
los metanlisis se entienden en la Medicina Basada en Evidencias como un tipo de Revisin
cuantitativa, pues se distinguen dos tipos de revisiones:
1. Revisiones narrativas: Revisan un tema en forma ms o menos exhaustiva, generalmente por un experto en el contenido. En general, el autor presenta el tema en un formato
narrativo sin declarar explcitamente los mtodos utilizados para obtener y seleccionar la
informacin presentada. Su debilidad radica en que no existen normas sobre cmo conseguir
[ 94 ]

los datos primarios o cmo integrarlos; por lo tanto, no existe un estndar para evaluar la
calidad de la revisin.
2. Revisiones sistemticas): Son aquellas que resumen y analizan la evidencia respecto
de una pregunta especfica en forma estructurada, explcita y sistemtica. Tpicamente, se
explicita el mtodo utilizado para encontrar, seleccionar, analizar y sintetizar la evidencia
presentada. Existen dos tipos de revisiones sistemticas:
a) Cualitativas: Cuando se presenta la evidencia en forma descriptiva, sin anlisis estadstico.
b) Cuantitativas o Metanlisis: Cuando mediante el uso de tcnicas estadsticas, se
combinan cuantitativamente los resultados en un slo estimador puntual.
Los metanlisis se requieren por la misma razn por la que se necesitan los grandes
estudios, aleatorizados y controlados, y mientras estos se realizan pueden sustituirlos. Los
estudios pequeos y medianos tienen mayor oportunidad de sufrir un sesgo estadstico, fundamentalmente por una menor oportunidad de que el reparto entre los grupos sea realmente
por azar, y frecuentemente no tienen el poder estadstico, por el tamao de la muestra, para
distinguir diferencias no tan obvias. El metanlisis, a diferencia de los grandes estudios controlados, no est sujeto a reglas tan estrictas, por lo que siempre sus conclusiones deben ser
tomadas como interinas, mientras se tiene la informacin proveniente de un gran estudio. Su
ventaja ms importante es que para brindar informacin, no requiere del periodo de tiempo
tan largo como un buen gran estudio.

El nivel jerrquico de evidencias obtenidas por los metanlisis


Existe gran confusin en el nivel jerrquico que ocupan los metanlisis para la obtencin
de evidencias. En algunas clasificaciones, como la del Centro para la Medicina basada en
Evidencias de Oxford, la revisin sistemtica de estudios controlados y aleatorizados, con
homogeneidad, representa el nivel 1a, mientras que los estudios aleatorizados de casos, con
intervalos de confianza estrechos constituyen el nivel 1b.
Pongamos en perspectiva la utilidad de los metanlisis:
Un estudio clnico, pequeo o mediano, controlado y aleatorizado, sirve para estudiar
mecanismos.
Un metanlisis de estudios clnicos, pequeos o medianos, y aleatorizados, sirve para
generar hiptesis y planear estudios clnicos mas dirigidos.
Un estudio clnico grande, controlado y aleatorizado, sirve para obtener respuestas amplias y confiables.
Un metanlisis de estudios clnicos grandes, controlados y aleatorizados, sirve para obtener un estimado tpico y no sesgado del efecto de un tratamiento o para estudiar las
interacciones entre subgrupos.
Sin embargo existen evidencias de que la informacin obtenida por metanlisis an de estudios grandes y muy bien hechos, es inferior a la evidencia obtenida por un estudio mayor. Por
ejemplo el magnesio en el tratamiento del infarto del miocardio, los estrgenos en la prevencin
[ 95 ]

de la enfermedad cardiovascular en la mujer, los antioxidantes vitamnicos para la prevencin


cardiovascular, los antibiticos para clamidias en el tratamiento del sndrome isqumico coronario agudo, mostraron en estudios medianos y en metanlisis de ellos, ser tiles. Sin embargo,
cuando se practicaron estudios clnicos aleatorizados y controlados en poblaciones muy grandes no se demostr ninguna utilidad con estos procedimientos. Este fenmeno puede explicarse
por la metodologa del metanlisis desarrollado, pues cuando se basan solamente en datos
publicados en forma agregada, solo proporcionan estimaciones del efecto de los tratamientos y
de su significacin, que no se confirman cuando se analiza toda la evidencia relevante.
La mejor metodologa es la que rene, comprueba y analiza datos de pacientes individuales procedentes de todos los ensayos relevantes. Desafortunadamente este mtodo
requiere una cantidad de tiempo considerable, as como recursos humanos y financieros
muy amplios. Estos estudios se conocen como metanlisis basados en datos de pacientes
individuales (DPI).
Por esta razn, pensamos que la evidencia obtenida del metanlisis tradicional es provisional y que requiere la prueba final con el estudio controlado, aleatorizado, de preferencia
cegado, con un tamao muestral suficiente para mostrar una diferencia estadsticamente significativa con intervalos de confianza muy estrechos. Estos estudios son lo mejor con lo que
cuenta la ciencia para demostrar la verdad. (La senso-percepcin que es el nico camino
que tiene la mente para conocer el entorno, puede ser muy engaoso, por lo que el mtodo
cientfico es la nica forma conocida de obtener certezas razonables sobre la realidad).

Objetivo y utilidad de los metanlisis


A. Evitar el efecto producido por las variaciones del muestreo en una serie de pequeos estudios y, por lo tanto, comprobar la existencia de un efecto en la direccin de inters. Esto
es: incrementar el tamao muestral y el poder estadstico.
B. Confirmar hiptesis u otra informacin generada en estudios preliminares o exploratorios.
C. Identificar errores producidos en diversos estudios y que por su magnitud nicamente
puedan ser identificados mediante su agrupacin.
D. Buscar asociaciones adicionales a los objetivos centrales de las investigaciones originales
y que por su escasa frecuencia no pudieron ser detectadas en estudios individuales.
E. Generar nuevas hiptesis que justifiquen su posterior investigacin, en dos aspectos: reconocer cules son las variables de mayor relevancia y cules las comparaciones ms
apropiadas y ayudar a decidir entre organizar un gran estudio en un solo sitio o varios
pequeos en diferentes lugares.

El proceso del metanlisis


Las etapas a seguir, al practicar un metanlisis, son muy parecidas a las que se siguen con
otro tipo de investigacin, solamente que en este caso la unidad de observacin no son pacientes
o sujetos, sino estudios3. La siguiente secuencia es una modificacin de la recomendada por la
Asociacin Espaola de Hipertensin y la Liga Espaola de Lucha contra la Hipertensin:4
[ 96 ]

1. Se elabora un protocolo, que defina claramente los objetivos y que describa minuciosamente los mtodos que se utilizarn durante el estudio, el establecimiento de la pregunta
que se desea responder y las razones para ella se deben especificar claramente.
2. Se identifican las fuentes bibliogrficas que se sometern a revisin, principalmente
consultas en Medline con palabras clave, en ocasiones es necesario contactar a los investigadores originales para obtener permisos y bases de datos. Se debe realizar una bsqueda exhaustiva, objetiva y reproducible de los trabajos originales sobre el tema, que adems de bases
de datos electrnicas incluya bsquedas detalladas en las revistas relacionadas y bsquedas
manuales de la llamada literatura gris (referencias bibliogrficas, tesis doctorales, comunicaciones a congresos, informes de instituciones pblicas o privadas, trabajos no publicados o
publicados en revistas no indexadas, etc). La exhaustividad y el rigor de la bsqueda bibliogrfica determinar en gran medida la calidad y validez final del metanlisis.
3. Es necesario declarar expresamente, desde antes los criterios de seleccin de los ensayos clnicos que deben ser incluidos, esto es criterios de inclusin y exclusin clara de
estudios. Los investigadores deben establecer cules de los trabajos recuperados sern incluidos finalmente en el metanlisis, elaborando una lista de criterios de inclusin y exclusin que deber ser lo ms objetiva posible. Para evitar el denominado sesgo de seleccin,
es importante aplicar dichos criterios rigurosamente a cada estudio, siendo recomendable
que esta evaluacin sea realizada de forma ciega e independiente por varios evaluadores.
Entre los criterios de seleccin utilizados con mayor frecuencia en el metanlisis estn: el tipo
de diseo de los trabajos, el tamao muestral estudiado, la exhaustividad de la informacin
que presentan o la comparabilidad en la definicin de los factores de exposicin, de las intervenciones y de las respuestas estudiadas.
Aunque algunos autores sugieren utilizar la calidad metodolgica de los trabajos como
un criterio de inclusin, es ms aconsejable considerarlo como una variable ms a tener en
cuenta en la interpretacin de los resultados del metanlisis mediante un anlisis de sensibilidad, es conveniente emplear la clasificacin de la evidencia segn las revistas mayores del
tema. En cualquier caso, una vez valorada la calidad metodolgica de cada trabajo, algunos
autores proponen utilizar las puntuaciones asignadas como pesos en el metanlisis, mientras
que otros defienden la utilizacin en su lugar de un anlisis de sensibilidad.
4. La seleccin de investigadores independientes que lean, clasifiquen, codifiquen, cuantifiquen y finalmente evalen y elijan el grupo de ensayos clnicos que sern incluidos, es una
opcin para garantizar la equidad de acceso de los estudios.
5. Elaborar una gua de los datos que deben ser recolectados de los ensayos clnicos escogidos para ser procesados en el metanlisis.
6. Combinar los resultados obtenidos y asegurar la calidad de los datos y su procesamiento estadstico adecuado. Los investigadores debern concretar qu medidas se van a
utilizar para medir el efecto de inters, en funcin del tipo de respuesta a estudiar y el diseo
[ 97 ]

de los estudios revisados. As, por ejemplo, si la respuesta es binaria (enfermedad/no enfermedad, muerte/supervivencia,) las medidas de efecto utilizadas suelen ser la diferencia de
proporciones, el riesgo relativo o la relacin de desventajas o momios. Por el contrario, si la
respuesta es un parmetro numrico (por ejemplo, la determinacin de un parmetro analtico) el efecto suele medirse mediante la diferencia estandarizada de medias en los grupos de
inters. Debe tenerse en cuenta que en los estudios experimentales, con grupos aleatorizados,
el propio diseo controla la confusin y los efectos pueden medirse con resultados crudos
como los descritos. Por el contrario, en metanlisis realizados a partir de evidencia observacional, el control del sesgo en el anlisis deber hacerse mediante tcnicas de regresin
multivariada, siendo los resultados de estos modelos los que deben combinarse en la etapa del
metanlisis para obtener una medida global de inters.

Finalmente, es tambin aconsejable que en el momento de planificacin de la investigacin
se fije la diferencia mnima en la variable respuesta que ser considerada de relevancia clnica.
En la mayora de los casos, el estimador del efecto combinado se calcula como una
media ponderada de los estimadores de cada estudio, donde los pesos se asignan en base a
la precisin de cada trabajo, generalmente el inverso de la varianza de la estimacin correspondiente. De esta forma, los estudios con mayor variabilidad (por ejemplo, aquellos con
un tamao muestral ms reducido), tienen una contribucin menor en el estimador global.
La heterogeneidad entre estudios puede ser tenida en cuenta en estos clculos utilizando el
llamado modelo de efectos aleatorios, o no ser incluida mediante el uso del modelo de efectos
fijos.5 La principal diferencia es que con este ltimo se considera que no existe heterogeneidad
entre estudios, mientras que con el modelo de efectos aleatorios se consideran dos posibles
fuentes de variabilidad, la variabilidad intra-estudio y la variabilidad entre-estudios, que se
incorporan al estimador combinado a travs de los pesos correspondientes. No obstante,
debe tenerse en cuenta que cuando existe una gran heterogeneidad entre estudios el metaanlisis, an bajo la suposicin de efectos aleatorios, no es apropiado y lo que procede es
identificar las fuentes de variabilidad y realizar un anlisis por subgrupos.
Cuando hay informacin suficiente son dos los pasos que se siguen: en primer lugar la
extraccin del estimador especfico del estudio y su error estndar y luego la combinacin de
esos estimados en un estimador o funcin de resumen.
Cuando la informacin existente es incompleta como para permitir utilizarla con algunos clculos sencillos, existen mtodos estadsticos complejos que permiten hacerlo: ajustes
usando estimadores externos de confusin tales como factorizacin de riesgos relativos y
ajuste de coeficientes; ajustes para sesgos de seleccin y clasificacin; tasas y razones de regresin; estimacin desde informes que emplean categoras amplias de exposicin y estimacin
de coeficientes desde informes que slo presentan promedios. El estimador adecuado puede
ser una diferencia de proporciones entre dos grupos, una relacin de momios, un riesgo relativo, etc. Cada uno de ellos tiene sus ventajas e inconvenientes y por lo tanto su eleccin debe
ser meditada y justificada. Tambin podemos estar evaluando una variable cuantitativa continua, en cuyo caso habitualmente se utilizar como medida del efecto la diferencia de medias
entre los grupos, o situaciones ms complicadas, que de momento no vamos a considerar,
como pueden ser variables de tipo ordinal, o variables similares a las utilizadas en el anlisis
de supervivencia (observaciones censuradas), etc.
[ 98 ]

Aunque existen diferentes propuestas estadsticas para combinar estudios, hay tres fundamentales, que se conocen con el nombre modelo de efectos fijos, modelo de efectos aleatorios y por ltimo el modelo bayesiano.
En el modelo de efectos fijos los estudios se combinan considerando que no existe heterogeneidad entre ellos, y que por lo tanto todos ellos constituyen estimaciones de un efecto
real, cuya magnitud se desea conocer. As pues, la inferencia realizada est condicionada a
los estudios que se han efectuado.
En el modelo de efectos aleatorios la inferencia se basa en suponer que los estudios incluidos en el anlisis constituyen una muestra aleatoria del universo de estudios posibles, y
sus resultados son ms conservadores al tener en cuenta una fuente extra de variacin, ya que
ahora se incluyen dos posibles fuentes de variacin: la existente dentro de los estudios y la
variacin entre los estudios.
La utilizacin de modelos bayesianos constituye, una alternativa interesante a la estadstica inferencial clsica.
7. Anlisis de la heterogeneidad de los estudios: la evaluacin del grado de heterogeneidad de los estudios puede llevarse a cabo mediante distintas pruebas estadsticas, entre las
que destaca la prueba Q propuesta por Der Simonian y Laird.6 No obstante, estos tests presentan una potencia muy baja, dado que adems en la mayora de los casos los metaanlisis
incluyen un nmero relativamente pequeo de estudios, aumentando as la posibilidad de cometer un error de Tipo II. Por todo ello, el anlisis de la heterogeneidad suele llevarse a cabo
mediante mtodos grficos como el grfico de LAbb o el grfico de Galbraith que permiten
inspeccionar visualmente la falta de homogeneidad entre los estudios recopilados.
En caso de que exista heterogeneidad entre los estudios incluidos en la revisin, los investigadores pueden optar simplemente por no realizar el metaanlisis, por obtener una medida
agregada del efecto de inters indicando una medida de la variabilidad entre estudios o bien
por realizar un anlisis por subgrupos homogneos de ser posible identificar la causa de la
heterogeneidad.
8. Anlisis de sensibilidad: El anlisis de sensibilidad permite estudiar la influencia individual de cada estudio al resultado del metaanlisis y, por lo tanto, determinar si los resultados pueden verse sesgados por estudios con escasa calidad metodolgica, trabajos no
publicados o que no cumplan estrictamente los criterios de seleccin, etc. Consiste en replicar
el metaanlisis quitando en cada paso uno de los estudios incluidos, para ver si se obtienen o
no resultados similares de forma global.
9. Identificacin del sesgo de publicacin: Como en cualquier otro estudio, en un metanlisis deber valorarse la existencia de posibles sesgos entre los que el sesgo de publicacin
es uno de los ms importantes. Entre los mtodos disponibles para valorar el sesgo de publicacin el grfico en embudo o funnel plot7 es quiz el ms utilizado, en el que se representa el
tamao muestral de cada trabajo frente al tamao del efecto detectado. Este tipo de grficos,
puesto que pueden dar lugar a interpretaciones poco objetivas, suelen complementarse con
tcnicas estadsticas como la prueba de Begg y Egger.8
[ 99 ]

10. Analizar e interpretar los resultados del metanlisis


11. Llegar a conclusiones y dar recomendaciones.
12. Elaborar el informe final y publicar el metanlisis.
En resumen el primer paso es la elaboracin de un protocolo correcto de investigacin,
en el que se inicie describiendo el motivo para practicar el metanlisis, los objetivos que se
proponen, la hiptesis que se intenta demostrar, es muy importante precisar el mbito del
cual se seleccionaran los estudios que se agruparn, el alcance para la bsqueda de trabajos y
de los mtodos que se utilizarn en esa bsqueda, as como los criterios de la inclusin y de la
exclusin de los estudios candidatos a ser incluidos. El siguiente paso es elaborar un resumen
de los datos obtenidos de los diferentes trabajos en forma estructurada y de esta forma proceder al anlisis, la descripcin de los resultados y por ultimo su discusin. Todo el proceso
debe ser descrito con toda claridad en la publicacin, puesto que solo se puede juzgar de la
calidad de un metanlisis si se est seguro que se sigui un procedimiento alejado de sesgos.
Para que un metanlisis sea aceptado como fuente de informacin definitiva, debe cumplir
con requisitos similares a los de un buen estudio clnico que seran:

Caractersticas cualitativas:
1. Un protocolo prospectivo
2. Definicin comparable de los eventos cruciales a incluir
3. Control de calidad de los datos
4. Inclusin de todos los pacientes, de todos los estudios seleccionados, para el anlisis
final

Caractersticas cuantitativas:
1. Cuidado de que la muestra total sea suficientemente grande para asegurar resultados
reales y confiables
2. Empleo de tcnicas cuidadosas de estadstica para constatar, que la acumulacin de
datos es correcta y que los resultados del metanlisis puedan ser confiables.

Representacin grfica de los resultados


Adems de toda la informacin bsica de cada estudio, se presenta la informacin reanalizada (estimacin puntual del efecto, error estndar) en forma de tabla, lo cual permite
visualizar la variacin de los resultados. Tambin se presenta en forma grfica a travs de un
histograma ponderado de los resultados.
En el caso de los metanlisis no es posible el clculo verdadero del riesgo relativo, por lo
que se recurre frecuentemente al clculo de la relacin de momios con su respectivos intervalos de confianza, la grfica de la relacin de momios nos da una impresin visual muy til y
fcil de interpretar. Analicemos la figura 1 que corresponde a un metanlisis de la mortalidad
[ 100 ]

observada en 17 estudios de prevencin secundaria, despus de un infarto del miocardio,9


utilizada para explicar estos conceptos en una magnfica serie que sobre metanlisis ha publicado el British Medical Journal.10
Cada cuadro negro representa la relacin de momios de un estudio diferente, su tamao
expresa el peso relativo de cada estudio.
Las lneas horizontales corresponden a los intervalos de confianza al 95% de cada estudio (contienen el efecto verdadero del estudio que se repetir en el 95% de las ocasiones en el
que el estudio se efecte nuevamente)
La lnea vertical slida equivale a la relacin de momios 1, que es el punto de corte en el
cual el efecto del uso del betabloqueador es igual a no usarlo, llamado punto de no-efecto,
de tal forma que si los cuadrados que muestran los resultados se sitan a la izquierda de esta
lnea, el usar un betabloqueador es mejor que no usarlo y se sita del lado contrario, es mejor
no usar un betabloqueador que usarlo.
Si los intervalos de confianza tocan o cruzan la lnea de igualdad (1), la diferencia no tiene
validez estadstica, (p>0.05) . En este ejemplo ninguno de los estudios muestra diferencia estadsticamente significativa, excepto los estudios G y J, que favorecen el uso del betabloqueador.
El rombo blanco indica la combinacin de todos las relaciones de momios su ancho
muestra los intervalos de confianza de la combinacin, esto es: la relacin de momios calculada en conjunto para los estudios incluidos en el metanlisis es de 0.28 con intervalos de
confianza del 95% que van de 0.71 a 0.87. Otra manera de expresar este resultado es decir
que el uso de betabloqueadores despus de un infarto del miocardio reduce la mortalidad en
un 22% (1 - 0.78 = 0.22 = 22%).
La lnea punteada que expresa la relacin de momios conjunta, cruza la casi totalidad
de los intervalos de confianza de cada estudio, excepto la del estudio N, lo que indica que el
metanlisis se efecto con una serie de estudios bastante homogneos entre si.

Principales problemas de los metanlisis


Los dos principales problemas metodolgicos de los metanlisis de ensayos clnicos son:11, 12
El sesgo de publicacin que es una de las principales limitaciones de los metanlisis, consiste en que no todos los ensayos clnicos realmente realizados se publican, de esta forma los
trabajos con resultados positivos y significativos estadsticamente, tienen mayor probabilidad
de ser publicados que los que no muestran diferencias, o estas son negativas, es decir que no
hayan encontrado diferencias entre el grupo de estudio y el de control o que estos resultados
resulten inesperados. Por otra parte los buenos estudios, adems de ser ms aceptados, tardan
menos en ser publicados y son citados con ms frecuencia, lo que aumenta considerablemente la
probabilidad de que aparezcan en una bsqueda bibliogrfica. Asimismo los ensayos con gran
nmero de pacientes, tienen mayor probabilidad de ser publicados, aunque sean de tipo negativo. De entre los trabajos que se publican, aquellos con resultados estadsticamente significativos
tienen una mayor probabilidad de aparecer en las revistas importantes. Por lo que no cabe duda,
e incluso se han hecho estudios que lo confirman, que hay un sesgo favorecedor de determinado
tipo de publicaciones, un importante sesgo de idiomas, los publicados en ingls son mucho ms
[ 101 ]

accesibles y citados y adems existe una preferencia en el nmero de citas, lo que conlleva a que la
probabilidad de que determinados resultados intervengan o no en un metaanlisis est sesgada.
El otro problema frecuente que limita la validez externa de los metanlisis, es la heterogeneidad entre los ensayos seleccionados para el metanlisis, que se da necesariamente por
diferentes caractersticas clnicas y socio-demogrficas de las poblaciones de cada ensayo,
pues suceden en distintas instituciones y regiones del mundo. Los mtodos de evaluacin
clnica aplicados, la dosis, forma farmacutica o pauta de dosificacin del frmaco evaluado,
etc., resultan muy heterogneos pues proceden de diferentes protocolos.

El futuro de los metanlisis


Los grandes estudios controlados y aleatorizados para conocer el impacto que las acciones teraputucas tienen sobre los descenlaces importantes y para fundar nuevas indicaciones
de agentes teraputicos seguirn realizndose en el futuro, aunque quiz en menor escala por
su alto costo. Por lo que veremos todava muchos metanlisis en este campo.

Figura 1: Ejemplo de la representacin grfica de un metanlisis. Modificada de: Yusuf S y col.9

[ 102 ]

Referencias
1. Greendlands S. Quantitative methods in the review of epidemiologic literature. Epidemiol Rev 1987; 9: 1-30.
2. Thacker SB Meta-analysis: A quantitative approach to research integration JAMA 1988;
259: 1685-1688.
3. Guallar E, Banegas JR, Martn-Moreno JM, Del Ro A. Metaanlisis: su importancia en
la toma de decisiones clnicas en cardiologa. Rev Esp Cardiol 1994; 47: 509-517
4. Sociedad Espaola de Hipertensin y Liga Espaola de Hipertensin www.seh-lelha.org/
stat1.htm, consultada noviembre 15-2007
5. Egger M, Smith GD, Phillips AN. Meta-analysis: Principles and procedures. BMJ 1997;
315: 1533-1537.
6. DerSimonian R, Laird N. Meta-analysis in clinical trials. Control Clin Trials 1986; 7:
177-188.
7. Egger M, Smith GD, Schneider M, Minder C. Bias in meta-analysis detect by a simple,
graphical test. BMJ 1997; 315: 629-634.
8. Begg CB, Mazumsdar M. Operating characteristics of a rank correlation test for publication bias. Biometrics 1994; 50: 1088-1101.
9. Yusuf S, Peto R, Lewis J, Collins R, Sleight P. Beta blockade during and after myocardial
infarction: an overview of the randomized trials. Prog Cardiovasc Dis 1985; 27:335371
10. Egger M, Smith GD, Phillips AN. Meta-analysis: Principles and procedures. BMJ 1997;
315:1533-1537
11. Ruano-Ravia A, Figueiras A, Barros-Dios JM. El metaanlisis a debate. Med Clin
(Barc) 2002; 119(11): 435-439.
12. Egger M, Smith GD. Meta-analysis bias in location and selection of studies. BMJ 1998;
316: 61-66.

[ 103 ]

Captulo 9

Que es cardiologa basada en la evidencia?


Salim Yusuf

Rafael Daz

n 1836, el editor del American Journal of Medical Sciences, Elisha Bartlett, present un
estudio declarndolo como uno de los ms importantes trabajos mdicos del siglo que
marcar el comienzo de una nueva era en la ciencia. Dicha proclama, que sugera un cambio
de paradigma, la determinaba una coleccin sistemtica y presentacin numrica de una serie
de datos acerca de flebotomas (sangras) efectuadas por el Dr Pierre Louis.1 Este mdico Francs acumul una vasta cantidad de datos de una gran cantidad de pacientes durante sus aos
de actividad como clnico y anatomopatlogo en el hospital Parisino de la Charit. Louis fue
un clnico meticuloso, lo cual tuvo importantes implicancias en la calidad de su investigacin
sobre la eficacia de la flebotoma para el tratamiento de la neumona. Despus de establecer en
cada paciente el tiempo desde el inicio de los sntomas, analiz la duracin de la enfermedad y
la frecuencia de muerte segn el momento en que se efectu la primera sangra, obteniendo dos
grupos comparables. Louis argumentaba que esto era necesario para equilibrar las diferencias
entre ellos, pues siguiendo esta metodologa los errores (que son inevitables) se distribuyen
igualmente en los dos grupos de pacientes sometidos a diferente tratamiento y, de esta manera,
se compensan mutuamente pudiendo ser desestimados sin afectar sensiblemente la exactitud de
los resultados.2 Louis prosegua: un agente teraputico no puede ser empleado con alguna
probabilidad de xito, a menos que su eficacia en casos anlogos haya sido previamente documentada y as, sin la ayuda de la estadstica, nada que se parezca a la medicina es posible.3
El concepto prevaleciente de la poca era que los enfermos se hallaban contaminados,
bien por alguna toxina o contagio, o por un exceso de uno u otro. Esta concepcin de la enfermedad contena en s la idea de que esos estados mejoraran abriendo una vena para dejar
salir el padecimiento al exterior. La investigacin de Louis comprob que la sangra aceleraba
la muerte de los pacientes portadores de neumona, mostrndose como una sorpresa devastadora. Precisamente, a George Washington se le haban extrado 2,4 litros de sangre en las
15 horas previas a su muerte: haba estado padeciendo fiebre, dolor de garganta y dificultad
respiratoria durante 24 horas.4 Basados en la observacin de Louis algunos han sostenido que
Washington fue asesinado.5-7
Aunque ste es un ejemplo relativamente reciente, el reclamo de una evaluacin comparativa se materializ tempranamente, y a travs de la historia hubo repetidos exhortos para
cuantificar los problemas mdicos o sanitarios y para comparar los resultados en grupos de
[ 104 ]

pacientes bajo diferentes conductas teraputicas y asistir a los mdicos en forma individual.
En este captulo discutiremos el significado de la medicina basada en la evidencia y su
consecuente toma de decisiones. Desarrollaremos un caso clnico como recurso didctico en
la aplicacin de estos conceptos.

Qu es la medicina basada en la evidencia?


Aunque los fundamentos de la medicina basada en la evidencia fueron establecidos
a lo largo de varias centurias, recin en las ltimas dcadas ha sido concebida como una
filosofa explcita, con sus conceptos, definiciones y modelos conexos que la instalan como
una doctrina formal. La medicina basada en la evidencia es un recurso que procura hallar
la mejor evidencia experimental, objetiva, cuantificable y relevante para resolver un problema en particular.8 Este enfoque le quit nfasis a la intuicin, la experiencia clnica no
sistemtica y al fundamento fisiopatolgico aislado como bases suficientes para la toma
de decisiones clnicas, acentuando la importancia de el examen de la evidencia a partir
de la investigacin clnica.9 Sin embargo, la evidencia experimental aislada nunca es suficiente para tomar una decisin clnica. El mdico siempre debe interpretar a la evidencia en
el contexto del paciente individual, y analizar desde una perspectiva costo beneficio la aplicabilidad de esa evidencia en esa situacin clnica particular. Adems, deben considerase
igualmente las preferencias y los valores del paciente. 10 La figura 1 est basada en la primera edicin de Evidence-Based Medicine 11 y fue publicada en una editorial del ACP Journal
Club y Evidence-Based Medicine en 1966, cuya definicin es: La medicina basada en la
evidencia consiste en el empleo juicioso y consciente de la mejor evidencia disponible proveniente de la investigacin clnica en el manejo de pacientes individuales.12 Asimismo, la
editorial inclua la advertencia de que la definicin evolucionara a medida que emergieran
nuevos tipos de informacin, y por ello debera depurarse y mejorarse continuamente.

Figura 1. Modelo temprano de los elementos clave para las decisiones clnicas basadas en la
evidencia.

[ 105 ]


Los conceptos de medicina basada en la evidencia han evolucionado considerablemente y
el modelo inicial ha sido recientemente ampliado, especialmente en lo que se entiende por experiencia clnica y en lo concerniente a la consideracin de las circunstancias clnicas. En la seccin
siguiente utilizamos este nuevo modelo de decisiones clnicas basadas en la evidencia para
ayudar a resolver un caso clnico frecuente.

Enfoque de la toma de decisiones basada en la evidencia.


Panorama clnico
Un mdico de familia le enva a usted un paciente y requiere su contribucin en el tema
de la teraputica antitrombtica. Se trata de un hombre de 80 aos con historia de hipertensin arterial, en quien hace 10 meses se constat una fibrilacin auricular en un examen de
rutina. Al da siguiente de este diagnstico, el paciente sufri una hemorragia digestiva que
requiri hospitalizacin, endoscopa y transfusin de sangre urgentes. El paciente no haba
iniciado teraputica antitrombtica pero s haba recibido AINES por una osteoartritis.
Continu libre de sntomas gastrointestinales y mediante la ingesta de acetaminofeno ha
evitado exitosamente a los AINES. Ocho meses atrs el ecocardiograma evidenci funcin
ventricular izquierda normal, ausencia de alteraciones estructurales y funcionales valvulares y aurcula izquierda severamente dilatada (65 mm). Basado en la duracin de la arritmia
usted decide que la cardioversin no es una opcin vlida. El paciente est muy preocupado
por la posibilidad de padecer un accidente cerebrovascular (ACV), ya que su esposa, luego
de un ACV mayor, qued completamente dependiente de l durante los 2 aos previos a su
muerte. El mdico referente, quien recientemente tuvo un paciente que sufri serio sangrado
gastrointestinal mientras se hallaba recibiendo warfarina, se encuentra muy preocupado
acerca del riesgo de sangrado que presenta su paciente actual, considerando su edad y la
historia reciente de hemorragia digestiva.
Nuevo modelo para las decisiones clnicas basadas en la eficiencia
La Figura 2 muestra la evolucin del modelo para las decisiones clnicas basadas en la
evidencia, 8 que ha sido redefinido recientemente como la integracin de la mejor evidencia clnica con las habilidades clnicas (expertise) y el juicio u opinin del paciente.13 Este
modelo representa un enfoque deseable de cmo deberan ser construidas las decisiones clnicas. No obstante, reconocemos que actualmente muchas de las decisiones clnicas no son
realizadas de este modo. Por ejemplo, hoy en da, las preferencias individuales de los mdicos
(que no son lo mismo que sus habilidades clnicas), tienen a menudo un gran papel en sus
decisiones, llevando a grandes variaciones en lo concerniente al manejo prctico de casos
similares. De esta manera, confrontados con pacientes crticamente enfermos, distintos mdicos pueden instituir diferentes intervenciones.14 Nuestro modelo acepta que las preferencias
de los pacientes sean consideradas en primer trmino anteponindose a las preferencias de los
mdicos, siempre que esto sea factible.
En la Figura 2, el estado y circunstancias clnicas del paciente reemplaza a la habilidad clnica como uno de los elementos clave en la toma decisiones. Las preferencias del
[ 106 ]

paciente son extendidas hasta incluir las acciones del paciente, y stas se superponen con
evidencia experimental, comprometiendo su frecuente precedencia frente a sta. Integrar
los tres aspectos requiere juicio y experiencia clnica, constituyendo un cuarto elemento
integrador. Describiremos cada componente, y el rol de la experiencia clnica que los fusiona.

Figura 2. Modelo en evolucin para las decisiones clnicas basadas en la evidencia

Estado clnico y circunstancias del paciente


El estado clnico y las circunstancias del paciente juegan a menudo un papel dominante
en la toma de decisiones clnicas. Los ensayos clnicos nos proporcionan resultados que reflejan al paciente promedio dentro de los grupos de tratamiento del estudio, pero raramente
el paciente de la prctica clnica es el mismo que el paciente promedio del estudio clnico.
Los pacientes individuales tienen caractersticas nicas y poseen en un menor o mayor nivel
de riesgo de eventos, o de efectos colaterales del tratamiento, que el del paciente promedio
del ensayo clnico. As, las decisiones clnicas ptimas deberan ser ajustadas al estado clnico
del paciente. Un paciente que presenta alto riesgo de un futuro evento vascular pero bajo
riesgo para cualquier complicacin derivada del uso de una determinada droga (por ejemplo,
un paciente con colesterol LDL de 300 mg/dl post infarto de miocardio y ninguna contraindicacin para terapia con estatinas), o a la inversa, un paciente que se halla en bajo riesgo
de eventos y en alto riesgo de complicaciones por el tratamiento (por ejemplo, un hombre
de 40 aos con fibrilacin auricular sin factores de riesgo para ACV que ha experimentado
un sangrado gastrointestinal importante), exhiben estados clnicos que pueden dominar el
desarrollo del proceso de decisin.
Es notable que los crculos correspondientes a estado, circunstancias clnicas y evidencia experimental se superpongan. Frecuentemente la evidencia experimental puede in[ 107 ]

formarnos acerca de la influencia del estado y las circunstancias clnicas. Considerando a


nuestro paciente, los datos reunidos de cinco estudios clnicos randomizados (ECRs) que
evaluaron la eficacia de la warfarina en pacientes con fibrilacin auricular no valvular
(FANV), demostraron una tasa media anual de ACV del 4-5% y una tasa de sangrado mayor del 1% en pacientes que no reciben medicacin antitrombtica. Los investigadores, que
combinaron los cinco ECRs, usaron los datos de los pacientes del grupo control para desarrollar una herramienta para la prediccin clnica que permitiera estimar el riesgo anual de
ACV. En estos pacientes los factores de riesgo que predijeron ACV en forma independiente
fueron la edad, historia de hipertensin arterial, diabetes, y ACV o ataque isqumico transitorio previo. El riesgo anual de ACV para nuestro enfermo resulta estimado en 8%, ms
alto que el 4.5% del paciente control promedio de los cinco ECRs.15 Anlogamente, ha sido
desarrollada una herramienta de prediccin clnica del riesgo de sangrado mayor (definido
como la prdida del equivalente a dos unidades de sangre en 7 das, o sangrado que amenace la vida) durante el tratamiento con warfarina.16 Los factores de riesgo que lo predicen en
forma independiente incluyen edad >65 aos, historia de ACV, historia de sangrado gastrointestinal, infarto de miocardio reciente, anemia, insuficiencia renal y diabetes (ntese que
varios de los factores que predicen un mayor riesgo de ACV, aumentan asimismo el riesgo
de sangrado). El riesgo de sangrado mayor de nuestro paciente, igual a 8%, tambin difiere
de aqul del paciente promedio tratado con warfarina en los cinco ECRs, cuyo riesgo anual
de sangrado fue del 1.3%. No tenemos conocimiento de instrumentos clnicos diseados
para predecir sangrado mayor durante la ingesta de aspirina, y los ensayos clnicos sobre fibrilacin auricular no tenan una potencia suficiente para estimarlo. No obstante, basados
en los resultados del meta-anlisis realizado por los investigadores del grupo Antithrombotic Trialists Collaboration, esperaramos que la aspirina aumente el riesgo de sangrado
mayor en 1% a 1.3% en promedio.17
Las circunstancias mdicas en las cuales se encuentran usted y su paciente (como su posibilidad de administrar y controlar el tratamiento) pueden ser muy diferentes de las de un
ECR. Por ejemplo, el paciente puede no tener la posibilidad de controlar el nivel de anticoagulacin con la necesaria frecuencia. No obstante, para un paciente con las mismas caractersticas clnicas es posible optimizar las circunstancias clnicas para disminuir el riesgo
de un evento o de un efecto colateral del tratamiento. Por ejemplo, podemos disminuir el
riesgo de sangrado por warfarina mediante un monitoreo ms intenso de sus parmetros
de coagulacin. Luego, una decisin basada en la evidencia acerca de la anticoagulacin
para un paciente con fibrilacin auricular, no est solamente determinada por la eficacia
demostrada de la terapia antitrombtica y por sus potenciales efectos adversos, sino que
oscilar segn el estado clnico del paciente y de acuerdo con las circunstancias clnicas
individuales.

Preferencias y acciones de los pacientes


Los pacientes pueden o no poseer firmes opiniones sobre sus opciones teraputicas, dependiendo de su estado, valores y experiencias personales, grado de aversin al riesgo, recursos y seguros de salud, familia, voluntad de tomar la medicacin, informacin exacta o
[ 108 ]

incorrecta a su disposicin, etc.8 Individuos con estados clnicos y circunstancias muy semejantes pueden elegir cursos de accin muy diferentes, a pesar de haber sido confrontados con
la misma informacin acerca de los beneficios y riesgos de una intervencin.
Para nuestro paciente con FANV la evidencia experimental nos provee informacin sobre las diferentes preferencias de los pacientes y sus mdicos respecto de la terapia antitrombtica en la fibrilacin auricular, al evaluar los riesgos de ACV y sangrado.18 En este
caso, los participantes (mdicos y pacientes) revisaron material que describa en detalle las
consecuencias en el corto y largo plazo de un ACV mayor y menor y de un sangrado mayor.
A los participantes se les inform que la probabilidad de ACV mayor y menor era la misma.
Los participantes fueron entonces interrogados mediante un cuestionario tcnico (trade-off
technique*) que determinaba el nmero mnimo de ACVs que sera necesario poder prevenir
para que cada participante juzgara que la terapia antitrombtica estaba justificada (valor
determinado para la warfarina y la aspirina), considerando el riesgo asociado de sangrado,
costos e incomodidades.
La misma tcnica fue empleada para determinar el nmero mximo de sangrados que
el participante considerara aceptable con la teraputica antitrombtica (determinado para
warfarina y aspirina dados los beneficios en trminos de reduccin de los ACV con esta
terapia). Este estudio demostr una variabilidad significativa entre mdicos y pacientes en
su ponderacin de los posibles resultados asociados con la fibrilacin auricular y su tratamiento. Los pacientes requeran menos reduccin de los ACV y eran ms tolerantes con el
riesgo de sangrado que los mdicos. Por ejemplo, en promedio, los pacientes se hallaban
dispuestos a aceptar el riesgo de 17 eventos extra de sangrado mayor en 100 pacientes en un
perodo de 2 aos, si la warfarina prevena 8 ACVs entre esos 100 individuos. Los mdicos,
no obstante, estaban dispuestos a aceptar solamente 10 eventos de sangrado mayor por el
mismo nivel de beneficios. Ms an, los mdicos variaban significativamente acerca de qu
riesgo de sangrado era aceptable para una determinada reduccin en los ACV asociada
con un agente antitrombtico. De este modo, distintos mdicos daran recomendaciones
muy diferentes al mismo paciente con idnticos riesgos de sangrado y ACV. Esto subraya
la importancia de guiar las decisiones por medio de los valores y preferencias del paciente.
Es el paciente el que est en riesgo de eventos y as, siempre que lo desee y sea apto para
hacerlo, debera ser l quien pondere los potenciales beneficios versus los riesgos, costos
e incomodidades.
Existe controversia en cuanto al modo ptimo de obtener e incorporar las preferencias
del paciente en la elaboracin de las decisiones clnicas. Un mtodo es discutir los beneficios
y los riesgos potenciales con el paciente e incorporar la impresin del mdico acerca de las
preferencias del paciente en la decisin clnica.
Cualesquiera que sus preferencias puedan ser, las conductas de los pacientes pueden diferir de sus preferencias y de los consejos del mdico.19 Por ejemplo, un paciente puede preferir
perder peso, dejar de fumar y tomar sus medicamentos de acuerdo a las prescripciones, pero
* trade-off technique: postula que un individuo puede elegir entre un conjunto de alternativas disponibles de forma
que maximice su satisfaccin. Ello implica que conoce cada una de las alternativas y es capaz de evaluarlas. En el caso
de un individuo racional y consistente es posible definir una funcin de valor (determinstica) o una funcin de utilidad
(probabilstica) que represente sus preferencias.

[ 109 ]

su conducta contrastar y estar alejada para llegar a alcanzar esos objetivos. Alternativamente, pueden seguir el tratamiento como est prescripto, an siendo renuentes a la imposicin,
los efectos adversos y el costo. Desafortunadamente, las estimaciones de los mdicos sobre
la adherencia de sus pacientes a los tratamientos prescriptos no tienen ms exactitud que la
de una conjetura. 20
Debemos reconocer que actualmente las preferencias de los pacientes raramente son incorporadas a la prctica clnica. Esto puede estar relacionado con la falta de entrenamiento
del mdico en este tipo de enfoques, el recelo de transitar por terrenos poco familiares, y tambin en muchas circunstancias a la falta de informacin cuantitativa exacta de los posibles
peligros o beneficios y sobre herramientas de prediccin del riesgo.

Evidencia Experimental
Nosotros respaldamos una definicin muy amplia de la evidencia experimental, que
podra ser: cualquier observacin emprica acerca de la relacin aparente entre eventos.
De acuerdo con esta definicin, la evidencia experimental incluye desde la observacin no
sistemtica de un solo mdico, hasta la revisin sistemtica de grandes ECRs. No toda la
evidencia se origina por igual, y por lo tanto hay una jerarqua de evidencias que vara segn
se trate de decisiones diagnsticas, pronsticas o teraputicas. 21
Toda evidencia es valiosa, y la mejor evidencia disponible debe ser entonces considerada. As, las observaciones no sistemticas de los colegas no deberan ser desestimadas cuando no existe un nivel de evidencia mayor. Ciertamente, las observaciones aisladas
pueden conducir a concepciones muy valiosas, y los clnicos experimentados generalmente
tienen respeto por los conceptos de sus colegas ms avezados. No obstante, es igualmente
importante reconocer que las observaciones no sistematizadas estn corrientemente limitadas por el pequeo nmero de casos observados, la variabilidad de los resultados, la falta de
objetividad y las dificultades para integrar otras variables (por ejemplo, al tomar en cuenta
la historia natural de la enfermedad, el efecto placebo y el deseo del paciente de complacer al
mdico). 22 Toda evidencia tiene limitaciones, aunque la mayora de los avances en medicina
son inicialmente trados a la luz a travs de observaciones individuales, estudios fisiolgicos,
observacionales o ensayos controlados y randomizados designados para evaluar eventos surrogantes. Sin embargo, hubo varios descubrimientos que causaron marcada confusin y, en
algunas oportunidades, han llegado a producir dao. Es importante recordar que no han sido
pocos los casos de resultados contradictorios entre diferentes estudios, con distintos niveles
de jerarqua en la tabla de evidencias. Quiz el ejemplo ms importante est en la historia de
la terapia antiarrtmica. A pesar de la evidencia alentadora de que la encainida y la flecainida
podan prevenir la extrasistolia ventricular, un ECR demostr una mayor tasa de mortalidad
con esas drogas que con placebo, resultando en una muerte extra por cada 20 pacientes que
reciban esta teraputica. 23 Se estima que ms norteamericanos murieron a causa de esas drogas que en la guerra de Vietnam. 24 En forma ideal, correspondera tener evidencias en todos
los niveles de jerarqua, evidencias que deberan ser coherentes con cada uno de estos niveles
[ 110 ]

transformndolas en las ms convincentes. No obstante, esto raramente ocurre, porque todava los ECRs exhiben frecuentemente por azar hallazgos contradictorios, especialmente
cuando son pequeos.
Por lo tanto, es deseable utilizar el mayor nivel de evidencia disponible para la toma de
decisiones, como la proveniente de la revisin sistemtica de varios ECRs o, simplemente, de
un extenso ECR bien diseado. El ECR es una herramienta muy poderosa porque la randomizacin es nuestro nico medio para reducir el sesgo en las comparaciones de tratamientos,
al controlar factores pronsticos conocidos y desconocidos. 25 Es as que, los ECRs tienen
la posibilidad de proveer la ms valiosa estimacin del efecto del tratamiento y cuando
sus criterios de inclusin son amplios aumentan la generalizacin de sus hallazgos (validez
externa). 26
Retornando a nuestro caso del paciente con FANV, el mayor grado de evidencia procede
de una revisin sistemtica de todos los ECRs que han evaluado la terapia antitrombtica en
pacientes con fibrilacin auricular. 27 Este estudio demuestra que la warfarina reduce el riesgo
relativo de ACV (isqumico y hemorrgico) en 62%, y la aspirina en 22%.
Considerando el riesgo de sangrado asociado con la terapia con warfarina, hay un ECR
que demuestra un 50% de disminucin del riesgo de sangrado si el paciente est dispuesto a
someterse a un proceso de aprendizaje, entrenamiento y auto-monitoreo del tiempo de protrombina. 28

Experiencia clnica
La toma de decisiones requiere experiencia clnica para establecer y balancear el estado del paciente, sus condiciones, preferencias, conductas y la mejor evidencia experimental
disponible. Antes de considerar cualquier decisin teraputica se necesita la pericia clnica
suficiente para obtener un diagnstico y un pronstico correctos. Como se ha visto, los procedimientos para la prediccin clnica pueden ser extremadamente tiles para determinar
el pronstico del paciente, pero es muy improbable que puedan eliminar la necesidad de un
juicio slido basado en la experiencia clnica.
Como parte de la experiencia clnica, la comunicacin con el paciente adquiere gran
importancia debido a un creciente deseo de los pacientes de involucrarse en las decisiones
relativas a su salud. La experiencia clnica es necesaria para proveer a los pacientes la informacin que necesitan, conocer sus preferencias e incorporarlas en las decisiones. Actualmente no existe consenso acerca de cmo debe presentarse la informacin a los pacientes y
cmo incorporar sus preferencias. No obstante, sabemos que la informacin no debe manifestarse en trminos relativos (por ejemplo, la warfarina disminuir su riesgo en de ACV
en 62%). 29 Una reciente revisin sistemtica de ECRs que comparaban ayudas de decisin
(trade-off technique) con los mtodos tradicionales de involucrar/informar a los pacientes
en la toma de decisiones, demostr que las ayudas de decisin, al contrario que los mtodos
corrientes, mejoraban los puntajes promedio de comprensin de las opciones y resultados
posibles en 20% (95% CI 13 25), redujeron los puntajes de conflicto de decisiones (esto
es, los pacientes se sintieron ms seguros, informados y orientados acerca de los alcances
de su decisin), y aumentaron la participacin del paciente en la toma de decisiones. 30
[ 111 ]

Cuando es accesible, la ayuda de decisiones potencialmente provee un medio para facilitar


la presentacin de la informacin, la incorporacin de las preferencias y la participacin en
el proceso de la toma de decisiones.

Los roles variables de los componentes de las decisiones clnicas basadas en la


evidencia
Dependiendo de las circunstancias, podra predominar cualquiera de los crculos del
nuevo modelo. Esto puede visualizarse variando el tamao de los crculos para reflejar su
contribucin efectiva a la decisin clnica. A veces, el estado clnico o la situacin del paciente
dominan la determinacin mdica. Por ejemplo, el proceso de toma de decisiones en un paciente que se halla en alto riesgo de eventos y bajo riesgo de complicaciones, puede hallarse
dominado por el estado clnico. Un paciente que vive en un rea remota puede no tener acceso
al monitoreo de la anticoagulacin, y esto probablemente dominara el proceso de toma de
decisiones. Las preferencias del paciente pueden ser tan fuertes que acten como factor determinante en dicho proceso. Tal el caso de algunos pacientes que no querrn recibir productos
derivados de la sangre sin importar su situacin clnica.
La evidencia experimental puede ser el factor principal cuando el beneficio de una intervencin es moderado a importante y el riesgo es pequeo, como la teraputica con bloqueantes beta adrenrgicos en pacientes post-infarto de miocardio, los inhibidores de la enzima
convertidora de la angiotensina II en la enfermedad coronaria o la insuficiencia cardaca, o la
reduccin del colesterol con estatinas. Finalmente, la experiencia clnica puede predominar,
especialmente cuando se trata de recursos tcnicos.

Aplicacin a nuestro paciente


Para nuestro paciente la evidencia sugerira un 8% de riesgo de ACV anual y 1% de
riesgo de sangrado mayor sin terapia antitrombtica. Con warfarina esperaramos que el
riesgo anual de ACV se redujera al 3% y el de sangrado mayor aumentara a 8%. Este ltimo
podra ser reducido al 4% si el paciente estuviera dispuesto a controlar l mismo su tiempo de
protrombina y cumplir un programa de educacin relacionada con ello, como se ha discutido
ms arriba. 28 Con aspirina esperaramos que la tasa anual de ACV disminuyera a 6% y el
riesgo de sangrado mayor aumentara a 1.3%.
Como se ha discutido anteriormente, no hay consenso en cuanto a cmo presentar esta
informacin a nuestro paciente o cmo incorporar sus preferencias. Nosotros hemos elaborado una ayuda de decisiones para pacientes que describe la fibrilacin auricular (Tabla 1), un
ACV mayor y uno menor (Tabla 2), un sangrado severo (Tabla 3) y un balance de las probabilidades resultantes para ningn tratamiento, tratamiento con aspirina, y tratamiento con
warfarina (Figura 3).

[ 112 ]

Tabla 1. Fibrilacin auricular: el desorden ms comn del ritmo cardaco


Riesgo

Las chances de desarrollarla aumentan con la edad y est presente en alrededor del 10%
de las personas por encima de los 75 aos de edad.

Sntomas

Latidos cardacos irregulares y habitualmente rpidos, percibidos como un aleteo en


el pecho. Algunos pacientes no tienen molestias y no estn al tanto de que padecen
fibrilacin auricular.

(Stroke) Accidente cerebrovascular (ataque cerebral)


La fibrilacin auricular aumenta el riesgo de desarrollar cogulos en el corazn. Estos
pueden ser arrastrados por la sangre hasta el cerebro, produciendo un accidente
cerebrovascular.
Complicaciones Con la fibrilacin auricular las chances de desarrollar un ataque cerebral aumenta con
la edad (mayor de 65 aos), alta presin arterial, diabetes, insuficiencia cardaca, y con el
previo antecedente de mini-ataques (mini-strokes).
El riesgo de desarrollar un accidente cerebrovascular con la fibrilacin auricular vara,
dependiendo en cuntos de los factores arriba mencionados tiene usted.
Tratamiento

Hay medicaciones para licuar o disolver la sangre, que ayudan a prevenir los cogulos y
por lo tanto el ataque cerebral (stroke).
La sangre licuada aumenta a su vez el riesgo de sangrado.

Tabla 2. Los accidentes cerebrovasculares pueden ser mayores o menores segn su severidad.
Si usted padece uno a causa de la fibrilacin auricular, las posibilidades de que sea mayor o
menor, son las mismas.
Accidente menor

Accidente mayor

Sntomas fsicos

Sbitamente usted no puede mover o


sentir un brazo y una pierna.

Sbitamente usted no puede mover un


brazo y una pierna. No puede tragar.

Sntomas mentales

No puede comprender completamente


lo que se le dice y tiene dificultad para
expresarse.

Es incapaz de comprender lo que se le


dice y de hablar.

Dolor

No siente dolor

No siente dolor
Es internado.
No se puede vestir por s mismo.
Las enfermeras lo alimentan.
No puede caminar.

Recuperacin

Riesgo subsiguiente

Es internado.
Su debilidad, embotamiento y problema
con el habla mejoran, pero todava siente
algo dbil o torpe un brazo o pierna.
Despus de 1 mes de fisioterapia puede
Puede realizar casi todas sus actividades
mover los dedos de los pies y levantar el
como antes del ataque.
brazo de la cama.
Puede manejarse en forma independiente.
Deja el hospital luego de 1 semana.
Permanece en este estado por el resto
de su vida.
Tiene un mayor riesgo de sufrir otros
ataques cerebrales.

Su muerte ser causada probablemente


por otras enfermedades.

Las descripciones de ACV mayor y menor, y de sangrado severo, son ligeras modificaciones de las desarrolladas y chequeadas por Man-Son Hing y colegas. 31 Tambin hemos
personalizado el balance de las probabilidades para nuestro paciente, asumiendo que realizara el monitoreo de su tiempo de protrombina en caso de decidir terapia con warfarina
(Figura 4).
Tabla 3. Sangrado severo mientras toma warfarina o aspirina: un ejemplo a nivel del estmago.

Fsicamente

Usted no se siente bien durante 2 das, entonces tiene un vmito de sangre.

Tratamiento

Es hospitalizado.
Suspende la toma de warfarina o aspirina.
Un mdico lo examina mediante un tubo que pasa por la garganta, para localizar de dnde
viene la sangre.
Recibe sedacin para aliviar las molestias del examen.
No necesita operaciones (ciruga).
Recibe transfusiones de sangre para reemplazar la que ha perdido.

Recuperacin

Permanece en el hospital por una semana.


Hacia el final de su estada en el hospital, ya se siente bien.
Necesita tomar pastillas durante 6 meses, para evitar un nuevo sangrado.
Luego de todo esto, usted ha vuelto a la normalidad.

Al alcanzar esta decisin clnica basada en la evidencia, nuestra tarea an no est completa. El paciente necesitar control para asegurar que l est en condiciones de seguir y
concretar el tratamiento indicado. Una ventaja de la ayuda de decisiones provista es que el
paciente puede llevar a su domicilio la informacin y no tiene que confiar en su memoria para
recordar los hechos discutidos durante la entrevista mdica.

Limitaciones del modelo de decisin clnica basado en la evidencia


Este modelo no toma en cuenta los importantes roles que la sociedad, los gobiernos y las
organizaciones de salud pueden jugar en la toma de decisiones. Nosotros nos hemos limitado
deliberadamente a la consideracin de las decisiones tomadas por los pacientes y sus proveedores de salud, a fin de permitir un examen enfocado de los temas involucrados en forma
inmediata al tomar cualquier decisin. Por ejemplo, la falta de reembolso de la angioplastia
transluminal coronaria primaria en el infarto agudo de miocardio puede tener un enorme
impacto en los resultados de las polticas de salud, e impondr una decisin clnica sobre
todos los pacientes y los mdicos al eliminar esta opcin. En estos casos, los mdicos debern
intervenir considerando las condiciones clnicas de sus pacientes.

[ 114 ]

Sin medicacin anticoagulante


Chance de ACV en los prximos
2 aos
es por 100.
Chance de sangrado severo en los
prximos 2 aos
es por 100.

Aspirina
Chance de ACV en los prximos
2 aos
es por 100.
Chance de sangrado severo en los
prximos 2 aos
es por 100.

Warfarina
Chance de ACV en los prximos
2 aos
es por 100.
Chance de sangrado severo en los
prximos 2 aos
es por 100.

Figura 3.

Conclusiones
Los fundamentos de la medicina basada en la evidencia han sido establecidos a lo largo
de los siglos pero las filosofas especficas, conceptos, definiciones y modelos han evolucionado esencialmente en las ltimas dcadas. La medicina basada en la evidencia trata de la
solucin de problemas clnicos. La toma de decisiones basada en la evidencia depende de la
utilizacin de la experiencia clnica para integrar la informacin acerca del cuadro clnico y
las condiciones de un paciente, con la mejor evidencia experimental disponible, incorporando al mismo tiempo las preferencias y conductas del enfermo.

[ 115 ]

Sin medicacin anticoagulante


Chance de ACV en los prximos
2 aos
es 8por 100.
Chance de sangrado severo en los
prximos 2 aos
es 1por 100.

Aspirina
Chance de ACV en los prximos
2 aos
es 6por 100.
Chance de sangrado severo en los
prximos 2 aos
es ..1,3...por 100.

Warfarina
Chance de ACV en los prximos
2 aos
es 3por 100.
Chance de sangrado severo en los
prximos 2 aos
es 4por 100.

Figura 4

Referencias
1. Louis PCA. Researches on the effects of blood-letting in some inflammatory diseases,
and on the influence of tartarised antimony and vesication in pneumonitis. Am J Med Sci
1836;18:102-11.
2. Louis PCA. Researches on the Effects of Bloodletting in Some Inflammatory Diseases
and on the Influence of Tartarised Antimony and Vesication in Pneumonitis. Translated
by CG Putnam. Boston: Hilliard, Gray, 1836.
3. Louis PCA. Medical statistics. Am J Med Sci 1837; 21: 525-8.
4. Morens DM. Death of a president. N Engl J Med 1999; 341: 1845-9.
5. Lloyd JU. Who killed George Washington? Eclectic Med J1923; 83: 3536, 403-8, 453-6.
6. Marx R. A medical profile of George Washington. Am Heritage 1955; 6: 43-7, 106-7.
7. Pirrucello F. How the doctors killed George Washington. Chicago Tribune Magazine, 20
February 1977.
8. Haynes RB, Devereaux PJ, Guyatt GH. Clinical expertise in the era of evidence-based
medicine and patient choice. ACPJournal Club 2002; 136: A11-A13.
9. Evidence-based medicine working group. Evidence-based medicine, a new approach to
teaching the practice of medicine. JAMA 1992; 268: 2420-5.
[ 116 ]

10. Haynes RB, Sackett DL, Gray JMA, Cook DC, Guyatt GH. Transferring evidence from
research into practice: 1. The role of clinical care research evidence in clinical decisions.
ACPJournal Club 1996; 125: A-14. Evidence-Based Medicine1996; 1: 196.
11. Sackett DL, Richardson SR, Rosenberg W, Haynes RB. Evidence-Based Medicine: how
to practice and teach EBM. London: Churchill Livingstone, 1997.
12. Sackett DL, Rosenberg WMC, Gray JA, Haynes RB, Richardson WS. Evidence-Based
Medicine: What it is and what it isnt. BMJ 1996; 312: 71-2.
13. Sackett DL, Straus S, Richardson SR, Rosenberg W, Haynes RB. Evidence-Based Medicine: how to practice and teach EBM, 2nd edn. London: Churchill Livingstone, 2000.
14. Cook DJ, Guyatt GH, Jaeschke R. Determinants in Canadian health care workers of the
decision to withdraw life support from the critically ill. JAMA 1995; 273: 703-8.
15. Atrial Fibrillation Investigators. Risk factors for stroke and efficacy of antithrombotic
therapy in atrial fibrillation. Arch Intern Med 1994; 154: 1449-57.
16. Beyth RJ, Quinn LM, Landefeld S. Prospective evaluation of an index for predicting the
risk of major bleeding in outpatients treated with warfarin. Am J Med 1998; 105: 91-9.
17. Antithrombotic Trialists Collaboration. Collaborative metaanalysis of randomised
trials of antiplatelet therapy for prevention of death, myocardial infarction, and stroke in
high risk patients. BMJ 2002; 324: 71-86.
18. Devereaux PJ, Anderson DR, Gardner MJ et al. Differences between perspectives of physicians and patients on anticoagulation in patients with atrial fibrillation: observational
study. BMJ 2001; 323: 1218-22.
19. Haynes RB. Improving patient adherence: State of the art, with a special focus on medication taking for cardiovascular disorders. In: Burke LE, Okene IS (eds). Patient Compliance in Healthcare and Research. American Heart Association Monograph Series.
Armonk, NY: Futura Publishing Co, 2001.
20. Stephenson BJ, Rowe BH, Macharia WM, Leon G, Haynes RB. Is this patient taking
their medication? JAMA 1993; 269: 2779-81.
21. Guyatt G, Haynes B, Jaeschke R et al. Introduction: the philosophy of evidence-based
medicine. In: Guyatt G, Rennie DR (eds). Users guides to the medical literature. AMA
Press, 2002.
22. Nisbett R, Ross L. Human Inference. Englewood Cliffs, NJ:Prentice-Hall, 1980.
23. Echt DS, Liebson PR, Mitchell LB. Mortality and morbidity in patients receiving encainide, flecainide, or placebo: The Cardiac Arrhythmia Suppression Trial. N Engl J Med
1991; 324: 781-8.
24. Moore TJ. Excess mortality estimates. Deadly medicine: why tens of thousands of heart
patients died in Americas worst drug disaster. New York: Simon & Schuster, 1995.
25. Kunz R, Oxman AD. The unpredictability paradox: review of empirical comparisons of
randomised and non-randomised clinical trials. BMJ 1998; 317: 1185-90.
26. Chalmers I. Unbiased, relevant, and reliable assessments in health care. BMJ 1998; 317:
1167-8.
27. Hart RG, Benavente O, McBride R, Pearce LA. Antithrombotic therapy to prevent stroke
in patients with atrial fibrillation: a meta-analysis. Ann Intern Med 1999; 131: 492-501.
28. Beyth RJ, Quinn L, Landefeld CS. A multicomponent intervention to prevent major
[ 117 ]

bleeding complications in older patients receiving warfarin. Ann Intern Med 2000; 133:
687-95.
29. Malenka DJ, Baron JA, Johansen S, Wahrenberger JW, Ross JM. The framing effect of
relative and absolute risk. J Gen Intern Med 1993; 8: 543-8.
30. OConnor AM, Rostom A, Fiset V et al. Decision aids for patients facing health treatment
or screening decisions: a systematic review. BMJ 1999; 319: 731-4.
31. Man-Son-Hing M, Laupacis A, OConnor A et al. Warfarin for atrial fibrillation: The
patients perspective. Arch Intern Med 1996; 156: 1841-8.

[ 118 ]

IV. Anlisis del conocimiento y herramientas


para su validacin

Captulo 10

Lectura crtica de la literatura cientfica


Daniel Fernndez-Bergs

Antonio Paragano

esde el advenimiento de la informtica y la llegada de Internet los tiempos han cambiado; hoy da, el mdico ve como lejanas las pocas en que deba realizar las bsquedas
bibliogrficas en los complejos libros del Index Medicus para, finalmente, localizar los trabajos que otros colegas citaban en sus artculos de investigacin. En este momento cualquier
buscador, cada vez menos especfico, nos permite introducir un ttulo o referencia y una ola
de informacin inunda la pantalla de nuestra computadora. ste es un autntico cambio cualitativo, una inflexin en la evolucin de nuestro acceso a la informacin y en la modulacin
de nuestro pensamiento.
La experiencia, adquirida con los aos de ejercicio en la profesin, contina siendo importante, pero es imprescindible unir a ella el conocimiento que surge de las investigaciones. La
medicina basada en la evidencia1 ha demostrado con claridad cmo la informacin o el conocimiento que no ha sido verificado puede llegar a incorporarse por dcadas en la prctica clnica
con resultados opuestos al esperado. Sirven a modo de ejemplo los estudios CAST I y II,2-3 donde se expuso que la administracin de drogas antiarrtmicas del grupo I-C, de la clasificacin
de Vaughan Williams,4 aumenta la mortalidad en los pacientes que han padecido un infarto
agudo de miocardio. Esta informacin, ahora hecha conocimiento, anul un errneo concepto
teraputico previo, la muerte sbita en el paciente coronario sobreviene como consecuencia
de las arritmias ventriculares, luego, cualquier frmaco capaz de tratarlas con eficacia evitar
millones de muertes. Por supuesto, no se consideraba que una droga antiarrtmica por sus
efectos arritmognicos podra aumentar la mortalidad de estos pacientes.
La introduccin del meta-anlisis constituy un notable avance en el conocimiento y, sobre todo, destac la necesidad de emprender estudios con el poder suficiente para demostrar
con robustez una hiptesis de trabajo. La investigacin biomdica produce actualmente una
gran cantidad de informacin cientfica, disponible en grandes bases de datos electrnicas, el
punto crucial es poder distinguir si lo que leemos es realmente creble, es decir, si es aceptable
segn la idea que poseemos sobre el tema para ser incorporado a nuestra prctica cotidiana
con seguridad.
Cmo se construye la informacin resultante de una investigacin es el tpico que nos
ocupa, pero nadie puede negar que para comprender adecuadamente un trabajo de investigacin es necesario tener un conocimiento aproximado en lo referente a metodologa y anlisis
estadstico, de lo contrario, habr que recurrir a comentarios sobre el estudio en cuestin pa[ 121 ]

ra tener una idea ms concreta acerca de su credibilidad. Uno de los objetivos de este captulo
es transmitir al lector la necesidad de leer un trabajo de investigacin con cierto orden y rigor,
cuestionando y contrastando lo ledo con otras publicaciones sobre el mismo tema. Tambin
pretende orientar acerca de cmo interpretar rpida, correctamente y con pocas frmulas, las
medidas estadsticas ms frecuentes en la bibliografa mdica.

El artculo cientfico
Un artculo cientfico recoge en forma ordenada la informacin que surge de un trabajo
de investigacin. Por lo tanto, debemos leerlo crticamente y en cada apartado observar si lo
que sostiene o propone tiene una base razonable. 5 Corresponde saber si la publicacin que
seleccionamos es de calidad y si sus resultados pueden aplicarse a nuestro desarrollo profesional. La medicina basada en la evidencia ha contribuido considerablemente para facilitar esta
tarea, aunque, finalmente quien lee es el que decide si lo que examina es creble. La credibilidad surge del juicio cualitativo, pero este juicio de valor conlleva implcito el conocimiento
de la metodologa empleada para resolver el problema investigado.
Un primer paso para reconocer la calidad del artculo es averiguar si la revista que lo
publica est indexada, esta comprobacin nos da ciertas garantas, ya que probablemente
lo hayan ledo previamente al menos dos revisores y un editor jefe, que han tratado que su
revista gane prestigio con la publicacin que acepta. Es cierto que a veces, a la hora de publicar, no se puede evitar el sesgo de aceptacin que tiene un autor conocido, pero no es lo ms
frecuente. Este punto nos lleva a recomendar que siempre se verifiquen los autores. Conocen
el tema que publican o es su primer artculo? Son de una institucin con reconocida trayectoria en investigacin? Quiz, esto puede parecer discriminatorio, pero debemos saber qu
vamos a leer porque en la profesin mdica la lectura es constante, y la velocidad con que se
desarrolla el conocimiento, y nos llega la informacin, obliga a este ejercicio cotidianamente
pues nuestro tiempo es limitado.
Adems del ttulo, la publicacin debe adjuntar al inicio un resumen que sintetice la
investigacin y sus conclusiones. Luego comenzar con una introduccin al tema, que nos
anuncia el estado actual de la situacin que se investiga, nos informa acerca de la hiptesis
que sustenta el trabajo y cules son los objetivos del mismo. Proseguir con el material que
es objeto de la investigacin (pacientes generalmente) y los mtodos seguidos, donde conoceremos el diseo del trabajo y con qu herramientas ha sido construido. A esta exposicin
sucedern los resultados obtenidos para culminar con la discusin, donde los autores deben
defender, criticar, justificar sus hallazgos, proponer cambios o nuevos estudios y comunicar
las limitaciones de su investigacin.
Frecuentemente surgen otros puntos de valor y que son parte de los requerimientos de
las revistas cientficas, como la declaracin de conflicto de intereses, que tambin deben ser
ledos con atencin pues no son banales. El artculo cerrar con los agradecimientos y por
ltimo la bibliografa.
A continuacin, las secciones mencionadas y de las que corrientemente se compone una
comunicacin cientfica sern examinadas en sus aspectos ms esenciales.
[ 122 ]

1. Ttulo y resumen
El ttulo debe responder a la hiptesis planteada para el progreso de la investigacin, o
enumerar el o los resultados importantes, instruyndonos acerca de las caractersticas del
ensayo o, qu tipo de artculo vamos a leer.
El resumen es una sntesis ordenada que slo pretende dar un pantallazo informativo al
lector, pero no es el artculo. Ninguna prctica peor que leer el resumen y sus conclusiones asumiendo, falsamente, que sta lectura nos ha brindado el conocimiento integral de la investigacin.
El resumen puede, a lo sumo, informarnos en lneas muy generales sobre el tema que se discutir
y si el mismo es de nuestro inters. El conocimiento vendr luego de evaluar la informacin completa, de tal manera podremos conformar una idea ms concreta sobre su credibilidad.

2. Introduccin
La introduccin debe ser sucinta, pero relevante, y dejar claramente planteado el estado
de la cuestin y los puntos que deben todava investigarse, porque resultan conflictivos o bien
porque han surgido nuevas evidencias en la literatura mundial. A lo largo de todo el trabajo
deberemos cotejar las citas bibliogrficas, al leerlo verificaremos si la hiptesis que lo sustenta se apoya en otras investigaciones, sealadas en las referencias, y que son el antecedente
cientfico que respalda la teora de la nueva publicacin. Puesto que es muy difcil tener ideas
absolutamente originales u observar hechos que nadie ha visto, debemos recordar siempre la
frase del genial Nbel espaol Ramn y Cajal: No hay cuestiones agotadas sino hombres
agotados en las cuestiones.

3. Objetivos
Cada ensayo debe exponer claramente el objetivo principal, si van a estudiarse otros
puntos de inters los mismos sern secundarios, y deben estar especificados antes de realizar la investigacin. De la propia hiptesis de trabajo se desprende el objetivo. Es cierto que
el resultado del anlisis de subgrupos de pacientes puede servir como molde para futuras
investigaciones, aunque resulta cuestionable observar la cantidad de estudios que analizan
subgrupos de pacientes, que fueron parte de un ensayo clnico con determinado objetivo,
donde se demuestra una cuestin que no form parte del objetivo inicial. El diseo de un estudio depende del punto a estudiar, si se cambia el objetivo, lo ms probable es que el diseo
ya no sea el adecuado y las conclusiones sern discutibles.

4. Material y mtodos
Este apartado nos pone en contacto con las caractersticas propias del estudio. Debe
especificar el lugar geogrfico donde se realiz la investigacin, la edad y gnero de los su[ 123 ]

jetos seleccionados, qu criterios de inclusin y de exclusin se siguieron, etc. Nos referimos


concretamente al diseo del ensayo, y en este sentido, los trabajos de investigacin pueden
clasificarse como: estudios observacionales o experimentales.
Los estudios observacionales se fundamentan en el seguimiento de uno o ms grupos
de pacientes, registrando sus caractersticas para un anlisis posterior. Los experimentales
comprenden una actividad o una intervencin controlada por el investigador, como puede
ser la administracin de un frmaco o procedimiento, y el inters recae sobre el efecto que la
intervencin tiene sobre los sujetos alistados en el estudio.
A. Estudios de observacin:
A1- Descriptivos o casos en serie: el informe describe ciertas caractersticas de un grupo
(o serie) de pacientes (casos), se detallan algunas observaciones interesantes que presenta un
nmero reducido de ellos, en general por un perodo corto de tiempo, y suelen conducir a
la concepcin de una hiptesis que se investigar ms adelante. Por definicin no incluyen
controles, es decir sujetos sin la enfermedad o factor que se indaga, y tampoco admiten intervencin.
A2- Estudios de caso-control (retrospectivos): los casos se seleccionan de manera individual sobre la base de alguna enfermedad o consecuencia, buscando causas o factores de
riesgo que potencialmente puedan explicarla; los controles son sujetos sin la enfermedad. Como indagan hacia atrs en el tiempo se los llama retrospectivos, y como cubren cierto tiempo
tambin son longitudinales. Algunos investigadores, cuando una o varias caractersticas en
los grupos estn desequilibradas usan el sistema de parejas para relacionar casos y controles.
El proceso de parear asegura que los dos grupos sern semejantes, por ejemplo en edad y/o
sexo, evitando confundir al momento de las conclusiones. Generalmente reportan causas e
incidencia de una enfermedad o identifican factores de riesgo.
A3- Estudios transversales (prevalencia): permiten conocer las caractersticas de un grupo de sujetos en un momento determinado, no en un perodo de tiempo. Plantean qu sucede
en ese momento particular, la seleccin y la informacin de los sujetos se obtiene en un corto
plazo de tiempo, por eso tambin se llaman estudios de prevalencia. Los estudios transversales se utilizan para describir una enfermedad o proporcionar informacin respecto al diagnostico o etapa de la misma, y especialmente para describir la utilidad de un procedimiento
nuevo.
A4- Estudios de cohortes (prospectivos): una cohorte es un grupo de individuos con algo
en comn y forman parte del grupo por un perodo prolongado. Ellos se seleccionan por presentar algn rasgo o factor que se sospecha es la causa para un efecto patolgico o enfermedad. Se observan durante cierto tiempo para constatar el efecto de estas caractersticas, tanto
en sujetos que las presentan (expuestos) como en los que no (no expuestos). Como los eventos
que interesan se manifiestan despus de iniciado el estudio tambin se los llama prospectivos.
El ms prestigioso de stos es el estudio Framingham, que inici en 1948 para investigar la
enfermedad ateroesclertica e hipertensiva, a la fecha se han publicado numerosos artculos
sobre el mismo, permaneciendo an en observacin algunos sujetos originales. Sin embargo,
para emprender un estudio de cohorte tambin se puede emplear informacin archivada y
analizarla en la actualidad, precisamente, partiendo de datos sobre factores de riesgo en el
[ 124 ]

pasado se observa su efecto en el presente. En este caso se llaman estudios de cohorte histricos o de cohorte retrospectivos, y nicamente son posibles si los registros de seguimiento
se hallan completos.
B. Estudios experimentales:
En seres humanos se denominan pruebas clnicas, su propsito es extraer conclusiones
acerca de un procedimiento o tratamiento particular.
B1- Pruebas clnicas controladas: estudios donde un procedimiento o frmaco experimental se compara con otro aceptado. Estos se clasifican en:
B1.1- Pruebas con controles paralelos o concurrentes, independientes: incluyen dos grupos, el experimental o sometido al procedimiento que se probar, y el grupo control que recibe el tratamiento estndar o placebo. Los dos grupos deben ser iguales en todos los aspectos,
de modo que las diferencias encontradas se puedan adjudicar al procedimiento y no a otros
factores. Los grupos deben participar del estudio en el mismo perodo, concurrentes, y para
garantizar que los investigadores o los participantes no vean lo que esperan ver, ninguno conoce el grupo al que fue asignado, doble ciego. A su vez estos estudios pueden ser:
Aleatorios o randomizados: los sujetos que participarn en los grupos son distribuidos al azar, esta metodologa proporciona la evidencia ms fuerte de asociacin,
asegurando que el resultado se debe a la participacin.
No Aleatorios: los pacientes no son asignados al azar, presentan el inconveniente de
que nada previene el sesgo en la distribucin de los participantes, y por lo tanto son
menos confiables.
B1.2- Controles secuenciales: incluyen a las pruebas clnicas con autocontroles y los
estudios cruzados. Los estudios con autocontroles utilizan al mismo grupo de sujetos para
opciones experimentales y de control, los pacientes se evalan al inicio del estudio y luego
son sometidos a un procedimiento o tratamiento, para ser estimados nuevamente en busca
de cualquier cambio.
Los estudios con controles cruzados emplean dos grupos, uno experimental y otro control.
Despus de un perodo de tiempo se suspende el tratamiento, experimental y placebo, se deja
transcurrir un tiempo de reposo, en general sin tratamiento alguno, y luego se asigna a cada
grupo el tratamiento alterno, o sea, el grupo control pasa a ser experimental y viceversa.
B1.3- Pruebas con controles externos: el tercer mtodo para controlar experimentos es el
manejo de controles que no pertenecen al ensayo, o externos. Estos comparan el resultado del
propio estudio, grupo experimental, con el de otro investigador, grupo control. En ocasiones
son sujetos que el mismo observador ha tratado previamente con otro procedimiento, en este
caso se llaman controles histricos.
B2- Pruebas clnicas no controladas: son estudios que slo incluyen al grupo experimental, no hay controles. Es ms probable que se usen con procedimientos y no con un frmaco,
el principal conflicto es que los investigadores suponen que el procedimiento experimental es
mejor que cualquier otro, sin haber comprobado su eficacia.6

[ 125 ]

C. Revisiones
C1- No Sistemticas: clsicamente se basa en la seleccin de un nmero determinado de
artculos sobre una cuestin en particular, tras su examen el autor expone una conclusin
ms o menos general sumando adems su experiencia u opinin personal. Esta modalidad de
revisin genera un margen de duda sobre la confiabilidad de lo expresado pues nicamente
ofrece el punto de vista, a veces subjetivo, del autor.
C2- Sistemtica cuantitativa, meta-anlisis: es una metodologa de anlisis cimentada en la combinacin de la informacin obtenida en diferentes ensayos clnicos sobre un
tema determinado. El objetivo es proporcionar una estimacin cuantitativa de todos los
estudios disponibles, y dado que incluye un nmero mayor de observaciones tiene un poder
estadstico superior al de los propios trabajos que contiene. Los principales problemas metodolgicos de los meta-anlisis resultan como consecuencia de la diversidad de los ensayos
clnicos que incluye, ya que las caractersticas clnicas, sociales, demogrficas, etc., de los
sujetos reclutados son diferentes en cada uno de ellos; como tambin son dismiles los mtodos de evaluacin aplicados, la forma farmacutica o dosificacin del frmaco evaluado,
etc. Asimismo, considerando que no todos los ensayos clnicos han sido publicados, por
resultados no esperados o negativos, siempre mantienen la posibilidad de incurrir en un
posible sesgo de publicacin.7 - 13
Continuando con los aspectos metodolgicos, cuando leemos un trabajo de investigacin debemos distinguir si se ha procedido en forma correcta al establecer el tamao de la
muestra, si no encontramos esta informacin nos enfrentamos al menos con dos problemas:
el primero es que no sabemos si el nmero escogido fue el necesario para demostrar las diferencias que se buscaban, y el segundo es si no se ha incluido ms gente innecesariamente,
con los riesgos que puede conllevar para los pacientes seleccionados, adems de la prdida
de tiempo y recursos econmicos. Tambin repararemos sobre la estimacin del nmero de
pacientes perdidos durante el perodo de observacin, porque es muy difcil lograr un seguimiento completo en un estudio de ms de seis meses.
La determinacin del tamao muestral es una tarea del epidemilogo, que mediante un
modelo matemtico que incluye varios elementos, como variabilidad del parmetro, el error
y que indican el nivel de confianza, etc., establece el nmero mnimo imprescindible de
individuos a incluir en los grupos que van a estudiarse. No es necesario en todas las investigaciones, pero es ineludible cuando se buscan diferencias predefinidas entre grupos.
En general se puede decir que a mayor nivel de precisin y confianza, mayor debe ser la
muestra. Se trata en definitiva de entender que si el estudio es pequeo y con un resultado
positivo existe la posibilidad de que sea un falso positivo, ya que el hallazgo pudo ser vlido
nicamente por azar. Investigaciones futuras homologarn su valor, o no, cuando se intenten
confirmar sus deducciones con estudios ms grandes.14
Si hay muestras sanguneas, cmo se recolectaron; si las sustancias que se examinaron
son estables; cuntas muestras se recogieron y en qu condiciones se produjo el almacenamiento y el traslado (si es que lo hubo). Estos aspectos, con las muestras sanguneas en particular, han merecido varios artculos en la literatura mdica dentro de los cuales el de Jaffe y
Vatus15 es particularmente revelador.
[ 126 ]

Las caractersticas de los sujetos seleccionados para participar de la investigacin son un


elemento clave, aunque no el nico, a la hora de evaluar la importancia de una investigacin.
Cuando se lee un artculo cientfico debemos poner atencin a los criterios de inclusin y de
exclusin, ambos deben estar claramente establecidos porque definen a la poblacin objeto
del estudio; y permitir reconocer si estos pacientes son similares a los que vemos en nuestra
prctica clnica.
La seleccin de los mismos, asignacin a un grupo definido, la recoleccin y anlisis de
los datos obtenidos, etc., son puntos importantes que nos introducen al concepto de sesgo,
precisin y validez de un estudio.
Dando por cierto que el tema y los objetivos de un estudio son de inters, queda an determinar si el mismo es preciso y vlido. El propsito de toda investigacin debe concentrarse
en alcanzar la exactitud en la medicin de los datos, todo lo que amenace esta premisa debe
ser identificado y advertido. Hablamos de los errores en las mediciones, y los hay de dos tipos:
aleatorios y sistemticos.
Entendemos por sesgos a los errores sistemticos que producen una estimacin incorrecta
de asociacin entre la exposicin y la enfermedad, o una estimacin equivocada del efecto.
La precisin de un estudio se corresponde con la reduccin del error debido al azar o
aleatorio, error que suele ser de mayor magnitud cuando se realizan inferencias a partir de
resultados obtenidos en muestras pequeas de una poblacin. Para restringir esta desviacin,
el elemento ms importante del que disponemos es incrementar el tamao de la muestra. De
esta manera los intervalos de confianza y el error estndar se reducen, logrando aumentar
la precisin. La precisin de un estudio nos garantiza que ser reproducible, esto es, obtener
aproximadamente el mismo resultado cada vez que se repite, cuando es conducido en las
mismas condiciones.
El error sistemtico aparece como consecuencia de faltas cometidas durante el proceso
de diagnstico o de seleccin de los pacientes. La ausencia de error sistemtico define la
validez del estudio, que tiene dos componentes: la validez interna, que es la ratificacin de
las inferencias a los sujetos incluidos en el propio ensayo, y la validez externa, que posibilita
la generalizacin de los resultados a individuos que no formaron parte del mismo, o a la
poblacin general. La validez interna es por lo tanto un prerrequisito para que pueda darse
la externa.
La validez interna, se ve amenazada por distintos tipos de sesgos:
A. Sesgos de seleccin: los grupos del estudio no son comparables debido a cmo fueron
seleccionados los pacientes, hace referencia a cualquier error que se deriva del proceso de
identificacin de la poblacin a estudiar. Estos sesgos pueden ocurrir al seleccionar el grupo
control o el espacio muestral donde se realizar el estudio. Tambin por prdidas durante el
seguimiento o por la presencia de una supervivencia selectiva. Los sesgos de seleccin pueden
manifestarse en los estudios de casos y controles, cuando el procedimiento utilizado para
identificar la enfermedad (sesgo diagnstico) vara o se modifica con el status de exposicin.
Este sesgo se llama sesgo de deteccin. El resultado produce una relacin entre exposicin
y enfermedad que es diferente entre los individuos seleccionados para el estudio, y aquellos
que pudiendo haber sido elegidos para participar no fueron incluidos.
[ 127 ]

B. Sesgo de informacin u observacin: los grupos de pacientes del estudio no son comparables debido a como se obtuvieron los datos. Incluye cualquier error sistemtico en la
exactitud de los datos o los resultados. Por lo tanto producen una distorsin en la estimacin
del efecto, las fuentes de sesgo de informacin ms frecuentes son: instrumento de medicin
inadecuado, criterios diagnsticos incorrectos, omisiones, o imprecisiones en la bsqueda o
clasificacin de los datos introducidos por los cuestionarios o los encuestadores.
C. Factores de confusin: los autores no han apreciado informacin sobre un factor que
se relaciona a la vez con la exposicin y con el efecto estudiado. Dicho error provocar una
alteracin en la estimacin del resultado, debido a una o ms variables no consideradas. La
prevencin y control de los sesgos potenciales debe considerarse durante el diseo del estudio,
ya que al momento del anlisis no es posible solucionarlos. Por el contrario, los factores de
confusin s pueden controlarse durante el anlisis.16
Por ltimo cules fueron los puntos finales? o end-points. El punto final ms duro es
la mortalidad de cualquier causa o mortalidad total, es fcil de averiguar durante el seguimiento, a travs de un llamado telefnico a familiares o al registro civil. Algunos estudios seleccionan un punto final combinado (dos o ms) aumentan as la tasa de eventos esperada, de
esta manera necesitan incluir menos pacientes que los requeridos al escoger un nico punto
final.17 Cuestin que nos obliga a examinar la publicacin completa, para ver que efecto tuvo
cada uno de los factores que componen el punto final combinado sobre mortalidad global, y
ste ejercicio nos permitir redimensionar las conclusiones.

5. Anlisis estadstico
El anlisis de los datos reunidos durante la investigacin culmina con la obtencin de un
resultado, que es el producto de estimar un parmetro o una diferencia entre grupos o bien
una asociacin entre variables, y este resultado procura responder a la o las preguntas planteadas en el objetivo. En general, el anlisis de los datos experimentales apunta a establecer si
las diferencias o las asociaciones observadas entre los distintos conjuntos estudiados reflejan
caractersticas reales de las poblaciones, o si estos contrastes podran haberse dado por el
azar del muestreo. Esta ltima posibilidad se conoce como hiptesis nula, y el poder rechazarla le confiere legitimidad automtica a la hiptesis alternativa, que es la que suele interesar
especialmente al investigador. En este punto, ante una desigualdad (u otro tipo de relacin)
entre muestras, las tcnicas estadsticas posibilitan cuantificar la probabilidad con que una
diferencia, igual o ms extrema que la advertida, podra ser observada si las muestras provinieran de la misma poblacin, esto es, si la diferencia se debiera solamente a las fluctuaciones
del muestreo. Si dicha probabilidad resulta pequea, digamos menor que el 5%, se dice que la
diferencia observada es significativa, con una probabilidad p< 0,05. De modo que el nivel de
significacin dado por p, mide la probabilidad de equivocarnos al rechazar la hiptesis nula
como improbable y aceptar la alternativa como vlida.
Por lo tanto, p< 0,05 significa que la diferencia observada tiene el 95% de probabilidades
de no provenir de muestras del mismo universo, sino que stas deben representar poblaciones
[ 128 ]

diferentes. El valor 95% se conoce como nivel de confianza de la estimacin. Cuanto menor
es la p, es decir, cuanto menor es la probabilidad de que los resultados observados ocurran
como producto del azar, mayor ser la tendencia a concluir que la diferencia existe en realidad. Deducimos entonces que existe una diferencia significativa entre los grupos o variables
estudiadas, que la posibilidad de equivocarnos es tan slo de un 5% y que nuestra diferencia
en un 95% se debe al factor analizado y no a la mera casualidad. Inversamente, si el valor
de p es mayor que el 5%, se considera que no hay suficientes indicios para descartar que la
o las desigualdades obtenidas se deben a la intervencin del azar, no pudiendo descartar la
hiptesis de nulidad o equivalencia entre lo que se compar.18
Segn lo expresado, podremos juzgar si el estudio que estamos leyendo es creble en
cuanto a sus conjeturas, revelando un valor de p suficientemente pequeo que permite aceptar que el efecto que se comunica existe realmente y en la direccin en que se informa. La
falta de claridad conceptual es la que hace pensar que la estadstica se equivoca y tambin
que puede manipularse, por ello debemos dominar conocimientos bsicos de la estadstica y
de sus limitaciones, para descubrir errores, sesgos o simplemente falta de rigor o calidad en el
artculo que estamos examinando.
Si leyramos estudios de los aos 60, observaramos que el anlisis bivariado era la metodologa estadstica ms corrientemente empleada, y la simple obtencin de una p< 0.05
conclua que el resultado era estadsticamente significativo. Generalmente as fundamentados, sugeran que el hallazgo de A en la enfermedad B podra ser de valor para determinar
el diagnstico, el pronstico o el tratamiento. La significacin estadstica no quiere decir significacin clnica, quien no comprende este concepto puede creer que la significacin lograda
indica causalidad y que el resultado obtenido en un trabajo nos obliga a aplicar una determinada intervencin para lograr mejorar, por ejemplo, el pronstico de una enfermedad, esto
es un error de criterio importante.
Los ensayos clnicos metodolgicamente ms convincentes son relativamente nuevos, en
1948 el Consejo ingls de Investigacin Clnica dio a conocer los resultados del primer estudio
randomizado para evaluar la eficacia de la estreptomicina; y en 1951 Bradford Hill proporcion la primera definicin sobre la sistemtica de un ensayo clnico: Es un experimento
diseado cuidadosa y ticamente con el objetivo de responder alguna pregunta formulada
con precisin.19 Inmediatamente surgieron los estudios que incluyen el anlisis multivariado,
regresin, correlacin, etc. Estos modelos de anlisis nos informan si la o las variables que en
el bivariado surgan como estadsticamente significativas (an aquellas con valores de p de
hasta 0.15 y en algunas ocasiones hasta 0.20, por considerarlas de inters clnico trascendente) mantienen su independencia con respecto al objeto principal de la investigacin o variable
dependiente. Lo que nos anunciar la posibilidad de que pudieran ser tenidas en cuenta como
parte o causa de la enfermedad o evento. El ejemplo que sigue nos ilustrar, si en un modelo de
regresin se incluye la edad para conocer su posible independencia con la variable objetivo, por
ejemplo mortalidad, lo ms probable es que la edad tenga un vnculo significativo o causalidad
con la muerte. Si en el mismo modelo se introduce arrugas, stas no tendrn probablemente
la misma asociacin o vnculo, pero si se quita la edad pasarn a tener una significacin muy
similar, dado que es muy probable que nuestro cuerpo tenga ms arrugas a mayor edad.20

[ 129 ]

6. Los diferentes tipos de ensayos clnicos


En general, los mdicos vivimos pendientes del diagnstico, pronstico y tratamiento
de las enfermedades que aquejan a nuestros pacientes. Surgen a diario, en cada uno de estos
segmentos, diversos interrogantes que frecuentemente hallan respuesta en un nmero de ensayos que suelen proponer diferentes estrategias de aproximacin. Cmo interpretar estos
estudios para extraer la informacin que pueda auxiliarnos en la prctica clnica?
Interpretacin de los estudios sobre pruebas diagnsticas
El notable avance tecnolgico de la ltima mitad del siglo XX ha llevado a que dispongamos de numerosos medios diagnsticos pero, como veremos, los mtodos diagnsticos tambin tienen sus indicaciones precisas y, fundamentalmente, sus limitaciones.
Antes de ser introducido en la prctica clnica cada mtodo debe confrontarse, idealmente, con uno de probada eficacia que sirve de referencia o patrn oro, gold standard. 21, 22
En cardiologa, por ejemplo, un mtodo que estudie la circulacin coronaria debe contrastarse con la coronariografa, su aproximacin diagnstica a esta ltima lo har de
mayor confiabilidad.
Para el caso de comparar dos mtodos, el problema ms sencillo que se nos puede plantear es el de una prueba dicotmica, que clasifica a cada paciente como sano o enfermo en
funcin de que el resultado de la prueba sea positivo onegativo. La tabla 1 nos ayudar a
comprender los trminos empleados.
Verdadero diagnstico
Resultado de la prueba
Enfermo

Sano

Positivo

Verdaderos positivos
(vp)

Falsos positivos
(fp)

Negativo

Falsos negativos
(fn)

Verdaderos negativos
(vn)

Tabla 1. Relacin entre el resultado de una prueba diagnstica y la presencia o ausencia de


una enfermedad.
Generalmente, al resultado positivo se lo asocia con la presencia de enfermedad y al
negativo con la ausencia de la misma. Cuando se estudia una muestra de pacientes los datos
obtenidos permiten clasificar a los sujetos, en una tabla de 2x2, en cuatro grupos, como en la
Tabla 1. En ella, se enfrenta el resultado de la prueba diagnstica (en filas) con el estado real
de los pacientes (en columnas) o, en su defecto, el resultado de la prueba de referencia que
vayamos a utilizar. La conclusin de la prueba puede ser correcta (verdadero positivo y verdadero negativo) o incorrecta (falso positivo y falso negativo). El anlisis de su validez puede
obtenerse calculando los valores de sensibilidad y especificidad:

[ 130 ]

Sensibilidad: es la probabilidad de clasificar correctamente a un individuo enfermo, esto


es, la probabilidad de que en la prueba se alcance un resultado positivo en un sujeto enfermo. Por lo tanto, la sensibilidad es la capacidad del test para detectar la enfermedad [S = vp/
(vp+fn)].
Especificidad: es la probabilidad de clasificar correctamente a un individuo sano, o de
obtener un resultado negativo en ausencia de enfermedad. En otras palabras, se puede definir
la especificidad como la capacidad para detectar a los sujetos sanos, [E = vn/(vn+fp)].
Es claro que lo ideal sera trabajar con pruebas diagnsticas de alta sensibilidad y especificidad, pero no siempre es posible. Una prueba muy sensible ser especialmente adecuada
en aquellos casos en los que el no diagnosticar la enfermedad puede resultar fatal para los
enfermos, o en enfermedades en las que un falso positivo no produzca serios inconvenientes.
Por otro lado, las pruebas confirmatorias del diagnstico deben ser de alta especificidad,
evitando as los falsos positivos. Los test de alta especificidad son necesarios para descartar
el padecimiento de enfermedades graves, o cuando se diagnostic un mal que se sospecha no
aquejar al paciente. 21, 23
Los conceptos de sensibilidad y especificidad permiten, efectivamente, justipreciar el rendimiento de una prueba diagnstica. Sin embargo, ante la obtencin de un resultado positivo
o negativo, el mdico ms bien se plantea: cul es la probabilidad de que el paciente est
realmente enfermo, o no? Los valores predictivos nos permiten responder esta cuestin:
Valor predictivo positivo: es la probabilidad de padecer la enfermedad si se obtiene un
resultado positivo en el test. El valor predictivo positivo puede evaluarse a partir del nmero
de pacientes con un resultado positivo en la prueba y que finalmente resultaron enfermos,
sobre el total de resultados positivos: [VPP = vp/(vp+fp)].
Valor predictivo negativo: es la probabilidad de que un sujeto con un resultado negativo
en la prueba se halle realmente sano, se estima dividiendo el nmero de verdaderos negativos
entre el total de pacientes con un resultado negativo en la prueba: [VPN = vn/(vn+fn)]. 21, 24
Los valores de sensibilidad y especificidad definen la validez de una prueba diagnstica,
independientemente de cul sea la prevalencia de la enfermedad en la poblacin a la cual
se aplica. Pero tienen la desventaja de que no proporcionan informacin relevante a la hora
de tomar una decisin clnica ante un determinado resultado. En cambio, los valores predictivos, a pesar de la enorme utilidad que brindan a la hora de tomar decisiones clnicas y
transmitir a los pacientes informacin sobre su diagnstico, presentan la limitacin de que
dependen considerablemente de lo frecuente que sea la enfermedad a diagnosticar. Cuando
la prevalencia de una enfermedad es alta, un resultado positivo tiende a confirmar su padecimiento, mientras que si la prevalencia es baja, un resultado positivo no permitir afirmar
su presencia.
Entonces, debido a la influencia la prevalencia, los valores predictivos no pueden ser
utilizados como ndices a la hora de comparar dos mtodos diagnsticos diferentes, tampoco
[ 131 ]

permiten extrapolar los resultados de otros estudios a datos propios. Para ello, es necesario
considerar otros ndices de estimacin clnicamente tiles y que no dependen de la prevalencia de la enfermedad en la poblacin a estudiar. As, adems de los conceptos anteriormente
citados, se suele hablar de razn de verosimilitudes, razn de probabilidad, cociente de probabilidades o likelihood ratio. Ellos indican cunto ms probable es un resultado concreto
(positivo o negativo) segn la presencia o ausencia de enfermedad, y se definen como sigue:
Razn de verosimilitudes positiva o cociente de probabilidades positivo: es la razn
entre la probabilidad de un resultado positivo en los pacientes enfermos y la probabilidad de
un resultado positivo entre los sanos. O bien, el cociente entre la fraccin de verdaderos positivos (sensibilidad) y la fraccin de falsos positivos (1 especificidad): RVP = sensibilidad/
(1 especificidad).
Razn de verosimilitudes negativa o cociente de probabilidades negativo: se calcula
dividiendo la probabilidad de un resultado negativo en presencia de enfermedad entre la
probabilidad de un resultado negativo en ausencia de la misma. O bien, el cociente entre la
fraccin de falsos negativos (1 sensibilidad) y la fraccin de verdaderos negativos (especificidad): RVN = (1 sensibilidad)/especificidad.21, 25
Una RV de 1 significa que la probabilidad de un resultado positivo es exactamente la
misma que la de uno negativo, en enfermos o sanos. RV superiores a 1 incrementan la probabilidad de que se encuentre presente el trastorno objetivo y, al contrario, RV inferiores a 1
disminuyen esta probabilidad.
La razn de probabilidades ofrece la ventaja de que relaciona la sensibilidad y la especificidad de una prueba en un solo ndice. Permite expresar la informacin de manera no
dicotmica (resultado normal o anormal, positivo o negativo) y, al igual que sucede con
la sensibilidad y la especificidad, no vara con la prevalencia. Estas consideraciones nos
permiten adoptarla como ndice de comparacin entre diferentes pruebas para un mismo
diagnstico.
Finalmente, otra opcin estadstica til a la hora de valorar la capacidad diagnstica de
una prueba cuantitativa son las llamadas curvas ROC (Receiver Operating Characteristic).
Se calculan a partir de la sensibilidad y especificidad para cada uno de los posibles valores de
corte de la prueba. Hasta ahora nos ocupamos del caso de un test con un resultado dicotmico, positivo o negativo, pero en muchas situaciones la confirmacin de un diagnstico debe
hacerse a partir de un parmetro numrico. Estos se pueden clasificar en forma dicotmica
segn sean superiores o inferiores al elegido como corte. La estrategia de este anlisis consiste
en representar grficamente los distintos valores de especificidad y sensibilidad obtenidos,
generndose as una grfica llamada curva ROC. El rea bajo dicha curva se convierte as en
el mejor indicador de la capacidad predictiva del test, pues es independiente de la prevalencia
de la enfermedad en la poblacin de referencia, admitiendo efectuar comparaciones entre
diferentes pruebas diagnsticas. En forma muy general, puede aceptarse que la capacidad de
prediccin para un rea bajo la curva de 0,50-0,60 se considera mala; de 0,60-0,70 pobre;
de 0,70-0,80 aceptable; de 0,80-0,90 buena a muy buena, y de 0,90-1,00 excelente. 26
[ 132 ]

Cuando leemos un artculo que informa sobre una nueva herramienta diagnstica debemos
conocer estos conceptos y valorar si su introduccin en la prctica clnica aporta informacin
relevante o no. Adems, no debemos olvidar que existen determinados aspectos en el diseo de
este tipo de investigaciones que pueden afectar a la precisin y a la validez de las estimaciones
realizadas. La poblacin de estudio, la estrategia de muestreo, la seleccin del criterio de referencia y la forma de aplicacin de las pruebas diagnsticas sern algunos de los elementos a
cuidar para evitar la presencia de sesgos. Por supuesto, siempre deberemos valorar el costo que
introduce en nuestro accionar (costo/beneficio) para saber si es aplicable en nuestro medio.
Interpretacin de los estudios sobre pronstico y tratamiento. Ensayos clnicos
Los ensayos clnicos han permitido un enorme avance en el conocimiento y han terminado con muchas indicaciones teraputicas que se tenan por buenas.
Los estudios observacionales son muy importantes, porque de ellos surgen conjeturas
que luego habrn de comprobarse en otras investigaciones, pero no debemos tomar conductas basados en ellos. Ciertas hiptesis fisiopatolgicas o trabajos con un reducido nmero de
casos, y por lo tanto con insuficiente potencia, llevaban a la aplicacin de una determinada
medicacin que luego result ser nociva. Podramos citar el ejemplo de la administracin
profilctica de lidocana, por su efecto antiarrtmico, a los pacientes que padecan un infarto
miocrdico agudo, pero luego los ensayos clnicos demostraron que no otorgaba beneficio,
sino ms bien era perjudicial. 27
Otro ejemplo, relativamente cercano, fue la aceptacin de que el suplemento hormonal
en la mujer menopusica disminuira los eventos cardiovasculares, no obstante, los ensayos
con terapia sustitutiva encontraron que podan aumentarlos. Un reciente meta-anlisis sobre
el tema muestra que si bien no incrementa el riesgo de nuevos eventos cardacos, tampoco lo
reduce, pero s agranda el riesgo de accidente cerebrovascular, 28 esto condujo a que las recomendaciones internacionales desaconsejaran su aplicacin. 29
El nmero de ensayos clnicos y meta-anlisis se ha multiplicado en los ltimos aos,
en muchos de ellos se despliega una metodologa estadstica que habitualmente expresa los
resultados en forma de razn o ratio. Al leerlos descubrimos expresiones como: odds ratio
(OR), riesgo relativo (RR) o lo que es igual cuando se trata de estudios de supervivencia, hazard ratio (HR), trminos que son poco intuitivos y a veces de difcil comprensin. Seguidamente, intentaremos orientar acerca de cmo interpretar correctamente estas medidas muy
empleadas en bibliografa mdica.
Una forma de estimar el riesgo entre dos grupos es mediante una relacin que se suele
denominar relacin de odds o chance. La OR es la relacin entre las odds del grupo experimental sobre las odds del grupo control, y se obtiene dividiendo el nmero de eventos sobre
el nmero de no eventos en cada grupo.
En otras estimaciones del riesgo relativo (RR), el numerador contiene el nmero de eventos y el denominador el nmero total de pacientes en riesgo (eventos + no eventos). Ambas
expresiones se emplean como estimadoras del riesgo relativo, la diferencia fundamental entre
la OR y el RR reside en el denominador que se emplea para calcular las tasas de eventos. En
la tabla 2 ejemplificaremos la diferencia:

[ 133 ]

Grupo Control

Grupo Experimental

Evento

Si

a 30

b 10

No

c 70

d 90

Totales

a + c = 100

b + d = 100

Tabla 2
Odds ratio: [b/d]/[a/c] = [10/90]/[30/70] = 0,11/0,43 = 0,26 o 26%.
Riesgo relativo: [b/(b+d)]/[a/(a+c)] = [10/100]/[30/100] = 0,10/0,30 = 0,33 o 33%.
En este ejemplo, la probabilidad del evento en el grupo experimental se redujo a 0,26
segn la OR, y a 0,33 de acuerdo al riesgo relativo.
Cuando la tasa de eventos en el grupo control es menor a 30%, la OR y el RR se aproximan o son similares, pero cuando la proporcin de eventos es mayor al 30%, como sucede
habitualmente en ensayos clnicos, la OR y el RR tienden a distanciarse.
Reduccin de riesgo relativo (RRR) es la reduccin proporcional en la tasa de eventos
entre grupo control y el experimental, se calcula como [(a b)/a] o bien [1 RR]. Del ejemplo
anterior, [(30 10)/30] = 20/30 o directamente [1 0,33 = 0,67]. De igual manera que la
RRR se puede obtener la reduccin de la OR (ROR = 1 - OR) en el ejemplo, ROR = (1 0,26
= 0,74).18, 30-33
Cmo se interpretan estas medidas, intervalo de confianza (IC)
Aunque su frmula matemtica es diferente, el significado de la OR, el RR y el HR es
equivalente. Siempre hay un grupo experimental al que se le adjudica el valor de la ratio, lo
que equivale a tomar como referencia al otro grupo. En el ejemplo anterior, B es el grupo de
inters al que se refiere la estimacin, y el grupo que sirve de referencia o de grupo control
es A, cuyo valor es 1. La OR o similares deben ser distintos que 1 para aceptar con alguna
certeza que existe un efecto. Una OR, un RR o un HR igual a 1 significa que en B se produce
el mismo efecto que en A, en tanto, la OR del ejemplo indica que por cada evento en A hay
0,26 en B o sea, hay una reduccin del 74%. El RR indica lo mismo, por cada evento en A hay
0,33 en B, reduccin del 67%. Como vemos la OR suele magnificar el efecto.
Si se tratara de un estudio de supervivencia (por ejemplo, estimacin de la sobrevida
a travs del mtodo de Kaplan-Meier), el HR indicara que el riesgo de eventos terminales
que se podran esperar en B, durante el tiempo de seguimiento, es 0,33 a 1 comparado
con A.
Estas estimaciones estadsticas suelen comunicarse seguidas del intervalo de confianza
(IC) que expresa, en la poblacin de estudio, la variabilidad del clculo debida al azar. La
mayora de las investigaciones mdicas incluyen muestras de una poblacin, aunque la autntica realidad de un fenmeno slo puede alcanzarse analizando la totalidad de esa poblacin.
Lo que en un estudio se calcula y ofrece como un resultado puntual, razn o ratio, no tiene
por qu corresponderse con el verdadero valor en la poblacin, estimacin que siempre ser
[ 134 ]

desconocida. Su confiabilidad depende de que el resultado se encuentre comprendido entre


un rango de valores, o IC, dentro de los que se encuentra la realidad biolgica del fenmeno
estudiado. De tal manera, si se obtiene una diferencia, esta puede ser aceptada biolgicamente y estadsticamente, es decir, el IC de la ratio puede ser considerado significativo en un
determinado nivel. Adems, tiene que haber una diferencia entre lo que se compara, y dicha
diferencia debe tener una determinada direccin compatible con la realidad. Esto se logra
nicamente cuando los individuos de la muestra tienen inicialmente la misma probabilidad
de ser ingresados para su comparacin, premisa que nos seala que slo tienen valor los estudios aleatorizados.
El IC expresa los lmites que con una cierta garanta contendrn el verdadero valor del
resultado obtenido. Generalmente se calcula con un margen de seguridad del 95%, lo que
quiere decir que deja una probabilidad de 0,05 de que el verdadero valor de la ratio no se halle
en este intervalo. Si el IC del 95% de una ratio no contiene el 1, el grado de evidencia de que
los datos del estudio sean compatibles con la hiptesis nula (igualdad entre lo que se compara)
ha de ser menor de 5%, y viceversa.
Evidentemente, el IC nos proporciona la misma informacin que el valor de p, pero
adems a travs de sus propios lmites nos da una idea de la intensidad posible del fenmeno
estudiado, otro paso para estimar la credibilidad del estudio.
En el ejemplo anterior tomamos como referencia un valor de 0,26 para la OR, se corresponde con una p < 0,0003 y con un IC del 95% entre 0,12 y 0,57. Este ltimo nos indica que
la reduccin real pudo haber oscilado entre el 12% y el 57%, en tanto que el nivel de p nos dice que la reduccin del riesgo fue significativa, o en otras palabras, que la probabilidad de un
resultado azaroso, igual o ms extremo, es menor del 5%. Dicho de otro modo, si se informa
que la reduccin fue de 26%, el IC 95% de 12% a 57% traduce que existe una probabilidad
menor del 5% de que el evento no se reduzca por lo menos un 12%.
Si el resultado de p fuera no significativo, el IC contendra la unidad. Por ejemplo, si el IC
95% fuera 0,24 a 1,20, la relacin de riesgos oscilara entre 0,24/1 y 1,2/1, existiendo la probabilidad de que en realidad no haya reduccin sino ms bien un aumento del evento o riesgo.
En el ejemplo, para el RR de 0,33 el IC 95% es de 0,15 a 0,72 y se interpreta de manera
similar. Pero si fuera mayor que 1? digamos 1,5. A es el grupo de referencia y se le transfiere
el 1, y B el experimental. Entonces, en B hay 0,5 ms eventos que en A, es decir que B, en el
caso de que fuera un nuevo tratamiento, es menos efectivo que A. Por lo tanto, un valor inferior que 1 indica un efecto menor para el grupo experimental, y viceversa.
Aunque lo anterior no es difcil de comprender, estas medidas no dan una idea inmediata
de la magnitud absoluta de la diferencia entre los grupos comparados. Existe una frmula
sencilla para resolver este problema, y se denomina diferencia o reduccin relativa de riesgo
(RRR): cuando una ratio es menor que 1 se utiliza este procedimiento, cuyo resultado es una
proporcin: RRR = OR - 1 (del ejemplo: 0,26 1 = 0,74) o la tasa de eventos en B es 74%
menor que en A. Cuando es mayor que 1 se aplicar RRR = 1 -OR (del ejemplo: 1,2 1 =
0,2), que traduce una tasa de eventos 20% mayor en B que en A.18
Entonces, para comprender el mensaje de una OR, un RR o un HR, hay que indagar qu
proporcin absoluta de eventos se producen en el grupo control o de referencia, buscando
entre los datos y las tablas que se nos ofrecen en el trabajo de investigacin. Igualmente, nos
[ 135 ]

ayudara el clculo de la diferencia relativa de riesgo, que traduce las ratio a porcentajes, medidas que son ms fciles de interpretar.
Por ltimo, el nmero necesario a tratar, number needed to treat (NNT), se ha convertido en un indicador muy apreciado por los mdicos, pues tiene la ventaja de darnos una
idea rpida de la efectividad de un tratamiento, es ms fcil de recordar y adems permite
comparar los beneficios y efectos adversos de una determinada terapia. Es un indicador especfico para cada opcin teraputica, y describe la diferencia que hay entre dicha opcin de
tratamiento y el control para alcanzar un resultado clnico concreto. Su rango de valor va de
1 a infinito, siendo 1 el NNT ideal, ya que la mejor terapia es aquella donde debo tratar a un
solo paciente para que este se beneficie. Por consenso, slo se expresa en nmeros enteros y
cuanto ms alto es el NNT menos eficaz es la intervencin. Al agrupar un nmero mayor de
pacientes las revisiones sistemticas o meta-anlisis, elaborados con ensayos clnicos aleatorizados, proporcionan resultados de mayor confiabilidad al momento de calcular el NNT.
La reduccin del riesgo absoluto (RRA), absolute risk reduction (ARR), es la diferencia
absoluta entre la tasa de eventos en los grupos evaluados [Tasa de eventos grupo control
Tasa eventos grupo experimental]. En el ejemplo de la tabla 2, [a b] o [30% 10%] = 20%,
su IC 95%, entre 9% y 31%. El NNT, nmero de pacientes que se necesitan tratar para evitar
un evento, se obtiene aplicando regla de tres simple a partir de la RRA. Si cada 100 pacientes
tratados se reducen 20 eventos, cuntos necesitamos para reducir un evento?: [100/20 = 5].
O bien como [1/RRA], 1/0,2 = debemos tratar 5 pacientes para impedir el efecto adverso en
uno de ellos. Estas estimaciones renen cierto grado de incertidumbre que ha de ser expresada mediante el intervalo de confianza. Para calcular el IC del 95% del NNT se emplea el
valor inverso de los extremos del IC del 95% de la RRA, en el ejemplo, IC 95% del NNT=
1/0,09 a 1/0,31 = 3 a 11. Significa que si los estudios se repitiesen, en el 95% de las veces el
resultado estara entre esas cifras, es decir, debemos tratar entre 3 y 11 pacientes para reducir
el efecto en 1 de ellos.18, 34, 35
Al mismo tiempo, recordemos que toda intervencin puede promover efectos adversos o
no deseados, y tambin se pueden estimar.
El incremento del riesgo absoluto (IRA) o absolute risk increase (ARI), es la diferencia
absoluta en las tasas de eventos perjudiciales entre los grupos evaluados, revela que el tratamiento experimental causa ms dao que beneficio. Su clculo es semejante al de la reduccin del riesgo absoluto. IRA = [Tasa de eventos adversos en el grupo control Tasa eventos
adversos en el grupo experimental].
El nmero necesario para hacer dao (NND) o number needed to harm (NNH), nos
indica a cuntos pacientes hay que tratar para que en uno de ellos se presente un efecto no
deseado. O bien, el nmero de pacientes que si recibiesen el tratamiento experimental tendran un efecto adverso adicional comparado con el tratamiento control. Se calcula como 1/
IRA, y su rango tambin va de 1 a infinito, pero al contrario del NNT, cuanto menor es su
valor menos segura es la intervencin. Si un ensayo muestra un bajo NNT con un alto NND
implica que el perfil teraputico es seguro. Tambin, si el estudio informa o hace referencia a
estos indicadores, se puede obtener la relacin beneficio/riesgo del tratamiento experimental
(NNT/NND). Y si adjunta el costo por perodo de tiempo necesario para evitar el evento, se
puede construir un indicador de costo/efectividad.18
[ 136 ]

7. Discusin y conclusiones
En este apartado l o los autores defienden la validez de sus observaciones, apoyados en
los resultados de la propia investigacin y los publicados en otros informes. Usualmente la
discusin incluye una visin general de los hallazgos principales, su integracin o relacin con
la teora que sustent el ensayo clnico y de sus limitaciones, ambigedades e implicancias para futuras vas de investigacin. Aceptar como vlidas las conclusiones de una investigacin
depende de una adecuada preparacin metodolgica que nos permitir analizar, calificar
y reconocer lo publicado en forma objetiva, hasta que nuevas evidencias sean presentadas.
Al mismo tiempo, fundamentados en nuestras propias deducciones podremos evaluar si los
resultados estn de acuerdo con el conocimiento actual, y si nos permiten trasladar sus probables beneficios a la prctica clnica.

8. Referencias bibliogrficas
Constituyen una parte importante del artculo porque brindan solidez a los hechos expuestos por el autor, adems, ofrecen varias opciones de informacin sobre conceptos, tcnicas, metodologas, etc., que sustentan la teora de la investigacin. Las referencias facilitan la
posibilidad de ampliar la informacin sobre el aspecto tratado, por ello es primordial que el
ensayo cuente con las referencias adecuadas y actualizadas.

9. El conflicto de intereses
Gran parte de la investigacin en medicina ha quedado en manos privadas, y sobre todo
la investigacin farmacolgica. Esta realidad nos lleva a tener en cuenta que las empresas esperan rendimientos; y si bien es cierto que cuanto ms efectiva sea una droga ms aceptacin
tendr en la clase mdica, no es menos cierto que muchas investigaciones se realizan teniendo
en cuenta las necesidades del mercado, y sobre todo de un mercado que pueda enfrentar gastos sanitarios.
Esto no es una crtica, es la descripcin de un hecho, la investigacin puede encararse de
diferente manera si el que investiga lo hace para solucionar un problema o para obtener rendimientos econmicos. Por ello, es necesario que al publicar se explicite con toda claridad si se
tiene algn conflicto de intereses, y si la investigacin ha sido financiada total o parcialmente
por empresas interesadas en el resultado. El conocerlo no invalida de ninguna manera los
logros, simplemente permite a los lectores ampliar el juicio global del estudio en cuestin. 36

Corolario
Hasta aqu comentamos qu buscar y cmo interpretar la informacin contenida en cada
seccin de un artculo cientfico, el objetivo fue ofrecer las herramientas para valorar en forma
[ 137 ]

crtica la informacin que se consulta y particularmente ponderar los mritos conceptuales y metodolgicos de las investigaciones publicadas. Esperamos que este captulo sea de utilidad para
los que se inician en el apasionante campo de la investigacin. Elaborar las propias conclusiones
y confrontarlas con los resultados que ofrecen otros investigadores puede ser el primer paso.

Referencias
1. Sacket D, Scout Richardson W, Rosenberg W, Brian Haynes R. Evidence-based Medicine. How to practice & Teach EBM. 1997, Pearson Professional Limited.
2. Echt DS, Liebson PR, Mitchell LB, Peters RW, Obias- Manno D, Barkers AH et al. Mortality and morbidity in patients receiving encainide, flecainide, or placebo. The Cardiac
Arrhythmia Suppression Trial. N Engl J Med 1991; 324: 781-788.
3. The Cardiac Supresin Trial II Investigators. Effect of the antiarrhythmic agent moricizine on survival after myocardial infarction. N Engl J Med 1992; 327: 227-233.
4. Vaughan Williams EM. A classification of antiarrhythmic actions reassessed after a decade of new drugs. J Clin Pharmacol 1984; 24: 129-147.
5. Greenhalgh T. How to read a paper. The basics of evidence based medicine. 2nd Edition
2001. BJM Books.
6. Dawson-Saunders E, Trapp R. Basic and Clinical Biostatistics 1990. Ed Appleton &
Lange. Cap. 2; 7-21.
7. Greenhalgh T. Assessing the methodological quality of publisher papers. BMJ, 1997;
315: 305-308.
8. LeLorier J, Grgoire G, Benhaddad A, Lapierre J, Derderian F. Discrepances between
meta-analyses and subsequent large randomized, controlled trials. N Engl J Med 1997;
337: 536-542.
9. Cappelleri JC, Ioannidis JPA, Schmid CH, et al. Large trials versus meta-analysis of smaller trials. How do their results compare? J Am Med Ass 1996; 276: 1332-1338.
10. Villar J, Carroli G, Belizan JM. Predictive ability of meta-analyses of randomised controlled trials. Lancet 1995; 345: 772-776.
11. Naylor David C. Meta-analysis and the meta-epidemiology of clinical research. Br Med
J 1997; 315: 617-619.
12. Egger M, Davey Smith G. Misleading meta-analysis. Br Med J 1995; 310: 752-754.
13. Ioannidis J., Cappelleri J. C., Lau J., et al. Meta-Analyses and Large Randomized, Controlled Trials. N Engl J Med 1998; 338: 59-62.
14. Dawson-Saunders E, Trapp, R. Basic and Clinical Biostatistics 1990. Ed Appleton &
Lange. Cap. 7; 136-138.
15. Jaffe AS, Vatus H. Acute coronary syndrome biomarkers. The need for more adequate
reporting. Circulation 2004; 110: 104-106.
16. Dawson-Saunders E, Trapp R. Basic and Clinical Biostatistics 1990. Ed Appleton &
Lange. Cap. 15; 305-318.
17. Gottlieb S. Dead is dead - artificial definitions are no substitute. Lancet 1997; 349: 662663.
[ 138 ]

18. Greenhalgh T. How to read a paper. The basics of evidence based medicine. BMJ Publishing Group. 2001; Cap. 5: 76-93.
19. Hill B. The clinical trial. Med Bull 1951; 7: 278-282.
20. Brotman DJ, Walter E, Lauer MS, OBrien RG. In search of fewer independent risk factors. Arch Intern Med 2005; 165:138-45.
21. Greenhalgh T. How to read a paper. The basics of evidence based medicine. BMJ Publishing Group. 2001; Cap. 7:105-119.
22. Jaeschke R, Guyatt GH, Sackett DL. Usersguides to the medical literature. III. How to
use an article about a diagnostic test. Are the results of the study valid? Evidence-Based
Medicine Working Group. J Am Med Ass 1994; 271: 389-391.
23. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 1: sensitivity and specificity.
Br Med J 1994; 308: 1552.
24. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 2: predictive values. Br Med
J 1994; 309: 102-107.
25. Dujardin B, Van der Ende J, Van Gompel A, et al. Likelihood ratios: a real improvement
for clinical decisin making? Eur J Epidemiol 1994; 10: 29-36.
26. Altman D.G., Bland J.M. Statistics Notes: Diagnostic tests 3: receiver operating characteristic plots. Br Med J 1994; 309: 188-193.
27. Antman E, Lau J, Kupelnick B, et al. A comparison of results of meta-analyses of randomized control trials and recommendations of clinical experts. Treatments for myocardial
infarction. J Am Med Ass 1992; 268: 240-248.
28. Magliano DJ, Rogers SL, Abramson MJ, Tonkin AM. Hormonal therapy and cardiovascular disease: a systematic review and meta-analysis. BJOG 2006; 113:5-14.
29. Evidence-Based guidelines for cardiovascular disease prevention in women: 2007 Update. Circulation 2007; 115: 1481-1501.
30. A. Fahey T, Griffiths S, Peters TJ. Evidence based purchasing: understanding results of
clinical trials and systematic reviews. Br Med J 1995; 311: 1056-1060.
31. Pearce N. What Does the Odds Ratio Estimate in a Case-Control Study? Int J Epidemiol
1993; 22(6):1189-1192.
32. Forrow L, Taylor WC, Arnold RM. Absolutely relative: How research results are summarized can affect treatment decisions. Am J Med 1992; 92: 121-124.
33. Naylor CD, Chen E, Strauss B. Measured enthusiasm: Does the method of reporting trial
results alter perceptions of therapeutic effectiveness? Ann Intern Med 1992; 117:916-921.
34. Furukawa TA, Guyatt GH, Griffith LE. Can we individualize the number needed to
treat? An empirical study of summary effect measures in meta-analyses. Int J Epidemiol
2002; 31:72-76.
35. Sinclair JC, Cook RJ, Guyatt GH, Pauker SG, Cook DJ. When should an effective
treatment be used? Derivation of the threshold number needed to treat and the minimum
event rate for treatment. J Clin Epidemiol 2001; 54: 253-262.
36. Doval Hernn C. Es fiable lo que leemos en las revistas mdicas? Resultados diferentes
segn el patrocinio de los ensayos clnicos Rev Arg Cardiol 2007; 75: 498-502.

[ 139 ]

Captulo 11

Delimitacin de un rea de investigacin


Anlisis de los conocimientos existentes
y elaboracin de nuevas cuestiones.

Eduardo B. Arribalzaga

l siglo XX demuestra una aceleracin de la historia al testimoniar sobre innovaciones


cientficas y avances tecnolgicos con un creciente volumen de informacin sucedida con
inusitada rapidez. Esta celeridad en la aparicin de conocimientos es, tal vez, el factor con
mayor impacto en el estilo de vida cotidiano al modificar realmente las formas de comunicacin e incrementar las reas de investigacin,9 incluso con reas como la ingeniera gentica
donde hay que repensar los derechos de la propiedad intelectual de los nuevos descubrimientos. 2, 32, 37 En las ltimas dos dcadas se obtuvieron beneficios como la creacin de nuevos
problemas que generaron tanto incomprensin como prevenciones hacia el mundo cientfico
y se busc necesariamente el consenso basado en la evidencia cientfica.6, 12 Una fuente de esa
divergencia es que los cientficos logran integrar un especial conjunto de objetivos, creacin
de conjeturas en el transcurso de su aprendizaje y guan su visin de los problemas segn la
naturaleza de su propia disciplina con ignorancia de la relacin existente con la comunidad
no cientfica que dificultan ese conocimiento hasta lmites insospechados. 30, 33, 41 No se debe
olvidar que la ciencia se opone en absoluto a la opinin:7 la opinin traduce necesidades en
conocimientos y esto es un claro error conceptual. Al designar los objetos por su utilidad, ella
se prohbe conocerlos.

Adems, para agregar ms confusin, no slo aumenta el nmero de artculos editados
en revistas cientficas sino que aparecen nuevas publicaciones, 50 incluso en formatos no tradicionales como la edicin virtual electrnica: en 1970 se haban publicado cuatro millones de
artculos (3) y en la actualidad se suman aproximadamente 5.000 nuevos ttulos diarios de
todo tipo (artculos originales, de revisin, monografas, etc).

Por ms que la aparicin de Internet y los avances en el uso de computadoras personales
con una intensa aplicacin en las ciencias de la educacin y las comunicaciones, permitieron el
surgimiento de medios dinmicos muy eficaces para el manejo ordenado de un flujo creciente
y constante de documentacin cientfica y tecnolgica, un nuevo paradigma de comunicacin
masiva se ha reconocido y facilita no slo al nivel cientfico-tecnolgico sino a toda la humanidad, con amplia comunicacin de su mtodo, sin exagerar su indisoluble asociacin con la
industria farmacutica13, 26, 38, 43, 47, 72, 97,98 e infringir normas ticas elementales.14, 23-25, 46, 75

[ 140 ]

Acerca de la validez del mtodo cientfico



Una aproximacin desarrollada por los cientficos para percibir e investigar el mundo
exterior es conocido como mtodo cientfico, que no debe entenderse solamente como referencia a un conjunto de procedimientos definidos rgidamente y asegurado por el hallazgo
de respuestas correctas; la ciencia no es una sencilla mquina de resolucin de problemas. En
vez de eso, engloba cualquier aproximacin para ayudar a descubrir la Verdad acerca de la
naturaleza.17 El trabajo del cientfico consiste en proponer teoras y en contrastarlas.81
A veces, el amplio campo de actividades llamadas cientficas, refleja un conjunto de
principios que emergieron relativamente tarde en el desarrollo de la civilizacin. Se cambi
de una creencia en designios divinos o sobrenaturales con milagros incluidos a un sistema de
preceptos que contenan la idea justificada y hallada en un mundo determinista-positivista,
susceptible de un anlisis racional. Otra innovacin fue la abjuracin del pensamiento filosfico y fijar en su reemplazo preguntas bien definidas y con resultados posibles de medir, coincidentes con un coherente mundo conceptuado acerca de la naturaleza (pequeos ladrillos en
un gran edificio de conocimientos, que encajan unos con otros).
Tambin la ciencia descubri en forma desordenada un pensamiento discursivo con dificultades para separar repentinamente 2 clases de nociones: las observaciones y las conclusiones.
La primera debe ser verificable pero ms tarde siempre es tema de reemplazo (o revisin) ante
nuevas evidencias y principios. En la prctica, los conceptos esenciales tienen (o no) probada
fiabilidad por el simple paso del tiempo: las bases del edificio cientfico son cotidianamente
consolidadas por la importancia de hallazgos posteriores. Al principio, slo se comenz con
descubrimientos individuales, sin relacin entre ellos hasta que, al incorporarse como un cambio social, acumul secuencialmente y sin interrupciones nuevas nociones en un intercalado
entretejido en el cuerpo global del conocimiento. Estos conceptos son de categora jerarquizada:
busca la comprensin de los fenmenos no solamente a un nivel particular de organizacin
como as tambin en trminos de propiedades e interacciones de sus componentes. Como ejemplo de este principio de explicacin o reduccin de sucesos a un primer nivel de interaccin de
sus componentes (el reduccionismo), se comprende la neurobiologa al dominar su complejo
desarrollo como una simple interaccin bioqumica de sus componentes. Se entiende mejor
un fenmeno y se tiene ms confianza en su interpretacin si refuerza nuestro razonamiento
acerca de sus caractersticas a diferentes niveles comparado con otros conocimientos, formas
de pensamiento que deberan incorporarse en el grado universitario, 22, 83, 99 con la asociacin
de la investigacin a la prctica asistencial cotidiana.18, 52 Diferenciar entre la investigacin
bsica, cuyo objetivo es comprender la naturaleza de la investigacin aplicada (que pretende su
utilizacin controlada), no siempre es clara y es fuente permanente de tensin entre cientficos
y mdicos asistenciales por los riesgos generados54, 82 as como con los organismos estatales de
financiamiento de las investigaciones.55

Los conocimientos empricos (basados en la experiencia) desarrollaron una destacada
y abundante tecnologa, pero sin una racional y coherente idea cientfica. Actualmente la
tecnologa es dependiente de la ciencia y sus diferencias son muy precisas (Tabla 1)

[ 141 ]

Tabla 1: Diferencias entre Ciencia y Tecnologa


Ciencia

Tecnologa

Orientada al conocimiento

Orientada a las necesidades

Parte de la bsqueda del conocimiento

Parte de la utilidad

Soluciona interrogantes

Soluciona problemas prcticos

Inquisidora

Constructiva

Nuevo conocimiento como producto del anlisis

Nuevo objeto tecnolgico como producto de la


sntesis

Es imprescindible conocer la promocin pblica de nuevas investigaciones as como sus


posibles aplicaciones y consecuencias con especial nfasis en que su aplicacin tecnolgica no
est exenta de riesgos. Muchas tcnicas de avanzada, como por ejemplo la ingeniera gentica,
han generado muy fcilmente ansiedad y temores, aunque remotos como son los hipotticos
riesgos que comprometeran la dignidad humana. 57, 60
Para los cientficos es muy difcil corregir estos conceptos equivocados, porque siendo
investigadores no pueden, con buena intencin conciente, definir enunciados absolutos de
seguridad (58) sin ser vistos como defensores de sus propios intereses (becas, subsidios, premios, prestigio (59, 63) y resultar contrarios con el compromiso de bienestar de la sociedad.

El mtodo cientfico, con desarrollo constante debido a Francis Bacon desde el siglo
XVII, no es esttico y comprende desde la descripcin pasiva (la historia natural) con los
mecanismos subyacentes en un proceso, hasta la revolucionaria introduccin del experimento al manipular condiciones de un fenmeno y observar los efectos resultantes, intencional
ejercicio intelectual promovido por el genio de Galileo. Cuando la experimentacin vari
el nfasis de la lgica inductiva a la deductiva (derivando las consecuencias de un principio
terico), se afirm indudablemente la descripcin hipottico-deductiva. En pasos sucesivos,
las observaciones cargan con la imaginativa creacin de una hiptesis explicativa. La lgica
es destinada a deducir las consecuencias as como una mezcla de lgica e imaginacin es aplicada para disear experimentos y obtener resultados y consecuencias esperadas. El investigador o bien usa mtodos conocidos o desarrolla nuevos para llevar a cabo sus experimentos. A
veces, las brillantes ideas dependen ms de un salto imaginativo que de la intuicin. Por eso,
modelo e interpretacin son virtualmente sinnimos de hiptesis pero con menor nfasis en la
naturaleza tentativa del concepto. Teora y ms a menudo ley, son usadas para expresar algo
desde el punto de la significacin (la importancia). Recordar tambin acerca de la naturaleza
provisoria de las conclusiones que muchas veces pueden no distinguirse de las hiptesis y que
las dejan claramente descartadas ante nuevas y probadas evidencias.

La moderna ciencia es dominada por esta concepcin hipottico-deductiva, donde la etapa descriptiva sigue siendo muy importante: el anlisis equivocado de datos o su insuficiente
recoleccin determinan errores que pueden originar riesgos y/o peligros para la sociedad.
Las diferencias entre la tcnica y la tecnologa (Tabla 2), productos finales de la investigacin
cientfica, definen el perfil de las investigaciones a desarrollar en el futuro.

[ 142 ]

Tcnica

Tecnologa

Objetivo compartido: actuar en la realidad satisfaciendo los intereses de los sujetos.


Ambas poseen un carcter socialmente estructurado

Es Procesal con tcnicas en

Es Procedimental e instrumental

determinado marco sociocultural

Es constitutiva del hombre

Es contingente. Surge con la ciencia

Es unidisciplinaria. Ej. Fabricacin artesanal

El multidisciplinaria integrada en procesos

industriales vinculada al conocimiento

cientfico

Intereses colectivos

Intereses individuales

Tabla 2: Diferencias entre Tcnica y Tecnologa


Al idear nuevos instrumentos y procedimientos nuestro anlisis se increment sensiblemente y asegur al cientfico un conocimiento de sus lmites y la eleccin de aquello que era
apropiado para su propsito. La ciencia no slo tiene lmites sino grandes poderes que pueden
destinarse a resolver preguntas objetivamente enunciadas del mundo exterior y es limitada
su capacidad en solucionar cuestiones que involucran valores morales o estticos. El reclamo
de soluciones cientficas para los problemas sociales a veces son tentadores pero se acercan a
posiciones polticas equivocadas ms que lograr resultados exitosos esperados. El cientfico,
en determinadas oportunidades, no aprecia las diferencias entre la ciencia y los problemas
que incluyen valores, y con humildad debe aprender a no generar expectativas pblicas frustrantes a mediano y/o largo plazo. Por consiguiente, hay que comprender las diferencias entre
las ciencias naturales y las sociales para evitar y/o reducir las odiosas comparaciones: no
puede la ciencia responder a controversias sociales, pero puede ayudar a reconocer que dichos
problemas involucran no solo valores sino tambin otros factores (biolgicos, toxicolgicos,
etc) que le permiten a la ciencia ejercer una crtica enrgica y til.

Uno de las desventajas del avance cientfico en determinadas reas donde es exitosa es
que muchos intelectuales desviaron la atencin en advertir la temprana preocupacin si la
principal existencia es de los principios o por el contrario de los valores e intereses conflictivos contra los cuales se ha de enfrentar. Ms all de mellar muchas creencias de tradiciones religiosas, se ha originado un nuevo conflicto: la debilidad del consenso moral. La
inevitable y comprensible reaccin ha sido fuente de un antiguo antagonismo con la ciencia.
La bsqueda de un fuerte consenso en valores y una gran cohesin social, beneficiar ms
desde la claridad de las relaciones entre la ciencia y los valores que desde cada una de las
partes intervinientes. Se asume que la ciencia est aqu para quedarse, pero a la sociedad
en general este crecimiento indito de la ciencia y la tecnologa la hace temer entrar en una
era sombra.
[ 143 ]


Fuera del limitado espectro del mtodo cientfico, otra limitacin es la imperfeccin
en muchos casos en la bsqueda del apropiado acercamiento y se da muchas veces por
casualidad con el mtodo adecuado. Cuando se prueba la experimentacin a una cuestin
aparentemente sencilla en un campo de estudio bien definido,61, 62 el sendero es a menudo
tortuoso, con muchas falsas opciones. En el edificio de la ciencia, muchos ladrillos pueden
reemplazarse por otros antes que el defecto pueda ser revelado, demostrando as que los
ms importantes avances en la ciencia son rpidamente aceptados, 69 las incertidumbres
en algunas reas pueden originar extensas controversias: 67 ocasionalmente se sugiere la
existencia de fraude cientfico, 84 cuando es imposible de verificar.85 Muchas veces la pasin
puesta en la investigacin en perseguir una lnea de trabajo origina tensiones y prdida de
la objetividad: el cientfico quiere probar que no est equivocado y ve ms all de los
verdaderos resultados obtenidos. 86, 88 La responsabilidad de aceptar su correspondencia
con la realidad,90 hace que las reacciones iniciales a la nueva propuesta sean infludas tanto
por modas, prestigio de los investigadores, relaciones pblicas-comerciales, rivalidades de
grupos de investigacin y la fuerza de las necesidades de aceptacin de las novsimas ideas.
Por eso, es tan difcil la adhesin a nuevas lneas de investigacin o de sus resultados. 87, 91

Caractersticas generales de la investigacin cientfica


Se debe desarrollar la investigacin bajo ciertas condiciones para describir hasta comparar
e inferir la mejor decisin a seguir desde los resultados obtenidos. En los experimentos donde
se tratan de probar diferencias entre variables, es necesario tener un grupo control para saber
si los cambios presentados se deben al experimento en s. En biologa hay oposicin no solamente por la complejidad de los sistemas analizados sino tambin por las variaciones acostumbradas por la evolucin: dentro de las especies frecuentemente no hay 2 miembros idnticos.
Estas fuentes de variaciones originan resultados conflictivos y son culpables de sorpresas. En
tanto que los avances cientficos siguen una aparente va con nuevos hallazgos y tcnicas que
responden a nuevas cuestiones a solucionar, en muchos fructferos descubrimientos se puede
sealar que a menudo existi un encuentro accidental con algo inesperado llamado suerte o
azar. Slo quien est preparado para advertir esta casualidad, sabr sacar provecho de estas
situaciones. Recordar que Fleming, cuando descubri la penicilina, estaba rodeado de investigadores tan famosos o ms que l y solo quien fuera posterior Premio Nobel se di cuenta
de la revelacin. Como dira Pasteur en el campo de la investigacin la posibilidad favorece
solo a mentes preparadas. Es muy comn prepararse intelectualmente reteniendo el acceso a
adecuados bloques de informacin actualizada que permitan la interesante asociacin de ideas
y resolver el paso del pensamiento abstracto al concreto o viceversa sin obstculos (15). Hay
que tener olfato para saber distinguir lo importante de lo trivial y pasajero en la informacin
bibliogrfica analizada (4), de similar entidad a un buen diseo de protocolo de experimentacin, prerrequisito para reconocer resultados inesperados.
Por otro lado, asumir que la evidencia objetiva puede eventualmente ser la culpable de
la representacin fidedigna de la realidad, en muchas ocasiones confronta con las hiptesis
propuestas. Esta es una de las intransigencias de la ciencia: el criterio de la evidencia objetiva
como base de cualquier investigacin. Como deca Maran una bella hiptesis puede ser
[ 144 ]

destruda por una fea realidad. Por eso, los investigadores son particularmente impacientes
cuando se presentan en la prensa no cientfica evidencias o grotescos argumentos creando
falsas expectativas a la sociedad. 5

Modos de almacenamiento y acceso a la informacin:


publicaciones y bases de datos
Difusin de los conocimientos
Al admitir que un byte35, 36 permite almacenar una informacin determinada con caractersticas similares al alfabeto, y que por lo tanto una publicacin cientfica escrita en
bytes en un medio electrnico es similar a una palabra, nmero o parte de un grfico, se
redefine entonces que un artculo cientfico escrito en bytes es semejante a la transmisin
de informacin mediante papel: escribir un artculo cientfico y que los lectores lo lean mediante un sistema de computacin es de igual significacin que leer una tradicional revista
cientfica.
Internet es una de las ms conocidas redes electrnicas de sistema abierto, que cuenta con
aproximadamente algo ms de 1000 millones de usuarios en todo el mundo3 y es una red de
redes electrnicas. Su uso, facilitado por su relativo bajo costo, facilidad de acceso, rapidez en la
comunicacin, tiene distintas herramientas informticas para ofrecer (TELnet, Gopher servers,
FTP, World Wide Web servers). La mayora de los centros acadmicos pueden penetrar en el
ciberespacio, y esto transform a la computadora u organizador personal (la popular PC) en
una formidable herramienta multimedia que puede ser manejada razonablemente para muchos
emprendimientos de investigacin. El gran nmero de recursos tcnicos, cientficos y biomdicos existentes al internarse en esta red es de particular inters para el mundo de la medicina.
Muchos centros mdicos, grupos de investigacin y hasta organizaciones gubernamentales (como el National Institutes of Health) o no gubernamentales (Organizacin Mundial de la Salud,
UNESCO, etc) ofrecen sus servicios y facilitan la comunicacin de sus informaciones. Una de
las redes enlaza directamente a 450 instituciones de enseanza superior y centros de investigacin en los Estados Unidos y se llama sistema BITNET.3 A su vez sirve de sostn al sistema
BITNITS de la National Library of Medicine, de Washington, principal biblioteca de medicina
en el mundo y responsable del Index Medicus y su versin en CD-ROM, el Medline. Otra de las
redes es el MEDIS que la Asociacin Mdica Americana usa para difundir el texto completo de
los artculos publicados en sus diversas revistas cientficas como el JAMA, Archives of Internal
Medicine, Archives of Dermatology, entre otras.
Al existir diversas maneras de transmisin de la informacin cientfica,103 algunas como
los CD-ROM (discos compactos con memoria solamente para lectura. En ingls, Compact
Disks Read-Only Memory), que se leen con las computadoras, o el correo electrnico (Email), medio de divulgacin electrnica, tal vez el ms popular a nivel nacional e internacional que permite enviar un mensaje, una carta, una fotografa, una hoja de clculos, una base
de datos o un documento escrito mediante el sistema telefnico conectado con una computadora o cientos de ellas segn sea su destino, se ampla la difusin de conocimientos (nuevos,
o ya vistos pero sin publicacin previa) al expandir e interconectar a los investigadores, sin
importar en que lugar del planeta Tierra se encuentren.
[ 145 ]


Una herramienta a considerar es la telaraa o www (world wide web) o simplemente
web, interfase de la red de computadoras interconectadas que tiene un complejo y atractivo
formato (las pginas web) donde se intercalan figuras con texto y que posee un localizador uniforme de recursos, transmitido mediante un protocolo de transferencia de hipertexto (el famoso
http); se escribe por medio de un lenguaje especial (html, hypertext markeup language). Los
programas que usan la web estn disponibles en muchos sistemas operativos de sistemas de
computacin: simplemente al teclear (y marcar) o resaltar un texto en la pantalla de computacin, el usuario puede navegar (o surfear) en la red de Internet en busca de informacin.

De esta manera, crear con buena calidad una pgina web no es tan dificultoso como
lento de hacer, pero se deben seguir diversas guas que caracterizan la autora de la telaraa
(web). Existen criterios de autora protegidos por leyes (3), similares a todos los conocidos
en la actualidad (especialmente en libros, revistas, videos, pelculas, etc), con reconocimiento
expreso de la propiedad intelectual y un importante inters comercial no bien advertido en
los pases en desarrollo. En determinadas especialidades mdicas como la radiologa, el uso
intenso de imgenes puede ser beneficioso para la educacin de especialistas, al existir en
diferentes lugares del mundo depsitos de informacin radiolgica que estn siempre disponibles al alcance de los usuarios de esta red de redes como es Internet.

Una de las desventajas, por ms que se encuentre la informacin en las pginas web, es
que esto no asegura su bsqueda y que tenga una aplicacin prctica de consulta. No existe un
acceso universal a Internet por ahora, aunque se predice que en los prximos aos todo el mundo lo tendr facilitado.3 Tambin otra dificultad es comunicar resultados preliminares de estudios de investigacin que puedan originar tcnicas o teraputicas dainas para los pacientes.
Por eso se deben considerar los artculos que hayan sido aprobados por sistemas de revisin de
revistas o comits de tica. Ciertas revistas como el New England Journal of Medicine plantean
la necesidad de seguir la regla de Ingelfinger51 que establece no publicar aquello que no ha sido
sometido a revisin por pares o si ya fue publicado con anterioridad. Se considera a la presentacin de un artculo en correo electrnico como una publicacin cientfica formal, aunque slo
sea un resumen o abstract. La revisin por pares (peer review system) es fundamental para
mantener la calidad de la informacin provista por las revistas cientficas, aunque estas sean
electrnicas o slo usen el correo electrnico como medio de difusin.3
Se advierte que si se utiliza la red Internet para solamente artculos preliminares, en muy
poco tiempo las revistas cientficas convencionales podran publicar muy poco, por haber
sido la informacin ya publicada mediante otra forma.

Otra forma de divulgacin de un artculo cientfico mediante Internet es su disponibilidad en un simple formato que almacena un documento. A esto se llama Portable Data Format
(PDF) que necesita un programa especial para su lectura (muchas veces se descarga gratis de
Internet, el programa Acrobat Adobe Reader, en varias versiones).
Tambin el artculo cientfico escrito para una revista electrnica, parece ser una va
actual en amplio proceso de expansin, como una nueva manera de comunicacin propuesta
que es la presentacin en PowerPoint de archivos que semejan artculos de una revista3 en
virtud de ser una estructura capaz de capturar informacin tecnolgica (IT en ingls) con
su procesamiento, almacenamiento, filtrado y distribucin. As se reconocen condiciones
para que el manejo del conocimiento entre pares (cientficos, especialistas mdicos, etc.) sea
[ 146 ]

completo en una flamante forma. Una desventaja es no poder evaluar cmo son presentados
los manuscritos al sistema de revisin por pares: hay que actuar con la misma metodologa
porque actualmente es el tiempo de la evidencia basada en la comunicacin cientfica, pasible
tambin de una estricta evaluacin para no trasmitir conocimientos de escasa o nula importancia. As se han visto diferencias entre la revista tradicional y aquella hecha en PowerPoint, 3 donde adems hay un proceso de post-revisin por pares en el cual se evala la calidad
al final de la presentacin de PowerPoint.

La ms novedosa idea, an sin ejecucin, fue presentada en Recife, Brasil, durante un
Workshop de Editores cientficos en septiembre de 2004. En una Mesa Redonda denominada
Experiencias positivas/innovadoras de algunas revistas cientficas brasileas, se propuso
la unin de un conjunto de Editores cientficos que cree un sitio WEB, y en l se colocaran
electrnicamente los nuevos artculos que estaran protegidos por un certificado digital.100
Los editores estaran constantemente tomando conocimiento de las informaciones que se
almacenan y aquellas que fueran de calidad e inters para las revistas tradicionales seran
seleccionadas electrnicamente para una mayor difusin va impresin en papel.
Por otro lado, la publicacin en papel se ve paulatinamente limitada debido al progresivo
aumento del costo de su materia prima (el papel), adems de tornar complejo el continuo
almacenamiento de publicaciones impresas porque el espacio es limitado y de alto valor econmico. Internet ofrece, entonces, soluciones a estos problemas al cambiar drsticamente la
forma como los cientficos comunican el resultado de sus investigaciones.
Revisin Editorial
Todas las posibles formas de futuras publicaciones tienen como caracterstica comn dar
una mayor agilidad al proceso de publicacin del conocimiento cientfico. Se pretende as
ayudar principalmente a los nuevos graduados en el proceso de elaboracin de manuscritos
de conocimientos con creciente valor cualitativo y de inters,100 y atender la elaboracin de
nuevas cuestiones, basados estos en problemas de la prctica asistencial.
Por lo tanto, es absolutamente necesario conocer las actividades de los cuerpos editoriales
para, de esta forma, saber si se cuenta con interlocutores vlidos ante la evaluacin de un manuscrito original:3 no se puede exigir evaluacin imparcial y perfecta donde no haya un cuerpo
u rgano editorial sin interpretar acabadamente sus funciones y responsabilidades,92, 106 que
use pautas internacionales de edicin y asimismo sea reconocido por entidades editoriales
como el Comit Internacional, Consejo de Editores Cientficos, Asociacin Mundial de Editores, Asociacin Europea de Editores, etc, entes que cumplen funciones de investigacin y
docencia en esta particular rea de la publicacin cientfica. Precisamente en 1988, el Comit
Internacional de Editores de Revistas Mdicas agreg normas para presentar por escrito los
aspectos estadsticos de la investigacin89 o intensificar en aspectos gramaticales del manuscrito para facilitar su claridad y precisin. 34 Recordar que una buena redaccin es como
una pecera: si el vidrio est opaco impedir ver a los peces pero si es transparente y claro se
apreciar en toda su magnitud la belleza de su contenido. 3 Lo mismo ocurre con un original
bien redactado.

Este procedimiento de revisin por pares de todo manuscrito original10, 107 no es un capricho de los editores sino que constituye la piedra fundamental de la idea de publicar ni[ 147 ]

camente aquello con valor y poseedor de una metodologa cientfica eficaz, luego de una
evaluacin exhaustiva de su contenido y forma. De este modo, se evitarn hiptesis confusas o
no probadas, triviales o hasta peligrosas.26, 102, 104 Se solicitar el consentimiento informado de
los pacientes involucrados en el escrito,19 distinguir si se publica para un evento cientfico o una
revista biomdica,3 o si es la divulgacin de conocimientos a la comunidad no cientfica20, 78 o
un original mtodo de enseanza a estudiantes y jvenes graduados. Para ello es ventajoso
comprender si efectivamente el autor es quien realiz la investigacin, 3 si se realiz una previa
y profunda evaluacin de la literatura pertinente, 3 con adecuada seleccin de revistas consultadas73 y recuperacin de citas atinentes95 que permiten la formulacin de preguntas apropiadas a la idea de investigacin, sin dejar de lado ni las evidencias31, 53, 96 ni todas aquellas
explicaciones cientficas necesarias. 3, 29 Recordar que la ausencia de evidencia no es evidencia
de ausencia de importancia de los resultados obtenidos,1 Se detectar y excluir toda conducta catalogada como incorrecta desde el punto de vista tico76, 101 como formal 28 ni publicar
probadamente resultados intrascendentes o muy preliminares.40
Por estas razones, que no son todas las involucradas en un artculo cientfico que es el corolario final de toda investigacin cientfica (experimental u observacional), cada autor/investigador debe estar dispuesto a ampliar sus lecturas de trabajos y/o reas de investigacin,44, 45,
66
para asegurar la calidad del material escogido y ser la base para la elaboracin de un marco
terico3 y definir as qu clase de artculo cientfico es el mejor para enumerar sus resultados.
Asimismo, tendr en consideracin su forma de presentacin, 56, 65 el detalle de complejos
diseos de investigacin70 o si la revista a enviar el manuscrito original es la ms apropiada
para sus observaciones;3 igualmente si es preferible su difusin por va electrnica36, 51 o la
tradicional en papel. La decisin final de aceptacin o rechazo del manuscrito, luego de su
revisin editorial, no es ms que la bsqueda de la excelencia en las publicaciones39 para no
proponer insignificante o irrelevante informacin, con errores graves en su intentada originalidad o sin destacar la precedencia de otros autores en la idea investigada, uso excesivo
de auto-citas bibliogrficas (como si uno fuera el nico que estudi ese tema) o con defectos
de forma. Por eso, antes de la entrega del manuscrito a la editorial correspondiente para su
evaluacin, averiguar con un par de ojos nuevos y frescos, como si se lo leyera por primera
vez, si est a prueba de balas3 desde todos los aspectos posibles a considerar en una revisin
para que no sea rechazado.80
No olvidar que la salud pblica debe ser preservada y por lo tanto, slo investigaciones
cuyos resultados fueron evaluados por rbitros y/o especialistas certificados mediante el proceso de revisin editorial, como tambin el prestigio y la reputacin de los autores y la revista
implicada, exigen un cuidado especial en el manejo del manuscrito, excluyndolo si la informacin contenida es dada a conocer por otra va no evaluada cientficamente:42 recordar el caso
de Robert Gallo que primero se preocup en dar a publicidad por peridicos no cientficos el
supuesto descubrimiento del virus del SIDA-HIV y luego se prob que todo era falso.78
La responsabilidad de la publicacin de investigaciones inexistentes no debe recaer exclusivamente en los editores que las permiten16 sino tambin en los lectores que estn siempre
comprometidos con el contenido al admitir aquellos notoriamente engaosos, confusos al
entregarse en formato electrnico49 o provenir del mundo en desarrollo68, 105 donde se aduce
que los sistemas de revisin no existen o son muy inverosmiles.79, 105 En ms de la mitad de
[ 148 ]

los casos no hubo respuestas por parte de los autores ante reclamos y/o preguntas de los
lectores,48 con lo cual invalidaban y distorsionaban peligrosamente el nuevo conocimiento
clnico presentado.
Los autores creen poseer grandes ideas y saber escribir maravillosos artculos,71 pero no
conocen en realidad cmo se hace el trabajo; por esta simple razn es que los editores esperan
de los investigadores/autores que comprendan y acepten las decisiones editoriales y que dicho
procedimiento debe permanecer en el anonimato con una demanda de bastante tiempo de
revisin;77 el resultado final es la mejora del trabajo expuesto inicialmente. Si los equvocos
de los autores son responsabilidad del cuerpo editorial por no ser evidente lo que se pide al
evaluar y reaccionar como si se exigiera algo utpico o irreal,93 es innegable que los trabajos
no se reformarn y el complejo tramado de edicin de una revista3 se transformar en un intrincado galimatas de muy difcil resolucin. Se comprometer a mejorar la calidad como si
fueran informes sucintos que delimiten el problema y sus posibles soluciones probadas.94
Tambin debern recordar los autores que los consensos han sido ampliamente usados
desde hace mucho tiempo como forma de ayuda para la distribucin de recursos o en la toma de decisiones: se disminuirn los sesgos durante la investigacin y se evitaran decisiones
unilaterales del investigador, supuestamente ms famoso, para interpretar equvocamente
la realidad de los resultados logrados. Mtodos de consenso universalmente aceptados son
el Delphi y la tcnica del Grupo Nominal;6 en estos mtodos existe una combinacin, casi
perfecta, de la sntesis de evidencia cientfica y la interaccin intelectual y experimentada
de los expertos. Las Recomendaciones y Guas que se obtienen para la Prctica Clnica, fin
ltimo de la mayora de las investigaciones, se basan en la lectura crtica de literatura cientfica previa, y por lo tanto, es necesario conocer toda la informacin relacionada con un
tema especfico de investigacin, con seleccin y resumen en funcin de su aportada calidad.
Con el fin de analizar la calidad de la informacin en cuanto a las Guas de prctica clnica,
una iniciativa europea (AGREE) produjo un listado de criterios tiles para su lectura crtica
(www.agreecollaboration.org).6

Reflexin final
No hay fin del progreso cientfico-tecnolgico ni final de la difusin de las revistas cientficas porque involucrara la falta de investigaciones; por eso empezar ahora mismo una investigacin, ya sea para escribir la Tesis nunca realizada, una revisin actualizada de un tema
que interesa especialmente y de utilidad prctica asistencial o un caso clnico observado que
demand un tiempo mayor de preocupacin intelectual. El tiempo es hoy y ya estn presentes
las formas imaginables del artculo cientfico del siglo XXI a disposicin de todos, segn el
tipo de investigacin a desarrollar y las consecuencias de sta (Mapa Conceptual 1):

[ 149 ]

Mapa Conceptual 1:

investigacin
cientfica

recurso
que identifica
Causas de
enfermedad

Dilemas
ticos

a travs de

analizado con

Investigacin Bsica

Principios
y Reglas

Inventigacin Clnica
que implican

para velar por


Inters del paciente

Decisiones
y resolver
Problemas
actuales



Los avances cientficos dependen tanto de poner las manos en la masa (la prctica de la
observacin, clnica o experimental) como de tener ideas y nuevos conceptos (formar la teora) para recprocamente disponer tanto de la inteligencia como de la habilidad de manipular
herramientas o instrumentos que permitan el progreso de la evolucin humana, con orgullo
y sin prejuicios de ningn tipo.64
As como se ense a ser investigador profesional, 21, 29 tambin se debe aprender a ser
autor. Parafraseando a Maran, investigadores/autores, a las cosas!!!!

Referencias
1.
2.
3.
4.

Altman DG, Bland M. Absence of evidence is not evidence of absence. BMJ 1995;311:485.
Andrews LB. Genes and patent policy: rethinking intellectual properties rights. Nature
2002;3:803-7.
Arribalzaga EB, Borracci RA, Giuliano RJ y Jacovella PF. El artculo cientfico. Del papiro al formato electrnico. Editorial Magster Eos, Buenos Aires, 2005.
Arribalzaga EB y Mihura ME. Ciruga basada en la evidencia: moda, mito o metodologa moderna? Rev Argent Cirug, 2001;81(1-2):18-29.
[ 150 ]

5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.

19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.

Arribalzaga EB. Dilemas de investigacin cientfica. Anal Fac Medicina Univ May San Marcos
1997;58(2):149-152.
Asua J. Conferencias de consenso basadas en la evidencia. Gac Med Bilbao 2006;103:3-6.
Bachelard G. La formacin del espritu cientfico. Editorial Argos, Buenos Aires, 1999, 22. Edicin.
Bachrach SM. Scientific journals of the future. American Academy of Arts and Sciences, 2005.
Barcat JA. Original e interesante. Rev Md Rosario, 1992;60(1):42-43.
Baue AE. Peer and/or peerless review. Arch Surg, 1985;120:885-6.
Beecher HK. Ethics and clinical research. N Engl J Med 1966;274(24):1354-1360.
Berkwits M. From practice to research: the case for criticism in an age of evidence. Soc Sci Med
1998;47(10):1539-1545.
Bhandari M, Busse J et al. Association between industry funding and statistically significant proindustry findings in medical and surgical randomized trials. CMAJ 2004;170(4):477-80.
Bhutta ZA. Ethics in international health research: a perspective from the developing world. Bull
WHO 2002;80(2):114-120.
Borracci R, Arribalzaga EB y Chiappetta Porras LT. El pensamiento abstracto en el nivel universitario. Rev Argent Cirug, 1997;72:123-30.
Brice J, Bligh J. Author misconduct: not just the editors responsibility.Med Educ
2005;39(1):83-9.
Bunge M. La investigacin cientfica. Siglo XXI Editores, Barcelona, 2000.
Caminiti C, Scoditti U, Diodati F and Passalacqua R. How to promote, improb and test adherence to scientific evidence in clinical practice? BMC Health Services Research 2005;5:62 Disponible
en http://www.biomedcentral.com/1472-6963/5/62.
Clever LH. Obtain informed consent before publishing information about patients. JAMA,
1997;278(8):628-9.
Cooper C. Writing for the popular press: to inform and entertain.Hosp Medicine,
2001;62(6):364-5.
Cruess SR, Cruess RL. Professionalism must be taught. BMJ, 1997;315:1674-7.
DNegri CE, De Vito EL. Introduccin al razonamiento aproximado; lgica difusa. Rev Arg Med
Resp, 2006;4:126-136.
Davis BD. The scientists world. Microbiol Mol Biol. Rev, 2000;64(1):1-12.
Decullier E, Lheritier V, Chapuis F. Fate of biomedical research protocols and publication bias in
France: retrospective cohort study. BMJ 2005;331:19-25.
del Pino J. EEUU prob en Africa un frmaco antiSida sin develar sus riesgos. El Pas
10/01/2005.
Dietrich H. Nueva gua para la investigacin cientfica. Editorial 21, Buenos Aires, 1999.
di Trocchio F. Las mentiras de la ciencia. Alianza Editorial, Madrid, 1998.
Downes S. How to publish a scientific paper. Australian National University, 2005.
Duran P. Qu investigamos cuando investigamos? Arch Argent Pediatr 2006;104(4):292-294.
Durand SE, Mombr A (Compiladores). Encrucijadas del pensamiento. Anlisis crticos del quehacer cientfico. Gran Aldea Editores, Buenos Aires, 2003.
Editorial. The need and means for evidence-based medicine in developing countries. ACP Journal
2000; July/August: A-11.
[ 151 ]

32. Elliot GC. A brief guide to understanding patentability and the meaning of patents. Acad Med
2002;77(12Pt2):1309-14.
33. Evett IW, Jackson G, Lambert JA. More on the hierarchy of propositions: exploring the distinction
between explanations and propositions. Sci Justice, 2000;40(1):3-10.
34. Eyssautier de la Mora M. Metodologa de la investigacin. Desarrollo de la inteligencia. International Thomson Editores, Mxico, 2002.
35. Flanagin A, Glass RM, Lundberg GD. Electronic journals and duplicate publication. Is a byte a
word? JAMA,1992;267(17):2374.
36. Fontoura Costa L. Bioinformatics: perspectives for the future. Get Mol Res, 2004;3(4):564-574.
37. Frisse ME, Tova JN. The commerce of ideas: copyright in the digital era. Acad Med, 1996;71(1):4553.
38. Garca Marcos F. Investigacin con seres humanos. Rev Fund Fac Med 1998;VII(27): 6-11.
39. Goldwyn R. Manuscript acceptance: excellence not favoritism. Plast Reconstr Surg, 2004;114
Suppl:22-23.
40. Goldwyn R. Preliminaryresults: facts or excuses? Plas Reconstr Surg, 2004;114 Suppl:32-33.
41. Gonzalez de Dios J. De la medicina basada en la evidencia a la evidencia basada en la medicina.
Anal Esp Pediatria 2001;55(5):429-439.
42.
42. Hamad S. Ingelfinger over-ruled. Lancet 2000;356:s16.
43. Harvard Business Review. La gestin en la incertidumbre. Ediciones Deusto SA, Bilbao, 1999.
44. Haynes RB, McKibbon K A et al. Deciding which journals to read regularly. An Intern Med,
1986;105(2):309-12.
45. Haynes RB, McKibbon KA et al. Expanding the number of journals you read regularly. An Intern
Med, 1986;105(3):474-8.
46. Heler M. tica y ciencia: la responsabilidad del martillo. Editorial Biblos, Buenos Aires, 1996.
47. Hofmann B. The technological invention of disease. J Med Ethics:Medical Humanities 2001;27:1019. 2002;287(21):2843-2847.
48. Huth EJ. Is the medical world ready for electronic journals? Online J Curr Clin Trials, 1992 Jul 1;Doc
No 7. Ingelfinger FJ. Purpose of the general medical journal. N Engl J Med, 1972;287(20)1043-4.
49. International Committee of Medical Journals Editors. Statements on electronic publication and
on peer reviewed journals. Ann Intern Med, 1992;116(12):1030. Isaacs D, Fitzgerald D. Seven
alternatives to evidence based medicine. BMJ, 1999:319:1618.
50. Jenkins D. Investigations: how to get from guidelines to protocols. BMJ 1991; 303:323-4.
51. Kates RW, Kasperson JX. Comparative risk anlisis of technological hazards. Proc Nat Acad Sci
USA 1983;80:7027-7038.
52. Kaufman JL. Protection of research sujects (Correspondence). N Engl J Med 2003;349(2): 188192.
53. Kauffmann R, Reyes H, Goic A. Various suggestions for the presentation of manuscripts in biomedical journals. Rev Med Chil 1991;119(8):933-7.
54. Kelch RP. Maintaining the public trust in clinical research. N Engl J Med 2002;346(4):285-287.
55. King DB, Dickinson JA, Boulton MR, Toumpas C. EBM Notebook: Clinical Skills Textbooks Fail
Evidence-based Examination.EMB (Ed Esp) 2005;4:241-242.
56. Knietowicz Z. Medical journals are corrupted by dependence on drug companies. BMJ
2005;330:1169.
[ 152 ]

57. Lede R, Abriata G, Copertari P. La medicina basada en las evidencias. Un movimiento cultural a
favor de una mejor asistencia mdica. Obstet y Ginec Lat Amer 1998;56 (5-6):305-311.
58. Lee JS, Urschel DM, Urschel JD. Is general thoracic surgical practice evidence based? Antorcha
Surg 2000;70:429-31.
59. Lee KP, Schotland M, Bacchetti P, Bero LA. Association of journal quality indicators with methodological quality of clinical research articles. JAMA 2002;287(21):2805-2808.
60. Lemmens T. Confronting the conflict of interest crisis in medical research. Monash Bioeth Rev
2004;23(4):19-40.
61. Lock S. Pride and prejudice. BMJ 1989;298:1197.
62. Logan PM. Preparing and presenting a scientific paper. CARJ 2001;52(6):361-5.
63. Loke YK, Derry S. Does anybody read evidence-based article? BMC Med Research Methodol
2003;3:14-20.
64. Los padres de la oveja Dolly crean gallinas con genes humanos. El Pas, 14/01/2007. Disponible
en: http://www.elpais.com.aertculo/sociedad/padres/oveja/Dolly.
65. Lown B, Bukachi F, Xavier R. Health information in the developing world. Lancet, 1998;352:3438.
66. Manterola C, Pineda V, Vial M, Losada H and MINCIR Group. What is the methodologic quality
of human therapy studies in ISI publications? Ann Surg 2006;244(5):827-832.
67. McSherry DMG. Intelligent dialogue based on statistical models of clinical decisin-making.
Statist Medicine, 1986;5:497-502.
68. Mee C. 10 lessons on writing for publication. J Infusion Nurs 2003;26(2):110-113.
69. Moses H, Martn JB. Academic relationships with industry. JAMA 2001;285(7):933-935.
70. National Library of Medicine. Journal selection for INDEX MEDICUS/MEDLINE, fact sheet
sent by Elsevier Science inc, July 1991.
71. Norelle Lickiss J. Late lessons from Auschwitz- is there anything more to learn for the 21st century?. J Med Ethics 2001;27-137.
72. Nuffield Council on Bioethics. Etica de la investigacin relativa a la atencin sanitaria en los pases en desarrollo. Stephemn Austin & sons Ltd, London 2002.
73. Office of Research Integrity (ORI). Managing allegations of scientific misconduct: a guidance
document for editors. January 2000, http://ori.dhhs.gov
74. Organ CH jr. What an editor wants or expects from authors. BJS 2000;87:1123-1124.
75. 78. Papponetti M. Los siete pecados capitales de la prensa. http://intramed.net.actualidad/art1.
asp.
76. Pellegrini Filho A, Goldbaum M, Silvi J. Production of scientific articles on health in six LatinAmerica countries, 1973-1992.Rev Panam Salud Publica 1997;2(2):121-132.
77. 80. Pierson DJ. The top 10 reasons why manuscripts are not accepted for publication. Respir Care
2004;49(10):1246-52.
78. Popper KR. La lgica de la investigacin cientfica. Ed. Tecnos SRL, Buenos Aires, 1985.
79. Poynard T, Munteanu M et al. Truth survival in clinical research: an evidence-based rquiem?.
Ann Inter.n Med 2002;136:888-895.
80. Raths LE. Cmo ensear a pensar. Teora y aplicacin. Editorial Paidos, Buenos Aires, 1999.
81. Relman AS. The Ingelfinger rule. N Engl J Med 1981;305(14):824-826.
82. Rhodes R, Strain JJ: Whistleblowing in academic medicine. J Med Ethics 2004;30:35-39.
[ 153 ]

83. Russell B. La perspectiva cientfica. Editorial Ariel, Barcelona, 1982.


84. Sabino CA. El proceso de investigacin. Editorial Humanitas, Buenos Aires, 1989.
85. Saville DJ. Basic statistics and the inconsistency of multiple comparison procedures. CJExperPsychol 2003;57(3):167-175.
86. Salk J. Supervivencia de los que saben ms. Emec Editores SRL, Buenos Aires, 1975.
87. Schachman HK. On scientific freedom and responsibility. Biophysical Chemistry 2003;100:615625.
88. Schulkin J. Decision sciences and evidence-based medicine-two intellectual movements to support clinical decisin making. Acad Med 2000;75(8):816-818.
89. Shashok K. Los autores y las buenas prcticas de publicacin: quien decide los criterios? Rev Panam Salud Publica 2004;15(1):4-8.
90. Shumak SL, Redelmeier DA. How to react when your colleagues havent read a thing. CMAJ
2000;163(12):1570-1572.
91. Smith R. Quality improvement reports: a new kind of article. BMJ 2000;321:1428.
92. Sood A, Erwin PJ, Ebbert JO. Using advanced search tools on PubMed for citation retrieval. Mayo
Clin Proc 2004;79(10):1295-9.
93. 96. Soto M, Rada G. Formulacin de preguntas en Medicina basada en evidencia. Rev Md Chile
2003;131:1202-1207.
94. Spar D. The business of stem cells. N Engl J Med 2004;351(3):211-213.
95. Swets JA, Dawes RM, Monahan J. Better decisions through science. Scientific American
2000;october:70-75.
96. 99. Teixeira Brandt C. Editoracao cientifica: as duas faces-analgica e digital. Acta Cir Bras
2004;19(6):587-589.
97. 100. Thorsteinsdottir H, Quach U, Daar AS, Singer P. Conclusions: promoting biotechnology
innovation in developing countries. Nature Biotech 2004;(22S):DC48-DC52.
98. Tomas y Garrido GM. Sabidura tica e informacin cientfica. Persona y Biotica 2003;(19):3946.
99. Veloso de Franca G. Los riesgos de la medicina basada en evidencias. Conferencia, I Congreso
Internacional y Segundas Jornadas de gestin de riesgos en atencin de salud, Santiago de Chile,
11-12/abril/2003.
100. Vos R, Willems D, Houtepen R. Coordinating the norms and values of medical research, medical
practice and patient worlds-the ethics of evidence based medicine in orphaned fields of medicine.
J Med Ethics 2004;30:166-170.
101. Wainerman C, Sautu R (compiladoras). La trastienda de la investigacin. Lumiere, Buenos Aires,
2001, 3ra. Edicin ampliada.
102. Weisinger JR, Bellorin-Font E. Access to medical information in Latin America. Lancet
2000;356:s15.
103. Whitcomb ME, Walter DL. Research training in six selected internal medicine fellowship programs. Ann Intern Med, 2000:133:800-807.
104. Young SN. Peer review of manuscripts:theory and practice. J Psychiatry Neurosci 2003;28(5):327330.

[ 154 ]

Captulo 12

Comit de tica e Investigacin Clnica


Luis Mara Ziehr


Rubn F. Iannantuono

Jos Luis Cacharrn

oy como nunca en la historia de la teraputica se cuenta con frmacos considerados


seguros y eficaces. Este desarrollo en la teraputica moderna se ha conseguido gracias
a las investigaciones clnicas.
En sus comienzos, las investigaciones clnicas utilizaron el mtodo ensayo y error sin que
se tomase debidamente en cuenta los derechos de las personas expuestas a riesgo. As, con
esta metodologa, se obtuvieron grandes avances junto a errores importantes (teratogenia
por talidomida) y violaciones a los derechos de las personas (estudio de sfilis en Tuskegee,
investigacin con radiaciones en mujeres embarazadas pobres en Tennesse e investigacin
con anticonceptivos en mujeres mejicanas en San Antonio, entre otros).
Actualmente, las investigaciones clnicas se realizan siguiendo el mtodo cientfico y normas de buena prctica clnica, para asegurar la calidad cientfica y el respeto de los derechos
de las personas.
Los avances de la ciencia y la tecnologa biomdicas y su aplicacin en la prctica de la
medicina estn provocando cierto grado de inquietud pblica, al enfrentar a la sociedad con
nuevos dilemas ticos. Esta expresa su preocupacin respecto a posibles abusos originados
en la investigacin cientfica y en la tecnologa biomdica. Ello resulta comprensible en vista
de la metodologa de la investigacin experimental biomdica. Pero, en los ltimos aos, muchas personas, tanto en los pases desarrollados como en desarrollo, han comenzado a ver no
slo los riesgos sino tambin los aspectos beneficiosos de la investigacin en seres humanos;
de hecho, hay beneficiarios potenciales que procuran ahora activamente participar en ese
tipo de investigacin, en especial las relacionadas con ensayos de nuevas terapias.

Investigacin clnica versus teraputica


Mientras que la investigacin clnica es una actividad diseada a partir de una hiptesis
experimental previa, con el objeto de obtener resultados que permitan una inferencia cientfica extrapolable a toda la poblacin a partir de la aceptacin o rechazo de la hiptesis, la
teraputica es la aplicacin a una persona de una determinada tcnica o medicamento con el
nico fin de prevenir, mitigar o curar una dolencia en esa persona dentro de una cierta expectativa de xito, sin pretender generalizar el resultado obtenido a la poblacin.
[ 155 ]

En la investigacin y desarrollo de medicamentos existen etapas a cumplir perfectamente


establecidas, que parten de la Farmacologa preclnica y se continan con las de la Farmacologa Clnica, en donde el ensayo clnico es la herramienta para medir la eficacia y seguridad
de los medicamentos. Mientras que en la Farmacologa preclnica los estudios se realizan
en animales de experimentacin, en la clnica es el ser humano el sujeto experimental; as
podemos definir al ensayo clnico como un experimento que se realiza con seres humanos
y que persigue objetivos correctamente definidos, que deben ser alcanzados siguiendo una
metodologa cientfica vlida dentro de un marco tico aceptable.
De la misma manera que en la prctica asistencial habitual, en la investigacin clnica
experimental, es deber del mdico proteger la vida, la salud, la intimidad y la dignidad del
ser humano.

Qu significa ser paciente y ser voluntario?


Toda persona que hace una consulta mdica como paciente habitualmente obtiene un
diagnstico y un tratamiento pero, si se la invita a participar a un ensayo clnico, pasa a
ser paciente voluntario si da su consentimiento. As, una persona no tiene obligatoriamente que ingresar a una investigacin clnica para recibir un tratamiento adecuado para su
enfermedad.
El Comit de Etica en Investigacin Clnica (CEI) es un organismo que tiene como misin
evaluar la tica de los ensayos clnicos tomando en consideracin tanto aspectos metodolgicos como los que tienen que ver con la autonoma de las personas. Es decir, salvaguardar los
derechos de las personas y en especial, de las consideradas vulnerables.
Para ello, un CEI debe evaluar primero la calidad cientfica y justificacin tica de un
protocolo para luego abocarse a la evaluacin y aplicabilidad del consentimiento informado,
que tiene relacin directa con la autonoma de las personas.

Responsabilidades de un CEI

Las responsabilidades ms relevantes son las siguientes:


Proteger los intereses de los participantes de la investigacin y asegurar que los resultados sean previsiblemente tiles para los grupos a los que pertenezcan los voluntarios segn gnero, edad, enfermedad o alguna otra particularidad.
Evaluar la investigacin propuesta antes de su inicio y durante todo su desarrollo
hasta su finalizacin mediante revisiones continuas con una frecuencia predeterminada.
Aprobar, desaprobar o aconsejar modificaciones a todo ensayo clnico puesto a su
consideracin.
Salvaguardar la confidencialidad de todos los documentos y comunicaciones que
reciba de todos los participantes en ensayos clnicos (pacientes, voluntarios sanos,
investigadores, solicitantes).
[ 156 ]

Considerar la competencia de los investigadores y revisar los contratos entre el patrocinador y el investigador y/o institucin.
Requerir, cuando corresponda, que se proporcione informacin adicional en tiempo
y forma a las personas voluntarias participantes en un ensayo clnico que pudiera
dar mayor relevancia a la proteccin de los derechos, seguridad y/o bienestar de las
personas.
Actuar en el completo inters de los voluntarios (sanos o enfermos) de la investigacin y de las comunidades involucradas dentro del contexto regulatorio vigente en la
Argentina y de las normativas internacionales en la materia.
Evaluar la pertinencia del pago a los voluntarios por participar en una investigacin
y establecer (de corresponder) tanto la cantidad como el mtodo.
Asegurar que tanto la cantidad como el mtodo de pago no vulnere la autonoma
que todo voluntario debe tener al momento de tomar la decisin de participar o de
continuar participando en un ensayo clnico.
Asegurar que toda informacin referente a pagos y reintegros a los voluntarios participantes en un ensayo clnico (mtodo, cantidad, prorrateo, etc.) est correcta y claramente estipulada en las hojas de informacin para el voluntario, y en el consentimiento
informado escrito de tal forma que el voluntario pueda comprenderla fcilmente.

Funciones y Composicin de un CEI


Un CEI debe realizar una exhaustiva evaluacin tcnica de los protocolos que se someten
a su consideracin, previa a sus sesiones programadas, de modo tal que los integrantes del
CEI tengan elementos de juicio que los ayuden a fundamentar sus decisiones en un mbito de
total autonoma en el que pueden a voluntad, aceptar total o parcialmente, o directamente
rechazar el protocolo considerado.
Un CEI debe estar preparado para recibir consultas de voluntarios (pacientes o sanos) y
de sus familiares, para asesorarlos en relacin a sus derechos y deberes como participantes
antes, durante y luego de la participacin en un ensayo clnico. Esta actividad debe quedar
debidamente registrada.
Un CEI debe estar compuesto por miembros con capacidad y experiencia para revisar
y evaluar los aspectos cientficos, mdicos, jurdicos y ticos de los estudios que se le proponen, libres de sesgo e influencias que pudieran afectar su independencia. Un CEI debe ser
multidisciplinario y multisectorial en su composicin, los miembros de diferente sexo, credo
y al menos uno de ellos, que se desempee en un rea no cientfica como representante de la
comunidad.
Un CEI, por ejemplo, puede estar constituido de la siguiente manera:
a) Miembros evaluadores participantes de las reuniones ordinarias y extraordinarias con
derecho a voto y con el perfil general descrito anteriormente;
b) Cuerpo tcnico para la evaluacin metodolgica previa de los protocolos de investigacin y para el anlisis de eventos adversos, informes de avance/finales, desviaciones/
violaciones a los protocolos entre otras actividades a su cargo. Debe estar integrado
[ 157 ]

por profesionales con experiencia en metodologa de la investigacin cientfica, entrenamiento en normas/regulaciones/lineamientos a los que adhiere el CEI relacionados
con la investigacin clnica y estudios en reas relacionadas con la salud de no menos
de 5 aos;
c) Area administrativa para la distribucin de la documentacin entrante y para el procesamiento de los documentos generados por el CEI y para el archivo adecuado de todos los
documentos entrantes y copia de los salientes.
d) Un asesor para voluntarios participantes en ensayos clnicos encargado de asesorarlos
en relacin a sus derechos y deberes como participantes o futuros participantes en una
investigacin clnica. El responsable de la asesora a pacientes debe ser un miembro del
cuerpo tcnico.
e) El CEI debe realizar sus tareas en sesiones programadas contando con por lo menos 5
miembros que colectivamente tengan la capacidad y experiencia para revisar y evaluar
los aspectos cientficos, mdicos y la tica de los estudios que se les proponen. Los miembros podrn ser hombres o mujeres y al menos:
Dos de ellos debern tener amplia experiencia en las reas de investigacin y metodologa en ensayos clnicos;
Un miembro deber tener conocimientos de leyes;
Un miembro deber ser representante de la comunidad.
La actividad de un CEI no debe circunscribirse a la evaluacin y seguimiento de
protocolos de investigacin clnica.
Dentro de sus funciones est la de generar mbitos de discusin y anlisis de las
distintas problemticas relacionadas con la investigacin clnica como, por ejemplo, conflictos metodolgicos (placebo, submedicacin y equivalencias) y conflictos pragmticos (poblacin vulnerable, situaciones de emergencia/urgencia, entre
otros).

Conflictos ticos
Mltiples son los conflictos que se presentan en la investigacin clnica. Desde un punto
de vista metodolgico podemos resaltar el uso del placebo, la submedicacin, la equiponderacin y el proceso de randomizacin.
Y, dentro de los que podemos denominar pragmticos, la investigacin clnica en pediatra y la toma de consentimiento informado en situaciones de urgencia/emergencia pueden
ser buenos ejemplos.

Placebos
La conveniencia metodolgica para el uso de placebo (medicamento sin principio activo)
y su justificacin tica debe analizarse caso por caso y puede tener diferentes enfoques:
Visin metodolgica: el placebo es necesario por cuestiones cientficas.
[ 158 ]

Visin tica: los derechos y bienestar de los pacientes estn por encima de la necesidad
de uso de placebo por cuestiones cientficas (visin compartida por la ltima versin de la
Declaracin de Helsinki).
En una aclaratoria posterior a la declaracin del ao 2000, la Asociacin Mdica Mundial permite el uso de placebos en dos situaciones: si no hay riesgos mayores o daos irreversibles para los probandos, y si hay motivos cientficos slidos para el uso de placebos, lo cual
constituye una flexibilizacin que recupera nuevamente el uso de placebos con argumentos
contingentes.

Submedicacin
El uso de un medicamento de referencia subdosificado en los grupos control para evitar
el uso de placebo podra aportar ventajas metodolgicas pero, como contrapartida, podra
someter a los voluntarios a todos los efectos negativos de una dosificacin insuficiente de un
principio activo (como por ejemplo, tolerancia, taquifilaxia entre otras). Por ello, tambin
esta estrategia de investigacin ha sido expresamente cuestionada por Helsinki al exigir que
los grupos controles reciban los mejores mtodos probados existentes.

Equiponderacin
Slo en circunstancias clnicas con terapias alternativas aparentemente equivalentes o
donde hay incertidumbres sobre el valor de una sobre otra, se da la situacin de equiponderacin, que justifica o requiere un estudio para decidir la mejor opcin mdica.
La equiponderacin clnica y toda otra equiponderacin slo tienen sentido como requerimiento normativo en ensayos clnicos bajo la suposicin que los investigadores tienen una
obligacin teraputica con los probandos, pero esa obligacin teraputica para investigadores...constituye una falacia teraputica acerca de la tica de estudios clnicos.
El objetivo de la equiponderacin no est en reforzar la metodologa cientfica, sino en la
proteccin a los pacientes de ser expuestos como probandos a terapias insuficientes y riesgos
innecesarios.

Es tica la randomizacin?
El imperativo de equidad implica que todos los sujetos de investigacin deben tener igualdad en la probabilidad de riesgos y beneficios independientemente de clase social, gnero,
raza o cualquier otro atributo. En este sentido, la randomizacin puede considerarse tica
porque slo considera el azar.

[ 159 ]

Es tico hacer investigacin clnica en pediatra? Es tico no hacerla?


Un porcentaje importante de medicamentos utilizados en pediatra no tiene sustento
metodolgico. Luego, es poco probable que se conozca el verdadero perfil de eficacia y seguridad de esos medicamentos utilizados con informacin obtenida de adultos. Por tal motivo,
la tendencia actual es estimular la investigacin clnica en pediatra para alcanzar en el mediano plazo una teraputica farmacolgica peditrica basada en evidencia cientfica tal cual
se realiza con los adultos.

Existe una nica forma de consentimiento informado?


Segn las Guas de Buenas Prcticas Clnicas (GCP) es un proceso mediante el cual un sujeto
confirma voluntariamente su deseo de participar en un estudio en particular, despus de haber
sido informado sobre todos los aspectos relevantes del mismo para que tome libremente la decisin de participar. El consentimiento informado se documenta por medio de una forma escrita
que debe ser firmada y fechada.
El imperativo del principio de autonoma es el derecho de dar el consentimiento vlido
antes de participar en una investigacin respetando la:
Veracidad: Informacin suficiente en cantidad y adecuada en calidad.
Libertad: Ausencia de coaccin externa o interna.
Oportunidad: Tiempo suficiente del sujeto para decidir reflexivamente.
Interactividad: Derecho al asesoramiento antes de la decisin final
Formalidad: Consentimiento por escrito.
Normalmente, la mayor parte de las investigaciones clnicas se realizan con pacientes
ambulatorios o, de estar internados, cuentan con tiempo suficiente para la administracin de
un consentimiento informado estandarizado segn GCP. Pero, se puede realizar en situaciones de emergencia/urgencia? Claramente NO.
Un consentimiento abreviado puede ser un adicional al consentimiento informado convencional de uso prctico en una situacin de urgencia / emergencia, ya que permitira respetar el principio de autonoma de mejor manera.
Un consentimiento abreviado debera contener en no ms de tres carillas (a lo sumo 4)
con tamao de letra no menor a 11 la siguiente informacin:
1. Ttulo:
2. Datos generales:
Nmero de protocolo:
[ 160 ]

Patrocinante:
Investigador Principal:
Direccin Centro:
Telfono:
3. Introduccin:

Objetivo. Informando que se trata de un Protocolo de investigacin (explicando que es


investigacin: droga/indicacin/edad etc. que no ha sido aprobada an)
Duracin.

4. Tratamientos alternativos: Deben figurar todos los tratamientos alternativos, considerando que en emergencia en general no existen muchos tratamientos alternativos.
5. Voluntariedad
6. Riesgos: Todos los eventos adversos serios. Clusula por daos (recordar que legalmente la Clusula de no renuncia, est implcita aunque no est colocada).
7. Beneficios: slo debe constar que el paciente puede no tener beneficios.
8. Procedimientos: Este tem debe contener slo los procedimientos relacionados a la
etapa aguda. Se debe explicar de ser necesario, la aleatorizacin, uso de placebo, procedimientos invasivos, etc.
9. Gratuidad
10. Firmas

La implementacin del consentimiento abreviado va de la mano del reconsentimiento


que debe siempre realizarse tan pronto como sea posible, ya sea cuando el paciente lo solicite
y/o cuando el mdico investigador lo considere oportuno.

Conclusiones
El ensayo clnico controlado, entendindose como un experimento que se realiza en seres humanos siguiendo metodologa cientfica vlida y ticamente justificado, es una de las
herramientas que garantiza y salvaguarda los derechos de los pacientes o voluntarios sanos
enrolados.
Es, tambin, el instrumento por el cual el paciente ingresa a un proceso teraputico de
elevada seguridad y respeto por los derechos de los pacientes, ya que recibe instrucciones por
[ 161 ]

escrito sobre, por ejemplo, la forma en que debe administrarse la medicacin, los medicamentos prohibidos, los procedimientos relacionados al protocolo junto a otro conjunto de pautas
conductuales (por ejemplo, clusula de no embarazo).
Esto significa que el paciente conoce sus obligaciones (por ejemplo, cumplir con las pautas del tratamiento y con las visitas de seguimiento establecidas en el protocolo) y sus derechos que siempre puede hacer valer si considera que se han vulnerado.
Tambin el cumplimiento estricto de los procesos establecidos en un protocolo de investigacin aprobado por un CEI por parte de los investigadores y su equipo y por las autoridades
regulatorias (de corresponder) sumado al estricto apego de las normas internacionales: Good
Clinical Practice (GCP), The International Conference on Harmonisation of Technical Requirements for Registration of Pharmaceuticals for Human Use (ICH), Food and Drug Administration (FDA), Agencia Europea de Medicamentos (EMEA) y locales: Administracin
Nacional de Medicamentos, Alimentos y Tecnologa Mdica (ANMAT), todas regulatorias
de la investigacin clnica en seres humanos, aseguran el respeto de sus derechos.
Todo ello con el objetivo de propender al desarrollo de medicamentos o procedimientos
teraputicos no medicamentosos eficaces y seguros para prevenir, tratar o diagnosticar las
enfermedades de los seres humanos entendidos como personas y mejorar sus condiciones de
vida como bien supremo a salvaguardar.

Referencias
1. Beecher HK. Ethics and Clinical Research. N Engl J Med 1966; 274: 1354-60.
2. Calvo JM. Hiroshima en el Oeste. Bogot, Colombia. Diario Ocho columnas, 25 de
febrero de 1994: 4.
3. Caplan AC. Twenty year after: The legacy of the Tuskegge Syphilis study. When evil
introduces hasting center report 1992; 22: 6-15.
4. Clayton EW, Steinberg KK, Khoury MJ et al. Informed consent for genetic research on
stored tissue samples. JAMA; 274: 1786-1792.
5. Bauchner H, Sharfstein J. Failure to report ethical approval in child health research:
review of published papers. Br Med J 2001; 323 : 318319.
6. Frana O, An F, Garca C, Gravert R, Nez J, Wodowooz O, Queirolo E. Etica en la
investigacin clnica. Una propuesta para prestarle debida atencin. Rev Med Uruguay
1998; 14: 192-201.
7. Medical Research Council (MRC). MRC guidelines for good clinical practice. In MRC
Clinical Trials Series . London: External Communications, 1998.
8. Food Drug Administration (FDA). International conference on harmonization, good clinical practice: consolidated guidelines. Federal Register 1997; 62: 2569225709.
9. International Conference on Harmonisation of Technical Requirements of Pharmaceuticals for Human Use (ICH). Topic M4 Organisation of Common Technical Document
for the International ethical regulations on placebo-use in clinical trials: a comparative
analysis. Bioethics ISSN 0269-9702 (print); 1467-8519 (online) 2008; 22: pp 6474
10. Josefson D. US researchers guilty of breaking safety rules. Br Med J 2001; 323: 69.
[ 162 ]

11. International Conference on Harmonisation of Technical Requirements of Pharmaceuticals for Human Use (ICH). Topic M4 Organisation of Common Technical Document
for the Registration of Pharmaceuticals for Human Use CPMP/ICH/ 2887/99. London:
European Agency for the Evaluation of Medicinal Products, 2000.
12. Lzaro P, Pozo F, Rico JR. Direccin General de Ordenacin de la Investigacin y Formacin. Ministerio de Sanidad y Consumo. Una estrategia de investigacin en el sistema
nacional de la salud (II): Investigacin en servicios de salud Madrid. Med Clin (Barc)
1995; 104: 67-76

[ 163 ]

V. El mdico como docente y comunicador pblico

captulo 13

Investigacin en Educacin Mdica

Alberto Alvs de Lima

Introduccin
La investigacin en educacin mdica comenz hace ms de 30 aos. Desde aquellos
inicios ha ido creciendo hasta expandirse alrededor del mundo con intensidad creciente.
Existen marcadas diferencias en los indicadores de avances cientficos entre la investigacin
en educacin mdica y medicina.1 En medicina, los indicadores de avances cientficos pueden
medirse a travs de puntos finales duros como la mortalidad, el infarto agudo de miocardio
o un accidente cerebro vascular. En educacin mdica este tipo de puntos finales duros no
existen por algunas razones:
1. Paradjicamente, diferencias evidentes en las estrategias educativas pueden no reflejarse en los puntos finales establecidos, por ejemplo desempeo profesional y carrera
de medicina. Simplemente porque los participantes, estudiantes de medicina, estn
con una fuerte motivacin, no estn ciegos a las distintas intervenciones y compensan cualquier defecto que pueda presentarse durante la currcula.
2. Un programa o una currcula no funciona como una droga o un frmaco. La droga
se aplica en dosis establecidas en horarios definidos y tiene al menos una cintica
predecible. La currcula de una carrera no es posible dosificarla, tiene mltiples componentes o porciones que son administrados por diferentes docentes con diferentes
niveles de calidad.
3. El tiempo entre la aplicacin de la estrategia educativa y los resultados puede ser tan
largo, que los efectos del programa podran verse discutidos.
La investigacin en educacin mdica ha contribuido y contribuye enormemente a comprender los intrincados procesos de aprendizaje con el fin de mejorar sus resultados. En los
ltimos aos, tanto la comunidad educativa como las autoridades universitarias estn considerando a la evidencia en educacin mdica como una herramienta esencial en la toma de
decisiones.1
Luego, el propsito de este captulo es reflexionar sobre temas generales de investigacin en educacin mdica. Analizaremos el significado del tpico de investigacin, el valor
de generar una adecuada pregunta de investigacin y una hiptesis como pasos esenciales
[ 167 ]

para el inicio de cualquier protocolo. Definiremos trminos como variables operacionales


y el concepto de validez y reproducibilidad de los resultados en investigacin en educacin
mdica.

Seleccionando un tema o un tpico de investigacin


El tema o tpico de investigacin es un rea de inters definida que es distinta de
otras. 2 Si bien al inicio pueden ser de ayuda los temas amplios, ser necesario ir seleccionando un tpico mas especfico para poder avanzar en las diferentes etapas del proceso de investigacin. Ej: a. educacin medica, b. evaluacin de competencias clnicas, c.
herramientas para evaluar habilidades psicomotoras, d. Evaluacin de Examen Clnico
Reducido (EECR). 3
Existen 3 principios rectores para hacer la seleccin del tpico:
Primero y principal es el grado de inters que el investigador tiene sobre el tpico. Esto no
es menor, el proceso de investigacin es largo, duro, lleno de sinsabores y en la mayora de los
casos los resultados suelen ser distintos a los esperados. Si uno genuinamente no siente una
gran motivacin para seguir ese tema lo mejor es descartarlo y pensar uno nuevo.
El segundo principio es el concepto de factibilidad. Lo ideal es no pensar en cosas que
por falta de recursos o participantes no podrn ser llevadas adelante. Pensar en algo que
puede llevarse adelante es darle sentido al trabajo, estimulo fundamental para arribar a buen
puerto.
El tercero, considere siempre la posibilidad que el tema sea publicable en una revista
cientfica.

Ejemplos de tpicos en educacin mdica


A continuacin se presenta una lista algunos tpicos de investigacin que han sido investigados por residentes o estudiantes en nuestra institucin
Obviamente son sugerencias generales
Impacto educativo y herramienta de evaluacin4
Promedio de carrera y rendimiento en exmenes de seleccin para una residencia de
cardiologa5
Validez y reproducibilidad de una herramienta de evaluacin de la competencia clnica3
Estilo de aprendizaje de un grupo de residentes de cardiologa y tipo de exmenes6
Calidad de una residencia y su relacin con el mercado laboral7

Defina la pregunta de Investigacin


Una vez que tenemos delineado el tpico de investigacin es esencial revisar a fondo la
bibliografa en relacin a ese tpico. El objetivo es ir definiendo la pregunta de investigacin.
[ 168 ]

La pregunta de investigacin es o son los interrogantes que le queremos formular al tpico


de investigacin.
Ej. Tpico de investigacin: Impacto educativo y herramientas de evaluacin
Ej. Pregunta de Investigacin: Cul es el impacto educativo del examen de opcin mltiple con respecto al EECR (Evaluacin de Examen Clnico reducido)?
Cuanto ms clara sea esta pregunta, ms especfica ser la bsqueda de la informacin.

Bsqueda de informacin en educacin medica


El objetivo de revisar la bibliografa es ayudar a definir la pregunta de investigacin y
llevar adelante un protocolo con un diseo eficiente. Existen fuentes primarias y secundarias
de informacin. Las primarias son reportes escritos por las personas que llevaron adelante la
investigacin y las secundarias son reportes escritos por personas distintas a las que llevaron
adelante la investigacin. Con el fin de mejorar la confiabilidad de la informacin siempre es
recomendable revisar fuentes primarias.
Las fuentes incluyen libros, captulos de libros, revistas cientficas, documentos y comunicaciones presentadas en conferencias profesionales.

Educational Resources Information Center (ERIC).


El problema del tiempo entre la finalizacin de los estudios y su publicacin habitualmente es extenso. Para resolver al menos parcialmente este problema la oficina norteamericana de educacin estableci en 1965 el centro de informacin de recursos educativos o
ERIC. http://www.eric.ed.gov/ . Fue establecida para proveer mecanismos para que nueva
informacin educativa, en particular de proyectos gubernamentales pueda estar disponible
en forma rpida y a bajo costo. Adems ERIC es responsable en la generacin de tres bases
de referencia:
1. CIJE (Current Index to Journals in Education): se trata de una base que indexa artculos que aparecen en revistas cientficas
2. RIE (Resources in Education): se trata de una base que indexa documentos educativos de ERIC
3. Thesaurus of ERIC Descriptors: contiene un listado de descriptores que se utilizan
para indexar los artculos de CIJE y los documentos de RIE. Todo aquel que desee
localizar informacin sobre un tpico en CIJE o en RIE debe usar siempre un descriptor que aparece en el thesaurus.

Otros sitios que indexan artculos de revistas cientficas de educacin son el Education
Index (www.educationindex.com) y el Psychological Abstracts www.apa.org/psycinfo/
products/psycabs.html .
Medline (www.pubmed.gov) en tambin un sitio en donde se indexan gran cantidad de
artculos vinculados a la educacin mdica.8
[ 169 ]

Formulado la hiptesis de Investigacin


Los estudios de investigacin son semejantes a una ecuacin aritmtica, una clara racionalidad o propsito (por qu y para qu van a definir una buena pregunta de investigacin,
qu es lo que se quiere investigar). Esto nos guiar hacia un adecuado Cmo? Es decir los
materiales y mtodos que necesitamos para llevar adelante la investigacin. Posteriormente
vendrn los resultados, es decir las respuestas a esas preguntas de investigacin formuladas.
Para finalizar aparecer la discusin. Esta seccin se trata de una reflexin sobre los resultados obtenidos.
Es frecuente observar que existe confusin entre objetivos y propsitos. Como dije anteriormente los objetivos se refieren a QU se va a investigar y el propsito al por qu y para
qu se llevar adelante la investigacin. Los objetivos de un estudio frecuentemente toman
la forma de pregunta. Las preguntas expresan cmo las variables a investigar podran relacionarse.
La hiptesis es la respuesta anticipada a nuestra pregunta de investigacin. Es una prediccin sobre el resultado en trminos de las variables a investigar.9 Una hiptesis tpica
en educacin podra ser: Los residentes de cardiologa instruidos a travs del mtodo A
obtienen calificacin ms alta en exmenes de apreciacin critica de trabajos cientficos con
respecto a los instruidos con el mtodo B. En este caso las variables son los mtodos de capacitacin A o B y el rendimiento en exmenes de apreciacin crtica. Es una prediccin que
el mtodo A se va a asociar a mejores resultados que el mtodo B. Es muy importante definir
con claridad las variables y evitar ambigedades. El ejemplo anterior es interesante, imaginemos que el mtodo A es un nuevo sistema de instruccin y el mtodo B es el tradicional.
Es muy frecuente en educacin que se defina con gran minuciosidad el nuevo mtodo de
instruccin pero el tradicional se deja librado a la imaginacin del lector asumiendo que ste
lo conoce en detalle.

Tipo y diseos de investigacin en educacin mdica


En investigacin en educacin mdica, los objetivos ms frecuentemente buscados son dos:
1. Determinar causas y factores de un determinado problema
2. Evaluar los resultados de una estrategia determinada
Cada uno de estos objetivos puede llevarse a cabo aplicando diseos de investigacin
apropiados.10
Por lo general se clasifican de acuerdo con:
El tipo de datos a recabar: pueden dividirse en investigaciones cualitativas y cuantitativas. Las de tipo cualitativas se utilizan para dar respuesta a preguntas que pueden
ser contestadas slo a travs de descripciones, en cambio las investigaciones de tipo
cuantitativas se utilizan para dar respuesta a preguntas que pueden contestarse a
travs de la recoleccin y anlisis de datos numricos.
[ 170 ]

Si se aplica o no una intervencin: si se aplica una intervencin: ej: utilizacin de un


simulador para RCP, el diseo es experimental. En este tipo de diseo la inclusin
de los participantes puede realizarse por un proceso de randomizacin individual
(experimental) o a grupos ya establecidos (Quasi-experimental). Si no se aplica una
intervencin y slo se observan las caractersticas que la poblacin ha adquirido
naturalmente, el diseo es Observacional.
Los diseos observacionales pueden adems dividirse en descriptivos, si slo se reportan los datos observados obtenidos de la poblacin estudiada, o analticos, si se
comparan datos entre sub-poblaciones (expo-facto) Ej.: capacidad de resolucin de
problemas de residentes de cardiologa con o sin experiencia de clnica mdica previa.
De acuerdo a cmo se van a recolectar los datos: Cuando los datos se refieren a eventos pasados el diseo es retrospectivo. Cuando los datos se van a recolectar hacia
delante en el tiempo desde el inicio del estudio, el diseo es prospectivo.

Instrumentos para medir variables operacionales


La definicin operacional de una variable, es una definicin que da significado a la variable a travs de la descripcin de cmo la variable es medida. La definicin de una variable
operacional, razonamiento clnico es por ejemplo el puntaje que una persona recibe en un
examen de opcin mltiple diseado para este fin. Hay variables operacionales ms sencillas
de definir que otras. La variable edad es muy simple ya que tpicamente se expresa en forma
numrica. La mayora de las definiciones operacionales en las investigaciones en educacin
mdica estn expresadas en forma de puntajes. Teniendo en cuenta que las herramientas de
evaluacin se utilizan para definir variables operacionales es primordial saber si esas herramientas son adecuadas.
Una herramienta de evaluacin adecuada debe ser primariamente vlida y reproducible.11

Validez
Los resultados de una evaluacin son vlidos cuando son apropiados, pertinentes y
adecuados a lo que estoy midiendo. Mide lo que quiero medir. Ej: si quiero medir habilidades de comunicacin, la herramienta (Gua de Observacin) mide comunicacin y no
examen fsico, y si quisiera medir glucemia, el mtodo (glucometer) mide glucemia y no
natremia.11
Es importante tener en cuenta algunos puntos
La validez se refiere a lo apropiado y adecuado de los resultados de una herramienta
de evaluacin para un grupo determinado de individuos y no a la herramienta en s
misma. Que un test sea altamente vlido para un grupo de estudiantes de medicina
de quinto ao no significa que lo sea para residentes de cardiologa.
La validez es un concepto continuo y no dicotmico.
La validez es siempre especfica para uso particular. Ninguna herramienta es vlida
[ 171 ]

para todos los propsitos. Una herramienta de evaluacin como el examen de opcin
mltiple de cardiologa puede ser altamente vlido para indicar habilidades de conocimiento, moderado para indicar habilidades de razonamiento y bajo para predecir
xito en la prctica del da a da.
La validez es un concepto nico, es decir no hay distintos tipo de validez, si distintos
modos de considerarla

Distintos modos de considerar validez


Existen cuatro modos para considerar la validez de una herramienta de evaluacin: de
contenido, de constructo, de criterio y de consecuencia.
Las consideraciones de contenido expresan, frente a un buen desempeo en el examen
que el estudiante conoce satisfactoriamente los tems o contenidos que deban ser evaluados.
Las consideraciones de constructo expresan que un buen desempeo puede ser interpretado
como una medida adecuada de una caracterstica o cualidad que quera ser evaluada (razonamiento). Las consideraciones de criterio expresan, frente a un buen desempeo en el
examen futuros buenos desempeos en exmenes estandarizados. Las consideraciones de
consecuencia indican que produce los efectos deseados (aprendizaje) o reduce efectos no deseados (Desercin escolar)
En resumen, una herramienta de evaluacin es altamente vlida cuando a travs de un
buen resultado podemos interpretar que el estudiante sabe todo lo que consideramos que
debe saber, que ha entendido el tema, que est por encima de un patrn predefinido y que
producir los efectos.

Reproducibilidad
La reproducibilidad se refiere a la consistencia de la medicin. Supongamos que tuvisemos un examen perfectamente reproducible. Si se lo administramos a un grupo de personas
y luego pudisemos borrar de sus memorias el examen y se lo tomramos nuevamente, deberan obtener exactamente el mismo resultado. No podemos esperar exmenes con consistencia perfecta ya que muchos factores pueden influenciar los resultados.12
Tenemos que tener en cuenta los siguientes puntos
La reproducibilidad se refiere a los resultados con el examen y no al examen en si mismo. Un examen tiene distinta reproducibilidad dependiendo del grupo evaluado, del
contexto etc.
La reproducibilidad siempre se refiere a algo en particular. Puede estar vinculada a
los resultados del examen, a los resultados inter-evaluadores o mismo intra-evaluadores.
La reproducibilidad es necesaria pero no una condicin suficiente de validez. Un
examen que arroja datos totalmente inconsistentes no podr brindarnos informacin vlida. Exmenes altamente consistentes podran estar midiendo cosas equivo[ 172 ]

cadas. Ej: supongamos que tengo un glucometer y una muestra de sangre. Si pongo
la muestra en el glucometer en varias oportunidades y siempre me indica valores de
glucemia de 100 mg/dl significa que el resultado de la medicin es vlido (siempre
mide glucemia) y reproducible (los valores son similares). En cambio si indica valores
distintos el resultado sigue siendo vlido (mide siempre glucemia) pero no es reproducible (da valores distintos). La reproducibilidad es necesaria pero no es una condicin
suficiente de validez.
Existen diferentes formas de evaluarla: test-retest, Split-half, coeficiente alfa, teora de
la generalizacin.
Test-retest: se administra en mismo examen en dos oportunidades al mismo grupo en
momentos distintos.
Split-half: se administra en examen en una oportunidad y posteriormente se hace una
correlacin entre los resultados de la primera mitad con la segunda.
Coeficiente alfa: se administra en examen en una oportunidad y se aplica la frmula de
Kuder-Richarson.
Teora de la generalizacin: a travs del anlisis de componentes de varianza, utiliza todos
los datos disponibles para cuantificar todas las fuentes de error en la misma experiencia.

Conclusiones
La investigacin en educacin mdica es comparable en general con la investigacin biomdica. Muchos investigadores tratan de aplicar las metodologas de investigacin de biomedicina y el resultado es que el proyecto no puede llevarse adelante o bien deben adaptar la pregunta de investigacin a la metodologa y no la metodologa a la pregunta de investigacin.
Otro problema importante es que la investigacin en educacin mdica es considerada
por muchos como algo sencillo y que cualquier persona medianamente inteligente la puede
llevar adelante inclusive sin un adecuado periodo de entrenamiento. Si bien es cierto que est
al alcance de todos, es imprescindible entrenarse en este sentido.
Los investigadores que llevan adelante los proyectos son en general extremadamente
tericos y sus resultados difciles de aplicar en la prctica del da a da. Es necesario integrar
habilidades de investigacin pero no perder la conexin con la docencia y la prctica mdica
en terreno.
Para concluir, no es la metodologa la que define la rigidez cientfica de la investigacin
sino la fortaleza de la pregunta de investigacin, el valor de definiciones operacionales, la
eleccin de la metodologa para la bsqueda de los objetivos propuestos y del cuidado y la
prolijidad como se lleva a cabo el proceso.13

[ 173 ]

Referencias
1. Norman G. Research in medical education: three decades of progress. BMJ 2002;324:156062.
2. Crowl. Selecting a research topic In Fundamentals of Educational Research. 2nd edition
Mc Graw Hill 1996;.
3. Alves de Lima A, Barrero C, Barratt S, et al. Validity, reliability, feasibility and satisfaction of the Mini-Clinical Evaluation Exercise (Mini-CEX) for Cardiology Residency
Training 2007.
4. Alves de Lima A, Thierer J, Paulin J, et al. A qualitative study of the impact on learning of the mini clinical evaluation exercise in postgraduate training. Medical Teacher
2005;27:46-52.
5. Alves de Lima A, Botto F, Azzari F. Examenes de seleccin para postulantes a residencias
en cardiologa. Variables que se asocian con los resultados. Revista Argentina de Cardiologia 2001;69:327-331.
6. Alves de Lima A, Baratta S, Falconi S, et all. Lerning Strategies used by cardiology residents: Assessment of their learning styles and their correlations. Education for health
2006;19:289-297.
7. Alves de Lima A. Evaluacin de calidad de una residencia en cardiologa: comparacin
de las opiniones de los egresados y sus actuales jefes en el mercado laboral. Revista del
CONAREC 2005;21:152-156.
8. Erbert J, Erwin P. Searching the medical literature using PubMed: A tutorial. Foundation for medical Education and research 2003;78:87-91.
9. Crowl. Formulating research hypothesis In Fundamentals of Educational Researh. 2nd
edition. The McGraw Hill companies 1996;
10. Henquin R. Clasificacion de los estudios de inbvestigacion. En Introduccin a Epidemiologa y Estadstica. 1 edicion. ELALEPH.COM 2006.
11. Linn R, Gronlund N. Validity, In Measurements and Assessment in Teaching. Merrill
Pprentice Hall 2000; ISBN: 0-13-878356-X.
12. Linn R, Gronlund N. Reliability and other desired characteristics, In Measurements and
Assessment in Teaching. Merrill Pprentice Hall 2000; ISBN: 0-13-878356-X.
13. Schuwirth L. Challenges for educationalists. BMJ 2006;333:544-46.

[ 174 ]

Captulo 14

Cmo hablar con los medios.


El supermercado de la salud

Nora Br

maginemos por un instante a Buenos Aires en 1810. Una aldea de unos 40.000 habitantes
con calles de barro en las que, segn escribi un viajero francs, en las horas de la siesta
no se vean ms que mdicos y perros.
Con ocho alumnos en los cursos del Protomedicato, el cuidado de la salud recaa en
otros tantos egresados, siete cirujanos, trece boticarios y algn que otro dentista u oftalmlogo.
En materia de remedios, se los utilizaba enrgicos (otra forma de decir que muchos
de ellos eran mortales en dosis elevadas), lo que de algn modo favoreca las malas artes de
curanderos y falsos mdicos, que se lanzaban a ejercer la profesin ms ardua e interesante
de la vida del hombre, segn las crnicas de la poca.
Por esos tiempos, el Ministro Godoy envi una memoria sobre el poder desinfectante
de los cidos minerales y, entre ellos, el nitro-muritico-oxigenado, recomendando que se
adoptaran las fumigaciones y se mandaran practicar en todos los Lazaretos fijos o provisionales, en todos los Hospitales militares y civiles, en todos los Cuarteles, presidios, crceles
y dems parajes, que por contener mucho nmero de individuos enfermos o sanos adulteran
la atmsfera que respiran y no basta la ventilacin del aire libre para destruir los grmenes
funestos que se anidan en su camas, muebles y paredes.
La medicina colonial inspira una sonrisa, pero entre el mercurio y la amalgama pulverizada surge un detalle de insospechada modernidad: en la misiva enviada por Godoy ya se
haca hincapi en la conveniencia de divulgar los conocimientos mdicos.
Considero escriba que conviene al mejor servicio del Rey y del Estado que se vulgaricen todo lo posible estos conocimientos; que se facilite a todos los jefes que vigilan o
tienen a su cargo la salud pblica, la instruccin que importa posean en ese importante
objeto...
Dos siglos ms tarde, la comunicacin de noticias mdicas y cientficas es una realidad
de crecimiento explosivo en los medios de comunicacin globales.
Prcticamente no existe emisora de radio, canal de televisin, diario o revista de inters
general que no incluya en su oferta informativa una seleccin de temas mdicos o un especialista que comente las ltimas novedades. Basta con teclear un vocablo mdico en Internet
para que la pantalla nos devuelva miles de sitios electrnicos.
[ 175 ]

Claro que, con 54.000 publicaciones cientficas, especialistas vidos por figurar en letras
de molde o aparecer en una pantalla de TV, y un pblico dispuesto a aceptar sin chistar las
novedades ms disparatadas, divulgar conocimientos cientficos no es tarea sencilla.
Para elegir el men del da, el periodista especializado deber bucear en decenas de
informaciones armado de un conocimiento apropiado de los temas que frecuenta y criterio
adecuado para valorar los nuevos conocimientos. El supermercado de la salud es un terreno pantanoso y sus ofertas deslumbran como luces de nen.
Una ancdota vale ms que mil palabras. Despus del xito de la pldora de la virilidad,
mientras todava se impriman pginas y pginas sobre el Viagra, ms de diez compaas
norteamericanas comenzaron a ofrecer frmacos para mejorar lo que, en un alarde de mercantilismo, denominaron prestaciones sexuales. Empresas dedicadas a la herboristera y
farmacias alternativas ofrecieron pcimas, pomadas, pldoras y ts destinados a optimizar el
rendimiento de los varones en el terreno amoroso.
En los Estados Unidos, Hypnovisin, una empresa de Nueva York, por ejemplo, produjo un
audiocassette subliminal que proclamaba: Mi sexo es perfecto porque Viagra funciona bien.
Bodyonics, de Hicksville, envi cartas a 10.000 mdicos anunciando Longevity, una
lnea de hierbas preparada para la generacin que pisa los cincuenta aos. Y los laboratorios
HerbaSway anunciaron la pldora Stamina, con hierbas provenientes de la China.
Los cables de las agencias noticiosas traan a nuestro escritorio todas estas novedades
y tambin las promesas de la medicina tradicional, que se ufanaba de haber encontrado un
abanico de remedios para otorgar vitalidad al orgullo masculino, como los extractos de ciertas plantas o comidas, como la sopa de pene de tigre, el polvo de cuerno de rinoceronte o las
pociones de animales tan extraos como la civeta, un cuadrpedo parecido a la mangosta.
El ejemplo tal vez suene un tanto exagerado, pero los hay incluso peores. Y si discriminar entre promesas, a cual ms seductora, no parece una prueba suficientemente ardua, en
nuestra particular carrera de obstculos para alcanzar la tan ansiada primicia se nos interponen desde los inventores autodidactos hasta los mdicos heterodoxos que desarrollan
tratamientos propios (y, por supuesto, no sometidos a la aprobacin de sus pares) para curar
algunos de los males ms persistentes.
En una sala de redaccin, atender el telfono resulta una experiencia que puede poner a
prueba la capacidad de asombro. Nuestro ocasional interlocutor suele apresurarse a explicar
que posee un mtodo revolucionario que hace recuperar el cabello a los calvos, restablece la
secrecin de insulina o elimina las secuelas del accidente cerebrovascular. Los medios de comunicacin ejercen una atraccin magntica para mercaderes de sueos dudosos. Los hay de
muchos tipos, pero todos tienen algo en comn: suenan absolutamente convincentes.
Por eso, hay momentos en que a uno le encantara tener a mano una bola de cristal o
poseer poderes anticipatorios.
Sobre todo cuando algn experimento cientfico parece inusualmente promisorio. Y en
especial cuando lo que promete es una pavada como erradicar el cncer o curar el sida.
Ah surge un dilema difcil de resolver: consiste en prever qu probabilidades tiene ese
cheque en blanco de convertirse en realidad. Y en qu plazo: maana, el ao que viene,
dentro de medio siglo...?
Estas decisiones son las que tenemos que tomar varias veces por da los periodistas que
[ 176 ]

trabajamos en temas de salud. Por ejemplo, hace un par de aos, un equipo de la Universidad
de Harvard anunci que haba encontrado una protena que protega a ciertos monos del
sida. Bastaba una extrapolacin un poquito ms optimista de lo razonable para empezar a
pensar que la misma cadena de aminocidos podra proteger a los seres humanos. Un poco
ms y casi, casi estbamos a un paso del remedio contra la pandemia.
Lamentablemente, la historia reciente demuestra que, en medicina y en investigacin,
nada es tan sencillo.
En agosto de 1995, Madeleine Nash se preguntaba en la revista Time si habamos encontrado el nirvana de la prdida de peso: el doctor Jeffrey Friedman, de la Universidad Rockefeller, haba inyectado diariamente durante dos semanas una hormona en ratones obesos
y stos sbitamente haban comenzado a comer menos y a quemar ms grasas. En un alarde
que slo pudo comprobarse en el mundo ratonil, stos no slo haban perdido un 30% de
su peso, sino que al mismo tiempo haban registrado descensos en sus ndices de colesterol y
glucemia.
La leptina una palabra que dio la vuelta al mundo se transform en el imaginario
colectivo en la hormona milagrosa que terminara definitivamente con la tortura de la
obesidad. Sin embargo, casi una dcada ms tarde y a pesar de los esfuerzos, todava no se
encontr la manera de remedar esos milagros a escala humana.
Antes del 3 de mayo de 1998, pocos haban escuchado los vocablos angiostatina y endostatina ms all de un estrecho crculo de investigadores en oncologa. Pero bast un artculo en
la primera plana de The New York Times para que se encendieran las ilusiones de todos: estaba
dedicado a las investigaciones en ratones de Judah Folkman y Timothy OReilly sobre cmo
impedir la formacin de nuevos vasos sanguneos (antiangiognesis) en un tumor. Cuando le
preguntaron a Folkman si lo consideraba una buena noticia, contest: Si usted es ratn, s.
Es en ocasiones como stas cuando la informacin responsable adquiere todo su valor.
Por eso, los comits de tica de diferentes asociaciones periodsticas aconsejan:
1. Ser vigilantes en la seleccin de fuentes, sopesando y descubriendo todo conflicto de
inters, sea este financiero, personal o profesional
2. Investigar e informar sobre lazos entre nuestras fuentes y empresas o laboratorios
cuando se promueve una nueva idea o terapia.
3. Investigar e informar sobre posibles lazos entre investigadores y compaas privadas,
instituciones, grupos de pacientes y sus sponsors.
4. Reconocer que la mayora de las historias que cubrimos implican un grado de complejidad que una fuente nica no puede proveernos.
5. Entender el proceso de la investigacin clnica para informar adecuadamente sobre
los avances (por ejemplo, reconociendo las diferencias entre pruebas de Fase I, II, o
III). Ser cauto en la informacin de estudios preliminares, in vitro o en animales.
6. Preservar la independencia periodstica.
7. Ser especialmente cuidadosos en el uso de estadsticas o en la informacin de conocimiento que pueda influir en el estado de nimo de los pacientes.
8. No explotar los costados dramticos y sensacionalistas de historias que involucren
a individuos enfermos.
[ 177 ]

9. Utilizar adecuadamente el lenguaje.


10. Cuantificar el riesgo. Un 50% de aumento en el riesgo relativo puede no ser mucho si
los nmeros absolutos son pequeos.
11. Informar sobre los riesgos y beneficios de los tratamientos.
12. Distinguir entre asociacin y causa.
13. Definir y comunicar las dudas e incertidumbres de los cientficos, tanto lo que los
mdicos saben como lo que ignoran.
14. Buscar expertos independientes para evaluar la calidad de la evidencia o confirmar
resultados.
15. Considerar que el principal criterio cuando se elige una noticia para publicar es el
inters pblico.
16. Ser escptico, sobre todo acerca de promesas enfticas.
17. Dejar de lado trminos como cura mgica y otros igualmente sensacionalistas.
Pero es necesario subrayar que si a los periodistas se nos acusa de teir de sensacionalismo el trabajo de los cientficos en pos de un titular llamativo, segn ms de doscientos
investigadores, funcionarios y representantes de medios europeos consultados para elaborar
las Guas sobre la comunicacin de la ciencia y la salud --producidas por el Centro de
Investigaciones Sociales de Gran Bretaa y la Escuela de Investigaciones en Comunicacin
de msterdam--, muchas de las distorsiones y malentendidos que exhiben actualmente las
notas periodsticas surgen de una cierta incapacidad de los cientficos para comunicar sus
hallazgos.
El resultado, segn las conclusiones del Programa Messenger, dentro del cual se desarrollaron las guas, es que el pblico se forma una imagen distorsionada del proceso cientfico,
padece ansiedades innecesarias y alienta falsas esperanzas.
Algunas de sus recomendaciones para los cientficos:
Lea los diarios, mire la televisin! Es importante que est al tanto de cmo su tema
de investigacin es reflejado en los medios. Cules son las reas de controversia?
Cmo se perciben los riesgos?
Conozca a los periodistas y estilos locales. La forma en que se cubren las noticias
cientficas vara de pas en pas de acuerdo con cuestiones morales, comerciales y
regulatorias.
Aclare si sus hallazgos son preliminares. Aunque hay una natural tendencia a destacar la importancia del propio trabajo, esto no sirve a los intereses del pblico ni de
los cientficos.
Destaque en qu forma sus hallazgos difieren de los obtenidos por otros. Esto ayudar a los lectores a ponerlos en contexto y a entender que otros investigadores pueden
tener diferentes visiones sobre el mismo tema.
Sea especialmente claro en la comunicacin de los riesgos. Para un cientfico, el
riesgo es simplemente la probabilidad estadstica de que ocurra algo. Esta no es,
sin embargo, la forma en que lo entienden las personas no entrenadas. Conviene
aclarar cul es el riesgo absoluto, de modo que se entienda el riesgo relativo, realizar
[ 178 ]

comparaciones y poner en contexto los grandes nmeros. Por ejemplo: es grande,


moderado o pequeo un riesgo de uno en un milln?
Si sus investigaciones tienen implicancias para la calidad de vida de su comunidad,
sea particularmente cuidadoso al describirlas. Este puede ser el caso cuando trabaja
en problemas alimentarios, seguridad, medio ambiente y otros temas. Est preparado para participar en discusiones sociales, ticas, econmicas y polticas.
Como afirman en sus consideraciones preliminares los autores del Messenger: Promover la cultura cientfica es parte de una buena higiene democrtica.
Y en esto, cientficos, periodistas y lectores tenemos responsabilidades compartidas...

[ 179 ]

VI. Elementos de Bioestadstica

Rogelio A. Machado

Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin
Seccin

1 Introduccin
2 Conceptos bsicos
3 Frecuencia y probabilidad de un suceso
4 Distribuciones de probabilidades
5 Muestreo. El desvo estndar de la media o error estndar
6 Inferencia estadstica
7 Comparaciones entre dos medias muestrales. La distribucin t
8 Comparaciones entre proporciones
9 Correlacin y regresin
10 Anlisis de la varianza
11 Regresin mltiple
12 Regresin logstica
13 Mtodos no paramtricos
14 Pruebas diagnsticas
15 Anlisis de la sobrevida
16 Enfermedades en las poblaciones

1. Introduccin

La bioestadstica es el instrumento que permite manejar y obtener informacin de la


gran cantidad de datos producidos en las diversas reas de inters de la biologa. Esto est
de acuerdo con la idea corrientemente aceptada que relaciona la estadstica con el manejo de
grandes cantidades de nmeros a fin de obtener ciertas conclusiones de inters. Cabe agregar
que los nmeros representan siempre observaciones de hechos objetivos, medidos, contados
o clasificados de manera de poder ser elaborados y entendidos mediante los mtodos estadsticos. Entre estos mtodos se cuentan aqullos que operan sobre conjuntos relativamente
limitados de individuos o casos, con la intencin de extender las conclusiones a los grupos o
poblaciones originales de los cuales proceden las muestras. Otra tarea tpica de la bioestadstica es la comparacin de muestras tomadas de distintas poblaciones, en la bsqueda de posibles diferencias que revistan algn inters, sea terico o prctico. Todos esos procedimientos
son numricos y esta caracterstica es la que permite el desarrollo de la teora y los mtodos
de clculo de la estadstica.

La estadstica es utilizada tanto por el mdico prctico que evala un dato de laboratorio y conjetura sobre la posibilidad de tratarse o no de un dato desviado de la normalidad,
como por el que debe tratar con poblaciones hospitalarias, tasas de internacin, rendimiento
de distintos procedimientos y relaciones costo-beneficio, o por el que lleva a cabo tareas de
investigacin, pura o aplicada. As, la bioestadstica es necesaria en prcticamente todos los
campos de la medicina y la biologa. Sin embargo, como la estadstica est fundamentada en
desarrollos matemticos, la comprensin de sus procedimientos no siempre resulta una tarea
sencilla para el mdico, que debe sin embargo lograr una mnima familiarizacin con sus
nociones bsicas y sus modos de operar, no slo para su eventual aplicacin en trabajos de
investigacin sino tambin para la evaluacin crtica de toda la informacin a la que se halla
expuesto diariamente. As, deberan conocerse los conceptos bsicos en los que se fundamenta la bioestadstica, el significado de sus mtodos ms corrientes y las posibilidades de su aplicacin en la prctica. De esta manera se podrn elegir los mtodos de anlisis ms adecuados
a la naturaleza de los datos, obtener la mayor informacin posible de los mismos y tambin,
estar alerta sobre las situaciones en las que un mtodo puede dar resultados errneos. Es
frecuente que durante el anlisis de un trabajo el investigador se enfrente con problemas que
implican dificultades no solo en la interpretacin de los datos sino tambin en lo referente a
los mtodos estadsticos ms adecuados para fundamentar las conclusiones. Muchas veces
[ 183 ]

hay ms de un mtodo para tratar con un mismo problema. En estos casos, frecuentemente
ser necesario el trabajo en conjunto con el matemtico, y aqu los conocimientos de bioestadstica del investigador nuevamente sern necesarios para ayudar a orientar el enfoque
del anlisis hacia los aspectos mdicos o biolgicos de mayor importancia, sobre los que el
matemtico podr no estar demasiado informado.
En lo que sigue se procura exponer los aspectos bsicos de la bioestadstica vistos desde
la orilla del mdico, aunque se mencionan algunos aspectos ms generales y formales a fin de
fundamentar algunos de los requisitos y limitaciones de los mtodos y de hacer comprensible
la lgica subyacente en los mismos, tratando de evitar la impresin de arbitrariedad que suele
surgir de la lectura de los textos cuando los diversos mtodos son presentados como una coleccin de recetas. Como se ha dicho, la consulta al especialista en bioestadstica ser muchas
veces necesaria, pero el planteo de las preguntas y los lineamientos de un estudio conciernen
directamente al mdico, para no mencionar la interpretacin biolgica de los hechos observados, sobre lo que el estadgrafo tendr en general menores posibilidades de contribuir.

Los temas abarcados en el texto, como el lector podr suponer, son slo algunos de los
ms importantes de la bioestadstica y de ninguna manera se trata de una revisin exhaustiva
de los mismos, sino ms bien de una introduccin que haga comprensibles y aprovechables
los procedimientos ms frecuentemente utilizados en esa disciplina. Las referencias sugieren
lecturas complementarias que pueden ayudar a la comprensin de ciertos aspectos que excederan los lmites de estos elementos de bioestadstica. Los nmeros entre parntesis, si no
se indica prrafo (), se refieren siempre a ecuaciones u expresiones anlogas incluidas en el
texto.
Asimismo, a lo largo de las distintas secciones se encontrarn ejemplos que procuran
ilustrar algunos de los aspectos prcticos de los distintos mtodos y complementar los conceptos vertidos en el texto. Por lo tanto su lectura no debera omitirse, si bien algunos detalles
numricos y de clculo pueden leerse superficialmente, ya que lo fundamental son los conceptos que ilustran, y que refuerzan o completan el tema de fondo. En este respecto, tanto en el
texto como en los ejemplos, se han introducido algunas expresiones algebraicas o frmulas
sencillas, por su valor para describir los procedimientos bsicos del clculo estadstico y
ayudar a comprender las ideas en que se basan. Consecuentemente, al tratar de los aspectos
ms complejos de la bioestadstica, se ha evitado la reproduccin de frmulas y algoritmos de
clculo extensos que van ms all de los propsitos del texto.
Algunos ejemplos se basan en datos publicados, generalmente simplificados para mayor
sencillez, y en estos casos se cita la fuente original. En tanto, en su mayora han sido elaborados mediante simulacin numrica con programas de estadstica, y si bien se ha procurado
que versen sobre conocimientos mdicos ampliamente aceptados, su finalidad ha sido ilustrar
los procedimientos de la bioestadstica y en ningn caso introducir juicios de verdad o proponer conceptos de validez comprobada en el campo de la medicina.

[ 184 ]

2. Conceptos bsicos

2.1. Individuos, observaciones y datos. Poblaciones y muestras



La bioestadstica es una disciplina que comparte reas de inters con las matemticas y
la biologa. Sus mtodos no difieren de los de la estadstica general, sino ms bien, se adaptan a las necesidades particulares de las ciencias biolgicas incluyendo la medicina. Puede
esbozarse una definicin de sus objetivos sealando que se ocupa del manejo de los datos
numricos provenientes de observaciones obtenidas de los diversos objetos de estudio de la
biologa. Estos suelen ser conjuntos de individuos o de distintos materiales biolgicos que
son estudiados con la finalidad de obtener informacin acerca de los conjuntos mayores o
poblaciones de los cuales provienen. Es decir, la bioestadstica procura obtener informacin
sobre las caractersticas de grandes conjuntos de objetos, como pueden ser los pesos o las glucemias en distintas comunidades, a travs de los valores medidos en grupos representativos
de tales comunidades o poblaciones. Esas mediciones no solo permitirn inferir las caractersticas de los conjuntos mayores (que en general no es posible estudiar exhaustivamente en
cada uno de sus individuos), sino tambin comparar conjuntos entre s en lo que respecta a
las caractersticas estudiadas.

Ntese que las observaciones implican mediciones o recuentos y producen nmeros o
datos. Estos suelen presentarse como extensas colecciones de nmeros cuyo examen directo
suele ser dificultoso, cuando no agotador e improductivo. En tanto, su elaboracin mediante los distintos mtodos de la estadstica produce resultados ms fcilmente interpretables,
como promedios, desviaciones y probabilidades. Puede decirse que los grandes conjuntos numricos son traducidos a conceptos ms comprensibles, intuitivos y concisos. Un listado con
la presin arterial sistlica de 150 pacientes puede resultar muy poco informativo si se limita
a la simple lectura de una columna de 150 nmeros. La estadstica ofrece mtodos para hacer
concisa y manejable la informacin contenida en tales conjuntos de datos, y en el ejemplo, se
podra calcular el promedio de las cifras de presin arterial y tomar nota del valor ms bajo y
el ms alto del listado: el informe sera entonces algo as como la presin sistlica promedio
del grupo fue 121mm Hg, con un rango de 82 a 183. De la comparacin estadstica entre
dos grupos como el mencionado pueden surgir conclusiones como los individuos del grupo
B tienen una presin arterial sistlica promedio mayor que los del grupo A. El estudio de
la correlacin entre frecuencia cardaca y volumen sistlico en un grupo de individuos puede
sugerir que en general, cuanto mayor sea la frecuencia cardaca, menor ser el volumen
[ 185 ]

sistlico, y viceversa. Estas conclusiones pueden ser muy difciles de percibir por la mera
inspeccin de las tablas con las mediciones originales. Ms an, en el caso de dos grupos con
diferentes promedios de presin arterial y en el de la correlacin entre frecuencia cardaca y
volumen sistlico, es importante conocer el nivel de seguridad o confianza que se puede tener
de que los resultados observados traduzcan relaciones realmente existentes en las poblaciones
de las que provienen los datos y no se hayan originado en fluctuaciones debidas al azar, y
estos son problemas tpicos que la estadstica ayuda a contestar. A continuacin se exponen
algunos de los conceptos bsicos utilizados en bioestadstica.
El trmino individuo se suele emplear para referirse a seres humanos, animales y tambin
a los diversos objetos de inters de la biologa en cuanto constituyan unidades productoras
de datos. Estos son nmeros provenientes de observaciones realizadas en los individuos y se
refieren a propiedades de tales individuos, como pueden ser el pulso, la presin arterial o las
glucemias. En general, los datos se obtienen midiendo, contando, comparando o clasificando
el material observado, proceso que converge en la produccin de nmeros. Los nmeros constituyen el material apto para ser analizado mediante los distintos mtodos de la estadstica.
Pero la estadstica no maneja nmeros aislados sino conjuntos de nmeros, de los que extrae
la informacin til.
Como ha mencionado, uno de los objetivos fundamentales de la estadstica es llegar
a conocer las caractersticas de conjuntos ms o menos extensos de individuos a partir de
muestras formadas por algunos de ellos. Este es el punto de partida de los procedimientos de
inferencia estadstica, que se vern en 6.1 y siguientes. En estadstica, cualquier conjunto
de datos extrado de un entorno mayor es una muestra del conjunto mayor, llamado a su vez
poblacin universo. Con ms propiedad, se entiende por poblacin o universo la totalidad
de los resultados experimentales posibles. En tanto, el trmino resultados experimentales
designa, no slo conjuntos de mediciones, como por ejemplo, de la presin arterial o de la
glucemia, sino tambin los datos provenientes de cualquier coleccin de individuos o especmenes biolgicos donde se puedan realizar observaciones. De esta forma, la cantidad de crisis
anginosas o el grado de disnea referidos por los pacientes, son datos biolgicos pasibles de
ser medidos, contados, estimados en su intensidad o clasificados, esto es, transformados en
nmeros.
Por otra parte, es fundamental que la extensin del universo del que provienen los resultados experimentales est claramente definida, como por ejemplo, hombres de 50 a 75 aos
residentes en tal rea geogrfica. Al definir un universo como la totalidad de los resultados
posibles, se establece la exigencia de que todos sus integrantes estn enunciados y definidos.
Sin embargo, el acceso a todos los elementos de un universo es casi siempre difcil de conseguir en la prctica, y puede llegar a ser imposible cuando se definen condiciones que implican
cierto grado de incertidumbre, como pueden ser coronarios o hipertensos. Muchas veces
los universos son entidades con aspectos dinmicos que hacen imposible congelarlos para
proceder a su medicin, como los pacientes de una determinada enfermedad, que se renuevan
constantemente en la poblacin. Por estos motivos, habr que ser siempre cuidadoso al hacer
extensivos los resultados obtenidos de las muestras, a todo el universo.

Ntese que cada individuo de una muestra puede proporcionar uno ms datos (por
ejemplo, una ms tomas de la presin arterial). Cada dato es un elemento de la muestra, y
[ 186 ]

el nmero de datos es una caracterstica muy importante de la misma, que define el tamao
muestral. De modo que, en cuanto a su obtencin, una muestra proviene de un grupo de individuos y est constituida por un conjunto de datos proporcionados por dichos individuos.
Cada dato es un elemento del conjunto muestral.
Se dijo que las muestras estn formadas por datos numricos, y esto es as an en los
casos especiales en que es estudiada una cualidad, como sano enfermo, alto bajo, leve,
moderado o severo: para el trabajo estadstico tales cualidades son representadas por nmeros o codificadas (por ejemplo, sano = 1, enfermo = 2). Cada nmero es as un elemento de la
muestra, representando a un individuo. En ltima instancia, si bien el concepto de individuo
es til, en forma ms rigurosa es preferible considerar una muestra como un conjunto de datos numricos. Como se ha mencionado, un mismo individuo puede proporcionar ms de un
dato elemento muestral. Por ejemplo, puede haber ms de una cifra de presin arterial por
paciente. Esto motiva ciertos cuidados en los procedimientos estadsticos para que no haya
individuos sobre infra representados en el estudio, y para dar cuenta de la correlacin
que podr existir entre datos provenientes de un mismo sujeto. Una breve referencia a los
mtodos para la obtencin de muestras se encontrar en 5.1.
2.2. Variables muestrales

Los nmeros que integran las muestras, procedentes de observaciones y mediciones, varan segn los casos dentro de lmites que pueden ser ms menos amplios. Las clases o
categoras de objetos sobre las que se realizan las mediciones se conocen como variables:
son variables la presin arterial y la frecuencia cardaca, as como el sexo, la condicin de
fumador y la capacidad funcional. Las tres ltimas deben ser codificadas segn ya fuera
mencionado, adjudicndose distintos nmeros a los diferentes casos posibles. Estas variables
se conocen como cualitativas. En tanto, las originadas en mediciones o en recuentos, como
la presin arterial y la frecuencia cardaca, se denominan variables cuantitativas.

Dentro de las variables cualitativas son muy abundantes las que se refieren a caractersticas que pueden exhibir solamente dos estados. Estas variables, como el sexo, la sobrevida o
cualquier otra variable que pueda ser definida por un par de estados (como gnero femenino
o masculino, prueba positiva o negativa, tabaquismo presente o ausente), se llaman binarias
o dicotmicas.

Las variables cuantitativas suelen dividirse en discretas y continuas. En las primeras,
que suelen provenir de recuentos, los valores estn claramente separados sin posibilidades
intermedias, como la frecuencia del pulso o el nmero de glbulos rojos por milmetro cbico de sangre. En cambio, las variables continuas pueden asumir una gama ininterrumpida
de valores y suelen resultar de mediciones, como la presin arterial, el peso y la glucemia.
Sin embargo, en la prctica, la distincin entre variables discretas y continuas no siempre es
clara, dado que toda variable continua es redondeada al ser medida (por ejemplo, la presin
arterial suele redondearse a centmetros de mercurio, y an si se expresara en milmetros de
mercurio se estara efectuando un redondeo). Afortunadamente, las consecuencias no suelen
ser importantes en la prctica, ya que la mayora de los mtodos estadsticos diseados para
variables continuas pueden aplicarse sin prdidas de exactitud a variables discretas, con tal
de que exista una subdivisin suficientemente fina de la escala, como puede ser el caso del
[ 187 ]

pulso arterial en latidos por minuto o los glbulos rojos por milmetro cbico de sangre (que
en rigor son variables discretas).
2.3. Organizando y resumiendo los datos: Tablas y distribuciones de frecuencias.
Estadstica descriptiva

Los datos obtenidos de cualquier investigacin y destinados al anlisis, son en general
un conjunto de nmeros del cual no es sencillo obtener conclusiones tiles por inspeccin
directa, esto es, sin haberlos organizado y resumido. Una buena manera de iniciar un anlisis
estadstico es disponer los datos en una tabla y a continuacin tratar de representarlos como
figuras o grficos. De esta manera la informacin contenida en los datos se puede compactar o resumir de modo de hacerla interpretable y asignarle sentido en el contexto biolgico
en el que fue obtenida y en relacin con las posibles hiptesis de trabajo. Estas tareas forman
parte de la llamada estadstica descriptiva.

Las tablas son arreglos o presentaciones de los datos que organizan la informacin y son
un buen punto de partida para proseguir con el anlisis numrico. Ciertas tablas permiten
presentar los datos sin ningn tipo de elaboracin estadstica, como no sea su ordenamiento
de acuerdo a su fuente de origen y a las variables consideradas. Estas tablas estn formadas
por un conjunto de filas (horizontales) y columnas (verticales) que se cortan determinando
celdas en las que se disponen los datos originales sin ningn tipo de elaboracin previa. Es la
forma de presentacin corriente de las hojas de clculo y de las planillas de anlisis de los diversos programas estadsticos. Existe una construccin de uso muy frecuente en la que a cada
tipo de variable (presin arterial, glucemia) se le asigna una columna y a cada fuente de datos
(individuo, preparado de laboratorio, etc.) una fila. Si por ejemplo se mide la glucemia en
varios individuos, los valores hallados se colocan en las celdas correspondientes a la columna
Glucemia, en la interseccin con las filas correspondientes a cada individuo estudiado. Este
arreglo de los datos es particularmente til para trabajar con hojas de clculo y programas de
anlisis estadstico, que operan sobre la matriz de datos introducida en la tabla, realizando
gran variedad de clculos en forma eficiente y rpida.

La construccin de tablas y la elaboracin estadstica de los datos est en la actualidad
notablemente facilitada por los programas de computacin y no tiene mayor sentido considerar el trabajo artesanal con papel y lpiz a menos que se trate de grupos reducidos de
datos o con el objeto de analizar y comprender mejor ciertas tcnicas. De esta manera, la
estructura de las tablas arriba citadas est disponible en hojas de clculo del tipo Excel, debiendo solamente asignarse la identidad de filas y columnas y llenar las celdas con los datos
correspondientes. A su vez, la matriz de datos resultante es accesible a numerosos programas
estadsticos, incluyendo los recursos propios con que cuentan las hojas de clculo.

Otro tipo de tablas ya presentan un primer paso en el resumen de los datos, que consiste en
agrupar los valores de una variable en niveles o categoras consignando el nmero de veces que
la misma se presenta en cada nivel. En el caso de variables cualitativas con los datos agrupados
en pocas categoras, el conteo de casos cayendo dentro de cada categora y eventualmente, la
proporcin o porcentaje del total de casos dentro de cada una es en principio suficiente, como
puede observarse en la Tabla 2.1, donde un conjunto de 646 pacientes con estenosis valvular
artica son clasificados segn el origen de la enfermedad (Passik y col, 1987).
[ 188 ]

Tabla 2.1. Pacientes portadores de estenosis valvular artica clasificados segn la etiologa de
la enfermedad (Passik y col, 1987).
Tipo de alteracin valvular

Frecuencia (N de pacientes)

Porcentaje ( % )

Vlvula bicspide congnita

246

38

Calcificacin degenerativa (senil)

213

33

Postinflamatoria (fiebre reumtica)

155

24

Otras causas
Totales

32

646

100

En cambio, para variables continuas, los datos deben agruparse en intervalos como se
observa en la Tabla 2.2, donde la presin arterial sistlica de 150 individuos se agrup en
intervalos de 10 mm Hg, comenzando por el que va de 80 a 89 mm Hg. Cualquier valor de
presin dentro del intervalo se cuenta como un dato en el mismo, sin importar su valor exacto. Esto implica un resumen de los datos, ya que a todos los que caen en un intervalo de clase
se les adjudica un mismo valor (en general el valor central del intervalo). Hay un efecto de
redondeo de los datos que origina prdida de informacin y es el costo de haberlos resumido,
aunque con intervalos no demasiado grandes dicha prdida suele ser pequea. La variable
queda as condensada y una tabla que tendra 150 filas se convierte en una de 10, como puede
observarse en la Tabla 2.2. Se ve claramente como los datos se agrupan hacia el centro de la
distribucin y as se tiene una imagen rpida de la misma.

Tabla 2.2. Tabla de distribucin de frecuencias. Presin arterial sistlica en 150 individuos
extrados de una poblacin con media de 120 mm Hg y desvo estndar de 15 mm Hg.

Presin Arterial

Frecuencia
por intervalo
(N de pacientes)

Frecuencia relativa
(%)

Frecuencia
acumulativa
(N de pacientes)

Frecuencia acumulativa
(%)

80 - 89

1.3

1.3

90 - 99

11

7.3

13

8.7

100 - 109

20

13.3

33

22.0

110 - 119

40

26.7

73

48.7

120 - 129

33

22.0

106

70.7

130 - 139

29

19.3

135

90.0

140 - 149

12

8.0

147

98.0

150 - 159

0.7

148

98.7

160 - 169

0.7

149

99.3

170 - 179

0.7

150

100.0

TOTALES

150

100

[ 189 ]


Una tabla como sta se conoce como tabla de distribucin de frecuencias. Los intervalos se eligen en forma arbitraria y en general iguales. La frecuencia relativa con que aparece
la variable en cada intervalo respecto del nmero total de casos, puede ser aadida a la tabla
como una nueva columna y expresada como porcentajes. El concepto de distribucin de
frecuencias es fundamental porque da una idea de la distribucin de probabilidades para la
variable en cuestin, ya que la frecuencia con que se presentan los distintos valores de una variable est en relacin con sus probabilidades (estos conceptos se completan en las Secciones
3 y 4). Una instancia ms en este tipo de tablas incluye la llamada frecuencia acumulativa,
que consiste en la suma de las frecuencias en cada fila desde el extremo inferior de la distribucin (primera fila de la tabla) hasta cada uno de los niveles en que sta ha sido dividida
(Tabla 2.2, columnas 4 y 5 ).
Con el objeto de realizar clculos estadsticos y contndose con programas de computacin elementales, que no tienen dificultades para manejar grandes cantidades de
datos, la tabla sin resumir mencionada en primer trmino es la de eleccin, ya que las
tablas de distribucin de frecuencias sacrifican una parte de la informacin contenida en
los datos al resumirlos en una cierta cantidad de niveles sin tomar en cuenta sus valores
exactos.

Otras tablas, muy frecuentes en la presentacin final de los resultados, ahorran la exposicin de toda la distribucin de frecuencias de las variables y la reemplazan por sus indicadores de posicin y dispersin, como la media y el desvo estndar o el rango, que como se ver
ms adelante, dan una rpida visin de la magnitud y forma de distribucin de la variable.
De esta manera la informacin es comprimida sin prdida de lo esencial y una sola tabla
puede albergar mltiples variables distintas, reducidas a sus medias y desvos estndar. Estas
tablas, como el lector habr notado, son muy utilizadas para la presentacin de los resultados
en los trabajos de investigacin.
2.4. Resumiendo los datos en forma visual: Grficos
Por su parte, los grficos brindan una apreciacin global de la informacin organizada
en las tablas. La impresin visual proporcionada por tales presentaciones informa de un golpe de vista sobre muchas propiedades de las muestras que pueden no ser en absoluto evidentes
a travs del examen directo de las tablas.

Los grficos son figuras donde se representan convencionalmente los datos numricos.
Algunos de ellos son el histograma, el polgono de frecuencias, el llamado box-and-whisker
(cuadro y lnea) y los diagramas de dispersin, pero hay muchos otros y pueden ser diseados
de acuerdo a las necesidades que planteen los datos a representar. Frecuentemente se construyen
sobre un sistema de dos ejes perpendiculares que se intersecan en el origen de las series de valores representados. El eje horizontal (eje de abscisas o de las x) se suele simbolizar con la letra X
y el vertical (eje de ordenadas o de las y) con la Y. En los ejes se hallan representadas las escalas
y las variables que permiten identificar y atribuir sus correspondientes valores a los elementos
del grfico. Un principio general establece que debe existir una relacin clara y bien definida,
en general aunque no siempre de proporcionalidad directa, entre las magnitudes reales de
los distintos datos y las de las figuras que los representan en los grficos. El no cumplimiento
de este requisito puede llevar a una interpretacin distorsionada de los datos.
[ 190 ]

Algunos grficos elementales destinados a representar las distintas clases de objetos en


que se subdivide un conjunto y sus proporciones respecto del total del conjunto, como pueden
ser las distintas etiologas de una determinada enfermedad, consisten en reas geomtricas,
frecuentemente crculos, divididas en sectores proporcionales al nmero de casos en cada
clase. El total de clases corresponde al rea total del crculo o 100%. Un ejemplo, correspondiente a la Tabla 2.1, se presenta en la Figura 2.1. Ntese como la impresin producida por
el pastel y sus porciones, da una idea mucho ms rpida y efectiva de la prevalencia de las
distintas etiologas de la estenosis artica que la sola lectura de la tabla.

Figura 2.1. Etiologa de la estenosis valvular artica en un grupo de 646 pacientes de ambos
sexos (Passik y col, 1987).


En lo que sigue, dentro de otros tipos de grficos ms elaborados, slo se mencionarn
algunos de los ms frecuentes.
2.4.1. Histograma y polgono de frecuencias
El histograma es un grfico de barras apropiado para la representacin de distribuciones
de frecuencia, indicadas en la escala vertical como nmero de casos o porcentajes, mientras
que cada rectngulo o barra representa una de las clases en que se dividen los datos. En la
Figura 2.2 aparece el histograma correspondiente a la distribucin de la Tabla 2.2. Siendo los
intervalos de clase de la misma magnitud, los rectngulos tendrn igual base y por lo tanto
sus reas sern proporcionales a las frecuencias representadas en el eje vertical. Por razones
tericas, lo esencial para la correcta representacin de distribuciones de frecuencias, es que
las reas del histograma sean proporcionales a stas.
Si se unen mediante segmentos los puntos medios del techo de cada rectngulo, se obtiene
una lnea quebrada llamada polgono de frecuencias. Cuando los intervalos de clase aumentan en forma indefinida, el polgono tiende a una curva continua (lo mismo ocurrir con el
[ 191 ]

borde superior del correspondiente histograma, ver Fig. 4.2 ). Estas curvas de frecuencias
son importantes en teora estadstica y se relacionan con las curvas de distribucin de probabilidades (ver Seccin 4). En la Fig. 2.2 se ha superpuesto al histograma la curva normal de
distribucin de probabilidades (ver 4.7).

Figura 2.2. Histograma de frecuencias correspondiente a los 150 individuos con presin
arterial sistlica media de 120 mm Hg y desvo estndar 15 mm Hg de Tabla 2.2. Se ha superpuesto la funcin de distribucin normal terica correspondiente a los datos.

2.4.2. Grficos Box and whisker


Estos grficos muestran un rectngulo o caja que se extiende desde el cuartil inferior al
superior, esto es, abarcando los dos cuartiles centrales con el 50% de los datos (ver 2.5.3).
De los lados inferior y superior de la caja salen dos lneas que llegan hasta los niveles de la
escala correspondientes a los valores mnimo y mximo de todos los datos, denotando el
rango de los mismos. Segn otra convencin las verticales no sern mayores que 1 y vez
la dimensin de la caja, y los datos ms extremos se indicarn con asteriscos, como posibles
datos ajenos a la distribucin (outliers). Suele agregarse una lnea horizontal que divide la
caja en dos a la altura de la mediana, con lo cual este tipo de grfico ofrece medidas de
posicin y de dispersin del conjunto de datos a representar (vase 2.5). En la Figura 2.3
se muestra esta clase de grfico para los datos de la Tabla 2.2 y para otro grupo de 150
individuos extrados de una poblacin con un promedio de presin arterial sistlica ms
alto. La comparacin entre ambas distribuciones de datos surge con bastante claridad de la
estructura de las grficas.

[ 192 ]

Figura 2.3. Diagrama de tipo box and whisker para dos grupos de individuos con presin
arterial sistlica media de 120 y 160 mm Hg respectivamente. Los asteriscos corresponden a
datos alejados del centro de la distribucin.

2.4.3. Grficos o diagramas de dispersin (scatterplots)


Cuando un mismo individuo (o cualquier fuente de datos) origina pares de medidas correspondientes a dos atributos diferentes (por ejemplo peso y talla), cada par de datos puede
representarse como un punto en un diagrama de ejes perpendiculares, donde los valores de
una de las variables (por ejemplo, la talla) se dan en la escala horizontal y los de la otra (el
peso) en la escala vertical (vase Seccin 9, Fig. 9.1).
2.4.4. Una precaucin til: verificar las escalas en los distintos ejes

En general, aunque no siempre, la proporcionalidad entre los datos representados y las
dimensiones de los correspondientes elementos grficos es un requisito para que la informacin proporcionada sea ntegramente aprovechable y an ms, para que no se produzcan interpretaciones distorsionadas de los resultados ilustrados por las figuras. Una forma comn de
afectar la interpretacin de una grfica produciendo un efecto visual que no se corresponde con
la totalidad de los datos y pasa fcilmente inadvertida, es causada por la interrupcin de las escalas mediante cortes en los ejes, habitualmente el eje vertical o de ordenadas. De esta manera,
cambios circunscritos a un pequeo sector de la escala, aparecen desplegados en toda la extensin del grfico y parecen ms grandes de lo que son. En la Figura 2.4 se observan las curvas
de sobrevida libre de eventos cardiovasculares de dos grupos, A y B, de 180 individuos cada
uno, que presentaron una tasa anual de eventos del 2.2% y 6.6% respectivamente. Los dos
grficos son equivalentes, pero el de la derecha produce la impresin de una diferencia mucho
[ 193 ]

ms marcada en la evolucin de cada grupo, lo que se debe a que la porcin del eje de ordenadas
entre el 0 y el 75% de la escala ha sido cortada. A pesar de todo, este procedimiento puede
ser til para evitar largos intervalos libres de datos, precisamente cuando stos oscilan dentro
de regiones muy pequeas de la escala.

Figura 2.4. Dos presentaciones de la sobrevida libre de eventos en dos grupos de individuos, A y
B. En el grfico de la derecha, la escala del eje de ordenadas ha sido omitida entre 0 y 75%.

2.5. Un resumen ms compacto de los datos: medidas posicin y medidas de dispersin


Es posible ir un paso ms all en la elaboracin de los datos considerando que muchas
veces se agrupan o distribuyen alrededor de un valor central ms frecuente (aunque no siempre), y que su frecuencia de presentacin tiende a disminuir al alejarse del centro, a partir del
cual se dispersan. Esto proporciona la oportunidad de elaborar estimadores de la posicin
central y estimadores de la dispersin de una variable, con lo cual un nmero estima el centro
de la distribucin de los datos y uno o dos nmeros ms describen el modo de dispersarse
alrededor del centro. Estos estimadores son nmeros que se obtienen a partir de los datos de
las muestras, y suelen denominarse estadsticos.
2.5.1. Medidas de posicin. Media, mediana y modo

La medida de posicin ms corriente es la media aritmtica o simplemente media o promedio, que es la sumatoria de todos los datos dividida por su nmero. Expresando cada dato
como x o, ms formalmente, como xi, donde el subndice i significa uno cualquiera de los x
datos (el dato i-simo ) la media se denota como x y se tiene que:
x = (x1 + x 2 + + x i + + x n ) / n
o, expresando la suma mediante el smbolo :
x = x i / n
donde n es el nmero de datos.
[ 194 ]

(2.1)


La media tiene importantes funciones en una gran cantidad de tcnicas estadsticas y es
el estimador de posicin central ms ampliamente utilizado.

Otra medida de posicin es la mediana, que se define como el valor del dato que se halla
en la mitad de la serie cuando los datos son ordenados en forma ascendente o descendente.
Si el nmero de datos es par, habr dos observaciones centrales y se acepta como mediana el
promedio de stas.

Una ventaja de la mediana sobre la media es no estar influida por los valores extremos de
los datos, inconveniente que s presenta la media. En la serie:
1, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 6, 7, 7, 8, 8, 70
la mediana es 5, ms en el centro y de acuerdo a las magnitudes de la mayora de los datos,
mientras que la media es igual a 7.9, muy a la derecha de la distribucin por estar muy influida por el valor extremo 70. A pesar de todo, el papel de la media en la teora estadstica
es mucho ms importante que el de la mediana, precisamente por tomar en cuenta las magnitudes de todos los datos. El problema de los datos extremos y su influencia excesiva sobre
la media aritmtica puede requerir tratamiento especial en ciertos casos, pues si bien podrn
provenir de la poblacin estudiada, tambin podr tratarse de elementos extraos a la misma
incluidos por error, de errores en la medicin o an de errores de copia.

El modo es el valor del dato que se presenta con mayor frecuencia dentro de un conjunto de observaciones, esto es, el valor de la observacin xi que se repite ms veces en
la tabla de distribucin de frecuencias. Pueden presentarse varios modos en un grupo de
datos, y aparte de cierto inters descriptivo, es poco usado en estadstica como indicador
de posicin.
2.5.2. Medidas de dispersin. Varianza y desvo estndar

Como ya se sealara, la forma en que una serie de datos se dispersa alrededor de sus valores centrales se puede apreciar a travs de las tablas y grficos de distribucin de frecuencias.
Sin embargo, es deseable obtener estimadores de la dispersin que a partir de la informacin
de los datos resuman en pocos nmeros las propiedades de aqulla. La media aritmtica
puede usarse como punto central de referencia para medir las desviaciones de los datos individuales de una serie.

Con el objeto de evaluar la dispersin de los datos, se puede restar a cada dato la media.
Las diferencias as obtenidas tendrn signo positivo o negativo segn el respectivo dato sea
mayor o menor que la media. Si estas diferencias se suman con el objeto de promediarlas
y obtener un estimador de la dispersin de los datos, se ver que la suma es cero, con lo
cual el mtodo es inaplicable. La sencilla opcin de tomar todas las desviaciones con su
valor absoluto, es decir como positivas, sumarlas y dividirlas por el nmero de los datos,
proporciona un promedio conocido como desviacin media, que si bien es un estimador
de la dispersin, resulta de escasa utilidad dentro del clculo estadstico, por lo cual no es
habitualmente utilizado.

En cambio, el recurso de elevar al cuadrado cada diferencia entre dato y media, adems
de eliminar el problema de los signos (todos los cuadrados son positivos), da origen a esti[ 195 ]

madores de la dispersin muy importantes en la teora estadstica. El primero de ellos es la


varianza, que es el promedio de tales desviaciones elevadas al cuadrado:

donde el numerador se conoce como suma de cuadrados alrededor de la media y n es el


nmero de datos.
Como en el clculo de la varianza las diferencias entre los datos y la media han sido elevadas al cuadrado, para volver a las dimensiones originales deber extraerse la raz cuadrada
de la varianza, que se conoce como desvo estndar:


La varianza y el desvo estndar son estimadores eficaces de la dispersin de los datos
alrededor de la media, y de los dos, el desvo estndar tiene las mismas dimensiones que los
datos originales y es el que permite obtener una idea ms clara e inmediata del grado de dispersin de stos.
Por razones tericas, cuando se utilizan la varianza y el desvo estndar para estimar sus
valores en el universo del que se han extrado los datos, debe emplearse el divisor (n 1) en
lugar de n, restando 1 al total de los datos empleados para calcularlos. En efecto, la varianza
y el desvo estndar obtenidos de las muestras presentan siempre valores ligeramente menores que los que tienen en sus respectivos universos, y esta desviacin sistemtica, conocida
como sesgo (bias), se corrige disminuyendo el denominador de (2.2) y (2.3) en una unidad.
Se demuestra que la varianza y el desvo estndar muestrales calculados con divisor ( n 1 )
resultan estimadores sin sesgo o insesgados, de los valores (muchas veces desconocidos)
que tienen en la poblacin. Estos estadsticos muestrales insesgados suelen designarse como
s (varianza muestral) y s (desvo estndar muestral, que es la raz cuadrada de s):

[ 196 ]

Ejemplo 2.1
El objeto del ejemplo es mostrar el clculo de la media y el desvo estndar muestrales a
fin de familiarizarse con la forma de manejar los datos en los procedimientos estadsticos. Este
tipo de clculo se realiza actualmente mediante programas de computacin que slo requieren
la introduccin de los datos originales sin procesar, por lo que el trabajo con calculadoras de
escritorio ya es obsoleto, pero seguir el desarrollo del clculo a travs del ejemplo ayuda a comprender la estructura de esos estadsticos muestrales. Considrese un conjunto de 10 individuos
para los que el laboratorio dio las cifras de HDL colesterol (en mg/dl) que forman la segunda
columna de la tabla. En la ltima fila se hallan las sumatorias o totales de columna.

Paciente N

HDL ( = x )

xx

( x x )

81

35

1225

37

-9

81

35

- 11

121

64

18

324

46

37

-9

81

45

-1

43

-3

21

- 25

625

10

51

25

TOTALES

460

2492

Clculo de la media muestral: x = x / n = 460 / 10 = 46.0


Clculo de la varianza muestral: s = ( x x ) / ( n 1) = 2492 / 9 = 276.9
Clculo del desvo estndar muestral: s = s = 276.9 = 16.6

Ntese como la suma de las desviaciones de los datos con respecto a la media es igual a
0, por lo que no se puede utilizar en las medidas de dispersin. En tanto, los cuadrados de las
desviaciones son siempre positivos y no se cancelan, permitiendo el clculo de la varianza. La
varianza, si bien es un indicador til de la dispersin de los datos, no resulta inmediatamente
interpretable por estar las desviaciones elevadas al cuadrado. Esto se subsana en el desvo
estndar mediante la extraccin de la raz cuadrada. Su valor tiene las unidades originales y
resulta rpida e intuitivamente interpretable: se ver ms adelante que en las llamadas distribuciones normales, un 95% de los datos suele encontrarse entre la media y dos desvos estndar, en este caso entre 46.0 ms/menos 2 16.6 o sea, entre 79.2 y 12.8 mg/dl. Comprubese
que en la tabla slo hay un dato fuera de estos lmites

[ 197 ]

2.5.3. Medidas de dispersin. Rango. Cuartiles y percentiles


El rango es la diferencia entre el mayor y el menor de los datos de un conjunto. Por
ejemplo, en los datos de presin arterial de la Tabla 2.2, el mayor registro fue de 173 mm Hg
(incluido en la ltima fila) y el menor 82 mm Hg (incluido en la primera fila), de lo cual resulta
que el rango es igual a 173 menos 82 o sea 91 mm Hg. Entre sus numerosos puntos dbiles,
el rango no informa como se distribuyen los datos en su interior y, con algunas excepciones,
es muy poco usado corrientemente.

Los cuartiles y percentiles son en cambio ms informativos. Con los datos ordenados
de menor a mayor, el cuartil inferior es el valor por debajo del cual queda la cuarta parte
de los datos y el cuartil superior es el valor por encima del cual queda otra cuarta parte de
los datos. Entre ambos cuartiles se extiende la distancia o rango intercuartil, que como se
comprende encierra la mitad restante de los datos, esto es, los datos no incluidos en los cuartiles extremos. En general, la divisin del rango total de los datos en intervalos que abarcan
determinados porcentajes de los mismos, genera percentiles. Los cuartiles y percentiles son
tiles con finalidades descriptivas y en este sentido son muy utilizados.

[ 198 ]

3. Frecuencia y probabilidad de un suceso

3.1. Conceptos generales sobre probabilidad


En la vida diaria es un hecho habitual el manejar ideas acerca de las probabilidades que
tienen de ocurrir los ms variados acontecimientos, y la manera de estimarlas no est estrictamente definida, siendo muchas veces decisiva la experiencia personal. En el campo de las
ciencias, en cambio, el concepto de probabilidad est sujeto a consideraciones ms rigurosas,
aunque afortunadamente existe un modo de entenderla que adems de ser suficiente para
una gran mayora de aplicaciones, est de acuerdo con el concepto corriente e intuitivo de la
misma: la probabilidad de un suceso est dada por la frecuencia con la que dicho suceso
ocurre. Cuando un suceso ocurre muy a menudo, aceptamos que tiene una probabilidad alta
de volver a presentarse (a menos que la misma vare). La frecuencia de ocurrencia del suceso
se expresa por el cociente o razn entre el nmero de veces en que se observa su aparicin y el
nmero total de observaciones realizadas. Por ejemplo, un informe del estudio Framingham
(Levy D et al, 1990) seala que entre 4684 individuos de ambos sexos con estudios ecocardiogrficos adecuados, se hallaron 755 con hipertrofia ventricular izquierda. La razn entre
los 755 casos con hipertrofia ventricular izquierda y el total de 4684 individuos examinados
es igual a 0.161 y es una estimacin de la probabilidad de que un sujeto elegido al azar de
la poblacin estudiada, presente esa condicin. Una forma habitual de informarla es como
porcentaje, multiplicando su valor original por 100, lo que en este caso resulta igual a 16.1%.
En general, el procedimiento para estimar la probabilidad de un suceso consiste en tomar
muestras al azar de la poblacin y dividir la cantidad de casos que presentan el fenmeno en
estudio por el total de individuos examinados. Como se comprender, los resultados podrn
variar cada vez que se repita el experimento, pero el hecho es que tendern a oscilar alrededor de un valor central. Por este motivo, se habla de estimaciones de la probabilidad y no
de su valor real, que es desconocido en tanto no se tengan los datos de todos los individuos
que forman el universo. Sin embargo, es posible aproximarse cada vez ms a ese valor ideal,
promediando los resultados de varios experimentos repetidos o agrandando la muestra de
estudio: un elemento esencial del concepto de probabilidad consiste en que, si se agranda
indefinidamente la muestra, la razn entre sucesos y total de casos observados se estabiliza
y tiende a un lmite: se lmite es la probabilidad del suceso en cuestin.
Algo diferente ocurre con los resultados posibles en tiradas de dados: parece obvio que las
probabilidades de obtener un as son iguales a 1 en 6, esto es 1/6 = 0.166 o 16.6%, y que lo mis[ 199 ]

mo ocurrir para cualquiera de las otras cinco caras. En este caso, y siempre que nos conste que
el dado es normal, no consideraramos necesario hacer una prueba experimental para determinar las probabilidades de cada una de las caras. Sin embargo, en la prctica, para obtener una
aproximacin a 0.166 suficientemente exacta, se debera realizar una gran cantidad de tiradas,
pues de hacerlo unas pocas veces, las desviaciones por azar podran ser importantes y el resultado estar muy lejos del deducido en forma terica. Este hecho exige que los universos donde se
estiman probabilidades permitan muestreos suficientemente grandes (ntese que en el caso de
un dado o una moneda, el tamao del universo no est dado por el nmero de caras sino por el
hecho de que las tiradas posibles son infinitas). Las probabilidades definidas por modelos como
los de la tirada de monedas o dados, se conocen como clsicas o a priori, en contraste con las
derivadas de frecuencias, denominadas frecuenciales o a posteriori. A pesar de su apariencia
slida, la probabilidad clsica o a priori no carece de dificultades tericas y esto, unido a las
limitaciones para su aplicacin a los problemas surgidos de situaciones reales, que en la gran
mayora de los casos deben abordarse a partir de muestras de universos slo parcialmente conocidos, hace que el modelo frecuencial o a posteriori sea de uso habitual y corriente.

3.2. La probabilidad de un suceso puede variar entre 0 y 1
Para cualquier experimento, el nmero de ocurrencias o apariciones de un suceso (n) no
puede ser mayor que el nmero total de casos evaluados (N), ni menor que cero. Como la
probabilidad se estima mediante la razn n / N, cuando n = N la probabilidad es 1, y cuando
n = 0, la probabilidad es 0. Cuando la probabilidad es 1, el hecho estudiado ocurre en todos
los casos y se tiene la certeza de que ocurrir siempre: es la probabilidad del suceso seguro.
Cuando la probabilidad es 0 tambin se tiene certeza, pero de que no ocurrir. Un suceso con
probabilidad 0 se dice que es un suceso imposible. La probabilidad de un suceso A se denota
habitualmente como P(A) o p(A), por lo cual la probabilidad antes mencionada de hallar individuos con hipertrofia ventricular izquierda (HVI) se expresar P(HVI) = 0.161. Es comn
expresar probabilidades con respecto a un valor de corte, y si quisiramos redondear datos
podramos decir que P es menor que 0.17 y expresarlo como P(HVI) < 0.17. Si se sobreentiende a qu variable nos estamos refiriendo, se puede ahorrar el parntesis y escribir P < 0.17.
3.3. Operaciones bsicas con probabilidades
Es importante tener en cuenta que la probabilidad de que ocurra un determinado acontecimiento (en general denominado suceso), sumada a la probabilidad de que no ocurra, debe
valer 1, ya que no hay otra forma en que las cosas puedan suceder. Si la probabilidad de que
ocurra un suceso A es igual a 0.30, la probabilidad de que no ocurra deber ser igual a 1
0.30 = 0.70. En smbolos: P(A) + P(no A) = 1.

Los sucesos (A) y (no A) se denominan complementarios. Conocida la probabilidad de
un suceso (A), la de su complementario ser: P(no A) = 1 P(A).
Es posible realizar clculos con las probabilidades para obtener nuevos conocimientos a
partir de sus relaciones lgicas, y si bien las operaciones ms sencillas con probabilidades no
son excesivamente complicadas, ciertos aspectos concernientes a su suma y multiplicacin
deben conocerse pues tienen significados importantes, tanto en lo terico como en lo prctico. En los prrafos siguientes se hace un resumen de los mismos.
[ 200 ]

3.3.1. Suma: la probabilidad de A o B


En algunas situaciones, la probabilidad de que ocurra un determinado suceso de entre
un grupo de dos o ms posibles, es igual a la suma de las probabilidades para cada suceso
considerado aisladamente. Por ejemplo, obtener con un dado un as o un cuatro en una sola tirada (cualquiera de ambos) es igual a la probabilidad de obtener un as (1/6) ms la de obtener
un cuatro (tambin 1/6) esto es, 1/6+1/6 = 2/6 = 1/3 o 0.33. Con esta probabilidad, se puede
esperar que en una de cada tres tiradas el dado presente un as o un cuatro. Esta sencilla regla
funciona solamente si los sucesos no pueden ocurrir a la vez (no es posible obtener un as y
un cuatro con un solo dado en una sola tirada).
Considrese en cambio una poblacin en la cual la probabilidad de sufrir sobrepeso u
obesidad sea del 64% y la de sufrir algn tipo de dislipemia, del 40%. Si ahora nos preguntamos cul es la probabilidad de que uno cualquiera de los individuos que la integran presente
sobrepeso o dislipemia, la respuesta ya no puede obtenerse sumando las probabilidades individuales del sobrepeso y la dislipemia, y esto es as porque algunos individuos pueden presentar las dos condiciones a la vez. Si esto no se toma en cuenta y se suman directamente la probabilidad de sobrepeso y la de dislipemia, se obtiene 0.64 + 0.40 = 1.04, un valor mayor que 1
y que por lo tanto no puede corresponder a una probabilidad. Esta cifra imposible se origina
en el hecho de que algunos individuos presentan sobrepeso y dislipemia al mismo tiempo, y
para ellos, sus probabilidades de pertenecer al conjunto suma han sido tomadas dos veces,
una como portadores de sobrepeso u obesidad y la otra como dislipmicos. En este caso, la
probabilidad correcta est dada por la suma de la probabilidad de tener sobrepeso ms la de
ser dislipmico, menos la probabilidad de presentar ambas condiciones a la vez (sobrepeso y
dislipemia). Esta es la regla para la suma de probabilidades y se puede escribir:
P(sobrepeso o dislipemia o ambas) = P(sobrepeso) + P(dislipemia) P(sobrepeso y dislipemia)
En forma general:
P(A o B o [A y B]) = P(A) + P (B) P (A y B)

(3.1)

Por lo tanto, para resolver la suma planteada en el ejemplo, falta conocer la probabilidad que tiene un individuo de presentar sobrepeso y dislipemia a la vez. Si suponemos como
ejercicio, que un 32% o 0.32 del total de la poblacin presentar conjuntamente sobrepeso y
dislipemia, la probabilidad buscada quedara estimada segn la ecuacin anterior, en 0.64 +
0.40 0.32 = 0.72 o 72%, que es un valor plausible para una probabilidad y es una estimacin de la probabilidad de elegir un individuo al azar y encontrar que presenta sobrepeso, o
dislipemia, o ambas condiciones a la vez.
Si A y B no pueden ocurrir juntos, P(A y B) = 0 y la frmula (3.1) queda reducida a:

P(A o B o [A y B]) = P(A) + P (B)
(3.2)
que fuera empleada en el ejemplo de la tirada de dados.
[ 201 ]


La regla para la suma de probabilidades se comprende mejor formalizando el tema y
mediante el uso de diagramas para representarlas. El conjunto de todos los sucesos posibles
en una situacin o experimento se llama espacio muestral del experimento. Por ejemplo, en
la tirada de un dado el espacio muestral es el conjunto [ 1, 2, 3, 4, 5, 6 ], y en la poblacin
considerada en el ejemplo anterior, cada uno de los individuos que la integran. Estos podrn
exhibir sobrepeso aislado, dislipemia aislada, sobrepeso y dislipemia, o bien no presentar
ninguna de las dos patologas, y cada individuo se considera un punto del espacio muestral.
Tambin se acepta que cada individuo o punto tiene las mismas probabilidades que los dems
de ser elegido u ocurrir, pasando a ser un suceso. Los espacios muestrales se pueden representar por reas dentro de una lnea cerrada que las delimita. Dichas figuras son conocidas
como diagramas de Venn y como se ver, son muy tiles para visualizar las relaciones lgicas
entre conjuntos en general y entre probabilidades en particular. Estas reas o figuras se utilizan para representar conjuntos de puntos muestrales de un experimento es decir, resultados
posibles del mismo. Los conjuntos de puntos de los espacios muestrales pueden contener subconjuntos formados por algunos de ellos, que a su vez pueden graficarse como otros tantos
diagramas de Venn contenidos en el conjunto principal. As, como se puede ver en la Figura
3.1, el conjunto de la poblacin a la que se refieren los datos del ejemplo, es el espacio muestral, y est representado por el rectngulo exterior, que a su vez contiene el subconjunto de
los individuos que presentan sobrepeso u obesidad ( S ) y el de los que son dislipmicos ( D ).
Algunos individuos presentan a la vez sobrepeso y dislipemia y forman el conjunto interseccin, que se simboliza (S D). Por ltimo, el conjunto de todos los individuos con sobrepeso,
o dislipemia, o sobrepeso y dislipemia, se denomina conjunto unin de S y D, y se simboliza
(S U D) (Fig. 3.1). Los puntos que quedan fuera del conjunto unin, son los que completan
el espacio muestral y como se deducir, est integrado por los individuos que no presentan
sobrepeso ni dislipemia. Debe entenderse que estos conjuntos representan a la vez las clases
de individuos, y sus respectivas probabilidades.

La suma de probabilidades, que se expresa como S, o bien D, o bien ambos calcula
las probabilidades del conjunto unin (S U D). De la inspeccin de la Fig. 3.1 surge que para
hallar la probabilidad de un suceso de ese conjunto, se debern sumar las probabilidades de S
y las de D, pero al hacer esto se tomarn dos veces las probabilidades del suceso interseccin
(S D) que resulta de la superposicin de S y D (grisado oscuro en la Figura). Por lo tanto hay
que proceder a restarlas de la suma S + D, lo que da lugar directamente a la frmula 3.1.

[ 202 ]

Figura 3.1. El rectngulo claro exterior representa el espacio muestral formado por los individuos de la poblacin general. Los conjuntos D (dislipemia) y S (sobrepeso) presentan un
rea comn (ms oscura) de interseccin (S D). En tanto, el conjunto unin (S U D, sigla no
incluida en la figura) corresponde a toda el rea grisada, y expresa solamente S + solamente
D + (S y D a la vez), lo que es igual a P(S) + P(D) P(S D).

3.3.2. Multiplicacin. Probabilidad de A y B. La probabilidad condicional. Sucesos


dependientes e independientes
Establecer la probabilidad de la aparicin simultnea o conjunta de sucesos diferentes,
requiere evaluar la probabilidad de cualquiera de los dos sucesos y multiplicarla por la probabilidad de que una vez que ha ocurrido, ocurra el restante. Dicha probabilidad corresponde
a la del conjunto interseccin S D de la Figura 3.1. Volviendo al ejemplo anterior, la probabilidad de que un individuo cualquiera de la poblacin general presente a la vez sobrepeso
y dislipemia, est dada por la probabilidad de que presente sobrepeso, multiplicada por la
probabilidad de que un individuo con sobrepeso presente dislipemia. Este ltimo tipo de
probabilidad requiere un comentario aparte por su importancia no slo en el clculo sino
tambin en la lgica de las probabilidades.

La probabilidad de un suceso (dislipemia) dada la presencia de otro suceso (sobrepeso)
se llama probabilidad condicional y se expresa P(dislipemia | sobrepeso) o en forma ms
general, P(A | B), que se lee probabilidad de A, dado B. De modo que, la probabilidad de la
presencia simultnea en un individuo, de dislipemia y sobrepeso, segn se enunci ms arriba, se podr calcular como:

P(sobrepeso y dislipemia) = P(sobrepeso) P(dislipemia | sobrepeso)

y en forma general:
P (A y B) = P (A) (B | A)

(3.3)

que es la expresin general de la multiplicacin de probabilidades y se refiere, como qued


expresado, a dos sucesos ocurriendo simultneamente.
[ 203 ]


Volviendo al ejemplo anterior, para conocer la probabilidad de la presencia simultnea de
sobrepeso y dislipemia en cualquier individuo de la poblacin, deber conocerse la probabilidad condicional de una de esas patologas con respecto a la otra, por ejemplo, la probabilidad
condicional de dislipemia en un individuo que presenta sobrepeso (dislipemia, dado sobrepeso). Si aceptamos para proseguir el ejemplo, que esta probabilidad condicional sea igual al
50% o 0.50, se tendr, reemplazando P(A) por P(sobrepeso) = 0.64 y P(B | A) por P(dislipemia
| sobrepeso) = 0.50, que la probabilidad de elegir un individuo al azar en la poblacin general y
que ste padezca simultneamente sobrepeso y dislipemia, resulta igual a 0.64 0.50 = 0.32 o
32%. Alrededor de un tercio de los individuos presentar las dos condiciones a la vez.
Cabe agregar que el mismo resultado debera esperarse si se empleara la probabilidad
de ser dislipmico y se multiplicara por la probabilidad condicional de presentar sobrepeso
siendo dislipmico, P(sobrepeso | dislipemia).

Debe notarse que en el ejemplo que se viene considerando, la probabilidad de dislipemia
en un sujeto con sobrepeso, P(dislipemia | sobrepeso), no es la misma que para un individuo
de la poblacin general en el que no se exija la condicin de sobrepeso. En cambio, en el caso
hipottico en que la probabilidad condicional P(dislipemia | sobrepeso) fuera la misma que
la probabilidad de dislipemia para la poblacin general, habra que aceptar que la presencia
de sobrepeso no afecta la probabilidad de dislipemia en la poblacin y podra escribirse
P(dislipemia / sobrepeso) = P(dislipemia). En general, cuando la presencia de una variable A
no afecta las probabilidades de otra variable B, puede escribirse
P (B | A) = P (B)

(3.4)

Se dice entonces que A y B son sucesos independientes y en estas circunstancias, (3.3)


queda reducida a:
P (A y B) = P (A) P (B)

(3.5)


que es la frmula para la multiplicacin de probabilidades independientes.

Las tiradas de monedas son ejemplos tpicos en que los resultados en distintas tiradas
o con distintas monedas tienen probabilidades independientes, ya que no dependen de los
resultados obtenidos en tiradas anteriores o con las dems monedas. As, la probabilidad de
obtener dos caras con dos monedas a y b, es igual al producto de la probabilidad de obtener
cara con cada moneda, ya que el resultado con la moneda b no depender de lo ocurrido con
la moneda a, y se podr escribir P(cara con moneda b) = P(cara con moneda b | cara con
moneda a). Como la probabilidad de cara es igual a con cada moneda, la probabilidad de
dos caras ser igual a .
Como se ha visto, la multiplicacin de probabilidades calcula la probabilidad de la aparicin conjunta de dos sucesos A y B, que es la probabilidad del suceso interseccin A B,
respecto de todos los resultados posibles o sea, respecto del espacio muestral completo. Muchas
veces se tienen datos acerca de dos sucesos A y B sin conocerse la probabilidad de su aparicin
conjunta, y es posible conocer la probabilidad condicional del suceso A una vez que se ha pro[ 204 ]

ducido B, as como la probabilidad de B en un espacio muestral ms amplio. En tal caso, la


probabilidad de la ocurrencia simultnea de A y B en el espacio muestral de referencia, puede
calcularse segn (3.3). En el ejemplo de la dislipemia y el sobrepeso, para conocer la probabilidad de su ocurrencia conjunta en la poblacin general (espacio muestral) se multiplic la
probabilidad de dislipemia condicional a la presencia de sobrepeso, por la probabilidad de
sobrepeso en la poblacin general.
A partir de las proposiciones bsicas tratadas hasta aqu, el clculo de probabilidades
admite desarrollos ms extensos de acuerdo a la complejidad de las situaciones experimentales, y su anlisis no se abordar aqu, pudiendo consultarse Turner, 1974. Sin embargo se
harn dos menciones, una de orden terico y otra de orden prctico. La primera se refiere a la
necesidad, cuando se calculan probabilidades, de verificar que todos los puntos muestrales o
posibles sucesos hayan sido tomados en cuenta. Por ejemplo, la probabilidad de obtener dos
caras con dos monedas no es la misma que la de obtener una cara y una cruz. En efecto, las
probabilidades para cada posible resultado de las tiradas son:

Tirada 1
Tirada 2
Tirada 3
Tirada 4

Moneda A
cara
cara
cruz
cruz

Moneda B P (A B)
cara
0.5 0.5 = 0.25
cruz
0.5 0.5 = 0.25
cara
0.5 0.5 = 0.25
cruz
0.5 0.5 = 0.25


Las tiradas 2 y 3 proporcionan una cara y una cruz, aunque con las monedas invertidas.
De modo que la probabilidad de una cara y una cruz (no importando cul de las monedas sea
cara y cul cruz) es igual a la suma de las probabilidades de las tiradas 2 y 3, igual a 0.25 +
0.25 = 0.50. Una cara y una cruz ocurrirn en la mitad de las tiradas y hubiera sido un error
calcular la probabilidad como P(cara) P (cruz) = 0.5 0.5 = 0.25 porque tal estimacin corresponde a la tirada 2 y omite la tirada 3 es decir, no considera el espacio muestral completo.
Sin embargo, 0.25 es la probabilidad de dos caras, o de dos cruces, que no tienen ms que un
modo de ocurrir.

La segunda mencin se refiere a la dificultad general para asignar las probabilidades correctas a los distintos sucesos reales dada la variabilidad de las muestras y las poblaciones, de
los procedimientos de medicin y de las condiciones experimentales. Una vez que pequeos
errores se hayan introducido en las estimaciones, las diversas operaciones realizadas sobre
las mismas tendern a aumentarlos y por eso, aferrarse al significado numrico exacto de
los clculos con probabilidades puede llevar a conclusiones poco consistentes que deben ser
consideradas en forma crtica.
3.4. Probabilidades y Odds
Si se divide la probabilidad de ocurra un suceso A, por la probabilidad de que el mismo
suceso no ocurra, el resultado puede entenderse como las chances del suceso A contra el suceso no A. As, una enfermedad que tiene una probabilidad de estar presente igual al 75% o
0.75, tiene una probabilidad de no estar presente igual al 25% o 0.25 y por lo tanto, sus chances son iguales a 0.75 / 0.25 = 3. Esto se puede entender como chances de 3 a 1 a favor de
[ 205 ]

la enfermedad presente, y es lenguaje familiar en el campo de las apuestas. La denominacin


corrientemente utilizada para esta razn de probabilidades es el trmino odds, cuya traduccin
se aproxima al significado de la palabra chance en el sentido de probabilidad o tendencia a
ocurrir. Resumiendo, para un suceso con probabilidad P, sus odds estn dados por
odds = P / ( 1 P)

(3.6)

Sin embargo, si la enfermedad tiene el 25% de probabilidad de estar presente, su odds se


invierte y es ahora igual a 0.25 / 0.75 = 0.33. Este resultado ya no es tan directamente intuitivo, pues hay que imaginar las probabilidades originales para darse cuenta que la expresin
decimal significa una chance igual a una de cada tres.
Conociendo los odds de un suceso, la probabilidad original se obtiene de la expresin:
P = odds / (odds + 1)

(3.7)


Los odds pueden variar entre 0 (probabilidad de ocurrencia igual cero) hasta valores
ilimitadamente grandes cuando la probabilidad del suceso aumenta. As, un suceso con una
probabilidad de 0.95 tiene odds iguales a 0.95/0.05 = 19 y como se ve, no hay lmite superior
para el valor posible de los odds, cuyo rango posible se extiende entre cero e infinito. En cambio, no existen odds negativos.
Como se ve, el lenguaje de los odds es mucho menos intuitivo que el de las probabilidades y se aleja bastante de la experiencia diaria. Una probabilidad de enfermedad del 95%
es claramente imaginable mientras que no lo es tanto su expresin en odds, igual a 19 (que
debera entenderse como chances de 19 a 1). Porqu entonces su importancia en estadstica? Porque adems de expresar la probabilidad de un suceso en relacin a su complemento
(1 P), aparecen en el desarrollo terico de varios procedimientos y tcnicas, tpicamente en
la regresin logstica y en las estimaciones del riesgo relativo en los modelos epidemiolgicos
de tipo caso-control, mtodos que se hallan relacionados entre s y tienen extensos campos
de aplicaciones en medicina (ver Secciones 12 y 16).

[ 206 ]

4. Distribuciones de probabilidades

4.1. Variables aleatorias, distribucin de probabilidades y funciones de probabilidad



Muchas veces se necesita conocer las probabilidades de los diferentes valores que puede
adoptar una variable o suceso en estudio, a fin de poder realizar previsiones respecto de su
posible comportamiento en las poblaciones de las que procede. Como se ver, las distintas distribuciones y funciones de probabilidad constituyen modelos tericos que permiten
alcanzar esos objetivos al ajustarse al comportamiento de las observaciones realizadas en
las muestras. En estos casos, el concepto de variable hace especial referencia a su carcter
aleatorio, esto es, que no permite predecir con certeza cul de los valores posibles tomar en
una determinada situacin, y se habla en estos casos de variables aleatorias. De hecho, gran
parte de los fenmenos biolgicos pueden ser representados por este tipo de variables.
Si bien no es posible conocer qu valores adoptar una variable aleatoria, frecuentemente
se pueden asignar probabilidades a los distintos valores que puede exhibir. As, la probabilidad de obtener un seis tirando un dado normal puede estimarse en 1/6 o 0.17, pero este conocimiento no permite saber con certeza cul ser el resultado de una tirada hasta no haberla
realizado. Las variables aleatorias se suelen denominar con una letra mayscula como X o Y,
mientras que cualquier valor adoptado en una determinada observacin se suele representar
por la misma letra en minscula. Si a la variable resultado de tirar un dado se la denomina
X, la probabilidad de obtener un seis se expresa como P(X = 6), que es tambin la probabilidad P(X = x) para x = 6. Tambin puede escribirse p(6) o p(x).
Dada una variable aleatoria, las llamadas distribuciones de probabilidades proporcionan las probabilidades asociadas con cada uno de los valores posibles de la variable.
Estas distribuciones son tericas y describen con mayor o menor exactitud el comportamiento de las observaciones realizadas en los diversos campos de la biologa. Con un nmero finito de valores posibles de la variable, tales distribuciones se pueden tabular y representar en
forma de histogramas, mostrando dichos valores en el eje horizontal y sus correspondientes
probabilidades en el eje vertical (Fig. 4.1).

[ 207 ]

Figura 4.1. Probabilidad de obtener cero, una o dos caras tirando dos monedas.


En general, las variables aleatorias pueden ser discretas o continuas. En el caso de una
variable discreta, cada valor de la misma se corresponde con una probabilidad finita. El histograma de la figura 4.1 muestra la distribucin de probabilidades examinada en 3.3.2. Las
probabilidades de obtener cero, una o dos caras tirando dos monedas a la vez, son 0.25, 0.50
y 0.25 respectivamente. Su suma es igual a 1, lo que implica que no quedan otros resultados
posibles.

Ntese que las distribuciones de frecuencias descriptas en 2.3, resumen las frecuencias
con las que se han presentado los distintos valores de una variable medida durante un experimento, esto es, de una variable muestral. Si bien las frecuencias se relacionan con probabilidades y pueden servir para estimarlas, las distribuciones de frecuencia son objetos empricos
resultado de la recoleccin de datos. En tanto, las distribuciones de probabilidades resultan de
funciones matemticas que asignan probabilidades a los distintos valores que puede adoptar
una variable independiente, sin que sea un requisito la observacin de los datos. As, no ha sido
necesario efectuar tiradas de monedas para calcular la distribucin de probabilidades de la
Figura 4.1, que se obtuvo a partir de una funcin de probabilidad.

Las funciones probabilsticas o funciones de probabilidad asignan probabilidades a
cada valor x que pueda adoptar una variable aleatoria X, de modo que las probabilidades
resultan una funcin de los valores de la variable aleatoria y se expresan P(X = x) o ms
sencillamente, p(x). En el ejemplo de la tirada de dos monedas analizado en 3.3.2 e ilustrado
en la Figura 4.1, las probabilidades de obtener 0, 1 o 2 caras son funcin de estos valores y
se expresan como P(X = 0 caras) = 0.25, P(X = 1 cara) = 0.50 y P(X = 2 caras) = 0.25. Las
probabilidades son funcin de cada posible valor de la prueba, 0, 1 y 2 caras, y en este caso
se obtienen de la llamada funcin binomial, que se examinar en 4.4. En relacin con esto,
obsrvese que las probabilidades de tirar cero, una o dos caras, se han determinado en forma
analtica en funcin de los valores que puede adoptar la variable (nmero de caras), y no ha
sido necesario realizar experimentos de muestreo para conocerlas.
[ 208 ]

Anlogamente a lo que ocurre con las distribuciones de frecuencias (2.3), las funciones de probabilidad deben cumplir con el requisito de que la suma de todas las probabilidades sea igual a la probabilidad total, o sea 1. Esto tiene que cumplirse de un punto
de vista matemtico para que la funcin represente correctamente las probabilidades de
una variable aleatoria. En el histograma de la figura 4.1 se observa que las probabilidades para cero, una y dos caras son 0.25, 0.50 y 0.25 respectivamente, con lo que la suma
es igual a 1 (que es adems el rea del histograma, integrada por rectngulos con base
igual a 1 y altura igual a la respectiva probabilidad). En las representaciones grficas, las
funciones de probabilidad pueden corresponder a histogramas (funciones discretas con
un nmero finito de valores posibles para la variable aleatoria) o a reas delimitadas por
lneas curvas que expresan un cambio gradual y continuo de las probabilidades a medida
que la variable aleatoria toma sus infinitos valores posibles (funciones continuas, ver ms
adelante). En la Figura 4.2 se observa el histograma de una variable discreta y la curva
que resultara de proseguir indefinidamente la subdivisin de la variable independiente
(ver 4.6). En cualquier caso, el rea de estos histogramas o curvas de probabilidades
debe valer siempre 1, que es el valor de la probabilidad para todos los valores posibles de
la variable aleatoria.
Figura 4.2. Histograma de una distribucin discreta de probabilidades, y curva de la funcin
continua a la que tiende al proseguir indefinidamente la subdivisin de la variable aleatoria.



La probabilidad de una variable aleatoria de tomar valores comprendidos entre el extremo izquierdo de la curva de probabilidades y un valor xi arbitrario, es cada vez mayor a
medida que xi se corre hacia la derecha de la distribucin. Esta acumulacin de probabilidades puede representarse como una nueva funcin de x llamada funcin de distribucin
acumulativa o simplemente funcin de distribucin (ver 4.6.1).
Las distribuciones probabilsticas tienen importancia por su capacidad para describir
ajustadamente el comportamiento de distintos tipos de variables obtenidas de mediciones
[ 209 ]

en muestras de poblaciones. La informacin que se obtiene del estudio de las funciones de


probabilidad est contenida en su estructura matemtica y, en gran parte, se encuentra resumida o condensada en un pequeo grupo de expresiones que las caracterizan, de las cuales
las fundamentales son la media, la varianza y el desvo estndar.
4.2. Esperanza matemtica () y varianza ( ) de una variable aleatoria
En la descripcin de muestras o conjuntos de datos en general, se definieron medidas de
posicin y de dispersin, entre las cuales se cuentan la media y la varianza muestrales (ver
2.5). Estas medidas permiten conocer y resumir las caractersticas de las muestras. En el caso de las distribuciones de probabilidades, se tienen expresiones anlogas como la esperanza
matemtica o media y la varianza de la variable aleatoria, que son constantes que caracterizan a cada una de las distintas funciones de probabilidad y se conocen como parmetros de
las mismas. Las funciones de probabilidad se utilizan para describir en forma terica distintos universos o poblaciones. En lo que sigue se expondrn algunos conceptos relativos a la
esperanza matemtica y la varianza de las funciones de probabilidad.

Dada una variable aleatoria X, se denomina esperanza matemtica de X a la suma de los
productos de cada valor x que toma la variable, multiplicado por su respectiva probabilidad.
Tratndose de variables discretas con un nmero finito de valores posibles, se tiene:
E ( X ) = x i P i

(4.1)

donde expresa el proceso de sumar los productos de las i observaciones de x por sus respectivas probabilidades. Se ha mencionado antes que la probabilidad P depender del valor
que tome x, esto es, P es una funcin de x y puede escribirse P = f( x ), con lo cual (4.1) toma
la forma:
E ( X ) = xi f(xi)

(4.2)


La esperanza matemtica corresponde al valor medio de la x para todos sus valores
posibles y es la media de la correspondiente distribucin de probabilidades. En el caso de
variables continuas, que implican infinitos valores posibles para la variable x, el clculo de la
esperanza matemtica requiere reemplazar la sumatoria por las integrales de las funciones de
probabilidad f( xi ), con lo cual la expresin (4.2) toma la forma
E ( X ) = x f(x) d(x)

(4.3)

que tiene el mismo significado y corresponde a la media de la distribucin.


Se acostumbra representar a la esperanza matemtica de X con la letra griega , como
smbolo de la media del universo representado por la funcin de probabilidades.
A fin de comprender mejor el concepto, vase como se obtiene la esperanza matemtica
( E ) en el modelo de las dos monedas del prrafo anterior, siendo la variable aleatoria X, el
nmero de caras. Segn la definicin (4.1), se debe multiplicar cada uno de los posibles valores del nmero de caras por su respectiva probabilidad, y sumar los trminos:
[ 210 ]

E(nmero de caras) = (0 caras) P( 0 caras) + (1 cara) P(1 cara) + (2 caras) P(2 caras)
= 0 0.25 + 1 0.50 + 2 0.25 = 1

Ntese que para cada posible resultado, su probabilidad depende o es funcin del nmero de caras de que se trate, y en este caso est determinada por la llamada funcin binomial,
que se examinar con algn detalle ms adelante. As, la probabilidad de 2 caras o cero caras
es la misma e igual a 0.25, mientras que la probabilidad de 1 cara corresponde a la suma de
la probabilidad de cara en la moneda A ms la probabilidad de cara en la moneda B, igual a
0.25 + 0.25 con lo que P(1 cara, cualquier moneda) es igual a 0.50. Ntese tambin que las
probabilidades, que se determinan en funcin de los valores que puede adoptar la variable
aleatoria, se originan en funciones de probabilidad tericas y no requieren estar avaladas por
experimentos. Puede observarse asimismo la correspondencia de la esperanza matemtica
con la media de un experimento ideal donde, en cuatro tiradas de dos monedas cada una, se
dieran las cuatro posibles combinaciones expuestas en 3.3.2: la suma del nmero de caras
en cada tirada sera igual a 2 + 1+ 1+ 0 = 4, lo que dividido por 4 tiradas es igual a 1, resultado idntico al de la esperanza matemtica. La diferencia entre la esperanza matemtica
y la media muestral reside en que sta tiene carcter experimental y oscila alrededor de un
valor central, siendo muy difcil que an con un nmero grande de experiencias (tiradas de
monedas) la media muestral tenga exactamente el valor de la media terica de la poblacin,
mientras que la esperanza matemtica de la variable aleatoria X es por definicin la media de
dicha variable, dada por la funcin de probabilidades correspondiente.

La varianza de una variable aleatoria X se define como la esperanza matemtica de la
diferencia entre las x y , elevada al cuadrado: E(x ), y tiene un significado anlogo al de
la varianza de una muestra, vista en 2.5. Para obtenerla, cada valor del trmino (xi ) se
multiplica por su probabilidad Pi en forma anloga a lo visto para la esperanza de la X. La
varianza se simboliza con la letra griega elevada al cuadrado ( ) y su expresin es:

= E (x ) = (xi ) Pi
(4.4)
Su raz cuadrada, , es el desvo estndar de la distribucin:
=

(4.5)

Como para la esperanza matemtica, cuando se trata de variables continuas el proceso


de sumatoria requiere el empleo de integrales.
Se ha visto (2.5.2) que la varianza y el desvo estndar muestrales calculados segn (2.4)
y (2.5), son estimadores insesgados de la varianza y el desvo estndar del universo.
4.3. Cul es el papel de las funciones de probabilidad en estadstica?
El hecho de poder caracterizar y medir la posicin y la dispersin de los datos experimentales mediante ciertos estadsticos como la media, la varianza y el desvo estndar obtenidos
de las muestras (2.5), lleva a plantear la pregunta acerca del objeto de introducir funciones
de probabilidad, que son construcciones matemticas de ndole terica, para tratar con da[ 211 ]

tos empricos que estn bien descriptos por los estadsticos muestrales ya mencionados. El
motivo es que las llamadas funciones probabilsticas demuestran ajustarse notablemente bien
al comportamiento de los datos muestrales y por otra parte, a partir de sus propiedades,
posibilitan la elaboracin terica de predicciones e inferencias que no podran obtenerse
sin ellas. Por ejemplo, se ver ms adelante que en una distribucin normal o gaussiana, las
observaciones que se hallan comprendidas entre la media y dos desvos estndar a cada lado
de la misma, constituyen casi exactamente el 95% de los casos. Por ende, la probabilidad de
encontrar observaciones o casos por fuera de la media 2 desvos estndar, es de slo el 5%.
Estas propiedades son caractersticas de la funcin normal y no se podran deducir sencillamente del examen directo de las muestras.
Conviene por lo dems tener en cuenta que para que las funciones de probabilidad resulten tiles en el estudio de poblaciones, el comportamiento de las muestras debe estar adecuadamente descrito por aqullas funciones tericas. En otras palabras, deben emplearse las
funciones de probabilidad que mejor se ajusten a la distribucin de los elementos muestrales
en cuestin. Cul de las distintas posibles funciones probabilsticas es la adecuada para cada
clase de muestra depende en gran parte del tipo de datos y de sus fuentes de origen: puede
tratarse de variables discretas o continuas, muestras grandes o pequeas, sucesos con alta
o baja probabilidad de aparicin, etc. La experiencia puede ayudar a determinar cul es el
tipo de distribucin ms adecuado, y a veces, podr ser necesario realizar distintas pruebas
exploratorias como evaluar la normalidad de los datos y eventualmente ensayar su transformacin para aproximarlos a la normalidad si este no fuera el caso y el tratamiento estadstico
lo hiciera necesario. Algunos de estos aspectos se irn mencionando a lo largo del texto (ver
4.8). En lo que sigue, se examinarn brevemente las principales distribuciones tericas de
probabilidad.
4.4. Distribucin Binomial
Como en el caso de las monedas visto en el punto anterior, existen variables que tienen
slo dos estados o resultados posibles, y en cada oportunidad presentan uno de los dos (variables dicotmicas o binarias). En el caso de las monedas los resultados posibles son cara
y cruz, que en general pueden denominarse A y B, de modo que la aparicin del suceso A
significa que no se ha producido B. Si se realiza una serie de experiencias con tales variables,
como puede ser una serie de tiradas con una moneda, surge la pregunta por la probabilidad
de obtener un nmero determinado de sucesos A (o simplemente, sucesos, como podran considerarse las caras) en un nmero n de experiencias o tiradas. En cada experiencia se puede
obtener cara o cruz, A o B, con lo que se entiende que el nmero de posibles caras o sucesos
en n pruebas podr variar entre 0 y n. Ese nmero de sucesos en n experiencias, se puede
denominar r. Resulta intuitiva la idea de que si se tira diez veces una moneda (n = 10) el valor
ms probable para el nmero de caras que se obtengan ser 5 (r = 5), y esto se debe a que en
este caso se tiene por cierto que las probabilidades de cara son iguales a las de no cara, independientemente de cul pudiera ser el comportamiento de una moneda real. En este mismo
caso, otros valores de r pueden ser esperados con menor frecuencia a medida que se apartan
del valor central 5. La distribucin que describe las probabilidades de obtener un nmero
r de sucesos en funcin de n y de la probabilidad de la variable binaria de que se trate, se
[ 212 ]

llama distribucin binomial. La variable aleatoria de la distribucin es r, que como se ha


mencionado, pude tomar valores entre 0 y n.
Conviene recordar que la probabilidad de suceso en una variable binaria no es necesariamente igual a 0.5. En realidad, muchos acontecimientos cuya probabilidad podemos estimar
de alguna manera, pueden considerarse variables binarias adjudicando dicha probabilidad
p a su aparicin, y la probabilidad complementaria 1 p = q, a su falta de aparicin. Por
ejemplo, si se acepta que la probabilidad de enfermedad coronaria en la poblacin general
es del 7%, entonces P(coronariopata) = 0.07 y P(no coronariopata) = 1 0.07 = 0.93. As
considerada, la presencia de coronariopata puede ser tratada como una variable binaria y
estudiarse mediante la funcin binomial.
En un conjunto de n ensayos o experimentos realizados con una variable binaria cuya
probabilidad se puede simbolizar como , la probabilidad de obtener un nmero r de sucesos
se puede calcular en dos etapas:
1. De acuerdo con la regla para la multiplicacin de probabilidades independientes (frmula 3.5), generalizada a varios factores, la probabilidad de obtener r sucesos y (n r) no
sucesos, con probabilidades y (1 ) respectivamente, es igual a:
. (1 ) (1 ) (1 )
r veces
(n r) veces
o sea al producto de por los r sucesos y ( 1 ) por los (n r) no sucesos, lo que se expresa
en forma abreviada:
r (1 ) n r

(4.6)

Esta es la probabilidad de obtener r sucesos y (n r) no sucesos en n experiencias. Pero


como se indica a continuacin, hay varias formas o disposiciones en que se pueden alternar
sucesos y no sucesos.
2. La probabilidad anterior se refiere a cualquiera de las posibles disposiciones de sucesos
y no sucesos en n experiencias, pero hay siempre varias posibles. Por ejemplo, tirando una
moneda 4 veces y expresando cara = C y cruz = c, tenemos que una cara se puede disponer
o presentar en 4 formas: (C, c, c, c), (c, C, c, c), (c, c, C, c) y (c, c, c, C), siendo r = 1 en cada
uno de los cuatro casos y teniendo cada caso, como resulta evidente, la misma probabilidad.
La probabilidad calculada por la frmula 4.6 es vlida para cualquiera de estas cuatro disposiciones, que son independientes y, por lo tanto, para hallar la probabilidad de obtener 1
cara sin importar en qu posicin aparece ubicada, hay que sumar las cuatro probabilidades
independientes o, como son las cuatro iguales, multiplicar por cuatro.

Otro ejemplo: dos caras en 4 tiradas se pueden presentar de 6 maneras: (C, C, c, c), (C,
c, C, c), (C, c, c, C), (c, C,C, c), (c, C, c, C) y (c, c, C, C), y la probabilidad total de obtener
dos caras (r = 2) en cualquier orden de presentacin, se obtendr sumando las probabilidades
individuales de cada disposicin o, como son iguales, multiplicando por seis la probabilidad
obtenida de la frmula (4.6).
[ 213 ]

Como se ve, para determinar la probabilidad de r sucesos en n pruebas, se necesitar


siempre el nmero de posibles formas de alternarse sucesos y no sucesos, y el nmero de
estas disposiciones de r sucesos entre n experiencias puede determinarse como se acaba de
hacer, haciendo explcita cada una de las posibles disposiciones de los resultados y contndolas. Sin embargo, su obtencin es mucho ms sencilla utilizando los llamados coeficientes
binomiales, que proporcionan algoritmos de clculo sobre los cuales no nos extenderemos
y que, por otra parte, pueden hallarse tabulados para valores de n tan altos como 100 (ver
Documenta Geigy, Tablas Cientficas). Estos coeficientes se simbolizan de varias formas,
siendo una de ellas nCr, que aplicada a los datos del prrafo anterior se escribe 4C 2 = 6 y se lee
disposiciones de 4 elementos tomados de a 2, igual a 6.
Resumiendo lo ya visto, puede decirse que, la probabilidad de obtener r sucesos en n
experiencias, se obtiene multiplicando la probabilidad dada por (4.6), por el correspondiente
coeficiente binomial, que da el nmero posible de distintas presentaciones con la misma n
y la misma r. La expresin de la funcin de probabilidad binomial en funcin de r queda
entonces expresada como:
P ( r ) = nCr r ( 1 ) n r

(4.7)

Como ejemplo prctico para afirmar los conceptos anteriores considrese el caso sencillo de calcular la probabilidad de obtener 2 caras (no menos ni ms) tirando una moneda 4
veces: hemos visto que 2 caras en cuatro tiradas pueden disponerse de 6 formas diferentes,
dadas por 4C 2 = 6, y que la probabilidad de cualquiera de estas seis disposiciones est dada
(suponiendo la probabilidad de cara = = 0.50), por:
r ( 1 ) n r = 0.50 ( 1 0.50 ) 4 2

= 0.25 0.25 = 0.0625
Por lo tanto, de acuerdo a (4.7), la probabilidad buscada es 6 0.0625 = 0.375.
Calculando por el mismo procedimiento las probabilidades para cada resultado posible, desde 0 a 4 caras, se tienen todos los datos de la distribucin binomial para n = 4 y =
0.50. Teniendo en cuenta que los coeficientes binomiales son 4 C 0 = 1, 4 C1 = 4, 4 C 2 = 6, 4 C 3
= 4 y 4 C 4 = 1, se puede comprobar fcilmente utilizando 4.7, que las respectivas probabilidades son:

P(0 cara) = 0.0625, P(1 cara) = 0.25, P(2 caras) = 0.375, P(3 caras) = 0.25 y P(4 caras)
= 0.0625, siendo su suma igual a 1 como corresponde a una funcin de probabilidades. El
correspondiente histograma se muestra en figura 4.3

[ 214 ]

Figura 4.3. Distribucin de la probabilidad de obtener r caras tirando n = 4 monedas. Se ha


superpuesto la curva de distribucin normal.

En la figura 4.3 se observa que la distribucin es simtrica, presenta la probabilidad


mxima en su esperanza matemtica, que es igual a 2 (ver a continuacin), y las probabilidades disminuyen hacia ambos extremos.
En el terreno relacionado con la obtencin de muestras, el cociente entre las r veces que
un suceso A ocurre en n experimentos, puede escribirse
p = r / n

(4.8)

donde p denota la proporcin de sucesos en n ensayos. Este cociente estima la proporcin de sucesos en el universo, que se suele representar con la letra y es la esperanza matemtica de p:
E ( p ) =

(4.9)

y tambin puede interpretarse como la probabilidad del suceso A. Se demuestra que la varianza de p es
Var ( p ) = (1 ) / n

(4.10)

y su estimacin a partir de muestras se obtiene reemplazando por p:


Var (p) = p (1 p) / n

(4.11)

Estas expresiones encontrarn sus aplicaciones en la Seccin 8.


4.4.1. Aproximacin de la binomial a la normal
A medida que aumenta el nmero de ensayos o pruebas (n), la funcin binomial se aproxima rpidamente a la conocida funcin normal (4.7), lo que puede corroborarse en la figura
[ 215 ]

4.3, donde se ha trazado la curva normal sobre el histograma que representa la distribucin
binomial para n = 4 y = 0.5. Con = 0.5 la distribucin es simtrica, y a pesar del exiguo
nmero de ensayos, la correspondencia entre ambas grficas es ya muy clara. Con algunas
decenas de ensayos ya suele ser suficientemente buena como para poder emplearse las propiedades de la funcin normal en aplicaciones de inferencia estadstica. La binomial es simtrica
cuando es igual a 0.5, y se torna asimtrica a medida que se aproxima a los extremos, 0 o
1. La simetra con cercano a 0.5 contribuye a que la funcin se aproxime ms rpidamente
a la normal al crecer n.
4.5. La Distribucin de Poisson

Una distribucin de probabilidades importante, aplicable a variables dicotmicas o binarias, es la distribucin de Poisson. Por razones de espacio slo se mencionarn sus propiedades y aplicaciones ms relevantes. Como todas las distribuciones de probabilidades, se trata
de un modelo matemtico que expresa el comportamiento de cierto tipo de variables, en este
caso el de sucesos que ocurren espordicamente en un continuo de espacio o tiempo, y con
una probabilidad relativamente pequea. Son ejemplos tpicos de variables que siguen esta
distribucin el nmero de bacterias, clulas u otros elementos formes esparcidos por campo
de microscopio o volumen de lquido (continuos de espacio) o la incidencia de enfermedades
relativamente poco frecuentes en perodos determinados (continuo de tiempo).
Aparte de las aplicaciones mencionadas, la distribucin de Poisson resulta una buena
aproximacin a la distribucin binomial cuando p es pequea y n grande, situaciones en las
que puede reemplazarla en el clculo.
4.6. Distribuciones continuas. Generalidades
Como ya se anticipara en 4.1, en las funciones de variables continuas las probabilidades
se distribuyen a lo largo de un conjunto infinito de posibles valores de la variable independiente, que pueden entenderse como el lmite al que tenderan los intervalos de una variable
discreta si se subdividieran indefinidamente hasta aproximarse a cero. En la Figura 4.2 se
observa un histograma que representa la distribucin de probabilidades de una variable discreta, y el resultado que se obtendra de ser posible continuar indefinidamente con la subdivisin de la variable hasta que la base de cada rectngulo tienda a convertirse en un punto. En
ese momento, el perfil del histograma tender a mostrar un contorno donde la lnea quebrada
formada por el techo de cada rectngulo ser reemplazada por una lnea curva (geomtricamente, sin discontinuidades). Se obtiene as una distribucin continua de probabilidades.
Estas distribuciones son generadas por distintas funciones de la variable aleatoria X, siendo
la ms importante la llamada normal o de Gauss, que se referir en el siguiente apartado.
Como se ha visto, en las distribuciones discretas hay proporcionalidad entre las reas de
los rectngulos de los histogramas y las probabilidades que representan, con un rea total
que debe ser igual a la unidad y corresponde a la sumatoria de todas las probabilidades de la
variable. Tambin se ha dicho que esto es un requisito para cualquier funcin probabilstica.
En las distribuciones continuas surge una dificultad para sumar las probabilidades en forma
convencional, ya que las bases de los rectngulos tienden a cero convirtindose en puntos correspondientes a los infinitos valores que puede tomar la variable aleatoria, y los rectngulos
[ 216 ]

se han transformado en infinitas lneas verticales adyacentes, sin un rea individual medible, ya que tienen base cero. Entonces, la probabilidad de un determinado valor puntual
resulta igual a cero, lo que contradice la intuicin, que espera una probabilidad para cada
posible resultado. Sin embargo, el equivalente de la suma aritmtica de infinitos valores de
probabilidad cada uno tendiendo a cero, se logra en forma analtica mediante la integracin
de la funcin de probabilidad f( x ) sobre el rango de las x. En esta integracin, el rea total
de la funcin de probabilidad, tambin conocida como funcin de densidad de probabilidad
y representada por una lnea curva, debe hacerse corresponder a 1, que se vio que es un requisito para este tipo de funciones, sean continuas o discretas. De esta forma, la integral de
f( x ) corresponde a la sumatoria de las probabilidades puntuales de la variable aleatoria X
y tambin, al rea bajo la curva de la funcin de probabilidad. El rea bajo esta curva puede
ser entonces dividida por lneas verticales (ordenadas) correspondientes a diversos valores
de la variable X con un resultado importante: el rea entre dos ordenadas representa la
probabilidad de que la variable tome valores comprendidos entre ellas (Fig. 4.4). En otras
palabras, aunque la probabilidad en un punto dado de una distribucin continua no es calculable, la probabilidad de x puede determinarse para cualquier intervalo entre dos valores de
la variable, estn prximos o separados, y est dada por la fraccin del rea bajo la curva de
la funcin de probabilidad, comprendida entre ambos valores. As, en la Figura 4.4, el rea
grisada correspondiente a los valores 1 y 2 de la variable aleatoria es igual al 14% del rea
bajo la curva, lo que expresa que la probabilidad de que la variable aleatoria X adopte valores
comprendidos entre 1 y 2, es igual a 0.14. Esto puede expresarse como P(1 < x < 2 ) = 0.14.

Figura 4.4. Distribucin normal. En el eje x los desvos estndar alrededor de la media. La
probabilidad de que la variable x tome valores comprendidos entre dos ordenadas cualesquiera puede determinarse con exactitud mediante el clculo. As, para el rea grisada, entre x =
1 y x = 2 desvos estndar, P = 0.14.


[ 217 ]

4.6.1. Funciones de densidad y funciones de distribucin



Debido a consideraciones tericas, las funciones de probabilidades, en especial las continuas, se denominan funciones de densidad de probabilidad y las curvas que las representan,
curvas de densidad de probabilidad. Como se ha mencionado, las curvas de densidad de
probabilidad correspondientes a funciones continuas f( x ) tienen un rea, dada por la integral definida entre los extremos de la variable aleatoria X, cuyo valor es igual a 1. La integral
de f( x ) se representa como F( x ) y sus valores en cualquier punto xi corresponden al rea de
la curva de densidad f( x ) entre su cola izquierda y xi. La funcin F( x ) se denomina funcin
de distribucin de probabilidades de x y es siempre creciente de izquierda a derecha (Fig.
4.5). De acuerdo a lo expresado, el valor de F(x) en xi representa la probabilidad de obtener
x menor o igual que xi o sea, F( xi) = P( x xi ). De la misma manera, la probabilidad de que
la variable aleatoria presente valores comprendidos en un intervalo xi xj est dada por la
variacin de la integral F( x ) entre xi y xj, que corresponde al rea de la funcin de densidad
f( x ) entre los mismos valores (Fig. 4.5).
As, dada una funcin continua de densidad de probabilidades, existe en general la posibilidad de calcular las probabilidades para cualquier intervalo de la variable, lo que se lleva
a cabo mediante procedimientos de integracin que permiten obtener la correspondiente
funcin de distribucin F(x). La estructura de la funcin de densidad define la forma y otras
caractersticas de la distribucin. La teora y prctica de esos procedimientos exceden los objetivos del texto y no se tratarn aqu (vase Wackerly DD et. al, 2002). La distribucin ms
importante de la estadstica es una distribucin continua llamada normal o de Gauss, cuyas
propiedades fundamentales se examinarn a continuacin.

Figura 4.5. Curvas de densidad f(x) y de distribucin F(x) de probabilidades, correspondientes a la funcin normal. La probabilidad de obtener x entre 1 y 2 desvos estndar a un lado
de la media, est dada por el rea de f(x) en ese intervalo y tambin por el crecimiento de la
integral F(x) entre los mismos puntos.

[ 218 ]

4.7. La distribucin normal o de Gauss



La funcin de distribucin de probabilidades normal o de Gauss, muchas de cuyas caractersticas han sido mencionadas en el prrafo anterior, ocupa un lugar central en la teora
estadstica y tiene la propiedad de describir adecuadamente el comportamiento de una gran
cantidad de variables del mundo fsico como las que manejan las ciencias biolgicas.
La forma de la distribucin seala la mayor probabilidad de los valores prximos a la media
y su disminucin a medida que se alejan del centro de la misma (Fig. 4.4). El trmino normal
no debe entenderse como sano o libre de anomalas, sino simplemente como un nombre. Por
lo tanto, la referencia a datos normalmente distribuidos alude a que sus probabilidades se
distribuyen siguiendo la funcin normal o de Gauss. Por cierto, esta distribucin de probabilidades es notablemente comn en la naturaleza, pero el hecho de que una variable se ajuste
a dicha distribucin no es de por s un criterio de normalidad en sentido biolgico o mdico.
Por otra parte, gran parte de los mtodos estadsticos se basan o estn relacionados con
la funcin normal o de Gauss y slo funcionan correctamente si los datos a evaluar se distribuyen de acuerdo a dicha funcin. Otros mtodos, si bien requieren la distribucin normal
de los datos, toleran cierta desviacin de la normalidad sin alterar demasiado los resultados
y por ello suelen ser denominados robustos. En algunas oportunidades en que los datos se
apartan de la distribucin normal, puede recurrirse a distintas operaciones matemticas sobre los mismos a fin de hacer que su distribucin de probabilidades se aproxime a la normal
(ver 4.8).

La funcin de densidad normal o de Gauss es la siguiente:
f ( x ) = (1 / 2 ) exp [ ( x ) / 2 ]
donde exp [ z ] indica la base e de los logaritmos naturales elevada a la potencia z, esto es ez,
siendo z = [ ( x ) / 2 ], = desvo estndar y = 3.14159 Los valores de f( x ) para
las distintas x, as como los de su integral F( x ) o funcin de distribucin, se hallan tabulados
extensamente, incluso en los paquetes de clculo estadstico.
Como para otras funciones de probabilidad continuas, la integral de f( x ) entre dos valores de x1 y x2 , corresponde a la probabilidad de la variable aleatoria de adoptar cualquier
valor dentro del intervalo, y corresponde geomtricamente al rea de la curva normal entre
las ordenadas que pasan por x1 y x2 (Fig. 4.4).

La media (simbolizada ) corresponde al centro de la distribucin y cuando la funcin
normal se utiliza para representar universos, representa la media de los mismos. El desvo
estndar (representado por ) se utiliza para medir la dispersin de la variable aleatoria alrededor de la media y, como se ver enseguida, para asignar las probabilidades de que una
variable tome valores comprendidos entre determinados lmites. Para simplificar estas tareas
se suele estandarizar la desviacin de las variables experimentales o muestrales con respecto
a su media. Dado que los universos no suelen ser conocidos en forma completa, sus medias y
desvos estndar son estimados a travs de la media y el desvo estndar muestrales, tal como
se ha expuesto en 2.5.

[ 219 ]

4.7.1. Desvo estandarizado


Como se comprende, la media y el desvo estndar de una distribucin normal tendrn
magnitudes de acuerdo con las de la variable de que se trate. Esto hace incmodo comparar
las caractersticas de variables de diferente magnitud o medidas en diferentes unidades. As,
para una variable X distribuida con media 100 y desvo estndar 20, un valor x = 130 puede
resultar poco informativo, y difcil de comparar con el valor y = 130 para una variable Y con
media igual a 106 y desvo estndar 15. Un mtodo til resulta medir la distancia de la variable a la media, y dividirla por el correspondiente desvo estndar. En el primer caso se tendr
(130 100) / 20 = 1,5 y en el segundo, (130 106) / 15 = 1.6, nmeros que dan la distancia de
x e y a sus respectivas medias, expresadas en unidades de desvo estndar. Las distancias han
sido de esta forma estandarizadas, y se ve en forma inmediata que en trminos de su desvo
estndar, la observacin y se halla ligeramente ms alejada de su media que la observacin x.
La expresin general de una variable normal estandarizada tiene la forma:
z = ( x ) /

(4.12)

donde x es el valor particular de la variable aleatoria a normalizar y z recibe el nombre desvo


estandarizado o asimismo, variable estandarizada. Esta permite comparar fcilmente la
dispersin de distintas variables, aunque sus distribuciones tengan medias y desvos estndar
de distinta magnitud. El desvo estandarizado cambia los valores originales de las variables por aqullos que expresan su distancia a la media en desvos estndar. Por tomarse las
distancias con respecto a la media o centro de la distribucin, se dice que la variable se halla
centrada.

Los valores de la integral de la funcin normal se hallan ampliamente tabulados en la
forma de desvos estandarizados a partir de la media, que se considera el centro de la distribucin y a la que se asigna el valor cero. Hay varias formas de presentar las tablas de la
funcin normal, siendo frecuente la que da la probabilidad de la variable aleatoria de adoptar
un valor entre 0 (el centro) ms o menos una determinada desviacin z, expresada como se ha
visto, en desvos estndar. Este valor corresponde al rea que se extiende z desvos estndar
a cada lado de la media. As, puede encontrarse que el rea de la curva entre 2 y + 2 desvos
estndar alrededor de la media es igual a 0.9545, lo que expresado en trminos de probabilidades significa que en casi exactamente el 95% de los casos, una variable normal tomar
valores dentro de 2 desvos estndar alrededor de la media.

Otras veces las tablas presentan la probabilidad de que la variable aleatoria tome valores
por fuera o ms extremos que los tabulados, hecho de inters en inferencia estadstica. En la
Tabla 4.1 se resumen algunos valores importantes de la variable aleatoria estandarizada, con
la respectiva probabilidad de que esos valores sean excedidos por azar en la distribucin
normal. Como la probabilidad en cada caso se refiere a valores en los dos extremos de la curva,
se trata de una tabla a dos colas. All se observa que la probabilidad de la variable aleatoria de
tomar valores por fuera de 2 desvos estndar alrededor de la media (z = 2) es igual a 0.0455,
muy aproximadamente el 5% (ntese que esto concuerda con el resultado dado ms arriba para
la probabilidad de caer dentro del intervalo, que es el complemento de la probabilidad de caer
por fuera del mismo). En este punto es fundamental observar que este 5% se reparte en las 2
[ 220 ]

colas de la distribucin, por lo cual la probabilidad de la x de ser mayor que el valor de la media
ms 2 desvos estndar ser aproximadamente del 2.5%, y la probabilidad de ser menor que
la media menos 2 desvos estndar, el 2.5% restante (vase Fig. 6.2). Estos valores son muy
aproximados, siendo el valor de z por fuera del cual queda exactamente el 5% de los casos,
igual a 1.96. Este nmero aparece frecuentemente en el desarrollo de pruebas de significacin
estadstica, aunque para el clculo aproximado y rpido puede usarse z = 2.
En las Figuras 4.4 y 4.5 se ha visto que el rea comprendida entre 1 y 2 desvos estndar
a partir de la media es igual al 14% del rea total de la curva, y por lo tanto tiene asociada
una probabilidad P = 0.14. Existen muchas formas de obtener este resultado a partir de las
distintas tablas de la distribucin normal. Por ejemplo, se puede consultar el valor de la
probabilidad entre la media y 2 desvos estndar y restarle la probabilidad entre la media
y 1 desvo estndar. Tambin se puede buscar la probabilidad de la variable x para valores
comprendidos entre dos desvos estndar alrededor de la media, y restarle la probabilidad
para valores comprendidos entre 1 desvo estndar. Estas son 0.95 y 0.68, y su diferencia,
igual a 0.27, da la probabilidad de x entre 2 y 1 desvos estndar y entre +1 y +2 desvos
estndar. Por lo tanto, la probabilidad de x comprendida entre +1 y +2 desvos estndar ser
igual a la mitad, o sea 0.135 o 0.14, con diferencias debidas al redondeo. En la prctica esto
significa que en una muestra normal, el 14% de las observaciones se hallarn a una distancia
de la media comprendida entre 1 y 2 desvos estndar (y la misma probabilidad existir para
la misma desviacin a la izquierda de la media, ya que la distribucin es simtrica).
Tabla 4.1. Valores de la variable estandarizada z y probabilidad de adoptar valores ms
extremos en cualquier direccin (dos colas).

z = ( x ) /

Probabilidad de mayor desviacin, ambas colas

0.000

1.00

1.000

0.317

1.960

0.05

2.000

0.0455

2.576

0.01

3.000

0.0027

4.8. Transformaciones
En lo que sigue se har una sucinta referencia al tema de las transformaciones en estadstica, que bsicamente constituye un cambio de la escala en la cual se expresan las variables. Su inclusin en este punto se debe a que existen numerosas variables muestrales cuyas
distribuciones se alejan de la normal, y que se pueden normalizar mediante algn tipo de
transformacin, como por ejemplo, tomando los logaritmos de los valores originales. En esta
eventualidad se hablar de una transformacin logartmica de los datos. Como se ha mencionado, la importancia de obtener distribuciones normales es hacerlas accesibles a los mtodos
de anlisis que requieren la distribucin normal de los datos y pueden originar resultados
distorsionados o errneos si se aplican a muestras cuyas distribuciones se alejan en mayor o
menor grado de la normalidad.
[ 221 ]


Una modalidad frecuente de alejamiento de la normalidad consiste en la asimetra de la
distribucin, lo que ocurre cuando las colas no son similares, esto es, cuando una de ellas
presenta una mayor proporcin de observaciones alejadas de la media, con lo cual aparece
ms extensa o larga que la otra. Cuando la cola ms alargada es la izquierda se habla de
asimetra negativa, y cuando lo es la cola derecha, de asimetra positiva. Esta ltima es con
mucho la ms frecuente en las muestras biolgicas en general (Figura 4.6, A). La asimetra
derecha suele corregirse mediante la transformacin logartmica de los datos, es decir, tomando su logaritmo, habitualmente el logaritmo natural (con base en el nmero e = 2.7182),
aunque los resultados no se alteran con el cambio de base. Resulta ms o menos intuitivo,
que como los logaritmos de los nmeros mayores que 1 crecen con menor rapidez que stos,
los incrementos derechos ms extremos que experimentan los datos en las distribuciones con
asimetra derecha, tendern a ser contrabalanceados al tomar logaritmos. En la Figura 4.6
se observa la distribucin de la masa ventricular izquierda en 205 adultos sanos (datos de
Rodrguez y col, 2004), que exhibe ligera asimetra derecha, y su normalizacin mediante el
empleo del logaritmo de la misma.
Figura 4.6. A: Distribucin de frecuencias de la masa ventricular izquierda en gramos, en
205 individuos normales. Se observa ligera asimetra derecha. B: distribucin del logaritmo
natural de la masa ventricular. La distribucin se ha normalizado. En cada histograma se ha
superpuesto la curva normal.


La asimetra derecha tambin tiende a corregirse tomando la raz cuadrada de los datos o bien su inversa. La primera de estas transformaciones es algo menos fuerte, y ltima
es ms fuerte, que la transformacin logartmica. Cul de las tres emplear, es una cuestin
prctica que debe decidirse para cada caso en particular. Si bien es posible calcular el grado
de asimetra a partir de los datos muestrales, un mtodo sencillo y rpido para evaluarla es la
inspeccin visual de los histogramas de frecuencias tal como se muestran en la Figura 4.6. En
la misma puede verse que la transformacin logartmica tiende a producir un ligero exceso en
la correccin, con una leve asimetra izquierda. Una forma de comprobar que la asimetra ha
sido eliminada es evaluar la normalidad de la distribucin resultante, y para hacerlo existen
numerosos mtodos, entre ellos los de Kolmogorov-Smirnov y de Shapiro-Wilk, disponibles
en los paquetes estadsticos corrientes y de sencilla implementacin en ese entorno. En cuanto
[ 222 ]

al ejemplo de Figura 4.6, la transformacin logartmica produjo una distribucin normal de


los datos, pese a la mnima asimetra izquierda resultante. En tanto, la raz cuadrada de la
masa ventricular, si bien normaliz la distribucin, dej una ligera asimetra derecha residual
que no alcanz a corregir, y el test de Shapiro-Wilk demostr un ajuste a la normal ligeramente mejor para la transformacin logartmica.
Como se ha dicho, la normalizacin de las distribuciones es un requisito para la aplicacin
de una gran cantidad de tcnicas estadsticas, y en estos casos, las transformaciones necesarias
se aplican a los datos antes de ser utilizados en la evaluacin de las distintas hiptesis de trabajo.
Las diversas pruebas de hiptesis, como pueden ser las comparaciones entre medias muestrales
(Seccin 6 y siguientes), son efectuadas de esta manera con la variable transformada y normalizada. Un problema que surge en estos casos, es el retorno a las unidades originales y as, no es
posible obtener los lmites de confianza para una diferencia de medias (ver Seccin 6) a partir de
los valores transformados. Por lo dems, si bien no siempre puede obtenerse la normalizacin
de una distribucin dada, la mejora en el ajuste de los datos a una distribucin normal, puede
facilitar y hacer ms seguro el anlisis de stos. Las distintas tcnicas estadsticas que requieren
distribuciones normales pueden ser ms o menos sensibles al alejamiento de la normalidad de
las muestras, y las que lo son en menor grado, es decir las que toleran bien las desviaciones moderadas de la normalidad, son llamadas tcnicas robustas.
Aparte de la normalizacin de ciertas distribuciones muestrales, las transformaciones
presentan otras muchas propiedades importantes entre las que se cuentan hacer uniformes
las varianzas entre diversos grupos, que es requisito de muchos procedimientos estadsticos,
y linearizar algunas relaciones entre distintas variables, necesidad que puede surgir en estudios de regresin lineal y se comenta brevemente en la Seccin 9. Acerca de la asimetra de
las distribuciones en biologa, y del manejo prctico de las transformaciones ms utilizadas,
consultar Bland, 2006.

[ 223 ]

5. Muestreo. El desvo estndar


de la media o error estndar

5.1. Muestreo estadstico


En 2.1 se definieron los conceptos de muestra y poblacin. Se ha dicho que el objetivo
fundamental de la toma de muestras de poblaciones o muestreo, es obtener informacin acerca de dichas poblaciones. Esto se realiza mediante operaciones de inferencia estadstica que se
irn examinando en la Seccin 6 y siguientes. La ventaja del trabajo con muestras radica en
la obtencin de informacin acerca de conjuntos extensos, partiendo de muestras de dimensiones mucho ms pequeas. Si bien es posible pensar que con los recursos de computacin
disponibles y dejando de lado el volcado de los datos en las planillas de clculo, el tiempo y
el trabajo personal consumidos sern los mismos analizando muestras o poblaciones, existen dos razones muy evidentes a favor del muestreo, que slo se mencionarn: la primera es
el costo, en dinero y en tiempo, de cada observacin, que puede limitar en forma drstica
el estudio exhaustivo de una poblacin. La segunda, de igual importancia, es que muchas
poblaciones, si bien pueden estar bien definidas, slo pueden ser muestreadas en forma
incompleta por no estar todos sus elementos accesibles. Si por ejemplo se quiere estudiar el
universo de los individuos con enfermedad coronaria en una determinada regin geogrfica,
muchas veces ser imposible que todos los individuos de ese universo sean accesibles al muestreo, pues habr motivos de diversa ndole, entre otros, socioeconmicos, para que esto sea
as. Por ejemplo, se debera poder realizar una cinecoronariografa a todos y cada uno de los
individuos en los que fuera necesaria para aclarar el diagnstico.

Lo anterior lleva directamente a un punto clave: las muestras deben ser representativas de
las poblaciones de las que proceden. Aunque el proceso de muestreo implica de por s la prdida
de cierta cantidad de informacin, la mejor forma de asegurar un mximo de representatividad
a una muestra es obtenerla por muestreo aleatorio. Este se define como aqul en el que cada
muestra posible, tiene la misma probabilidad de ser elegida. La forma prctica de realizarlo
consiste en elegir los elementos de la muestra al azar, por ejemplo numerando los individuos de
donde se extraer la muestra y seleccionando los que han de ser incluidos en la misma mediante
nmeros aleatorios, lo que equivale a un sorteo en el cual cada sujeto tiene las mismas chances
de ser elegido. Existen numerosas formas de generar nmeros aleatorios, como un bolillero, y
tambin se hallan disponibles en tablas y en los paquetes estadsticos de computacin.
Pese a la randomizacin, los estadsticos muestrales como la media y la varianza pueden
diferir por azar, de la media y la varianza del universo (habitualmente simbolizadas y
[ 224 ]

respectivamente), y esto se conoce como error de muestreo. El error de muestreo no se puede


evitar pero s acotar, esto es, establecer con un nivel de confianza razonable, entre qu lmites
puede variar. En los prrafos siguientes se vern algunas cuestiones importantes relativas al
error de muestreo.
5.2. Varianza de las muestras y varianza de las medias

Uno de los temas importantes en el muestreo estadstico es el estudio de la variabilidad
de las muestras y su relacin con los parmetros de poblacin, que frecuentemente son estimados a partir de las mismas. En este sentido, es importante distinguir claramente la variabilidad de los individuos dentro las muestras, de la variabilidad de las medias de las muestras
dentro de la poblacin.
Al considerar una muestra o conjunto de individuos, si bien no es difcil representarse la
dispersin de los casos alrededor de la media, el concepto de variabilidad de las medias no resulta tan inmediato. Al respecto, ntese que si se toman varias muestras de la misma poblacin,
cada media x de una muestra puede ser considerada como un individuo dentro del conjunto
de medias obtenido. Ms formalmente, una media de una muestra puede ser considerada una
nueva variable, con su media, varianza y desvo estndar (obsrvese que la nueva media ser la
media de las x o media de las medias muestrales). Por ejemplo, de una poblacin se pueden
obtener varias muestras de, digamos, 10 individuos cada una, y hallar las medias del peso corporal. Estas medias se comportarn como una nueva variable, distinta del peso individual y que
se podra denominar peso promedio de 10 individuos. Esta nueva variable tiene dos propiedades: la primera es bastante evidente y es que su media estima o apunta a la media universal
de los pesos , de la misma manera en que lo hacen cada una de las medias muestrales x que se
usaron para calcularla. La segunda es la ms interesante y es que, su dispersin alrededor de la
media universal , medida por la varianza y el desvo estndar de las x, es menor que la varianza y el desvo estndar de la variable x original. En el ejemplo, haciendo determinaciones de las
medias del peso (x ) en varios grupos de 10 individuos, se encontrar que el conjunto de medias
as formado tiene varianza y desvo estndar menores que la varianza y el desvo estndar de
los individuos dentro de las muestras. De esta forma, la varianza y el desvo estndar de una
muestra se refieren a los individuos que la integran, y no sern los mismos que la varianza y el
desvo estndar de un conjunto de medias tomadas de la misma poblacin: las medias muestrales estn ms concentradas alrededor de la media de la poblacin que los individuos considerados aisladamente. Esto es as porque cada media contendr individuos de bajo, mediano
y alto peso corporal, de modo que su valor estar en general ms cerca del promedio universal
que los pesos de individuos aislados tomados al azar. De modo que promediar datos concentra
los resultados alrededor de la media universal , y los promedios exhiben siempre menor variabilidad que los datos aislados. Tambin es intuitivo que cuanto ms grande sea una muestra,
ms acotada estar la variabilidad de su media alrededor de la media universal.*

La relacin precisa entre la dispersin de las medias y el tamao de las muestras de donde
provienen, es la base de muchos procedimientos estadsticos fundamentales y se mencionar
* Este no es el caso de la varianza y el desvo estndar de la variable x estimados a partir de los datos muestrales,
cuyos valores oscilan alrededor de los respectivos parmetros de poblacin y , sin estar afectados por el tamao
de la muestra.

[ 225 ]

en los prrafos siguientes. De modo que, si en las secciones precedentes se ha hecho referencia
a la varianza y el desvo estndar de los individuos en las muestras, en lo que sigue se incorpora el concepto de variabilidad de las medias.
5.3. Esperanza matemtica, varianza y desvo estndar de la media muestral

La media universal est estimada por la media muestral x, de modo que el valor ms
aproximado que se puede adjudicar a es x , aunque debido a las variaciones aleatorias
del muestreo, raramente una media muestral proporcionar el valor exacto de la media del
universo (que por otra parte no suele ser conocido). Con todo, la media muestral x es un
estimador insesgado de la media universal , lo cual significa que obteniendo muestras y
promediando los valores de sus medias, el resultado tender a aproximarse cada vez ms a
, oscilando a su alrededor cada vez ms estrechamente, a medida que el nmero de medias
muestrales promediadas aumenta. Esto equivale a decir que la esperanza matemtica de la
media muestral es la media universal o de poblacin:

E (x) =
(5.1)

Conociendo el grado variabilidad de x alrededor de , una gran cantidad de procedimientos de inferencia estadstica se hacen posibles, y se demuestra que la varianza de la
media muestral es igual a la varianza poblacional dividida por el nmero n de elementos
que forman la muestra:


var (x) = / n
(5.2)

Esta relacin expresa que cuanto mayor es el tamao de la muestra ( n ) menor es la
varianza de la media muestral. As, duplicando el nmero de elementos de la muestra, la
varianza de la media se reduce a la mitad. Se hace evidente que al reducirse la varianza de
las medias muestrales, stas tendern a oscilar cada vez ms prximas al centro de la distribucin . Tambin es evidente que las medias muestrales x, que resultan de promediar dos o
ms x, tendrn siempre una varianza menor que la variable original x de la que proceden (Fig.
5.1)
El desvo estndar de la media muestral es, por definicin, igual a la raz cuadrada de la
varianza y se conoce tambin como error estndar de la media, designndose como ES (x) de
modo que:
Desvo estndar (x) = ES (x) = ( / n) = / n

(5.3)

El trmino error estndar tiene la ventaja de evitar confusiones con el desvo estndar
de la variable x, y es el desvo estndar de la media de las x o x. Por ser en esencia un desvo
estndar, el error estndar describe la dispersin de las medias muestrales alrededor del centro
de la distribucin representado por la media universal . Resulta evidente que el incremento del
nmero de casos de una muestra, al reducir la varianza de la media muestral x, reduce tambin
la magnitud del error estndar, de modo que ambos estimadores de la dispersin de x pueden
[ 226 ]

hacerse ms pequeos con slo aumentar el nmero de casos de la muestra. En las prximas
secciones se ver que estos hechos son fundamentales en inferencia estadstica, para la deteccin de diferencias significativas en situaciones donde hay involucradas medias muestrales.
Figura 5.1. Dispersin de los individuos y de las medias de muestras de 9 individuos, alrededor de la media de poblacin . La campana amplia representa la distribucin de los individuos y la campana angosta la distribucin de las medias.

El clculo de la varianza y el desvo estndar de x requiere conocer n, lo que es inmediato,


y conocer , lo que muchas veces no es posible al no estar todos los elementos del universo accesibles para la medicin y el clculo. Cuando existe tal imposibilidad, se ver que es posible
reemplazar por la varianza muestral s calculada como en (2.4), con algunas condiciones
restrictivas.

5.4. La distribucin de la media muestral x
Resulta intuitivo y es adems correcto, que si x es una variable normalmente distribuida, sus medias muestrales x, de las que se han visto ms arriba la esperanza, la varianza y
el desvo estndar, tambin seguirn la distribucin normal. Pero hay una extensin de lo
mencionado, de notable importancia en toda la teora estadstica, que concierne a la distribucin de las medias muestrales cualquiera sea la distribucin de la variable original x, y
que se fundamenta en el llamado teorema central del lmite, cuyo enunciado expresa que:
cualquier variable aleatoria, con tal que tenga una media y una varianza , tendr una
media muestral x cuya distribucin se aproxima a la normal cuando n se agranda indefinidamente (cuando n tiende a infinito). El hecho notable es que la distribucin original
de donde provienen las medias no necesita ser normal para que el teorema se cumpla; slo
es necesario que el nmero de elementos con que se calculan las medias sea arbitrariamente
grande. Los siguientes puntos ayudan a entender mejor el tema:
1. Las medias tienden a normalizar su distribucin a medida que aumenta el tamao de
las muestras utilizadas para calcularlas. Esta particularidad permite utilizar las aplicacio[ 227 ]

nes de la funcin normal, ampliamente estudiadas y conocidas, a los resultados obtenidos de


muestras que se sabe que difieren, a veces considerablemente, de la normalidad. Esto significa
que no es imprescindible evaluar exhaustivamente una distribucin si se trabaja con promedios de varias mediciones (o sea, con medias muestrales) y si el nmero en que se basan tales
mediciones es razonablemente grande: tales promedios tendrn distribuciones aceptablemente normales y se podrn analizar con los mtodos de la distribucin normal.
2. A pesar del requisito n tendiendo a infinito la aproximacin a la normal funciona en
general muy bien an con valores de n relativamente pequeos. Esto significa que la normalizacin de la distribucin de las medias, que ser completa cuando n tienda a infinito, a los
fines prcticos ya suele resultar suficientemente buena con tamaos muestrales relativamente
pequeos (por otra parte es til tener en cuenta que pequeas desviaciones de la normalidad no
suelen afectar sensiblemente los resultados de muchos tests estadsticos, que las toleran bien.
El tamao til de n depender en ltima instancia de la muestra y del destino que se dar a los
datos). Otras propiedades importantes de las medias muestrales se comentan a continuacin.
5.5. Esperanza matemtica y varianza de una diferencia de medias

La diferencia entre dos medias muestrales x 1 y x 2 aparece frecuentemente al comparar
muestras con el objeto de realizar inferencias acerca de las poblaciones que representan. Una
diferencia de medias x 1 x 2 , puede considerarse una nueva variable, y en este sentido, conviene conocer cules son su esperanza matemtica, su varianza y su desvo estndar.

La esperanza matemtica de una diferencia de medias muestrales x 1 x 2 es el valor al que
tiende dicha diferencia al promediarse un nmero indefinidamente grande de observaciones.
Por otra parte, puede demostrarse que la esperanza matemtica de una diferencia de medias
muestrales x 1 x 2 es igual a la diferencia entre las respectivas medias universales:
E (x1 x2) = 1 2

(5.4)

y que la varianza de dicha diferencia es igual a la suma de las respectivas varianzas muestrales:

var (x1 x2) = (1 / n1 ) + (2 / n 2)

(5.5)

siendo el desvo estndar igual a la raz cuadrada de la varianza, que por apreciaciones anlogas a las ya vistas en el prrafo anterior, se designa como error estndar de la diferencia:
ES (x1 x2) = (1 / n1) + (2 / n 2)

(5.6)


Otro dato importante es que, si las medias x 1 y x 2 tienen distribucin normal, su diferencia tambin la tiene. La utilidad de estos resultados se har ms evidente en las secciones
siguientes.
Anlogos resultados se aplican a las diferencias entre proporciones. Siendo p1 la proporcin de individuos que presentan una caracterstica determinada en una muestra de tamao
n1 extrada de un universo donde dicha proporcin es 1, y p2 la proporcin que presenta esa
[ 228 ]

misma caracterstica en una muestra de tamao n2 proveniente de un universo donde la proporcin es 2 , se demuestra que:
E (p1 p2) = 1 2
y

var (p1 p2) = [1 (1 1) / n1] + [2 (1 2) / n 2]

(5.7)
(5.8)

donde se ve que la varianza de la diferencia de proporciones (p1 p2) es igual a la suma de las
varianzas de cada grupo (4.4).
Se ha visto cmo una diferencia entre medias o proporciones muestrales puede manejarse
como una nueva variable, con una varianza que es igual a la suma de las varianzas de cada
variable. Esto encuentra aplicacin en las comparaciones entre muestras de las que se ocupa
la inferencia estadstica. Cabe agregar que los resultados vistos ms arriba para la diferencia
entre dos medias o proporciones muestrales, se aplican por igual a la suma, de modo que
tanto la suma como la diferencia de medias se distribuyen con una varianza que es la suma
de las varianzas originales de las muestras. Se ha subrayado el caso de las diferencias por ser
el ms empleado en los problemas de inferencia estadstica. Un requisito que debe cumplirse
para que la varianza estimada sea vlida, es que las muestras sean independientes, o sea
que no exista correlacin entre las muestras (seccin 9), pues en este caso la varianza total
se reduce y, lo que es importante, existen mtodos ptimos para aprovechar esta reduccin
de la variabilidad de la diferencia de medias cuando se trata de comparaciones y pruebas de
hiptesis entre datos correlacionados (seccin 7).

[ 229 ]

6. Inferencia estadstica

6.1. Generalidades.

La inferencia estadstica es el conjunto de procedimientos por el cual la informacin
contenida en las muestras se utiliza para hacer estimaciones relativas a los universos de los
que proceden. En cierto sentido, la informacin de las muestras se hace extensiva a los universos. Este proceso de generalizacin tiene sus fundamentos, procedimientos y limitaciones.
Por ejemplo, se demuestra que la media muestral es la mejor aproximacin a la media del
universo, y que la varianza muestral, provistas ciertas restricciones, es la mejor aproximacin
a la varianza del universo. Si bien el pasaje desde la informacin provista por las muestras hacia las estimaciones acerca de los universos implica cierta prdida de exactitud, el margen de
error de las estimaciones realizadas s puede calcularse exactamente. Por ejemplo, si bien al
estimar la media de un universo mediante la media de una muestra, la diferencia exacta entre
ambas no se puede llegar a conocer con exactitud, la probabilidad de que la media universal
se halle comprendida dentro de determinados lmites alrededor de la media muestral puede
ser calculada con precisin, y ste es uno de los aspectos ms caractersticos de la inferencia
estadstica.
En general, la inferencia estadstica se ocupa de dos tipos de aplicaciones: la estimacin
de parmetros u otras caractersticas de las distribuciones de las variables en los universos de
los que proceden las muestras, y la verificacin de hiptesis acerca de dichos universos. En
ambos casos la informacin es proporcionada por las muestras y la direccin de la inferencia
estadstica es de la muestra hacia el universo, posibilitando estimaciones y comparaciones
que de otra forma exigiran la medicin de todos los individuos del mismo. En lo que sigue
se examinarn algunos temas de inferencia estadstica con particular referencia a la distribucin normal.
6.2. Estimacin de parmetros de poblaciones. Estimaciones puntuales, intervalos
y lmites de confianza

Un ejemplo que ilustra la prctica de estimaciones mediante inferencia estadstica consiste en obtener informacin acerca de la media del universo () a partir de una media
muestral x de tamao n, conociendo el desvo estndar del universo (). En principio, la
propia media muestral x es la mejor estimacin de (es un estimador insesgado), y si bien
es improbable que coincidan exactamente, se espera que las probabilidades de x de hallarse
[ 230 ]

cerca de sean mayores que las de hallarse lejos. Este tipo de estimacin mediante un nmero que se espera se aproxime al parmetro estimado, se denomina estimacin puntual
(point estimate). Prosiguiendo, se puede desear tener una idea del grado de exactitud de la
estimacin puntual llevada a cabo por la media muestral x . Esto puede lograrse calculando
un intervalo alrededor de x , en el cual exista una probabilidad definida, digamos del 95%
o 0.95, de encontrar la media universal . El procedimiento tiene en cuenta que tomando
muestras de una poblacin normalmente distribuida, el 95% de las medias muestrales
x estar comprendido en el intervalo entre +1.96 y 1.96 errores estndar alrededor de la
media de poblacin , lo que equivale a decir que una muestra tomada al azar tiene el 95%
de probabilidades de contener la media en el intervalo dado por x 1.96 errores estndar
(ntese que el error estndar es el nombre del desvo estndar de x , igual a / n, [5.3]).
Por lo tanto, la diferencia entre x y estar en el 95% de los casos comprendida entre +1.96
y 1.96 errores estndar. En smbolos:
1.96 ( / n) < ( x ) < 1.96 ( / n)

(6.1)

con probabilidad igual a 0.95. Si se resta x de cada trmino y se reordenan las desigualdades,
se obtiene:
x 1.96 ( / n) < < x + 1.96 ( / n)

(6.2)

lo que expresa que la media del universo se hallar con probabilidad igual a 0.95, en el intervalo comprendido entre la media muestral x y 1.96 veces el error estndar a cada lado (prcticamente 2 veces el desvo estndar a cada lado de la media muestral). Dicho intervalo se
llama intervalo de confianza de la estimacin (en este caso, intervalo de confianza del 95%).
Sus lmites, esto es, x ms/menos 1.96 / n, son los lmites de confianza, en este caso, del
95%. En resumen, no conocemos con exactitud la media universal , pero la consideramos
muy prxima a la media muestral y su estimacin puntual es precisamente el valor de x, y
adems tenemos un nivel de confianza del 95% de que se halle dentro de los lmites de confianza calculados. La expresin nivel de confianza no debe entenderse como una expresin
de credulidad, sino en el sentido de que estamos seguros de que si repetimos la estimacin 100
veces, 95 veces estaremos en lo cierto y las restantes 5, equivocados. La ltima eventualidad
es el error de la estimacin y expresa la probabilidad de que la media universal se halle por
fuera de los lmites de confianza calculados, eventualidad que debe ser siempre tenida en
cuenta al analizar los resultados. Desde ya, el nivel y los correspondientes lmites de confianza pueden establecerse en otros valores y as, para P = 0.01 debe reemplazarse el valor 1.96
de la variable estandarizada z empleado ms arriba, por z = 2.58
Ejemplo 6.1
Supongamos que se conozca el desvo estndar de la glucemia en una determinada poblacin (esto es bastante difcil sin examinar la poblacin completa, aunque si est muy bien
estudiada podra llegar a tenerse una idea suficientemente aproximada, como se acepta en
este ejemplo). Supongamos que dicho desvo estndar es de 12 mg/dl. Si calculamos la media
[ 231 ]

muestral x en un grupo de 100 individuos de dicha poblacin y resulta ser de 88 mg/dl, cul
es el intervalo de confianza para la estimacin de la media de la poblacin, ?
En primer lugar, se acepta como el valor ms probable de la media de la poblacin, el de
la media muestral, 88 mg/dl. Esta es la estimacin puntual de . En cuanto al intervalo de
confianza, si aceptamos un nivel del 95% slo debemos reemplazar los datos en 6.2:
88 1.96 (12 / 100) < < 88 + 1.96 (12/ 100)

85.6 < < 90.4
de lo cual se puede inferir que debe estar comprendida entre 85.6 y 90.4 mg/dl, con un nivel
de confianza del 95%.
6.3. Hiptesis, evaluacin de hiptesis y pruebas de significacin estadstica.
Se ha visto cmo es posible depositar cierto nivel de confianza en que un determinado
intervalo obtenido a travs de una muestra contenga un parmetro universal como puede ser
la media de la poblacin. De acuerdo al ejemplo anterior y en forma muy general, debera
esperarse que las medias de otras muestras tomadas de la misma poblacin tendieran a caer
dentro del intervalo de confianza establecido para la media de la poblacin, y el hecho de
que esto no ocurriera debera alertar sobre la posibilidad de estar muestreando un universo
diferente. Este universo diferente podra corresponder, por ejemplo, al universo original modificado por una enfermedad o por un tratamiento, o bien a otro universo independiente sin
ninguna relacin con el primero. As, cuando se hallan diferencias entre dos o ms muestras,
es frecuente querer saber si pueden haberse dado por azar entre muestras que en realidad
pertenecen a un mismo universo, o bien, si las muestras pueden estar representando universos
diferentes. El chequeo de hiptesis y las llamadas pruebas o tests de significacin estadstica
se basan en estas ideas, que se examinan a continuacin.

Las hiptesis estadsticas son proposiciones, en general originadas en conocimientos previos sobre la materia, que se refieren a las caractersticas de las poblaciones involucradas en el
estudio. Estas proposiciones se evalan mediante el estudio de muestras extradas de dichas poblaciones. Una hiptesis puede ser, por ejemplo, el colesterol LDL difiere entre individuos con
y sin sndrome metablico o, el conjunto de individuos estudiados, con una glucemia media
de 102 mg/dl, pertenece a un universo distinto de otro cuya media es de 90 mg/dl. En el primer
caso se postula la existencia de dos universos, uno formado por los individuos con sndrome
metablico y otro por los individuos que no lo padecen. Ms exactamente, los universos estn
formados por las cifras de colesterol LDL en cada una de las dos condiciones. En el segundo
caso, la comparacin surge entre una media muestral, y la media de un universo terico. Para
evaluar una hiptesis, en general se necesitan muestras representativas de las poblaciones en
estudio. Como se ver, el mtodo consiste en comparar las medias u otros valores muestrales, y
a partir de ellos realizar las correspondientes inferencias acerca de las caractersticas de los respectivos universos. Si bien es muy frecuente estar interesado en las medias, las hiptesis pueden
referirse tambin a otros parmetros de las poblaciones, entre ellos las varianzas.
Como queda dicho, lo que se desea frecuentemente es establecer si existe una diferencia
entre los parmetros de dos universos: son diferentes las medias universales del colesterol
[ 232 ]

LDL en los individuos con y sin sndrome metablico, como lo sugieren las muestras? Las
glucemias del grupo en estudio, podran provenir de un universo con una determinada media? Las preguntas se refieren a los universos, mientras que los datos de los que se dispone
provienen de las muestras. El procedimiento corriente es establecer una hiptesis nula, segn
la cual no hay diferencias entre las poblaciones comparadas en lo que respecta a los parmetros que interesan: los niveles sricos de colesterol LDL seran los mismos en individuos con y
sin sndrome metablico, y la media de glucemia de la muestra pertenecera a una poblacin
con la misma media que la del universo con cuya media se desea comparar (y las diferencias
se deberan en cada caso, a las fluctuaciones del muestreo). Estas hiptesis nulas comnmente contraran las expectativas sugeridas por el examen de las muestras, pero sin embargo,
para afirmar que realmente existe una diferencia entre los parmetros de las poblaciones,
las hiptesis nulas deben ser puestas a prueba y deben poder ser rechazadas como altamente
improbables. Solo as ser lcito aceptar como verdadera la hiptesis alternativa, que es la que
suele presentar mayor inters por significar en general conocimientos nuevos acerca de las
poblaciones en estudio.

Los procedimientos por los cuales se evalan las hiptesis se denominan pruebas o tests
de significacin estadstica. Tales procedimientos consisten en el clculo a partir de los datos
muestrales, de ciertos valores o estadsticos (2.5), que como se ver, permiten determinar en
qu grado se acercan o se alejan los valores muestrales de aqullos esperados por hiptesis y,
en consecuencia, calcular la probabilidad de que una hiptesis sea verdadera. En el problema
del colesterol LDL, si fuera cierta la hiptesis nula que plantea que los niveles de colesterol
LDL son los mismos en individuos con y sin sndrome metablico, habra que esperar una
diferencia entre las medias muestrales, igual o muy prxima a cero. En este caso, la variable
que se examina en busca de informacin acerca de diferencias entre los universos con y sin
sndrome metablico es la diferencia entre las medias de cada una de las dos muestras: si
fuera muy distinta de cero se podra deducir que los respectivos universos deben diferir entre
s en lo que se refiere al colesterol LDL.
Para probar la hiptesis con variables normalmente distribuidas, la diferencia hallada
entre las medias de las dos muestras se divide por una estimacin de su error estndar ( 5.5)
para as poder apreciar la magnitud de su desviacin de cero en los trminos de una variable
estandarizada. En el siguiente apartado se vern algunos detalles del procedimiento.

Los estadsticos calculados a partir de las muestras, como las diferencias entre medias,
siguen funciones de probabilidad ya tabuladas y permiten estimar la probabilidad (P) de que
esas diferencias hayan ocurrido por azar de muestreo. Si esa probabilidad es grande, se acepta que las diferencias encontradas pueden haberse debido simplemente a las fluctuaciones
del muestreo y, en el caso del colesterol LDL habra que aceptar la hiptesis nula de medias
iguales y no habra motivo para suponer que el colesterol LDL de los individuos con sndrome metablico constituya un universo diferente al del colesterol LDL de los individuos sin
el sndrome. Si por el contrario, la probabilidad de una diferencia igual o mayor a la hallada
es muy baja, digamos P < 0.05, debemos aceptar que una diferencia tal, difcilmente pueda
provenir del azar al muestrear un mismo universo, y que las diferencias observadas en las
muestras representan diferencias reales existentes entre distintos universos. En el ejemplo,
habra que aceptar que individuos con y sin sndrome metablico deben tener niveles diferen[ 233 ]

tes de colesterol LDL. En esta eventualidad, la hiptesis nula sera rechazada y la hiptesis
alternativa, de distintos niveles de LDL, sera automticamente aceptada.
El valor de P, que se adopta antes de realizar la prueba de significacin, se denomina
nivel de significacin y el test, en caso de motivar el rechazo de la hiptesis nula, es declarado
estadsticamente significativo en el nivel elegido, por ejemplo P = 0.05. El rechazo de la hiptesis nula no significa la certeza absoluta de que el colesterol LDL difiera entre los grupos
comparados, ya que si se acepta que una diferencia como la observada se puede obtener por
azar el 5% de las veces muestreando un mismo universo o dos universos iguales respecto del
colesterol LDL, no hay garanta absoluta de que este no sea nuestro caso, pero es un riesgo
que se acepta correr, pues de lo contrario no hay inferencia posible. Queda un nivel de incertidumbre del 5% al rechazar la hiptesis nula, y es un hecho caracterstico de la inferencia
estadstica que la cuanta de esa incertidumbre pueda ser calculada con exactitud.

Las pruebas de significacin pueden realizarse en pares de muestras o en grupos de tres o
ms muestras a la vez. Por ejemplo, pueden compararse las medias de la presin arterial bajo
tres o ms tratamientos diferentes, originndose comparaciones mltiples. Estas se realizan
mediante procedimientos especiales que son extensiones de los mtodos utilizados para la
comparacin de pares de muestras y se esbozarn en la Seccin 10.
En lo que sigue se examinar con cierto detalle el procedimiento para comparar medias
muestrales cuando las variables son continuas y siguen la distribucin normal o de Gauss.
Esto ayudar a comprender mejor la forma en que se llevan a cabo los procedimientos de la
inferencia estadstica. Por su parte, los programas computarizados evitarn gran cantidad de
clculo numrico, ya que slo requieren la entrada de los datos muestrales y la eleccin entre
los procedimientos disponibles.
6.4. Comparaciones entre medias de variables con distribucin normal
Al comparar dos medias muestrales la hiptesis nula ms frecuente suele ser que las medias de los respectivos universos son iguales y que las diferencias observadas entre las medias
muestrales se han debido al azar. En general lo que se busca son diferencias entre los universos o poblaciones y como ya se ha dicho, la forma de poder afirmarlas es tener suficientes
argumentos como para rechazar la hiptesis nula, es decir, como para poder demostrar que
dicha hiptesis tiene muy bajas probabilidades de ser cierta. Denotando las medias de los
universos con 1 y 2 , si la hiptesis nula es verdadera entonces debe ser 1 2 = 0, y en este
caso la diferencia entre las medias de las muestras x 1 x 2 debera tambin ser o estar muy
prxima a cero. De modo que, cuanto mayor sea la diferencia hallada entre las medias de las
muestras, mayor ser la evidencia en contra de la hiptesis nula.

La clave para evaluar la diferencia encontrada entre las medias muestrales, es tomar en cuenta que esta diferencia es una nueva variable, cuya distribucin es normal si lo es la distribucin de
x 1 y x 2 , y cuyo valor esperado por hiptesis nula es cero (ver Fig. 6.1 y Ejemplo 6.2). De esta forma,
lo que se evala es el grado de alejamiento de la diferencia de medias hallada en las muestras,
x 1 x 2 , del valor 0 esperado por hiptesis nula. Formalmente, se compara la diferencia de medias
muestrales con la diferencia de medias universales de la hiptesis nula, esto es: (x 1 x 2) (1
2), y como el segundo trmino es igual a cero, la prueba de la hiptesis se reduce a evaluar si la
diferencia de medias hallada en las muestras se aleja significativamente de cero.
[ 234 ]


La diferencia x 1 x 2 tiene un desvo estndar, que al tratarse de medias se denomina
error estndar y se calcula como se vio en 5.5, ecuacin (5.6). Dividiendo la diferencia x 1
x 2 por su error estndar, dicha diferencia queda expresada en unidades de desvo estndar,
como una variable estandarizada z:
z = (x 1 x 2) / ( 1 / n1 ) + ( 2 / n 2 )

(6.3)

donde el denominador es idntico a (5.6) y corresponde al error estndar de una diferencia de


medias. La variable z es el estadstico de prueba para la hiptesis nula de medias universales
iguales. La probabilidad de encontrar medias muestrales que presenten por azar diferencias
iguales o mayores que las encontradas, se obtiene de las tablas de la distribucin normal
(4.7.1). Se insiste en que la variable z es nada ms que la diferencia entre las medias muestrales experimentales expresada en unidades de desviacin estndar para poder encontrar
sus probabilidades en las tablas corrientes de la distribucin normal. Como puede observarse
en la Fig. 6.1, la diferencia entre las medias muestrales x 1 x 2 se comporta como una nueva
variable, con su campana de distribucin normal centrada alrededor de la media de dichas
diferencias de medias (ver el ejemplo 6.2).
En la ecuacin 6.3, x 1 y x 2 se obtienen directamente de las muestras, siendo n1 y n2 el
nmero de casos en cada una de las muestras. Para aplicar 6.3 har falta una estimacin de
las varianzas 1 y 2 de los universos de los que provienen las muestras, ya que estos parmetros no son conocidos. Provisto que el tamao de las muestras sea suficientemente grande,
digamos no menor de 100 observaciones en cada una, una buena aproximacin puede obtenerse reemplazando las varianzas universales desconocidas por sus respectivas estimaciones
muestrales s1 y s2, que son las varianzas de las muestras (calculadas segn 2.5.2, ecuacin
[2.4]). En este caso, 6.3 se convierte en:
z = (x 1 x 2) / (s1 / n1) + (s2 / n 2)

(6.4)

Si se trata de muestras chicas es conveniente emplear distribuciones ligeramente diferentes de


la normal estndar (Seccin 7). En el siguiente ejemplo se expone el procedimiento de comparacin de dos medias muestrales y se agregan algunos detalles adicionales.
Ejemplo 6.2. Comparacin de dos medias muestrales
Se obtiene una muestra de 100 individuos con sndrome metablico (SM) y una muestra
de 100 individuos de una poblacin sin enfermedad nutricional conocida (grupo control,
C). Las respectivas medias muestrales del colesterol LDL son x SM = 145.9 mg/dl y x C = 134.6
mg/dl. Las varianzas muestrales se obtienen como en (2.4) y para ahorrar trabajo rutinario
se dan ya calculadas: sSM =236, y s C = 253. Se desea saber si la diferencia hallada entre las
dos muestras expresa una diferencia existente entre las respectivas poblaciones, o si puede
haberse producido por azar del muestreo
1. Hiptesis: el colesterol LDL est elevado en el grupo con sndrome metablico respecto
de los controles sin el sndrome.
[ 235 ]

2. Hiptesis nula (H0): el colesterol LDL no es afectado por la presencia de sndrome metablico, con lo que las medias son las mismas para los respectivos universos y la diferencia
observada entre las medias muestrales se ha dado por azar. La hiptesis nula queda planteada como la igualdad de las medias universales:
H0: SM = C
por lo que su diferencia debe ser cero:
SM C = 0

Si no resulta posible rechazar esta hiptesis tampoco ser lcito aceptar que se ha encontrado una diferencia significativa entre los dos grupos en estudio.
3. Eleccin del nivel de significacin de la prueba. El valor de P a partir del cual se rechazar la hiptesis nula debe elegirse antes realizar la prueba de significacin. Habitualmente
se elige P = 0.05 o P = 0.01. Se optar por el primero.
4. Prueba de la hiptesis: el estadstico z y la obtencin de P. La pregunta que la prueba de
significacin debe contestar es: Cul sera la probabilidad de obtener una diferencia igual o
incluso mayor que la observada, si la hiptesis nula fuera verdadera, es decir, si no hubiera
diferencias entre las medias universales de individuos con y sin sndrome metablico?
Como se ha dicho, la diferencia entre las medias (x SM x C) es una nueva variable, que
en el presente par de muestras tiene un valor igual a 145.9 mg/dl 134.6 mg/dl = 11.3 mg/
dl. Si se repitiera el experimento de la toma de pares de muestras de los grupos en estudio, se
observara que las diferencias entre los pares de medias de cada experimento se distribuyen
en una campana normal alrededor de un valor central. Este valor representara el promedio
de las diferencias entre pares de medias en varias repeticiones del experimento. Esta media
de las diferencias, si fuera cierta la hiptesis nula, debera oscilar alrededor de cero. El valor
obtenido fue 11.3 mg/dl. En la Fig. 6.1 se observa la distribucin terica de las diferencias
entre pares de medias para los datos del ejemplo, con centro en el valor muestral 11.3 mg/
dl. Puede observarse que el valor 0 esperado por hiptesis nula queda hacia la cola izquierda
de la campana normal trazada en base a los datos muestrales, muy lejos de su centro de 11.3
mg/dl. Ser muy difcil seguir aceptando la hiptesis nula, pues la diferencia entre las medias
muestrales est muy lejos de cero y as, es demasiado grande como para admitir que podra
haberse dado por azar sin que los universos sean diferentes.

[ 236 ]

Figura 6.1. La diferencia entre dos medias muestrales es otra variable, que en el ejemplo 6.2
tiene un valor igual a 11.3 mg/dl. Este valor se compara con la hiptesis nula que propone que
la media de poblacin para la diferencia de medias vale cero.


La correspondiente prueba de significacin consiste en estimar si la distancia entre el
valor de la diferencia de medias obtenido en el experimento (x SM x C = 11.3 mg/dl ) y la
diferencia de medias esperada por hiptesis nula ( SM C = 0 mg/dl), es suficientemente
grande como para rechazar esta ltima. Siendo la diferencia (x SM x C) una variable normal,
hay que dividirla por su error estndar para expresarla en unidades de error estndar como
variable estandarizada z y as poder comprobar en tablas de la distribucin normal, si se
aleja o no significativamente del cero de la hiptesis nula. La variable z es el estadstico de
prueba. Su clculo se obtiene directamente de ( 6.4 ), reemplazando por los valores muestrales:
z = (x1 x2) / ( s1 / n1 ) + ( s2 / n 2 )
= (145.9 134.6) / ( 236 / 100 ) + ( 253 / 100 )
= 11.3 / 2.21 = 5.11
donde el numerador es la diferencia de las medias muestrales y el denominador estima el
error estndar de la diferencia de medias. Las varianzas muestrales (sSM = 236 y s C = 253)
se calculan directamente segn ( 2.4 ) y el nmero de casos, n SM y nC , es igual a 100 en ambas
muestras.

La probabilidad de encontrar valores de z iguales o mayores por azar de muestreo, se
obtiene directamente de tablas de la distribucin normal. En la tabla 4.1 se puede ver que
un desvo mayor de 3 se puede esperar por azar en menos de 3 casos por mil, de modo que
el desvo obtenido, que es mucho ms grande, implica probabilidades extraordinariamente
bajas de haber sido obtenido por azar muestreando universos con medias idnticas.
5. ltimo paso: aceptacin o rechazo de la hiptesis nula. En base a lo anterior corresponde el rechazo de la hiptesis nula por altamente improbable. Esto implica automticamente
aceptar la hiptesis alternativa, o sea, que las medias de los universos SM y C difieren sig[ 237 ]

nificativamente. El nivel de significacin de la prueba o valor de P es, como se dijo, mucho


menor que 1 en 10000, lo que se expresa como P < 0.0001 y excede holgadamente el nivel P
< 0.05 adoptado al comienzo de la prueba.
En este ejemplo se vio la forma de realizar comparaciones entre medias muestrales, bajo
la hiptesis nula de medias universales iguales, 1 2 = 0. Una gran cantidad de pruebas con
anlogos fundamentos pueden emplearse para evaluar otras hiptesis nulas donde la diferencia postulada entre las medias universales sea distinta de cero. En este caso, el numerador de
(6.3) y (6.4) deber expresarse [(x 1 x 2) (1 2)], ya que la diferencia 1 2 ser distinta
de cero.

Otras inferencias posibles se refieren a la comparacin de una media muestral con una media universal conocida o hipottica. En este caso se trata de una sola muestra. Aqu la hiptesis
nula es que la diferencia entre la media muestral x y la media universal con la que se compara,
0 , es igual a cero, con lo cual el numerador del estadstico de prueba (6.3) y (6.4) queda expresado por x 0. El error estndar de la media se estima a partir de la nica muestra disponible
y queda expresado por ( / n) = / n (5.3). Si no es conocido, puede reemplazarse por el
desvo estndar de la muestra, s, con lo cual el estadstico z toma la forma:
z = (x 0) / (s / n)

(6.5)

Ejemplo 6.3. Comparacin de una media muestral con una media universal hipottica
En una muestra de 100 individuos se midi una glucemia media x = 102 mg/dl, siendo
el desvo estndar de la muestra s = 16 mg/dl. Puede afirmarse que el universo del que proviene la muestra tiene una media mayor que la de un universo terico cuya media es 0 = 90
mg/dl?
Para contestar afirmativamente se debe poder rechazar la hiptesis nula de que ambos
universos tienen la misma media, esto es, que x 0 = 0. La magnitud de la desviacin de 0 exhibida por la diferencia entre la media muestral y la media del universo hipottico, se evala
mediante el cociente de prueba (6.5). Reemplazando por los datos del problema se obtiene:
z = (102 90) / (16 / 100) = 7.5
Este resultado expresa que la diferencia entre la media muestral y la media terica con la
que compara, es igual a 7.5 errores estndar. En tablas de la distribucin normal se obtiene
para z = 7.5 una probabilidad muy inferior a 0.0001, lo que significa que una diferencia igual
o mayor que la observada es altamente improbable de ser obtenida de universos con la misma
o muestreando un mismo universo. En base a esto corresponde el rechazo de la hiptesis
nula y la aceptacin de la hiptesis alternativa, o sea, que el universo del cual procede la
muestra y el universo con el que se compar tienen medias que difieren significativamente.
El nivel de significacin de la prueba se puede expresar como P < 0.0001 (si bien P < 0.05
tambin es verdadera, P < 0.0001 es ms exacta).

[ 238 ]

6.5. Resumen y comentarios sobre evaluacin de hiptesis


Resumiendo lo anterior, la evaluacin de hiptesis estadsticas consta de los siguientes
pasos:

1. Enunciado de la hiptesis de trabajo y de la hiptesis nula. Esta deber poder rechazarse como nica forma de aceptar una hiptesis alternativa.

2. Adopcin de un nivel P de significacin para la prueba.

3. Clculo de los estadsticos de prueba a partir de los datos muestrales. En el caso de
la comparacin de medias se trata de desviaciones estandarizadas de los valores muestrales,
cuyas probabilidades en el marco de distintas hiptesis son estimadas mediante tablas de
las correspondientes distribuciones (en los ejemplos que preceden, se trata de la distribucin
normal).

4. Comprobacin en tablas del nivel de probabilidad P del estadstico utilizado.

5. Aceptacin o rechazo de la hiptesis nula.


Los siguientes puntos completan conceptos importantes sobre inferencia estadstica:
6.5.1. Cmo afecta los resultados el tamao de las muestras
El nmero relativamente grande de individuos ha tenido un papel importante en el resultado del segundo ejemplo, al reducir el error estndar de la diferencia de medias, que se
obtiene dividiendo las varianzas por n, en nuestro caso por 100 = 10. Si en vez de 100, la
comparacin se hubiera hecho con muestras de tamao 10, puede comprobarse fcilmente
con los datos consignados ms arriba, que el error estndar de la diferencia de medias hubiera
sido igual a 6.99. Con este valor, z es igual a 11.3 / 6.99 = 1.61, muy por debajo de 1.96, que
es el valor de z para P = 0.05. En esta eventualidad, la hiptesis nula no hubiera podido rechazarse y tampoco sostener la hiptesis alternativa, esto es, que las medias del LDL difieren
significativamente entre los dos grupos. De modo que las muestras grandes, al implicar un
menor error estndar, facilitarn la deteccin de diferencias significativas y, a la inversa, las
muestras pequeas dificultarn la deteccin de diferencias significativas entre las muestras.

6.5.2. Pruebas de significacin a una cola y a dos colas
En general, si no se expresa lo contrario, se entiende que el nivel de significacin en
pruebas como las que hemos visto se determina tomando en consideracin las desviaciones o
apartamientos de la hiptesis nula en cualquiera de las direcciones posibles: en el ejemplo del
colesterol LDL se calcula la probabilidad de una diferencia de medias igual o mayor que la
observada, sea que el mayor LDL se observe en el sndrome metablico (como ocurri) o en
los controles. De modo que la diferencia entre las dos medias muestrales se toma en cuenta
por su magnitud y no por su signo: la hiptesis nula postula iguales niveles de colesterol LDL
en las dos poblaciones de donde proceden las muestras, y al rechazarla queda implcito que
cualquiera de las dos muestras poda haber exhibido la mayor de las medias. Admitiendo que
las diferencias observadas podran haber ocurrido por azar del muestreo en cualquier sentido, con x 1 mayor o bien menor que x 2 , la probabilidad de tales desviaciones queda repartida
en las dos colas de la curva de distribucin de probabilidades, como se ve en la Figura 6.2,
A. Este tipo de test se denomina a dos colas, y a cada cola le corresponde la mitad de las
[ 239 ]

probabilidades correspondientes al nivel de significacin del test. Cuando P se fija en 0.05, a


cada cola corresponde P = 0.025.
Por otra parte, si hubiera un motivo para estar seguro que la diferencia entre muestras
slo se puede dar en un sentido, por ejemplo x 1 > x 2 pero nunca x 1 < x 2 , estara justificado
evaluar la probabilidad de un desvo de la hiptesis nula solamente en el sentido en que ste
es posible. Este podra ser el caso de placebo contra droga, donde no sera de esperar la superioridad del placebo y por lo tanto, slo interesara saber si una diferencia observada a favor
de la droga activa puede ser calificada como estadsticamente significativa. En este caso, la
probabilidad se calcula de modo que la variable estandarizada z deje todo el valor de P aceptado como nivel de significacin para la prueba, en uno de los extremos de la distribucin.
Para dejar en una sola cola una determinada P, digamos P = 0.05, se necesita una menor
desviacin de z de la hiptesis nula que cuando la probabilidad se divide en 0.025 para cada
cola. En consecuencia, el test a una cola resulta significativo con menor valor absoluto de
z que el correspondiente test a dos colas, lo cual puede visualizarse en la Figura 6.2, B. Por
ejemplo, en las pruebas a dos colas vistas en los ejemplos anteriores, para un nivel P = 0.05 se
requiere z = 1.96, mientras que si la prueba es a una cola, z = 1.65. Esto da mayores chances
de encontrar diferencias significativas con el test a una cola.
Figura 6.2. A: Prueba de significacin a dos colas. B: Prueba de significacin a una cola. En
ambos casos las desviaciones se dan en variable estandarizada z. P = 0.05. Para alcanzar la
misma P se necesita una menor desviacin z con el modelo a una cola.


De acuerdo a lo dicho, practicar una prueba a una cola puede ser una oportunidad para
producir una diferencia significativa donde el test a dos colas no la detect. Por este motivo,
la decisin de utilizar pruebas a una cola debe ser tomada antes de realizar el clculo de P,
y debe estar muy slidamente fundada, ya que es posible que rinda un exceso de resultados
significativos, por lo cual nunca debera utilizarse ante el fracaso de la prueba a dos colas.
Asimismo, la decisin de realizar una prueba a una cola nunca debe ser tomada luego de
examinar las muestras y ver cmo se disponen las medias. Por estas razones, el consenso es
que, salvo circunstancias muy especiales, siempre debera utilizarse la prueba a dos colas, an
[ 240 ]

cuando parezcan existir buenas razones para que cualquier diferencia slo pudiera darse en
un solo sentido, como en el ejemplo del placebo versus droga.
6.5.3. Formas de expresar el nivel de significacin
Se ha dicho que en medicina frecuentemente se acepta P = 0.05 como un nivel de significacin suficientemente convincente para rechazar una hiptesis nula. Ciertamente que si el
nivel de significacin de una prueba es mayor an, digamos P = 0.01 o P = 0.001, la incertidumbre se reduce en forma proporcional y la evidencia producida por el test es ms fuerte.
A cada valor de z corresponde un valor definido de P, y los programas de clculo estadstico
los proporcionan en forma rutinaria. De modo que puede darse el valor exacto de P, ya que
ser evidente si tal valor es mayor o menor que el nivel de significacin adoptado. Estas cifras
exactas pueden dar una mejor idea del desvo que presenta z y del grado de significacin alcanzado.

La opcin de aproximar los valores de P a cifras redondeadas y de cmoda lectura, como
0.05, 0.01 o 0.001, es tambin vlida pero menos exacta, y se lleva a cabo expresando P como
menor que el valor que ms se le aproxime. As, si P = 0.0008 puede informarse P < 0.001.
Es obvio que en este caso tambin es verdadero que P < 0.05, pero esta expresin no informa
la alta significacin del resultado.
6.5.4. En una comparacin de medias, el rechazo de la hiptesis nula implica que sta no
se halla comprendida en el intervalo de confianza de la diferencia de medias
Esto relaciona las pruebas de hiptesis con la determinacin de los intervalos de confianza para los parmetros de las poblaciones. Por ejemplo, calculemos el intervalo de confianza
para la diferencia de medias entre los individuos con y sin sndrome metablico, SM C del
Ejemplo 6.2. Dicho intervalo se calcula a partir de las respectivas medias muestrales, segn
la ecuacin empleada en Ejemplo 6.1 para el clculo de intervalos de confianza:
x 1.96 / n < < x + 1.96 / n
Reemplazando x por la diferencia entre las medias muestrales y / n por el error estndar de la diferencia, se tiene:
11.3 (1.96 2.21) < 11.3 < 11.3 + (1.96 2.21) = 6.97 < 11.3 < 15.63
con un nivel de confianza del 95%. El valor ms probable de la diferencia de las medias
universales est en la diferencia muestral 11.3, y slo en el 5% de los casos ser menor que
6.97 o mayor que 15.63. Es fcil comprobar que tomando 3 errores estndar a cada lado, el
intervalo de confianza se extiende entre 4.67 y 17.93, y la media universal se encontrar fuera
de estos lmites en menos de 3 de cada mil pruebas (P = 0.0027). En cualquier caso, queda
excluido el 0, que es la diferencia que postula la hiptesis nula. En otras palabras, es altamente improbable que la diferencia entre la media de las poblaciones sea cero, como propone la
hiptesis nula. Esto equivale a su rechazo, llegndose al mismo resultado que en el Ejemplo
6.2, donde se evala la diferencia de medias contra la hiptesis nula de diferencia cero.
[ 241 ]

6.5.5. Si se toman en cuenta todos los elementos de los universos, no tiene sentido hablar
de diferencias significativas entre las medias
Cuando se habla de diferencias significativas entre medias muestrales se est haciendo
referencia a diferencias muestrales que expresan diferencias entre sus respectivos universos.
Se infiere a travs de muestras, la existencia de diferencias entre universos, por lo comn inaccesibles en su totalidad o que, por algn motivo, no han sido evaluados ntegramente. Por lo
tanto, siempre hay un nivel de confianza y una probabilidad de error asociados con este tipo
de apreciaciones fundadas en muestras. Por el contrario, si dos universos han sido medidos
en todos sus elementos y se halla que sus medias no son iguales, no tiene sentido preguntarse
si existe una diferencia significativa entre las medias pues la diferencia existe y ha sido puesta
en evidencia fuera de toda duda al medir ambos universos en la totalidad de sus individuos. El
trmino significativa se refiere a la confianza que generan las muestras en que la diferencia
no se limita a ellas mismas y puede por lo tanto hacerse extensiva a los universos. Pero si no se
trata de muestras, sino de los universos ntegramente medidos en todos sus elementos, cualquier diferencia hallada, pequea o grande, simplemente existe y no tiene sentido preguntar
si es significativa. S tendra sentido, en cambio, preguntar si la diferencia tiene importancia
mdica.
Por otra parte, es frecuente asociar el trmino significativa con importante, cosa que
debera evitarse, ya que diferencias muy pequeas entre muestras, pueden ser significativas,
esto es, denotar diferentes universos de procedencia y con todo, tener muy poca importancia
prctica (en lenguaje coloquial el trmino significativo tambin tiene la acepcin de importante, y en este sentido puede ser utilizado lcitamente, siempre que no ocasione ambigedades en la interpretacin).
6.6. Rechazo errneo de una hiptesis nula verdadera: Error alfa.

Qu ocurre si rechazamos la hiptesis nula y aceptamos una diferencia como estadsticamente significativa en un nivel P = 0.05, y en realidad las muestras estudiadas se hallan dentro
del 5% de los casos en que se pueden observar diferencias iguales o an ms extremas, solamente por azar y siendo que no existen diferencias entre las correspondientes poblaciones?
Cometemos un error conocido como error alfa. Si se realizan 100 comparaciones entre muestras extradas del mismo universo, en alrededor del 5% de los casos, esto es unas 5 veces, se
encontrarn diferencias significativas a nivel P = 0.05, como sera de esperar si efectivamente
se estuvieran analizando universos diferentes.
Si bien no tiene mayor sentido realizar un experimento como el mencionado, la probabilidad de encontrar diferencias significativas en realidad inexistentes es mucho ms peligrosa
cuando el investigador las cree posibles o an las espera, de acuerdo a sus hiptesis de trabajo.
Como se dijo, este es un riesgo inherente al procedimiento y exige siempre cautela en la interpretacin de las pruebas estadsticas, as como un juicio crtico cuidadoso al leer los informes.

Un hecho de la mayor importancia es que, si se realizan comparaciones mltiples, ser
inevitable obtener algunos resultados donde diferencias muestrales que aparecen significativas no traduzcan la realidad de los correspondientes universos. El problema de las comparaciones mltiples es de la mayor importancia y existen diversas tcnicas para abordarlo, que
se comentarn sucintamente en la Seccin 10.
[ 242 ]

Por otra parte, un recurso contra el error alfa es hacerlo ms pequeo reduciendo el nivel
de significacin de las pruebas, por ejemplo del 5% al 1%, con lo cual el riesgo de caer en
el mismo ser de una vez en cien. El precio que se paga es aumentar las chances de que las
comparaciones no alcancen el nuevo nivel de significacin exigido, y se pierdan hallazgos que
efectivamente sealen diferencias entre las poblaciones muestreadas. El nivel de error alfa
con el que se elige trabajar depende en parte del rigor que se quiere dar a las conclusiones.
Asimismo, nunca debe olvidarse que la interpretacin de los resultados de las evaluaciones
de hiptesis debe estar sujeta al criterio del investigador, quien suele tener conocimientos
fundados acerca de la materia en estudio y debe dar el peso correspondiente a los diversos
hallazgos. Si un resultado altamente significativo parece contradecir conocimientos previos
bien establecidos, debera ser evaluado cuidadosamente, ya que si bien puede sealar un hecho novedoso, podra tambin deberse a un caso de error de tipo alfa.
6.6.1. Necesidad de la publicacin de los resultados negativos

Una forma fundamental de evitar el dao potencial producido por la aceptacin de diferencias inexistentes debido al error alfa, es la publicacin de los resultados negativos, es decir,
de los resultados donde dichas diferencias hubieron de ser rechazadas. Frecuentemente se
buscan diferencias significativas a favor de distintas drogas y procedimientos y el hallazgo de
tales diferencias ocasiona su inmediata publicacin y difusin. Si hay suficientes datos y estudios que lo corroboren, el hallazgo tendr el respaldo necesario. Pero en los casos en los que
prima el entusiasmo teraputico es posible que las corroboraciones no se esperen demasiado
y los investigadores se involucren en conclusiones que a la larga son enmendadas por nuevos
conocimientos, aunque a veces esto tarde en llegar. A esto se suma el hecho de que, en general,
los hallazgos de diferencias significativas tienden a recibir prioridad y a ser publicados con
mayor frecuencia que los resultados negativos, tanto por los autores como por los editores
(publication bias). En este punto, la publicacin de resultados donde otros investigadores no
hayan encontrado diferencias a favor del nuevo tratamiento, obliga fuertemente a los sostenedores del mismo a reforzar las evidencias a favor, por ejemplo mediante nuevas evaluaciones
y ensayos clnicos. As, conviene no atender a la difundida creencia de que los estudios que
no hallan diferencias son inservibles. Ms an, la difusin de tales estudios es un control
efectivo contra las aceptaciones prematuras de resultados auspiciosos, que si bien pueden
deberse a fallas en el diseo de las investigaciones, tambin pueden originarse en el error de
tipo alfa, en especial cuando se realizan mltiples comparaciones sobre muestras divididas en
un nmero grande de subgrupos y evaluando distintos resultados teraputicos posibles.
6.7. Falla en la deteccin de una diferencia que realmente existe: Error beta
En 6.5.1 se mencion la posibilidad de que muestras pequeas no permitan detectar una
diferencia existente entre medias de distintos universos, esto es, que el nivel de significacin
alcanzado no sea suficiente para rechazar la hiptesis nula, an cuando la hiptesis alternativa
fuera cierta. En esta eventualidad, la hiptesis nula no ser rechazada y se aceptar que no existen diferencias significativas entre universos que en realidad difieren entre s. Este tipo de error
se conoce como error beta. La posibilidad de incurrir en este tipo de error debe ser especialmente tenida en cuenta cuando habiendo motivos bien fundados para pensar que deben existir
[ 243 ]

diferencias, stas no se han podido poner en evidencia en las muestras analizadas. Desde ya, el
ensayo con muestras ms grandes suele ser el recurso ms til contra el error beta.
El error beta se expresa, como el error alfa, por un valor de P, pero ahora con el significado de probabilidad de no detectar una diferencia que realmente existe, entre las medias de
diferentes universos. La definicin debe ampliarse a cualesquiera que sean las caractersticas
o parmetros de poblacin que se estn considerando. En general el error beta es ms tolerado
que el alfa, aunque las conclusiones a las que lleva son igualmente errneas. Sin embargo, es
ms comn que el error beta slo postergue o dilate los hallazgos, siendo ms difcil que por
su causa se tomen decisiones imprudentes, aunque esta afirmacin es muy general y por ejemplo, debido a este tipo de error podran llegar a pasarse por alto consecuencias indeseables de
diversos tratamientos, que sera importante conocer con certeza.
Si el error beta es del 10% o sea, P = 0.10, en una de cada diez veces el test de significacin fallar en detectar una diferencia significativa, pero la encontrar en las nueve restantes.
Estas nueve veces de cada diez representan la potencia de la prueba estadstica. Por lo tanto,
la potencia de un test es la probabilidad complementaria del error beta:
Potencia = 1 error beta

(6.6)

Por otra parte, el error beta depende del nivel aceptado de error alfa, del desvo estndar
de las variables implicadas y del tamao de las muestras. La probabilidad de error alfa queda
fijada al elegir el nivel de significacin para una prueba, y cuanto menor sea dicha probabilidad, mayor ser la probabilidad de error beta. La relacin inversa entre la magnitud de los
errores alfa y beta resulta de que si se pretende disminuir la probabilidad de error alfa, debern exigirse mayores diferencias entre las variables comparadas antes de aceptar su significacin estadstica y esto, a su vez, har ms probable que diferencias menores, aunque reales,
se pasen por alto y se desechen como no significativas (error beta). En cuanto a la influencia
del desvo estndar de las variables y el tamao de las muestras, sus efectos convergen en la
determinacin del error estndar empleado en las pruebas de hiptesis (ver 6.5.1).
El error beta puede calcularse con exactitud conociendo sus determinantes, mencionados en el prrafo anterior, y para algunos modelos de distribucin de probabilidades ha sido
calculado y tabulado. Su clculo no ser abordado aqu dada su relativa extensin, pudiendo
consultarse Armitage, 1994. Slo se mencionar que, de acuerdo a lo establecido ms arriba,
el investigador puede reducirlo agrandando las muestras, reduciendo la variabilidad de las
mismas y renunciando a niveles de significacin muy altos para el error alfa. La primera opcin es en general la ms factible. En cuanto a la variabilidad de las muestras, en general slo
se puede, en ciertas ocasiones, tratar de reducir el componente relacionado con la precisin de
las mediciones, ya que la variabilidad inherente a los datos no es influenciable directamente.
Sin embargo, hay un aspecto relacionado que slo se mencionar aqu, y que se refiere a la
posibilidad de controlar el efecto de ciertas variables que no intervienen en el estudio pero
que influyen sobre las que interesan. Por ejemplo, al medir la duracin del intervalo QT del
electrocardiograma, generalmente no interesan los efectos de la frecuencia cardaca, que son
conocidos y que tendern a acortarlo a medida que sta aumenta. La correccin para la
frecuencia cardaca, que tiende a eliminar su influencia en el QT medido, consiste en el uso de
[ 244 ]

determinadas ecuaciones donde la frecuencia cardaca es tomada en cuenta en cada individuo


para generar valores del QT corregidos (ver Seccin 9). El QT corregido tendr habitualmente menor varianza que antes de su correccin, con lo que se facilitar la deteccin de
cambios significativos en el mismo debidos, por ejemplo, a la accin de drogas en estudio.

La opcin de renunciar a niveles altos de significacin para el error alfa est ms limitada, ya que en general se aceptan sin inconvenientes niveles de P = 0.05 pero, a partir de
este valor, existe el consenso de que valores mayores, como P = 0.10, no son suficientemente
seguros para rechazar una hiptesis nula con suficiente nivel de confianza.
6.8. Determinacin del tamao de las muestras

Hasta aqu se ha visto cmo el aumento del tamao muestral, al reducir el error estndar
de las medias, facilita el hallazgo de diferencias significativas entre las muestras y permite reducir el nivel de error alfa y aumentar la potencia de un ensayo. Determinar el menor tamao
posible que debern tener las muestras para obtener resultados tiles con los diversos procedimientos de inferencia estadstica es una de las tareas ms frecuentes, fundamentalmente
porque las muestras cuestan tiempo y dinero, sin olvidar aspectos ticos, tan importantes en
medicina, como no extender las investigaciones en tiempo y nmero de pacientes cuando sea
posible obtener conclusiones con un menor nmero de casos, y no dilatar la aplicacin de
nuevos procedimientos tiles cuando se cuenta con la evidencia suficiente como para garantizar su empleo.
El tema del tamao de las muestras puede adoptar numerosas formas, donde las variables que determinan el nmero de casos a incluir en los anlisis son el desvo estndar de las
poblaciones o en su defecto el desvo estndar de las muestras, el error alfa deseado y el nivel
de error beta tolerado. De estos elementos, el que puede ofrecer mayor o menor dificultad en
su estimacin es el desvo estndar (recurdese que antes de comenzar el estudio puede ser
desconocido o de estimacin incierta). En cualquier caso, establecidas las condiciones requeridas, el nmero de casos de las muestras es la variable a despejar.
Para observar cmo puede surgir y abordarse una pregunta acerca del nmero de casos,
considrese el Ejemplo 6.2. Antes de comenzar la experiencia, el investigador podra tener suficientes conocimientos y opiniones sobre el tema como para querer asegurarse de que en caso
de obtenerse una determinada diferencia entre las medias del colesterol, sta sea detectada
como significativa y no pasada por alto debido a un nmero demasiado escaso de pacientes
en las muestras. Se sabe que incrementar el tamao de las muestras favorece la deteccin de
las diferencias significativas, pero lo que se desea conocer en este caso es el menor nmero
de individuos que garantiza que una diferencia preestablecida por el investigador, en caso de
presentarse, ser efectivamente sealada con un nivel de significacin tambin preestablecido
(digamos, P = 0.05). Para resolver la cuestin examnese la ecuacin (6.3) utilizada para la
obtencin del estadstico z en la prueba de significacin de la diferencia entre dos medias x 1
y x 2 , empleada en el ejemplo en cuestin. Para simplificar, considrese el caso de muestras
de igual tamao, n, cuyas varianzas 1 y 2 no sean muy diferentes y puedan expresarse en
una varianza comn . Llamando d a la diferencia (x 1 x 2) entre las medias muestrales, la
ecuacin (6.3) queda reducida a:

[ 245 ]

z = d / ( / n ) + ( / n )
de donde se puede despejar y obtener el valor de n reemplazando d, z y por los valores asignados por el investigador. Para despejar n se comienza elevando al cuadrado ambos trminos
de la ecuacin, con lo que se elimina la raz:
z = d / ( / n ) + ( / n )
= d / ( 2/n )
= n d / 2
de donde resulta:
n = 2 z / d
= 2 ( z / d )

(6.7)
(6.8)

Cualquiera de estas expresiones permite calcular n, el nmero de casos en cada muestra.


La diferencia preestablecida es d, y el valor de z es el valor de la variable estandarizada correspondiente al nivel de significacin elegido. Por ejemplo, si se desea trabajar con P = 0.05,
la tabla de la distribucin normal proporciona z = 1.96 para una prueba a dos colas. Queda
la estimacin de , que es la varianza comn postulada para las poblaciones muestreadas, y
que si las muestras no son demasiado reducidas, puede en principio estimarse a partir de sus
varianzas, promedindolas en una varianza comn.

Ejemplo 6.4
En la situacin del Ejemplo 6.2, el investigador desea calcular el tamao de las muestras
que ser necesario para detectar como significativa en un nivel P = 0.05, una diferencia entre las muestras de LDL colesterol igual (o mayor) a 10 mg/dl. Se debe tener una estimacin
de las varianzas de las poblaciones, que como se ha mencionado, puede obtenerse a partir
de las varianzas muestrales o bien de estudios anteriores. Aqu se emplearn las varianzas
muestrales del ejemplo, sSM = 236 y s C = 253. Como dichas varianzas no difieren en exceso,
puede emplearse su promedio como expresin de una varianza muestral comn s, que a su
vez estima la varianza de poblacin :
Varianza muestral comn s = ( sSM + sC ) / 2 = ( 236 + 253 ) / 2 = 244.5

Diferencia entre medias


Valor de z para P = 0.05

d = 10
z = 1.96

Reemplazando en (6.7) y estimando por medio de s, se tiene:


n = 2 z s / d = 2 1.96 244.5 / 10

= 19 pacientes en cada muestra

[ 246 ]

Por lo tanto, se necesitarn 38 pacientes en total para que, si es correcta la estimacin de


a partir de s, una diferencia de 10 mg/dl sea detectada con un nivel de significacin P =
0.05.
En este punto es conveniente sealar que muestras de 19 pacientes por grupo deberan
considerarse pequeas, y en este caso convendra abandonar las estimaciones del tamao
muestral basadas en la distribucin z y emplear otras ms adecuadas para muestras pequeas
(ver Seccin 7). De todos modos, recalculando el tamao muestral con este recaudo, se comprueba que se necesitaran no ms de 21 pacientes por grupo, una cifra similar a la encontrada ms arriba.

Un problema tpico en la comparacin de muestras es el que consiste en calcular el nmero mnimo de casos que debern tener para detectar una diferencia igual o mayor a un valor
establecido antes de iniciar la investigacin, con una potencia aceptable (digamos del 80%
o 90%, ver prrafo anterior) y un nivel de error alfa asimismo aceptable para el investigador
(digamos, del 5% o del 1%). Aqu las tcnicas para el clculo del tamao muestral son an
algo ms complicadas que la antes reseada, debido a la nueva condicin de tomar en cuenta
el error beta de la prueba. Por lo dems, los clculos cambian segn el tipo de distribucin
que adoptan las muestras y otras caractersticas de los estudios, por lo cual se comprende
que un examen ms completo del tema queda ms all del alcance del texto, y el lector puede
consultar Armitage y Berry, 1994. Una exposicin sencilla y suficientemente completa puede
encontrarse en Florey, 1993.

[ 247 ]

7. Comparaciones entre dos medias muestrales.


La distribucin t
7.1 La distribucin t de Student

En la Seccin 6 se ha visto el procedimiento general para la comparacin de medias muestrales de variables continuas. Los ejemplos empleaban muestras grandes, de 100 individuos,
y esto permita emplear las varianzas muestrales, s, en el lugar de las varianzas de los universos, en general desconocidas. Sin embargo, es muy frecuente tener que trabajar con muestras
ms pequeas, de pocas decenas de elementos, y estos casos, an tratndose de poblaciones
con distribucin normal, las muestras tienden a presentar mayores densidades de probabilidad hacia las colas, esto es, para un determinado desvo del centro de la distribucin, las
probabilidades de ser excedido por los valores de la variable son mayores que las predichas
por la curva normal. Estas muestras pequeas siguen la llamada distribucin t o de Student,
con forma de campana muy similar pero no idntica a la normal, ya que como se desprende
de lo dicho, tiene colas ligeramente ms altas, indicando mayores probabilidades para las
desviaciones ms alejadas del centro (Fig. 7.1).
Figura 7.1. Curvas de distribucin de probabilidades normal y de Student (trazo ms grueso).

Puede observarse que hacia los extremos de la curva, un mismo desvo estndar deja
por fuera un rea de probabilidades mayor que en la distribucin de Gauss. Esto quiere decir
que en las muestras pequeas, las probabilidades de que la variable asuma valores cercanos
a las colas de la distribucin, son relativamente mayores que en la distribucin normal. Por
[ 248 ]

esta razn, para poder afirmar que una observacin se aleja significativamente del centro de
la distribucin, deber hallarse a mayor distancia del mismo que si la distribucin fuera la
normal o de Gauss.

Dada una variable con distribucin normal y media , si se extrae una muestra de tamao n, con media x y desvo estndar s, se tiene que
t = (x ) / (s / n)

(7.1)

es un estadstico muestral que sigue la distribucin t o de Student, y se utiliza en las pruebas


de hiptesis con muestras pequeas. El nmero de casos menos uno (n 1), llamado grados
de libertad, es un parmetro de la distribucin, que vara con el tamao de la muestra y est tomado en cuenta en las tablas correspondientes, donde determina el valor de t para los
distintos niveles de probabilidad utilizados en las pruebas de significacin. Como para otras
distribuciones, las tablas de t se hallan extensamente publicadas y tambin se obtienen en los
paquetes estadsticos corrientes.
Puede verse que t es un cociente cuyo numerador es la desviacin de la media muestral
x respecto de la media universal , y cuyo denominador es el error estndar de dicha media
muestral. El error estndar corresponde a la expresin (5.3), en donde el desvo estndar del
universo, , se ha reemplazado por el desvo estndar muestral s. De esta manera, al igual que
z en la Seccin anterior, t es una variable que expresa el desvo estandarizado del estadstico
muestral x y se aplica cuando las muestras siguen la distribucin de Student. Su papel en las
pruebas de hiptesis es el mismo que el del estadstico z utilizado en la Seccin 6 para muestras grandes. Como las colas de la funcin t son ms altas que las de la normal (Fig. 7.1),
se precisa una mayor desviacin respecto de la hiptesis nula para que una diferencia resulte
significativa. As, en una muestra de 10 elementos, con 10 1 = 9 grados de libertad, para
alcanzar un nivel de significacin P = 0.05, se requiere t = 2.22 (la diferencia del numerador
deber ser 2.22 veces el desvo estndar dado en el denominador), mientras que la misma significacin se alcanza en la distribucin normal con una desviacin z = 1.96, algo menor de
2 desvos estndar. Esto seala la mayor sensibilidad para detectar diferencias significativas
que tienen los mtodos para muestras grandes vistos en la Seccin 6, que sin embargo, si se
aplican a muestras pequeas producen resultados inexactos, con un exceso de resultados
significativos.
Por lo dems, cuando n tiende a infinito, la distribucin t tiende a la normal, convergencia que se hace suficientemente importante en forma temprana y as, con muestras de unos
100 casos los valores de t ya son casi iguales a los de z. Esto explica que la distribucin de
Student sea apropiada tambin para muestras grandes, donde toma los mismos valores de
la normal. Esto es importante dado que el lmite entre muestras grandes y pequeas no est
claramente definido, y la distribucin t se ajusta bien en todos los casos.
7.2. Comparacin de dos medias muestrales: muestras no apareadas

Los procedimientos de inferencia son anlogos a los ya vistos para muestras grandes,
y se examinarn ejemplos relativos a la comparacin de dos medias muestrales. En general,
las muestras a comparar pueden estar formadas por individuos diferentes, o por los mismos
[ 249 ]

individuos antes y despus de alguna intervencin o de algn posible cambio en las variables
en estudio. En el primer caso se habla de muestras no apareadas, por lo que se entiende que
no hay correlacin estadstica entre los datos de las dos muestras.
Como se sabe, al comparar las medias de dos muestras, la hiptesis nula suele ser que
provienen de universos con la misma media, de modo que 1 = 2 y por lo tanto 1 2 = 0. De
acuerdo a esta hiptesis, se espera que las diferencias entre las medias muestrales, x 1 x 2 , presenten una distribucin en forma de campana con centro en 0, y la prueba consiste en dividir
la diferencia encontrada por su error estndar, lo que proporciona un valor de t. Este a su vez
permite encontrar en las tablas de la distribucin, la probabilidad de una diferencia x 1 x 2
igual o mayor que la hallada en el estudio. Si esa probabilidad es suficientemente pequea, la
hiptesis de medias de poblacin iguales debe ser rechazada, aceptndose la hiptesis alternativa de medias diferentes.
Siempre que las varianzas de las muestras sean similares, el error estndar de la diferencia de medias se obtiene a partir de una varianza nica s, que combina las varianzas de cada
una de las muestras, s1 y s2 :
s = [( n1 1) s1 + (n 2 1) s2 ] / [( n1 1) + (n 2 1)]

(7.2)

donde n1 y n2 es el tamao de cada muestra, y (n1 1) y (n2 1) son los grados de libertad de
las muestras.
Con esta estimacin de la varianza muestral, el error estndar de la diferencia de medias
se calcula a partir de (5.6), donde cada est estimada por la varianza combinada s :
ES (x1 x2) = ( s / n1 ) + ( s / n 2 )

(7.3)

y el estadstico de prueba t queda expresado como:


t = (x1 x2) / ( s / n1 ) + ( s / n 2 )

(7.4)

Ejemplo 7.1. Comparacin de dos medias muestrales. Muestras no apareadas


Se han determinado las cifras de colesterol HDL, en mg/dl, en una muestra de diez individuos
y son las siguientes: 72, 45, 89, 40, 96, 54, 79, 71, 37, 57. Se desea saber si la media muestral
difiere en forma significativa de la media de la muestra analizada en el Ejemplo 2.1.
1. Hiptesis: las medias del colesterol HDL difieren significativamente entre ambas muestras
2. Hiptesis nula (H0): el colesterol HDL no difiere significativamente entre las muestras.
La hiptesis nula postula que las medias universales 1 y 2 son iguales:

H 0 : 1 = 2
y que su diferencia es cero: 1 2 = 0
3. Eleccin del nivel de significacin de la prueba. Se acepta P = 0.05.
[ 250 ]

4. Prueba de la hiptesis: el estadstico t y la obtencin de P. Este es el nico punto que


difiere de los ejemplos de la Seccin 6: el estadistico empleado es t en vez de z, y como se ha
mencionado, en el clculo del error estndar de la diferencia de medias, se combinan las dos
varianzas muestrales. Se insiste en que los programas estadsticos obvian estos clculos, que
aqu se describen porque permiten entender los mecanismos de la inferencia estadstica. Por
lo mismo y para no alargar la exposicin, se dan ya calculadas las medias y las varianzas de
las muestras 1 y 2:
X1

X2

640

460

Nmero de casos ( n )
)
Media (x

10

10

64.0

46.0

Varianza muestral ( s )

422.4

276.9

A partir de (7.2) se obtiene una varianza muestral nica, s, que combina ambas varianzas muestrales, s1 y s2 :
s = [( n1 1) s1 + (n 2 1) s2 ] / [( n1 1) + (n 2 1)]
= [(10 1) 422.4 + (10 1) 276.9 ] / [ (10 1) + (10 1) ] = 349.7
El error estndar de la diferencia de medias se calcula segn 7.3:
x
) = ( s / n ) + ( s / n )
ES (x
1
2
1
2

= ( 349.7 / 10 ) + ( 349.7 / 10 ) = 8.36
El estadstico t se calcula entonces como:
t = (x1 x2) / ES (x1 x2)
= (64 46) / 8.36
= 2.15
siendo (n 1) + (n 1) = 9 + 9 = 18, la suma de los grados de libertad de las muestras.

La probabilidad de significacin buscada se encuentra en tablas de la distribucin t de
Student, en la fila correspondiente a 18 grados de libertad, donde para t = 2.10 corresponde
P = 0.05, con lo cual el valor 2.15 obtenido es ligeramente ms significativo, y por lo tanto se
puede escribir P < 0.05. El valor exacto de P (que se puede calcular de la tabla por interpolacin) se obtiene inmediatamente de los paquetes estadsticos y es P = 0.045.

5. ltimo paso: aceptacin o rechazo de la hiptesis nula

Dado que la diferencia de las medias se considera significativa en un nivel P < 0.05 y este
nivel ha sido alcanzado, se rechaza la hiptesis nula y se acepta la significacin de la diferencia de medias.
[ 251 ]

En el ejemplo se ha trabajado con varianzas que no difieren demasiado entre s, lo cual


permite combinarlas para obtener una estimacin comn con la cual completar los clculos.
La igualdad de varianzas debera evaluarse previamente, por procedimientos en los que no
entraremos, y de hallarse diferencias significativas entre las mismas el error estndar de la diferencia se debera calcular como en (5.6). Sin embargo y en general, los resultados no suelen
ser muy diferentes. Ms importante del punto de vista prctico, los programas de estadstica
analizan automticamente las varianzas y ofrecen junto con el correspondiente informe acerca de su similitud, la posibilidad de calcular t bajo cualquiera de los dos supuestos, varianzas
iguales o desiguales.
7.3. Comparacin de dos medias muestrales. Medias apareadas

Una situacin especial se plantea muy frecuentemente en la prctica cuando cada individuo o elemento de la muestra provee dos valores de la misma variable, uno antes y otro
despus de un determinado acontecimiento de inters, por ejemplo un tratamiento, y se desea
comparar los datos previos y posteriores al mismo (estrictamente, no es imprescindible la
existencia de un acontecimiento o tratamiento interpuesto, y pueden examinarse pares de
datos obtenidos con cualquier diferencia de tiempo, lo que puede informar acerca de la variabilidad de los mismos). En estas circunstancias, las muestras suelen presentar importante
correlacin estadstica (ver Seccin 9) y como se mencion en 5.5, las diferencias entre los
pares de datos correspondientes a cada uno de los individuos que integran las muestras, forman un conjunto con una varianza menor que la suma de las varianzas que sera de esperar en
muestras independientes. Esta reduccin de la varianza se aprovecha para aumentar el poder
de detectar algn cambio entre las muestras, mediante el procedimiento que se describe a
continuacin y que se entender mejor mediante un ejemplo.
Ejemplo 7.2. Comparacin de dos medias muestrales. Muestras apareadas.
Considrese la muestra del ejemplo 2.1, y supongamos que luego de un tratamiento dirigido a elevar el colesterol HDL, el mismo es nuevamente dosado en cada individuo con los
siguientes resultados:
Caso N

HDL pre-tratamiento

HDL post-tratamiento

81

85

Diferencia ( d )
4

37

38

35

37

64

72

46

51

6
7

37
45

45
38

8
7

43

58

15

21

25

10

51

61

10

TOTALES

460

510

50


[ 252 ]


Las respectivas medias muestrales antes y despus del tratamiento son 46.0 y 51.0 mg/dl,
y su diferencia, igual a 5.0 mg/dl, sugiere un leve aumento del colesterol HDL No obstante,
la diferencia entre las medias muestrales es menor que en el ejemplo anterior y, como el lector
puede comprobarlo, si se aplica el mismo mtodo de comparacin, no resulta significativa.
Sin embargo, si se observan en la cuarta columna de la tabla los cambios del HDL ocurridos en cada individuo, se ver que en nueve casos aument en la muestra post-tratamiento,
y que no hay grandes contrastes entre la magnitud de las variaciones para cada individuo: el
paciente con 81 mg/dl pasa a tener 84 (d = 84 81) y el paciente con 21 mg/dl pasa a tener 25
(d = 25 21). Por qu no analizar solamente las diferencias, ocurridas en cada individuo? Si
sobre las mismas no hubiera un efecto del tratamiento, su media debera oscilar alrededor de
cero, y sta es una buena hiptesis nula. Tal es el fundamento de la comparacin de muestras
apareadas. Si la media de las diferencias individuales difiere significativamente de cero,
se admite que un cambio significativo ha ocurrido entre las tomas de cada par datos. La
variable es la diferencia d entre cada par de datos, que se compara con una diferencia media
hipottica D = 0.
El procedimiento es como sigue. En la cuarta columna se hallan las diferencias ( d ) entre
ambas mediciones del HDL para cada individuo. La media de esas diferencias es igual a su
sumatoria dividida por el nmero de casos:

y en el ejemplo es igual a 5.0 mg/dl (es la misma que la diferencia entre las medias muestrales).

1. Hiptesis nula (H0): la diferencia media en el universo el igual a cero, D = 0

2. Hiptesis alternativa: la media de las diferencias en el universo, D (estimada por d )


difiere significativamente de cero
3. Eleccin del nivel de significacin de la prueba. Se acepta P = 0.05.
4. Prueba de la hiptesis: el estadstico t y la obtencin de P. El estadstico t mide la des
viacin de la diferencia media d con respecto al cero de la hiptesis nula, en unidades de error

estndar. Por lo tanto, el numerador de t est dado por d 0 = d , y el denominador es el error


estndar de la diferencia media, que se calcula como sigue.

Varianza de las diferencias: se obtiene como cualquier varianza muestral a partir de las
diferencias de la ltima columna de la tabla, a cada diferencia se le resta la diferencia media
, el resultado se eleva al cuadrado y la suma de los cuadrados y se divide por (n 1):

Error estndar de la media d : se obtiene a partir de (5.3) reemplazando por sD:


[ 253 ]

ESD = (sD / n )

(7.7)

de donde se obtiene t como el cociente entre d y ESD:



Con los datos del ejemplo:

d = (4 + 1+ 2+ + 10) / 10 = 5.0
sD = [ (45) + (15) + (25) + + (105)] / (101)
= 314 / 9 = 34.9
ESD = (sD / n)
= (34.9 / 10) = 1.87
t = 5.0 / 1.87 = 2.68
lo que corresponde segn tablas de la distribucin t de Student, a P = 0.0253, con lo cual
se satisface la condicin P < 0.05. Las diferencias observadas en el colesterol HDL antes y
despus del tratamiento se apartan significativamente de cero.
5. Ultimo paso: aceptacin o rechazo de la hiptesis nula

La hiptesis nula de una diferencia media universal D = 0 igual a cero deber ser rechazada, aceptndose la alternativa D 0.
Para comprender lo que ha ocurrido, hay que tener en cuenta que las cifras de HDL estn
(o pueden estar) influidas por el tratamiento y tambin por otras caractersticas particulares de
cada individuo. Las diversas fuentes de variabilidad generan las varianzas de cada muestra por
separado, mientras que por el contrario, la columna con las diferencias de HDL pre y post-tratamiento slo expresa las variaciones ocurridas entre la primera y la segunda medicin. Otras
fuentes de variabilidad, que se manifiestan en el hecho de que los distintos individuos se presentan inicialmente con valores de HDL ms altos o ms bajos, tienden a cancelarse cuando se
restan entre s los dos valores de cada par de datos. En el ejemplo, las varianzas de las muestras
son iguales a 276.9 y 332.4 (pre y post-tratamiento), mientras que la varianza de las diferencias
entre pares es igual a 34.9. Esto determina un menor error estndar y consecuentemente, el
incremento del valor de t y la posibilidad de detectar cambios significativos. En el ejemplo se
ha producido un aumento pequeo pero significativo del colesterol HDL, que hubiera quedado
oculto por la variabilidad individual de haberse empleado directamente las varianzas muestrales como se hace en el caso de muestras independientes, donde no es posible controlar la variabilidad dentro del grupo. Como se ve, la mayor eficacia del mtodo de muestras apareadas
se debe a que permite aislar las variaciones producidas por una determinada circunstancia o
intervencin, de la variabilidad existente entre los individuos de un grupo.

[ 254 ]

8. Comparaciones entre proporciones

Cuando se analizan muestras donde la variable de inters es de tipo binario (2.2), es


comn poder conocer la frecuencia con que la variable toma uno de sus dos estados posibles
en las distintas muestras, por ejemplo, se puede conocer la proporcin de fumadores, de sexo
femenino o masculino, si la edad es mayor o menor de 50 aos, etc. En estos casos, puede
resultar de inters saber si dos muestras que exhiben diferentes proporciones de una variable,
por ejemplo de fumadores, expresan diferencias reales entre las poblaciones de las que fueron
extradas o difieren por las fluctuaciones del muestreo. Conviene tener presente que para
cada variable binaria, uno de sus dos posibles estados suele considerarse el aspecto de mayor
inters y denominarse suceso, como por ejemplo el hecho de ser fumador, ser del sexo masculino (o femenino), ser mayor de 50 aos, etc. De esta forma, cada resultado de una variable
es registrado segn el suceso haya o no tenido lugar.
En general, un suceso (p.ej. ser fumador) se puede presentar r veces en n observaciones y
lgicamente, r podr variar entre 0 (no hay fumadores en la muestra) y n (todos son fumadores en la muestra). El cociente p = r / n es la proporcin de sucesos observados en la muestra
y estima la proporcin de tales sucesos en el universo muestreado (4.4). Como se ha mencionado, una de las situaciones ms frecuentes en la prctica es la necesidad de comparar dos
proporciones correspondientes a distintas muestras. Con este fin, es posible aprovechar la
aproximacin de la distribucin binomial a la distribucin normal, mencionada en 4.4.1.

8.1. Aproximacin a la funcin binomial mediante la normal
Este procedimiento se basa en que la proporcin p de sucesos observados en una muestra,
tiende a distribuirse en forma normal a medida que el nmero de observaciones realizadas, n,
aumenta. Esto permite emplear las tcnicas de la Seccin 6 para resolver diferentes problemas
de inferencia estadstica. Se ha dicho que la proporcin p de sucesos observados en una muestra,
es una estimacin de la probabilidad en el universo del que procede (4.4), y de esta manera, la
comparacin entre dos proporciones p1 y p2 , permite estimar las relaciones entre las respectivas
probabilidades 1 y 2 , en los universos de los que proceden las muestras. El procedimiento
para la comparacin de dos proporciones muestrales se mostrar mediante un ejemplo.

[ 255 ]

Ejemplo 8.1. Comparacin de dos proporciones en muestras independientes. Aproximacin mediante la distribucin normal
En un conjunto de 470 individuos internados por endocarditis infecciosa (Modenesi y
col., 2005) se encontr que 66 presentaron insuficiencia renal crnica (IRC) durante la evolucin (grupo 1) y 404 no la presentaron (grupo 2). Durante la hospitalizacin se observaron
24 muertes en el grupo 1 (IRC), y 90 muertes en el grupo 2 (no IRC).

La proporcin de fallecimientos fue p1 = 24 / 66 = 0.36 = 36% en el grupo 1, y p2 = 90 /
404 = 0.22 = 22% en el grupo 2. Son los datos prueba suficiente de que la muerte intrahospitalaria en la endocarditis infecciosa, es ms frecuente en los portadores de insuficiencia
renal crnica que en los que no la presentan?

La hiptesis nula es que la mortalidad intrahospitalaria es la misma en portadores de
insuficiencia renal crnica que en los que no la presentan, o lo que es lo mismo, la mortalidad en el universo del que procede el grupo 1 (1) es la misma que en aqul del que procede el grupo 2 ( 2). Para poder afirmar que la diferencia observada es estadsticamente
significativa, debe poder rechazarse la hiptesis nula y para esto, debe demostrarse que la
diferencia p1 p2 obtenida de las muestras tiene muy bajas probabilidades de observarse
muestreando universos en los que 1 = 2 .
Al igual que p1 y p2 , la diferencia (p1 p2) se distribuir en forma aproximadamente normal siempre y cuando las muestras no sean pequeas y las p no presenten valores extremos,
y en estos casos pueden utilizarse procedimientos similares a los ya vistos en Seccin 6. Esto
requiere construir un estadstico z para evaluar la diferencia (p1 p2) en trminos de su error
estndar, y as conocer la probabilidad de haber obtenido una diferencia igual o mayor siendo
verdadera la hiptesis nula de medias iguales (o diferencia cero). Llamando ES (p1 p2) al
error estndar de (p1 p2), se tiene:
z = (p1 p2) / ES (p1 p2)

(8.1)

Para calcular el error estndar de (p1 p2) debe obtenerse primeramente una p muestral
comn que suma los numeradores y los denominadores de p1 y p2:
p = (r1 + r2) / (n1 + n 2)

(8.2)

y calcularse la varianza de la diferencia (p1 p2) a partir de lo visto en 5.5, reemplazando


por la p muestral comn, y escribiendo 1 p = q :
var (p1 p2) = (pq / n1)+ (pq / n 2)

= pq (1/ n1 + 1/ n 2)

(8.3)

con lo cual el error estndar se obtiene como:


ES (p1 p2) = pq (1/n1 + 1/n 2)

(8.4)

y el estadstico z puede re-escribirse:


z = (p1 p2) / pq (1/n1 + 1/n 2)
[ 256 ]

(8.5)

Recapitulando los datos y reemplazando se tiene:


r1 = 24 muertes en el grupo 1,
n1 = 66 nmero de individuos en el grupo 1
r2 = 90 muertes en el grupo 2,
n 2 = 404 nmero de individuos en el grupo 2
p1 = r1 / n1
= 24 / 66 = 0.364
p2 = r2 / n 2
= 90 / 404 = 0.223
p = ( 24 + 90 ) / ( 66 + 404 ) = 0.243
q = 1 0.243 = 0.757
var (p1 p2) = 0.243 0.757 (1 / 66 + 1 / 404) = 0.00324
ES (p1 p2) = 0.00324 = 0.0569
z = (0.364 0.223) / 0.0569
= 0.141 / 0.0569 = 2.48
En tablas de la funcin normal se halla que para z = 2.48, la probabilidad de un valor
ms extremo es P = 0.013, lo que puede redondearse como P < 0.05 y ms exactamente,
como P < 0.02. Se concluye que la hiptesis nula debe ser rechazada y la diferencia entre las
proporciones muestrales se acepta como significativa en un nivel P = 0.013. La probabilidad
de muerte intrahospitalaria es significativamente mayor entre los pacientes con insuficiencia
renal crnica.
El procedimiento de aproximar la distribucin binomial mediante la normal ser suficientemente exacto siempre y cuando el estadstico z calculado segn (8.5) tenga una distribucin cercana a la normal. Este requisito se cumple cuando los productos p1 n1, p2 n2 ,
(1 p1) n1 y (1 p2) n2 son todos mayores que 5. Esto ocurrir con tamaos muestrales
n suficientemente grandes y proporciones p no demasiado cercanas a los extremos. En caso
contrario la aproximacin por la normal puede ser inexacta, y ser conveniente utilizar otros
mtodos como el test exacto de Fischer, que se menciona ms adelante.
En el ejemplo, todos los productos mencionados exceden largamente el lmite de seguridad 5 arriba consignado, con lo que la prueba resulta segura. De todos modos, siendo la distribucin binomial una distribucin discreta, suele realizarse una correccin en los clculos
de z, llamada de correccin de continuidad, que se mencionar ms adelante.
A continuacin se ver otra forma de encarar el mismo problema mediante el clculo de
un estadstico que se funda en los valores muestrales observados y en los que deberan esperarse de ser vlida la misma hiptesis nula con que se trabaj anteriormente, esto es, que las
proporciones del suceso (en el ejemplo, la mortalidad intrahospitalaria) no difieren entre los
grupos.
8.2. La distribucin chi-cuadrado

La comparacin entre proporciones puede realizarse comprobando si la variable estudiada (por ejemplo, la mortalidad intrahospitalaria), se asocia o aparece con mayor frecuencia
en uno de los dos grupos estudiados. Esto se logra disponiendo los datos en una tabla de
2 2 y calculando con su ayuda, los valores tericos de la variable que seran de esperar si
[ 257 ]

no hubiera asociacin alguna con cualquiera de los grupos. La Tabla 8.1 correspondiente al
ejemplo anterior permite ilustrar el resultado:
Tabla 8.1. Tabla de 2 2 correspondiente a los datos del Ejemplo 8.1

Grupo 1

Obitos

Vivos

Totales

Observados 24

Observados 42

66

(IRC)

Esperados 16

Esperados 50

Grupo 2

Observados 90

Observados 314

( No IRC )

Esperados 98

Esperados 306

Totales

114

356

404
470

Se comprueba que frente a 16 bitos esperados en el grupo 1, ocurrieron 24, y frente a los 98 bitos esperados en el grupo 2, slo se presentaron 90. La magnitud de las diferencias entre casos
observados y casos esperados, permite elaborar un estadstico muestral llamado chi-cuadrado
(que se suele escribir X), que se compara con una familia de distribuciones tambin conocidas
como chi-cuadrado y que se suelen denotar como . Este estadstico se calcula como:
X = [ (O E) / E ]

(8.6)

lo que expresa que para cada una de las cuatro celdas de la tabla, la diferencia entre los casos
observados ( O ) y los esperados ( E ), debe elevarse al cuadrado y dividirse por el nmero de
casos esperados, para finalmente sumar los resultados de las 4 celdas. Cuanto ms grande
resulte X, ms improbable ser que las discrepancias se deban al azar, y esto lleva a aceptar
la existencia de algn tipo de asociacin entre la mortalidad intrahospitalaria y la insuficiencia renal crnica en las poblaciones representadas por las muestras. En forma ms general,
la magnitud de X expresa el grado de asociacin entre las variables de filas y columnas. Al
igual que la normal, las distribuciones son continuas y se caracterizan por un parmetro
llamado grados de libertad, que en el caso de una tabla de 2 2 es igual a 1. Las probabilidades de que X supere determinados valores, en ausencia de asociacin entre los elementos de
filas y columnas, se hallan tabuladas para distintos grados de libertad. En el Ejemplo 8.2 se
elabora con ms detalle el procedimiento de clculo de X reseado hasta aqu.
Ejemplo 8.2. Comparacin de dos proporciones en muestras independientes.
La distribucin
Clculo de los casos esperados: Considrense los casos observados en el ejemplo anterior,
dispuestos en una tabla de dos filas y dos columnas o tabla de 2 2:
Grupo 1

Obitos

Vivos

Totales

Observados 24

Observados 42

66

Observados 90

Observados 314

404

114

356

470

IRC
Grupo 2
No IRC
Totales

[ 258 ]

En las filas, los pacientes son clasificados segn la presencia de insuficiencia renal crnica: en la primera aparecen los 66 pacientes que la presentan (grupo 1), divididos en 24 individuos que fallecen y 42 que sobreviven, y en la segunda aparecen los 404 pacientes que no
exhibieron insuficiencia renal crnica (grupo 2), divididos en 90 individuos que fallecen y 314
que sobreviven. Por otra parte, en las columnas, los pacientes son clasificados por la supervivencia: en la primera columna aparecen los bitos, y en la segunda los casos que sobreviven.
Las sumas de cada fila y de cada columna forman cuatro totales marginales. La suma de los
totales marginales es igual al gran total, que representa a todos los individuos del estudio
y se ubica en el ngulo inferior derecho de la tabla.
Para obtener los casos esperados, hay que calcular cuntos individuos debera haber en
cada celda de la tabla, si se distribuyeran en forma proporcional a los totales de fila y de
columna. Por ejemplo, 66 de los 470 pacientes, o sea 66 / 470 = 0.14 o 14% del total, present insuficiencia renal crnica (y un 86% no la present). Si se espera que los 114 bitos
observados se hayan producido en forma independiente de la presencia de insuficiencia renal,
su nmero en los grupos 1 y 2 slo debera depender del tamao de estos grupos y as, en el
grupo 1 (insuficiencia renal crnica presente) deberan esperarse 0.14 114 = 16 bitos, que
es un 14% del total de bitos observados, ya que el grupo 1 contiene el 14% del total de los
pacientes del estudio. Esta expectativa corresponde a la hiptesis nula de la prueba, a saber,
que los fallecimientos son independientes de la presencia de insuficiencia renal crnica.
Los 16 bitos esperados en el grupo 1, corresponden a la celda interseccin de la fila Grupo
1 y la columna Obitos.
Como se ha visto, para calcular los casos esperados en la casilla que corresponde a la
interseccin de la fila Grupo 1 y la columna Obitos, se hizo (66 / 470) 114, o sea, (total de
fila Grupo 1 / gran total) total de columna Obitos. Esto significa que, en general, para la
casilla correspondiente a la fila i y la columna j, se tendr:
Casos esperados = (total de fila i total de columna j ) / gran total

(8.7)

Con este procedimiento se pueden calcular los valores esperados en las restantes celdas.
En realidad, en tablas de 2 2 basta con calcular el valor esperado para una celda, y los otros
tres se obtendrn por diferencia con los correspondientes totales marginales. Por ejemplo, si
se esperan 16 bitos en el grupo 1, en el grupo 2 debern esperarse necesariamente 114 16
= 98 bitos.
En la Tabla 8.1 pueden verse los valores observados y calculados para el estudio que nos
ocupa. En el grupo 1 (insuficiencia renal crnica presente), se observaron ms bitos que los
esperados, exactamente 24 16 = 8 bitos ms. Lo opuesto ocurre en el grupo 2 (insuficiencia renal ausente), donde los bitos observados son menos que los esperados de acuerdo a
la cuanta del grupo. Otro tanto puede discurrirse acerca de los casos en que los pacientes
sobreviven la internacin: en el grupo 1 son menos que los esperados, y lo inverso ocurre en
el grupo 2. La diferencia entre observado y esperado es la misma para las cuatro casillas, y
slo cambia de signo: en dos casillas el signo es positivo y en dos es negativo. En la magnitud
de esta diferencia, que indica cunto se alejan las proporciones muestrales de las esperadas
bajo la hiptesis nula, se basa la prueba de chi cuadrado.
[ 259 ]

Conviene saber que el hecho de que los valores esperados en este ejemplo sean nmeros
enteros, es casual (en realidad, para fila 1 y columna 1 se esperan exactamente 16.0085 casos,
valor que ha sido redondeado). Al respecto, cuando hay decimales deben ser incluidos en los
clculos segn la precisin deseada (por ejemplo, uno o dos decimales).

La prueba de significacin se realiza mediante el estadstico X, definido ms arriba
(8.6). Como se ha mencionado, este estadstico sigue una funcin de probabilidad conocida
como chi-cuadrado y su magnitud aumenta cuanto mayor es la diferencia entre valores
observados y esperados. La distribucin se halla tabulada de modo de dar la probabilidad
con que distintos valores de la funcin son sobrepasados por azar de muestreo. En el caso
particular del arreglo 2 2, se dice que chi-cuadrado se halla distribuido con un grado de
libertad.

Los grados de libertad pueden entenderse como el nmero de celdas en que deben calcularse los casos esperados, para que queden automticamente determinados, por diferencia
con los marginales, los valores de las dems. As, se ha hecho notar ms arriba que en una
tabla de 2 2, basta calcular el valor en una de las celdas para que queden automticamente
determinados los valores de las otras tres: luego, en estas tablas X se distribuye con un grado
de libertad.
En la celda determinada por la fila Grupo 1 y la columna Obitos, se han observado 24 casos
y se han calculado 16 casos esperados. Luego, el primer trmino de la sumatoria en (8.6) es:

(O E) / E = (24 16) / 16

= 64 / 16

=4
Prosiguiendo con las tres celdas restantes, puede comprobarse que en todas ellas la diferencia es igual, en dos con signo positivo y en dos con signo negativo. Los correspondientes
cuadrados son siempre positivos y los cuatro numeradores de la sumatoria de X son iguales:

X = [ (O E) / E ]
= [(24 16) / 16] + [(42 50) / 50] + [(90 98) / 98] + [(314 306) / 306]
= 64 / 16 + 64 / 50 + 64 / 98 + 64 / 306 = 6.14
Segn tablas de la distribucin , para un grado de libertad y X = 6.14, se tiene P =
0.013, lo que obliga a aceptar una desviacin significativa de los valores observados, de aqullos que se esperan bajo la hiptesis nula de proporcionalidad entre los valores de las celdas
y sus marginales. La mortalidad y la presencia de insuficiencia renal crnica se hallan asociadas en forma estadsticamente significativa en la muestra analizada. Ntese tambin que
el valor de P obtenido aqu, es igual al que se obtuvo con la aproximacin normal (esto no es
casual, dado que las distribuciones normal y se hallan emparentadas matemticamente).

El mtodo de las tablas de contingencia se generaliza para ms de dos filas y / o columnas, siendo los procedimientos, anlogos al caso ms frecuentemente utilizado de la tabla
22. En todos los casos, los valores esperados para una celda se calculan como en (8.7), mul[ 260 ]

tiplicando los marginales de la fila y la columna correspondientes a esa celda, y dividiendo


por el gran total. Deben conservarse las suficientes cifras decimales en los nmeros calculados, a fin de no disminuir la exactitud de las estimaciones.
El valor de X se obtiene como indica (8.6). Hay varias frmulas equivalentes para el
clculo de X, tendientes a simplificar la aritmtica, pero con los recursos actuales para el
clculo que ofrecen los programas estadsticos, su exposicin aparece poco relevante.

Los grados de libertad para las tablas de contingencia se calculan siempre como el producto (nmero de filas 1) (nmero de columnas 1). As, una tabla de 3 4 tendr asociados (3 1) (4 1) = 6 grados de libertad. La importancia prctica de los grados de libertad
es que a medida que aumentan, se necesitan mayores valores de X para alcanzar un mismo
nivel de significacin estadstica.

Las distribuciones chi-cuadrado funcionan con variables discretas y por lo tanto, nunca
deben emplearse con porcentajes, o sea, despus de convertir las observaciones en valores
porcentuales (%), pues stos no siguen la distribucin .
8.3. Correccin de continuidad para las distribuciones discretas
Se ha dicho que una distribucin de proporciones muestrales es discreta, lo que puede
originar inexactitudes cuando se realizan inferencias utilizando las funciones normal o chicuadrado, ambas continuas. Estos inconvenientes son ms importantes cuando las muestras
son chicas. Por este motivo es comn introducir una correccin, llamada de continuidad, en
los procedimientos con variables discretas que recurren a la funcin normal o las distribuciones chi-cuadrado como se ha visto ms arriba. En el caso de la aproximacin por la normal,
el procedimiento consiste en acercar las proporciones muestrales p1 y p2 sumando 0.5 al numerador de la ms chica y restando 0.5 al de la ms grande, con lo que se reduce la diferencia
entre las nuevas estimaciones de p1 y p2 .
Ejemplo 8.3. Correccin de continuidad en el Ejemplo 8.1
Si p1 es la mayor de las dos proporciones muestrales, su versin corregida estar dada por:
p1C = (r1 0.5) / n1
y siendo p2 la menor de las dos proporciones muestrales, su versin corregida ser
p2C = (r2 + 0.5) / n 2
Con los datos del Ejemplo 8.1, resulta:
p1C = (24 0.5) / 66 = 0.356
p2C = (90 + 0.5) / 404 = 0.224
Obsrvese que aunque 24 es menor que 90, la probabilidad de p1 es mayor que la de p2 , motivo
por el cual se reduce 24 y se incrementa 90. De esta forma, p1C se reduce y p2C se incrementa,
disminuyendo la diferencia entre ambas, lo que hace ms exigente al test de significacin. La
diferencia p1C p2C = 0.132 es ligeramente menor que la obtenida sin la correccin, y permite
calcular z = 2.32, que corresponde a P = 0.02, valores ligeramente inferiores a los obtenidos
[ 261 ]

en el Ejemplo 8.1 sin efectuar la correccin de continuidad. Como se ve, sta resulta conservadora en el sentido de disminuir el nmero de resultados significativos en las pruebas.
En el caso de X la correccin de continuidad se aplica reduciendo en 0.5 la diferencia
entre cada valor observado y su correspondiente calculado. Dicha correccin es obligatoria
siempre que el valor esperado en alguna celda sea menor que 5.
Ejemplo 8.4. Correccin de continuidad en el Ejemplo 8.2

La correccin se efecta restando 0.5 del valor absoluto de cada diferencia entre valor
observado y valor calculado. De esta manera, (8.6) queda modificada de la siguiente forma:
X = [ ( O E 0.5 ) / E ]

(8.8)

donde las barras significan la diferencia tomada siempre con signo positivo (valor absoluto).
Reemplazando por los datos del ejemplo, se tiene para el primer trmino:
(O E 0.5 ) / E = (24 16 0.5 ) / 16

= (8 0.5) / 16

= 56.25 / 16

= 3.52
que resulta as de menor magnitud que sin la correccin, circunstancia en la que es igual a 4.
Procediendo de la misma forma con los tres restantes trminos, se obtiene X = 5.40, que
es menor que el valor 6.14 obtenido sin la correccin y, con un grado de libertad, corresponde
a P = 0.02, resultado igual al obtenido mediante la aproximacin normal, al aplicar la correccin de continuidad.
Resulta evidente que la repercusin de la correccin de continuidad en las estimaciones
disminuir al aumentar n y as, su importancia ser menor cuando se trate de muestras grandes y sus efectos sern mayores en las muestras pequeas. Por este motivo se suele aconsejar
emplearla siempre, aunque es un tema discutido y no todos los autores estn de acuerdo (ver
Armitage, 1994).
8.4. Riesgo y riesgo relativo

Los resultados del estudio en pacientes con endocarditis infecciosa visto en los ejemplos anteriores, permitieron afirmar que la proporcin de muerte intrahospitalaria es significativamente
mayor entre quienes presentan insuficiencia renal crnica, y asimismo, que la mortalidad y la
presencia de insuficiencia renal crnica se hallan asociadas en forma estadsticamente significativa. Por otra parte, la proporcin de muerte intrahospitalaria permite estimar su probabilidad
en el correspondiente grupo (3.1), y sta es una medida del riesgo del suceso en cuestin. As, el
riesgo de bito en los pacientes con insuficiencia renal crnica del Ejemplo 8.1 se estima mediante
la razn p1 (bitos / total de enfermos en el grupo IRC), y en forma anloga se calcula el riesgo en
los pacientes del grupo sin IRC. De este modo, el riesgo se define como la probabilidad de desarrollar una enfermedad (o cualquier suceso de inters) en un tiempo determinado de observacin
[ 262 ]

(en el ejemplo, durante la duracin de la internacin). El concepto de un tiempo dentro del cual se
realizan las observaciones es de importancia, como se ver en las Secciones 15 y 16.
Tratndose de una probabilidad, el riesgo puede expresarse como una proporcin y tambin como un porcentaje. En el Ejemplo 8.1, el riesgo de muerte en el grupo 1 se estim como
p1 = 0.364 o 36.4%. Los intervalos de confianza para el riesgo se calculan como los correspondientes a las proporciones que lo estiman.
Ejemplo 8.5.
En el Ejemplo 8.1 se vio que la proporcin de bitos en pacientes con endocarditis infecciosa e insuficiencia renal crnica, que estima el riesgo en el grupo, estuvo dada por
p1 = r1 / n1
= 24 / 66 = 0.364 o 36.4%
El intervalo de confianza del 95% para la estimacin se obtiene por aproximacin a la distribucin normal, tomando z = 1.96. La varianza (4.11) y el error estndar de p son iguales a :
Var (p) = p (1 p) / n
ES (p) = p (1 p) / n
y los lmites de confianza del 95% estarn dados por p 1.96 ES (p).
Con los datos del ejemplo:
Var (p) = 0.364 (1 0.364) / 66 = 0.00351
ES (p) = 0.00351 = 0.059

Lmites de confianza del 95%: 0.364 (1.96 0.059) = 0.480 y 0.248, o sea 48.0% y
24.8%.
El intervalo de confianza del 95% para la proporcin de bitos observada en la muestra
cuando coexiste insuficiencia renal crnica, se extiende entre 24.8% y 48.0%, y dentro del
mismo es de esperar que se halle la media de poblacin, con el mismo nivel de confianza.
Para comparar el riesgo entre dos grupos diferentes, es posible dividir el riesgo en uno de
ellos por el riesgo en el otro. El cociente se denomina riesgo relativo (RR, relative risk o risk
ratio) y expresa el riesgo del grupo en el numerador, con respecto al grupo en el denominador.
Simbolizando el riesgo con el cociente p = r/n, entre el nmero de individuos afectados ( r )
y el nmero total de individuos ( n ) en el correspondiente grupo, el riesgo relativo entre dos
grupos queda expresado por:
RR = (r 1 / n 1 ) / (r 2 / n 2)

(8.9)

donde los subndices identifican los grupos y el RR expresa el riesgo del grupo 1 con
respecto al grupo 2. En el ejemplo, el riesgo de bito en pacientes con insuficiencia renal
crnica result igual a 0.364, mientras que en los pacientes sin insuficiencia renal fue igual
[ 263 ]

a 0.223, con lo que el cociente 0.364 / 0.223 = 1.63, expresa el riesgo relativo de muerte
en los pacientes con insuficiencia renal, respecto de los que no la presentan. Si se invierten
los trminos del cociente, se cambia el grupo de referencia, y en el caso que nos ocupa se
obtiene el riesgo relativo del grupo sin insuficiencia renal, con respecto al grupo de los que
la presentan. Su valor est dado por 0.223 / 0.364 = 0.613, que es la inversa de 1.63 y al
ser menor que 1, indica un menor riesgo en los individuos sin insuficiencia renal cuando
se toma como referencia al grupo que la presenta. En el caso en que RR = 1 los dos grupos
comparados presentan el mismo riesgo, concepto que se extiende a todas las estimaciones
del riesgo relativo.
Existen varios mtodos para estimar el riesgo relativo, en buena parte originados en las
distintas posibilidades que brindan el tipo de datos y los modelos que se manejan, lo cual se
presta a algunas consideraciones. Por ejemplo, en el seguimiento de dos grupos a lo largo
del tiempo, la medicin de la proporcin de casos de enfermedad en cada uno de los grupos
al final del estudio, si bien es un modo de obtener una idea acerca del riesgo relativo, pierde
informacin acerca de lo sucedido durante el tiempo de seguimiento. As, no es lo mismo un
10% de mortalidad incidiendo gradualmente durante varios aos, que ocurriendo mayoritariamente en los primeros das o semanas del seguimiento. En el ejemplo de la endocarditis
infecciosa no se ha informado el tiempo de internacin hasta el bito, aunque no son de esperar perodos muy prolongados por tratarse de procesos agudos o subagudos y, en todo caso,
su registro no ha sido un objetivo de los autores del estudio, de modo que las estimaciones del
riesgo y el riesgo relativo se realizaron a partir de las proporciones de eventos en los distintos
grupos durante toda la internacin. En tanto, para estudios en los cuales el seguimiento en
el tiempo es una caracterstica relevante, existen mtodos apropiados para estimar el riesgo
relativo entre dos o ms grupos, diseados para obtener la mayor informacin posible de la
distribucin temporal de los sucesos y que se comentarn en la Seccin 15. Por otra parte,
otro modo muy difundido de estimar el riesgo relativo es mediante la razn de odds u odds
ratio entre los grupos que se comparan. Este procedimiento, que se emplea siempre en los estudios llamados de caso-control y se examinar en Seccin 16, presenta ciertas limitaciones
cuando se aplica a otro tipo de datos, como los de la endocarditis infecciosa vistos ms arriba,
sobre las que se discutir brevemente en 16.7 y s.

8.5. El test exacto de Fisher

Otro mtodo para la comparacin de proporciones consiste en disponer los datos en
una tabla 2 2 y examinar todas las variaciones que se pueden introducir en los mismos
sin permitir que varen los totales marginales. Con mtodos apropiados, se puede calcular
la probabilidad de cada una de las posibles disposiciones de los datos y luego, proceder a
sumar la probabilidad de la disposicin observada en el experimento, con las probabilidades de todas aquellas disposiciones o tablas que muestren desviaciones ms extremas. El
siguiente esquema ejemplifica el mtodo: Supngase que con un tratamiento A se observan 6
mejoras y 19 faltas de respuesta, y con un tratamiento B se observan 2 mejoras y 20 faltas
de respuesta. La tabla 2 2 con sus totales marginales es la siguiente:

[ 264 ]

Mejoras

Fallas

Total Tratamientos

Tratamiento A

19

25

Tratamiento B

20

22

Total respuestas

39

47

Aparentemente hay cierta ventaja con el tratamiento A. Por lo dems, existen otras dos
tablas que mejoran las cosas a favor de A sin modificar los marginales:
7
1

18
y
21

8
0

17
22

con 7 y 8 xitos respectivamente (compruebe que los marginales son los mismos). No hay
tablas ms extremas que la que le adjudica las 8 mejoras al tratamiento A.
Ahora bien, la probabilidad de presentacin de cada tabla se puede calcular mediante tcnicas de combinatoria que no examinaremos. La pregunta sobre cuntas veces o con
qu probabilidad se puede obtener la tabla del problema o cualquiera de las otras dos ms
extremas, se responde simplemente sumando las probabilidades de cada tabla (que son
independientes). Aqu las probabilidades para las tablas con 6, 7 y 8 xitos a favor de A, si
no hay ninguna influencia de los tratamientos (hiptesis nula) son 0.1301, 0.0336 y 0.0034
respectivamente, disminuyendo a medida que las cuentas se alejan de los valores esperados
en la hiptesis de no asociacin (el lector puede comprobar que el valor esperado bajo esta
hiptesis, para mejora con el tratamiento A, es igual a 4.26). La suma de las probabilidades
arriba calculadas es P = 0.167, que excede el nivel de significacin P = 0.05, por lo que la
hiptesis nula no puede rechazarse. Hay un 16% de probabilidades de obtener por azar una
tabla con 6, 7 u 8 xitos a favor de A.
Tambin se ha propuesto evaluar y sumar la probabilidad de los valores extremos de
la tabla en la otra direccin, esto es, con el tratamiento A en desventaja, con 2, 1 o 0 xitos. Esto equivale a una prueba a dos colas (vase 6.5.2). Existen an otras propuestas,
como calcular P en una sola direccin pero exigir un nivel de significacin ms estricto,
por ejemplo dividiendo P por dos y requiriendo P = 0.025 en lugar de 0.05 como nivel de
significacin.
El mtodo exacto de Fisher se obtiene en los programas estadsticos desde el men para
el anlisis de asociacin en variable discreta. Por otra parte, debe preferirse al mtodo de
chi-cuadrado cuando el nmero de casos esperado en alguna casilla sea menor que 5, o
bien cuando el tamao total de la muestra sea menor que 20. En el primer caso, si bien el
test de chi-cuadrado con correccin de continuidad es adecuado, el hecho de disponerse de
programas para el clculo estadstico hace preferible el empleo del test exacto.

[ 265 ]

9. Correlacin y regresin

9.1. Introduccin
Si se miden la talla y el peso de un grupo de personas, se observar que en general los
individuos ms altos son los de mayor peso, y los ms bajos los de menor peso. Se trata de dos
variables cuantitativas talla y peso que se presentan apareadas, cada par proviniendo de
un individuo, y entre las cuales existe un tipo de asociacin que puede expresarse diciendo
que al aumentar la talla tiende a aumentar el peso. Este tipo de asociacin se denomina
positiva. Otras veces, a los valores ms altos de una variable corresponden los ms bajos de la
otra, como puede ser el caso de la frecuencia cardaca y la duracin de la sstole: cuanto ms
alta la primera, menor la duracin de la segunda. En estos casos se habla de una asociacin
negativa o inversa entre las dos variables. Debe insistirse en que cada par de mediciones procede de una misma fuente, por ejemplo, cada individuo provee su estatura y su peso, o bien la
frecuencia cardaca y la duracin de la sstole. Adems, debe notarse que en vez de expresar
al aumentar la talla tiende a aumentar el peso podra decirse al aumentar el peso tiende a
aumentar la talla, ya que lo que se est haciendo es describir cmo se asocian las variables,
sin pretender afirmar si una variable determina el valor de la otra. Este tipo de asociacin
entre dos variables se suele referir con el nombre de correlacin.
El grfico natural para este tipo de datos es el diagrama de dispersin (scatterplot)
representado en la figura 9.1. Consiste en un par de ejes cartesianos, uno horizontal, comnmente llamado eje de abscisas o eje de las x, y otro vertical, eje de ordenadas o eje de las
y. A cada una de las dos variables correlacionadas se les adjudica un eje y de esta manera,
a cada par de datos xi e yi , le corresponde un punto de la grfica, con coordenadas xi , yi.
En la figura 9.1. A, estn representados los puntos correspondientes a la talla y peso de un
grupo de adultos de ambos sexos. Observando un punto, que representa a un individuo,
se pueden obtener la talla y el peso proyectndolo en forma perpendicular sobre cada uno
de los dos ejes, en donde se leen los correspondientes valores. En este ejemplo y en forma
arbitraria, se adjudicaron el eje de abscisas a la talla y el de ordenadas al peso. El hecho de
que ambas variables tiendan a crecer o decrecer conjuntamente, se evidencia en la direccin
de la nube de puntos que las representa, que se orienta hacia la derecha y arriba. Como se
mencion, este tipo de correlacin se llama positiva, y si los puntos se representan por una
recta que pase a travs de ellos, sta tendr pendiente positiva. Desde ya se puede adelantar
que si la relacin entre las variables fuera perfecta (y lineal), los puntos estaran sobre
[ 266 ]

una recta. Este no es el caso de la figura, donde forman una nube alargada que sigue una
direccin ms o menos lineal.
En la figura 9.1.B, se hallan representados la frecuencia cardaca y la duracin del perodo
eyectivo del ventrculo izquierdo medida en milisegundos, en una muestra de 100 individuos
adultos de ambos sexos. En este caso se observa que cuanto mayor es la frecuencia cardaca
el perodo eyectivo tiende a ser ms breve. Este tipo de correlacin, donde una variable tiende
a disminuir cuando la otra aumenta, se llama negativa o inversa, y si los puntos de la grfica
se representaran por una recta, sta se orientara hacia la derecha y abajo, exhibiendo una
pendiente negativa.
Figura 9.1. Grficos de dispersin. A: correlacin positiva entre talla y peso en 255 individuos
adultos de ambos sexos. B: correlacin negativa entre frecuencia cardaca y perodo eyectivo
en 100 adultos de ambos sexos sin enfermedad cardaca.


Lo visto es el aspecto grfico de la relacin entre dos variables. Cmo se puede medir
el grado de intensidad o fuerza de la asociacin? Corrientemente se emplea un estadstico
muestral conocido como coeficiente de correlacin, que se suele simbolizar con la letra r y
cuyo valor absoluto puede oscilar entre 0 (en cuyo caso hay ausencia total de correlacin y
los puntos de la grfica forman una nube sin direccin alguna) y 1 (en cuyo caso los puntos
se hallan perfectamente alineados sobre una misma recta). En los casos intermedios los
puntos tienden a agruparse en forma que sugieren la relacin que hay entre ellos, y cuanto
[ 267 ]

ms se aproxima el coeficiente de correlacin a la unidad, ms se aproximan los puntos


a una lnea que representa la direccin general del conjunto. El coeficiente de correlacin
puede tener signo positivo o negativo, indicando si la asociacin entre las variables es positiva o negativa, en el sentido ya mencionado. As, para un determinado valor absoluto de r,
el cambio de signo slo cambia la inclinacin de los puntos, como si la grfica se reflejara
en un espejo.
Puede tenerse una idea del significado del coeficiente de correlacin observando las dispersiones de la figura 9.1.A, donde r = 0.71 (correlacin positiva) y 9.1.B, donde r = 0.92
(correlacin negativa o inversa). Puede apreciarse que los puntos se hallan ms estrechamente
alineados en la segunda grfica, lo que se debe al valor ms alto de r, mientras que el signo de
la correlacin expresa la direccin general de los puntos, ascendiendo o descendiendo
hacia la derecha del grfico.

Dejando momentneamente el tema de la correlacin y considerando un caso donde los
puntos muestrales se hallen dispersos a lo largo de un trayecto indicando una cierta direccin
general, puede determinarse una recta que juega un rol anlogo al de la media muestral, al
representar y resumir la posicin de los puntos muestrales. Una recta tal tiene la siguiente
propiedad: si se miden verticalmente las distancias de cada punto a la recta y se las eleva al
cuadrado, la suma de todos los cuadrados es la mnima que se puede lograr para ese conjunto de puntos. Esto quiere decir que entre todas las rectas que se pueden hacer pasar por
los puntos, hay una que hace de la suma de los cuadrados lo que matemticamente se conoce
como un mnimo. Cualquier cambio subsiguiente en la altura o en la inclinacin de la recta,
por pequeo que sea, tendera a desmejorar el ajuste, aumentando la suma de las distancias
al cuadrado.* La recta que corresponde a la sumatoria mnima se llama recta de regresin y
est dada por una ecuacin lineal, ecuacin de regresin, cuya forma general es y = a + bx.
La ecuacin de esta recta de regresin se obtiene a partir de los datos muestrales mediante
procedimientos de clculo sobre cuya rutina se dar luego una breve resea ilustrativa. Sin
embargo, el clculo de esas ecuaciones figura en el men de los programas de estadstica, de
modo que lo que debe procurarse comprender son los conceptos bsicos que justifican la utilidad de la correlacin y la regresin en el campo de la investigacin mdica, ya que el clculo
numrico se obtiene fcilmente con solo introducir los pares de datos muestrales en dichos
programas.
La funcin lineal
Si en la ecuacin y = a + bx las letras a y b se reemplazan por nmeros fijos o constantes
y entonces se procede a dar valores arbitrarios a la x, para cada x la y toma un valor obligatorio. Se dice entonces que y es funcin de x, que x es la variable independiente (toma los
valores que se elijan), y que y es la variable dependiente (sus valores estn determinados por
los de x). Las ecuaciones con la forma y = a + bx corresponden siempre a lneas rectas, y esta
es la forma de las ecuaciones de regresin lineal.

Las letras a y b son constantes en cada ecuacin y se denominan parmetros. La letra
* Aqu ocurre algo similar a lo ya visto respecto del clculo de la varianza muestral (2.5.2): si las distancias de los
puntos a la recta se toman con su signo segn stos se hallen por encima o por debajo de la recta, la suma se cancela
y no se obtienen operadores tiles. En tanto, las distancias elevadas al cuadrado son siempre positivas y los estadsticos
resultantes demuestran tener numerosas aplicaciones tericas y prcticas.

[ 268 ]

a corresponde al valor que toma y cuando x = 0, o sea al punto en que la recta cruza el eje
vertical o eje de las y. Por este motivo representa el valor de la ordenada ( y ) en el origen de
las x (x = 0) y se denomina ordenada al origen.
En tanto, b multiplica a la variable independiente x, y el producto contribuye al valor de
y. Por lo tanto, si x se incrementa en una unidad, el incremento de y ser igual a b (al hacer
x = x + 1 el producto bx pasa a valer b (x + 1) = bx + b, con lo que bx aumenta b unidades).
Dicho de otra forma, b expresa el crecimiento de la funcin y = a + bx cada vez que x aumenta
en una unidad. Cuanto ms grande sea el valor de b, ms rpidamente crecer la funcin y
mayor ser la inclinacin de la recta que la representa.
En la figura 9.2 se observa cmo a un incremento x de la variable independiente corresponde un incremento y de la funcin. El cociente y / x es la tangente trigonomtrica de
la recta que representa y = a + bx, y se observa que si x = 1, de acuerdo a lo visto arriba, y
debe ser igual a b. Por este motivo b se denomina pendiente de la funcin y corresponde a la
inclinacin de la recta que la representa.

Qu ocurre cuando b tiene signo negativo? Como se comprende, a cada incremento de
x le corresponder un producto bx con signo negativo, con lo que el valor de la funcin y
disminuye y la recta que la representa se inclina hacia la derecha y abajo. En este caso las
variables x e y se hallan correlacionadas negativamente y la recta correspondiente presenta
pendiente negativa, igual a b.

Bastan las constantes a y b para determinar una recta nica, y cada recta est completamente caracterizada por esos dos parmetros.
9.2. Regresin lineal
Se ha visto que a partir de los datos muestrales puede determinarse una ecuacin de regresin, que corresponde a una recta de regresin con respecto a la cual, la sumatoria de las
distancias de los puntos muestrales elevadas al cuadrado, es un mnimo. Cuando se estudia
la regresin entre dos variables, en general siempre interesa ms conocer el efecto de una de
ellas sobre la otra. Por ejemplo, entre el perodo eyectivo del ventrculo izquierdo y la frecuencia cardaca, en general interesar saber qu valores puede tomar el primero para diferentes
frecuencias cardacas, mientras que difcilmente se est interesado en estimar la frecuencia
cardaca a partir de la medicin del perodo eyectivo. La ecuacin que da el perodo eyectivo
(y) en funcin de la frecuencia cardaca (x) tendr la forma Eyectivo = a + (b frecuencia cardaca). Los valores de a y b se obtienen de las muestras. Esto significa que en cualquier caso,
para obtener una ecuacin de regresin se precisa un grupo de observaciones en las que basar
los clculos. Luego, el investigador podr aplicar los resultados al estudio de otros grupos,
con alguna de las finalidades que se comentarn en ms adelante. Tambin debera tenerse
presente que los valores de la variable dependiente dados por la ecuacin de regresin para
cada posible valor de la variable independiente, son los valores esperados o ms probables,
existiendo un margen de error, como se ver enseguida.
Es importante tener en cuenta el rol de cada variable. Cuando x acta como independiente e y como dependiente, sta puede calcularse dando valores a x, hablndose entonces
de regresin de y en x. Esto implica que el mnimo de las distancias que determinan los parmetros a y b de la recta, se toma en la direccin del eje vertical o de ordenadas. Es posible
[ 269 ]

intercambiar ejes y calcular la regresin de x en y, siendo la ecuacin de la nueva recta en general diferente a la anterior, ya que las distancias minimizadas se toman ahora a lo largo del
eje horizontal. Sin embargo, corrientemente se trabaja con la regresin de y en x, a la cual se
refiere esta resea. En algunas oportunidades, x suele ser referida como variable predictora
o covariable.

La pendiente de la recta, b, toma el nombre de coeficiente de regresin e informa el signo
y magnitud de la relacin entre x e y.
Ejemplo 9. Obtencin de las ecuaciones de regresin

Slo con el objeto de esbozar la obtencin de las ecuaciones de regresin a partir de las
muestras obtenidas en la prctica, se exponen someramente los procedimientos estadsticos
bsicos a partir de las variables x e y cuyos valores se dan en la tabla 9.1.

Tabla 9.1
Caso

(x x)

(y y)

(x x)

(y y)

(x x) (y y)

TOTAL

15

25

10

22

14

x = x / n = 15 / 5 = 3
(x x) = 10

y = y / n = 25 / 5 = 5
(y y) = 22

(x x) (y y) = 14


Las diferencias al cuadrado son ya conocidas y se utilizan en el clculo de la varianza y
el desvo estndar. Las columnas (x x) y (y y) corresponden a las mismas diferencias antes
de ser elevadas al cuadrado, por lo cual tienen signo positivo o negativo, y en total suman
cero. Sus productos, (x x) (y y) para cada par de datos, figuran en la ltima columna con
el signo correspondiente (signos iguales tienen producto positivo, signos diferentes producto
negativo). La sumatoria de los productos, (x x) (y y), que est relacionada con una
medida de la dependencia entre dos variables tericas llamada covarianza, interviene en el
clculo del coeficiente de regresin b que se obtiene mediante la frmula
b = (x x) (y y) / (x x)

(9.1)

Remplazando por los datos del ejemplo:


b = 14 / 10 = 1.4
que expresa que la y crece a razn de 1.4 unidades por cada unidad en que lo hace x (Fig. 9.2).
[ 270 ]

Figura 9.2. Recta de regresin correspondiente a la ecuacin y = 0.8 + 1.4 x. El cociente de


los incrementos y / x de las respectivas variables, es igual a la pendiente b de la recta. Se
observa el valor de la funcin al origen, cuando x = 0. Las distancias de los puntos a la recta
( d ), se miden a lo largo del eje vertical.

Las medias de x e y determinan un punto que siempre se halla sobre la recta de regresin (en
este caso x = 3, y = 5). Aprovechando esto, una vez obtenido el coeficiente de regresin b, solo
queda calcular la ordenada al origen, a, para tener la ecuacin de regresin completa. Siendo y
= a + bx, pueden reemplazarse la x y la y por sus valores medios x = 3, y = 5 obtenindose:

5 = a + 1.4 3
= a + 4.2
de donde
a = 5 4.2
= 0.8
con lo cual la ecuacin de regresin puede escribirse:
y = 0.8 + 1.4 x
Existen, como es de suponer, una cantidad de condiciones y requisitos tericos para
garantizar que las ecuaciones de regresin calculadas a partir de las muestras proporcionen
resultados acordes con la realidad de los datos y para que los procedimientos de investigacin
e inferencia estadstica realizados sean correctos. No corresponde extenderse sobre el tema,
pero conviene saber que tanto x como y deben tener, cada una, distribuciones normales (o
muy prximas a la normal).

Los valores de la recta de regresin proporcionan el valor esperado o ms probable de
la variable dependiente y para cada valor de la variable independiente x. Sin embargo, en los
[ 271 ]

grficos de dispersin se observa que los puntos se distribuyen en el entorno de recta y en


general queda una distancia entre cada punto y la misma (Fig. 9.2, d). Ahora bien, estando
las variables relacionadas entre s, se observa que en promedio, las distancias de los puntos
a la recta son menores que las distancias de los puntos a la media de y. Es decir, las y estn
ms concentradas alrededor de la recta que alrededor de su media y . Esta reduccin de la
incertidumbre es una de las caractersticas fundamentales de la regresin y se dice que parte
de la variabilidad de la variable dependiente y queda explicada por la regresin, o que la
regresin da cuenta de cierta cantidad de variacin. La variabilidad que persiste alrededor
de la recta se denomina residual.
En la figura 9.3 referente a la talla y el peso en 255 adultos sanos, se observa que el rango
de dispersin del peso alrededor de su media, ledo sobre el eje y, an despus de excluir un
valor extremo de 128 kg, se extiende entre 40 a 114 kg. En tanto, la dispersin de los puntos
por arriba y debajo de la recta, o sea las distancias de los puntos a la recta, son en promedio
claramente menores, lo que ya es aparente a la inspeccin visual del diagrama. Esta caracterstica esencial de la regresin se ver con algn detalle luego de examinar el tema de la
correlacin (9.3).
Figura 9.3. Regresin del peso en la talla en 255 individuos adultos de ambos sexos. La sumatoria de los cuadrados de las distancias de los puntos a la recta es un mnimo. La flecha
grande representa la dispersin del peso alrededor de la media, y la flecha menor, la dispersin alrededor de la recta de regresin.

La ecuacin de regresin del caso que nos ocupa es:


Peso ( kg ) = 117 + 1.144 Talla ( cm )

que expresa que por cada centmetro de estatura el peso vara en promedio 1.144 kg en la
poblacin muestreada.

Ntese que el valor de la ordenada al origen es igual a 117, lo que significa que el peso
esperado en el caso de una talla prxima a cero tendra valor negativo. La explicacin es
[ 272 ]

que la recta ha sido calculada dentro de rangos de talla y peso muy diferentes, y la variable
peso sencillamente no existe para talla cero. Otro resultado de extender la operacin de la
recta ms all de los lmites permitidos por el rango de las variables de origen, es que para
un individuo de 1.10 m de estatura estima un peso de 9 kg. Evidentemente, la ecuacin no es
adecuada para su empleo en nios o en adultos con valores extremos en sus caractersticas
corporales). Tampoco existe la posibilidad de que la frecuencia cardaca de un individuo tome el valor cero, aunque la ecuacin de regresin proporciona para el caso un perodo eyectivo muy prolongado. Estos resultados pueden ocurrir cuando funciones tericas se extienden
indefinidamente ms all de la existencia fsica de las variables y de los lmites para los que
han sido calculadas. As, aceptar que las variables se comportan como lo predice la recta de
regresin an ms all de dichos lmites, lo que se conoce como extrapolacin de las estimaciones o de las conclusiones, es un procedimiento al menos inseguro cuando no errneo, que
en general debe evitarse.
9.2.1. Variabilidad de los coeficientes de regresin muestrales

Debe tenerse en cuenta antes de proseguir, que los coeficientes a y b de la ecuacin de
regresin son estadsticos sujetos al azar del muestreo, que estiman los parmetros universales y respectivamente. Estos caracterizan la ecuacin de regresin del universo de donde
provienen las muestras, que se expresa y = + x. Surgen aqu varios temas de inferencia
estadstica, de los cuales slo se examinar lo relativo a la significacin del coeficiente de
regresin entre dos variables x e y.

Dadas dos variables, el coeficiente de regresin b entre ambas puede ser de mayor o
menor magnitud, expresando la variacin de y ante los cambios de x. Sin embargo, debe ser
distinto de cero, pues en este caso, el trmino bx de la ecuacin de regresin se anulara para
todas las x, que as no tendran ninguna relevancia en la determinacin de las y. En este sentido, una vez calculada la ecuacin de regresin, debe ponerse a prueba y poder rechazarse la
hiptesis nula = 0, que es la condicin para aceptar que el coeficiente b estima un parmetro
diferente de 0 y contribuye efectivamente en la determinacin de y.
Ejemplo 9 (continuacin). Significacin estadstica de b frente a la hiptesis nula = 0
Si se determina b en varias ocasiones se observarn las variaciones debidas al error del
muestreo. Como se ha mencionado, para aceptar una relacin entre las variables x e y, se debe
poner a prueba el coeficiente de regresin b y demostrar su significacin estadstica frente a
la hiptesis nula de que el coeficiente de regresin para la poblacin es igual a cero ( = 0).
El procedimiento consiste en construir a partir de los valores muestrales un estadstico de
prueba que tiene la forma
t = b / ES ( b )

(9.2)

donde ES (b) es el error estndar del coeficiente de regresin b. La distribucin correspondiente es t con (n 2) grados de libertad, siendo n el nmero de pares muestrales.
Para llegar a t, primero debe calcularse una cantidad que es anloga a la varianza muestral ya conocida, con la diferencia que en este caso, las desviaciones que se elevan al cuadra[ 273 ]

do y suman, son las que existen entre los puntos muestrales y la recta. En el ejemplo visto
antes e ilustrado en figura 9.2, cinco puntos muestrales producan la ecuacin y = 0.8 + 1.4
x. Para obtener las desviaciones mencionadas, se calcula el valor Y de la recta (Y recta) para
cada x de la muestra:
fila 1: x = 2 Y = 0.8 + 1.4 2 = 3.6
fila 2: x = 4 Y = 0.8 + 1.4 4 = 6.4
y as sucesivamente completando las filas como se muestra en la tabla 9.2.
Tabla 9.2
Caso

y observado

Y recta

y observado Y recta

( y observado Y recta )

3.6

0.6

0.36

6.4

+0.6

0.36

5.0

1.0

1.00

7.8

+0.2

0.04

2.2

+0.8

0.64

TOTAL

15

25

25

2.40

Para cada punto muestral, la diferencia entre el valor de y observado (real) y el valor de y
que da la recta para el correspondiente valor de x (Y recta), se eleva al cuadrado y, sumando
en la ltima columna se obtiene la suma de cuadrados residual, que dividida por (n 2) es un
trmino que equivale a la varianza alrededor de la recta y se denomina cuadrado medio residual. El trmino residual expresa que el grado de dispersin vertical alrededor de la recta que
miden estos operadores es un residuo de variabilidad que persiste una vez que la regresin ha
reducido la variabilidad de las y alrededor de su media y. El procedimiento es como sigue:

Suma de cuadrados residual = (y observado Y recta)

(9.3)

Cuadrado medio residual = S 0 = (y observado Y recta) / (n 2)

(9.4)

Dividiendo S 0 por (x x) (ya calculado en Tabla 9.1) se obtiene la varianza de b:


var (b) = S 0 / (x x)

(9.5)

cuya raz cuadrada es el error estndar de b utilizado para la prueba de hiptesis:


ES (b) = S 0 / (x x)
y es el denominador de t en (9.2).

[ 274 ]

(9.6)

En el ejemplo se tiene:
Suma de cuadrados residual = 2.40
S 0
= 2.40 / (5 2) = 0.8
var (b) = 0.8 / 10 = 0.08
ES (b) = 0.08 = 0.2828
t = 1.4 / 0.2828
= 4.95
que, con 5 2 = 3 grados de libertad corresponde a P = 0.0158. Se rechaza la hiptesis
nula, pues b se aparta significativamente de 0, y se asume la validez de la regresin entre
x e y.

Si la regresin de y en x resulta significativa como en el ejemplo, es lcito suponer una
relacin funcional entre ambas variables y se puede aprovechar la informacin que aporta la
variable independiente para predecir o estimar el comportamiento de la variable dependiente.
De lo que se ha visto, se deduce que al informar el resultado de un ensayo de regresin lineal
es fundamental proporcionar, adems de la ecuacin de regresin, la significacin estadstica
del coeficiente de regresin b, que en general se acepta si P < 0.05.
9.3 Correlacin

Se ha mencionado que el coeficiente de correlacin, simbolizado r, mide el grado de
asociacin entre dos variables y se aproxima a 1 o 1 a medida que los puntos muestrales del
diagrama de dispersin tienden a presentarse sobre una lnea recta. Se ha mencionado tambin que el signo positivo corresponde al caso en que las variables crecen juntas y el negativo
al caso en que una variable crece cuando la otra decrece. En el caso en que no exista ningn
grado de correlacin entre las variables el coeficiente de correlacin toma el valor cero. Por lo
tanto, el coeficiente de correlacin podr hallarse entre 1 y 1.

Como no ha de extraar, por describir la interrelacin entre dos variables, el coeficiente
de correlacin est emparentado con el coeficiente de regresin, y para una muestra cualquiera, evaluar la significacin estadstica de b o r frente a la hiptesis nula, tiene los mismos
resultados. Sin embargo, mientras b informa la posicin y modo de relacionarse las variables,
y es til para describir los valores esperados de la variable dependiente al asignar valores a la
variable independiente, el coeficiente de correlacin slo indica la magnitud de la tendencia
de los puntos muestrales a disponerse sobre una lnea recta.
Ejemplo 9 (continuacin). Clculo de r.

La frmula que proporciona r a partir de los datos muestrales guarda gran similitud con
la vista en el clculo de b, en particular por incluir el producto de los desvos de las x y las y:
r = (x x) (y y) / [ (x x) (y y)]

(9.7)

En el ejemplo, los elementos para el clculo se hallan en la tabla 9.1 y se obtiene:


r = 14 / (10 22) = 0.944
[ 275 ]


La significacin estadstica de r se halla tabulada para distintas r y para distintos tamaos de muestra. Para una muestra de tamao 5, el nivel de significacin de r = 0.944 es P =
0.0158, idntica a la significacin de b, como ya se ha mencionado.

No se abundar con el procedimiento de clculo de P, que se obtiene en forma inmediata
en los programas de estadstica y ya se ha dicho que es equivalente a la P obtenida en la evaluacin del coeficiente de regresin b, pero s se mencionar que para un mismo valor de r, la
significacin ser mayor al aumentar el tamao de la muestra (nmero de pares muestrales)
y para un mismo tamao de muestra, la significacin aumentar al aumentar el valor de r.
Esto es, la significacin estadstica de r frente a la hiptesis nula de no correlacin, aumenta
exclusivamente con el valor de r y con el tamao de la muestra.
9.3.1. El coeficiente de determinacin r
Si se eleva al cuadrado el coeficiente de correlacin, se obtiene el llamado coeficiente de
determinacin, r, con un rol muy importante en el anlisis ya que permite relacionar la suma
de cuadrados de y alrededor de su media (Tabla 9.1, columna [y y] ), con la suma de cuadrados residual a la que se reduce la variabilidad de y cuando se la mide con respecto a la recta de
regresin. Su significado se comprender mejor a travs del ejemplo que se viene examinando.
Ejemplo 9 (continuacin). Variabilidad total y variabilidad explicada por la regresin
Como se ha visto en 2.5.2, la varianza muestral es el cociente entre la suma de las desviaciones de la media elevadas al cuadrado y el nmero de elementos de la muestra. El numerador de esta expresin se denomina suma de cuadrados alrededor de la media, y es tambin
una medida de la variabilidad. En la Tabla 9.1, la suma de cuadrados alrededor de la media
para la variable dependiente y es el total de la columna (y y), que expresa la dispersin de
las y independientemente (sin tomar en cuenta) los valores de x.
Por otra parte, en Tabla 9.2 se calcularon las desviaciones verticales de las y respecto de
la recta (ver Figura 9.2, d). Estas desviaciones, elevadas al cuadrado y sumadas, expresan lo
que queda de la variabilidad total de las y cuando sus desviaciones se toman respecto de la
recta de regresin, y recibe el nombre de suma de cuadrados residual. En Tabla 9.2, es el total
de la columna (y observado Y recta).
Si ahora, a la suma de cuadrados alrededor de la media se le resta la suma de cuadrados
residual, puede comprenderse que la diferencia represente los cuadrados explicados por la
regresin, o sea, la porcin de variabilidad o incertidumbre en la estimacin de y que ha sido
suprimida al tomar como referencia a la recta de regresin en lugar de la media de las y (los
cuadrados suprimidos por la regresin se corresponden con las distancias desde la recta a
la media de y, tomadas a nivel del valor x de cada observacin [Y recta y] ). De acuerdo a
lo expresado, la relacin entre las sumas de cuadrados puede escribirse:

suma alrededor de la media (suma total) suma residual = suma explicada por la regresin
En el ejemplo, la suma total de cuadrados alrededor de la media de y est dada en la
Tabla 9.1 y es igual a 22, la suma residual, obtenida en Tabla 9.2, es igual a 2.4, y la suma de
cuadrados explicada por la regresin resulta igual a 22 2.4 = 19.6. La variabilidad que resta
en el modelo luego de aplicada la regresin de y en x, variabilidad residual, es muy pequea
[ 276 ]

comparada con la variabilidad de y sin regresin (igual a 22), y con la variabilidad explicada
por la regresin (igual a 19.6).
Se demuestra que el coeficiente de determinacin r es igual a la proporcin de la variabilidad total de la y, explicada por la regresin. En trminos de suma de cuadrados:
r = suma explicada por la regresin / suma alrededor de la media
En el ejemplo se tiene que
r = 19.60 / 22
= 0.891
valor idntico al que se obtiene elevando al cuadrado el coeficiente de correlacin r calculado
ms arriba (r = 0.944 = 0.891). Una proporcin muy alta de la variabilidad total de la y est
explicada en este ejemplo por la regresin, exactamente 0.891 u 89%. Queda un 11% de la variabilidad, no explicada por la regresin, que es la variabilidad residual alrededor de la recta.
Esto puede visualizarse en la Figura 9.2, donde las distancias de los puntos a la recta son pequeas comparadas con el rango de variacin total de las y alrededor de su media. Debe tenerse
presente que para evaluar el efecto de una regresin en la estimacin de la variable dependiente,
no es preciso realizar las sumas de cuadrados vistas ms arriba, sino que basta con calcular el
cuadrado del coeficiente de correlacin r, que resulta igual a la proporcin de la variabilidad
total de y eliminada por el empleo de la ecuacin de regresin. Cuanto ms se aproxima r a la
unidad, mayor es la eficacia de la regresin y menor la variabilidad residual de las observaciones
alrededor de la recta. Cuando r = 1, el 100% de la variabilidad est explicada por la regresin,
la residual es cero y los puntos se hallan exactamente sobre la recta.
Como se acaba de ver, la proporcin de la variabilidad total de una variable y explicada por
su regresin en una variable x, est dada por el coeficiente de determinacin r. Dicha variabilidad, por motivos tericos, est expresada en trmino de sumas de cuadrados, y la suma total es
precisamente el numerador de la varianza muestral de y. Para dar un ejemplo ms, en la regresin
del peso en la talla ilustrada en la Figura 9.3, el coeficiente de correlacin es r = 0.71 y el coeficiente
de determinacin r = 0.50, de donde se deduce que la variabilidad del peso, en trmino de suma
de cuadrados, se reduce en 50% al tomar en cuenta su regresin en la talla. Una idea de esta reduccin la da la inspeccin de la figura, donde se ve que la dispersin de los puntos hacia arriba
y abajo de la recta es bastante menor que la dispersin total alrededor de la media, que va desde
41 a 128 kg. Sin contar con la regresin en la talla, si hubiera que apostar al valor ms probable
del peso de un individuo sorteado del conjunto, lo ms ventajoso sera optar por la media de la
muestra, que es igual a 72 kg, ya que en distribuciones normales el mximo de probabilidad est
en el centro de la distribucin. En cambio, conociendo la regresin del peso en la talla, lo ms
conveniente sera apostar al valor que da la recta para la estatura del individuo en cuestin. Por
ejemplo, si se sabe es igual a 180 cm, la ecuacin proporciona y = 117 + 1.144 180 = 89 kg, y
este valor tiene ms probabilidades de acercarse al peso real del sujeto que la media muestral de 72
kg. Esto es as porque los pesos estn ms concentrados alrededor de la recta (variacin residual
de las y) que alrededor de su media (variacin total de las y). Puede argumentarse que, de llevarse
[ 277 ]

a cabo el experimento, el individuo con talla de 180 cm podra por azar exhibir un peso cercano a
72 kg y perderse la apuesta. Esto puede ocurrir porque los valores que proporciona la recta son solamente los ms probables, y existe una dispersin residual alrededor de la misma, no eliminada
(explicada) por la regresin. Por este motivo podran llegar a perderse algunas apuestas, pero en el
largo plazo, si se repitieran un cierto nmero de veces, se comprobara que en promedio, los pesos
reales se acercan ms a los pesos estimados a partir de la talla que a la media muestral, y esto es
as porque los pesos reales estn en promedio ms prximos a la recta que a su media muestral.

Muy generalmente, puede decirse que correlaciones que van entre r = 0.50 y r = 0.70 son
consideradas buenas. Sin embargo, el valor de un coeficiente de correlacin no slo descansa
en su magnitud sino tambin, en lo adecuado que resulta para la explicacin de los fenmenos estudiados y en las necesidades del estudio (ver ms adelante). Por otra parte, a una correlacin como la recin vista entre la talla y el peso corporal, con r = 0.71, corresponde r = 0.50
y la dispersin original slo se reduce un 50%. Queda una proporcin similar de variabilidad
en la suma de cuadrados residual. No obstante, la significacin estadstica de r = 0.71 en una
muestra de 255 individuos como la del ejemplo, tiene una P < 0.00001. Recurdese que esta P
es la misma que para la prueba del coeficiente de regresin b, y en cualquier caso significa que
una relacin tal como se dio en la muestra y se observa en la figura 9.3, se obtendra por azar
en una muestra no correlacionada, en menos de 1 en 100000 veces. Como se ha mencionado,
la significacin estadstica de un coeficiente de correlacin depende en gran parte del nmero
de casos en las muestras y as, pueden obtenerse coeficientes altamente significativos an con
valores absolutos relativamente bajos, por lo que la importancia del grado de correlacin no
debiera confundirse con la significacin estadstica del respectivo coeficiente.
9.4. Aplicaciones principales de la regresin

Dentro de las aplicaciones de la regresin a los problemas de la investigacin mdica
pueden mencionarse:
Descripcin de la relacin entre dos variables
Esta es la ms general de las aplicaciones: en presencia de asociacin entre dos variables
cuantitativas que puedan considerarse continuas, la regresin determina el signo de la misma,
su grado (dado por la magnitud de la variacin explicada por la regresin), la posicin y la pendiente de la correspondiente recta de regresin y aporta informacin sobre la distribucin de
las desviaciones residuales, que muchas veces resulta de utilidad. Puede decirse que la regresin
caracteriza y resume la informacin relativa a la asociacin de las variables implicadas.
Ciertos ndices clnicos corresponden a coeficientes de regresin; as, se podra afirmar
que en poblaciones adecuadamente representadas por la muestra del ejemplo de la talla y el
peso corporal, ste crece a razn de 1.14 kg por cada centmetro de incremento de la talla. El
valor 1.14 es el coeficiente de regresin de la correspondiente ecuacin del peso en la talla.
Interpretacin de la relacin entre dos variables
Este punto se halla relacionado con el anterior, y con la distincin entre asociacin y causalidad. Las caractersticas de la asociacin entre dos variables informan sobre su comportamiento
en el contexto biolgico del cual proceden y permiten extraer conclusiones tiles. Tpicamente,
[ 278 ]

un aumento de la pendiente de regresin seala una mayor tasa de cambio de la variable dependiente por cada aumento unitario de la variable independiente. Un punto de la mayor importancia relacionado con la interpretacin de la asociacin entre dos variables, es el relativo a las
posibles vinculaciones causales entre los fenmenos descriptos por aqullas. En este sentido, el
hallazgo de regresin entre dos variables est lejos de asegurar que una sea la causa de la otra.
De cualquier manera, el modelo matemtico de la regresin no es una herramienta destinada a
detectar causas, sino a establecer el modo de asociacin entre variables de acuerdo a modelos
estadsticos. En algunos casos la relacin causal puede ser ms o menos evidente, como la posible
relacin entre concentracin de antibitico y rea de inhibicin del crecimiento bacteriano, y la
interpretacin se basa en conocimientos mdicos y no en indicios provenientes de los datos de la
regresin. Ms an, la tendencia a relacionar causalmente dos variables no queda definitivamente convalidada por el solo hallazgo de asociacin estadstica, ya que sta puede deberse a otras
asociaciones interpuestas, cuya deteccin es un tema adicional. Por ejemplo, si bien es de esperar
encontrar correlacin positiva entre las cifras de urea y creatinina plasmtica, no parecera lgico atribuir a una de ellas el aumento de la otra, siendo lo ms plausible que ambas sustancias
varen en el mismo sentido de acuerdo a la funcin renal. En resumen, debe quedar claro que
asociacin estadstica no implica causalidad, aunque por cierto no la excluye, y las relaciones de
causa-efecto entre dos variables tendern a producir asociacin entre las mismas. La asociacin
entre dos variables es un hecho de demostracin estadstica, mientras que atribuir un mecanismo
de causa-efecto a la asociacin demostrada es un producto del juicio del investigador, basado en
sus conocimientos del tema y la informacin previa disponible.
Prediccin de la variable dependiente
Conociendo la regresin de una variable dependiente y en una variable independiente x,
es posible predecir el valor ms probable de y para cada magnitud que se asigne a x. Dicho
valor es el que toma la coordenada y de la recta de regresin para la correspondiente x. Esto
quiere decir que la prediccin de y es para valores determinados de x, y es el caso de la prediccin del peso corporal a partir de la talla comentado anteriormente. Hay que tener en cuenta
que el valor predicho de y tiene un grado de incertidumbre debido a la variacin residual alrededor de la recta, por lo cual, para aumentar la precisin, la residual debera ser lo ms pequea posible, lo que se consigue cuando el coeficiente de correlacin r es lo suficientemente
grande. Debido a esta aplicacin, la variable independiente x suele ser denominada variable
predictora o simplemente, predictor. Conviene tener presente que una prediccin eficaz de
la variable dependiente no requiere que existan nexos causales con la variable predictora,
sino que la variabilidad explicada por la regresin sea lo suficientemente grande como para
acotar el error residual, situacin que se expresar en un coeficiente de determinacin r ms
o menos cercano a la unidad.
Ajuste para una covariable
Se trata de un procedimiento extremadamente til para comparar una determinada variable, en dos muestras que difieren en forma importante en algn factor, variable independiente o covariable, que a su vez tiene la capacidad de alterar la variable en estudio. En la figura 9.4 se puede observar que el perodo eyectivo ventricular izquierdo (la variable de inters,
[ 279 ]

y) depende marcadamente de la frecuencia cardaca (variable independiente o covariable, x) y


que la relacin es inversa, de modo que cuando aumenta la frecuencia cardaca disminuye el
perodo eyectivo. Tambin puede verse que el grupo presenta frecuencia cardaca promedio ms alta que el grupo . Adems, el perodo eyectivo es significativamente ms corto en
el grupo con frecuencia cardiaca alta (276 mseg versus 307 mseg, P < 0.0001). La diferencia
en la duracin del perodo eyectivo sin duda existe, y es significativa, pero expresa algn
trastorno de la funcin cardaca o simplemente se debe a que el grupo con perodo eyectivo
ms corto tiene frecuencia cardaca ms alta? Tratar de igualar la frecuencia cardaca de los
pacientes en los dos grupos antes de medir el perodo eyectivo sera una solucin perfecta,
pero como en la mayora de los casos, difcil o imposible en la prctica. En tanto, la estadstica proporciona un mtodo ingenioso y efectivo para cancelar el efecto de la diferente
frecuencia cardaca sobre las mediciones del perodo eyectivo.

Muy sumariamente, el mtodo consiste correr los puntos a lo largo de la recta de
regresin, moviendo el grupo con frecuencia cardaca alta hacia la izquierda y el grupo con
frecuencia cardaca baja hacia la derecha, hasta superponer las frecuencias cardacas. Entonces se observan los puntos en su nueva posicin y la pregunta es: todava estn los perodos eyectivos del grupo alta frecuencia por debajo de los del otro grupo? Si la diferencia
ha desaparecido y el perodo eyectivo resulta similar en ambos grupos, ser evidente que la
diferencia que exista antes de la maniobra se deba a las distintas frecuencias cardacas y se
informar: la diferencia entre los perodos eyectivos desaparece luego del ajuste (o la
correccin) para la frecuencia cardaca. En cambio, si despus de haber hecho coincidir
las frecuencias cardacas de los dos grupos el perodo eyectivo sigue siendo menor en el grupo
con frecuencia cardaca originariamente ms alta, resulta evidente que la mayor frecuencia
cardaca no alcanza para explicar la menor duracin del perodo eyectivo en este grupo y
hay que admitir que puede haber otros motivos para que esto ocurra, quiz un deterioro de
la funcin ventricular. El informe debe decir que la diferencia entre los perodos eyectivos
persiste luego del ajuste (o la correccin) para la frecuencia cardaca.
Figura 9.4. Ajuste de la duracin del perodo eyectivo ventricular izquierdo para la frecuencia
cardaca en dos grupos cuyos integrantes se denotan con y . Se observan las medias de la
frecuencia cardaca y del perodo eyectivo para cada grupo.

[ 280 ]

Si bien el deslizamiento de los puntos a lo largo de la recta puede imaginarse sin mucha
dificultad y la inspeccin visual del grfico es muy til, el anlisis se realiza por medio de tcnicas matemticas. Nuevamente conviene recordar que el procedimiento est disponible en la
mayora de los paquetes estadsticos bajo los ttulos comparacin de las rectas o anlisis
de la covarianza.
Se mencionarn algunos detalles de la prueba. Primero conviene obtener una recta de
regresin para cada grupo y comprobar que las pendientes no sean muy diferentes: en caso
contrario, la relacin funcional entre eyectivo y frecuencia cardaca ser distinta para cada
grupo y el ajuste para la frecuencia cardaca no ser seguro. Si en cambio las pendientes
son similares, se renen ambas regresiones en una sola y se evala si los puntos de un grupo
estn ms altos o bajos que los del otro, con respecto de la recta de regresin comn. La
eventual diferencia en la altura de las y para cada grupo, dar la pauta de diferencias entre
grupos corregidas o ajustadas para la frecuencia cardaca. Esto es lo que se ha hecho en la
Figura 9.4: se ha trazado la recta comn para ambos grupos y resulta claro que los respectivos
puntos no difieren en su altura con respecto a la recta, y se superpondran si se los deslizara
a lo largo de la misma. En la comparacin de diversas variables, el ajuste para factores que
pueden afectarlas y dificultar la interpretacin de los resultados es uno de los recursos ms
tiles del anlisis estadstico.
9.5. Regresin lineal y curvilinear. Transformaciones
Si bien es frecuente que las relaciones entre dos variables correspondan a puntos que
tienen tendencia a distribuirse a lo largo de una lnea recta, en otras oportunidades la observacin del grfico de dispersin sugiere que los puntos se hallan mejor representados por
lneas curvas. En estos casos la relacin entre las variables dependiente e independiente no es
lineal, y la expresin general y = a + bx ya no la describe en forma apropiada. En estos casos
es frecuente que una o ambas variables puedan ser re-expresadas mediante un cambio de escala, de modo que la nueva relacin entre ellas sea lineal. Estos cambios de escala se conocen
como transformaciones y han sido comentados en 4.8. Tpicamente consisten en expresar
las variables como su logaritmo, su inversa o bien una potencia (que para un exponente = 1/2
es la raz cuadrada de la base). Cuando esto es efectivo, las variables transformadas exhiben
entre s una relacin lineal y pueden ser analizadas por los mtodos corrientes que se han
visto hasta aqu y que se incluyen en los paquetes estadsticos.

Frecuentemente ocurre que la desviacin de la linearidad exhibida por los datos es poco
marcada y, en estos casos, la regresin lineal con la variable original puede resultar preferible por su simplicidad y porque en general, la interpretacin de los datos en sus unidades de
medida habituales resulta ms sencilla y directa. No obstante, si el ajuste lineal de los datos
transformados resulta en un incremento significativo del coeficiente de determinacin r, ser
en general aconsejable trabajar con los mismos. Por lo dems, en los casos en que las variables
x e y se hallan relacionadas en forma no lineal, puede ser importancia en la investigacin el
tratar de determinar el significado biolgico de la relacin curvilinear entre aqullas. Acerca
de las transformaciones en regresin lineal puede consultarse Ingelfinger, 1994.

[ 281 ]

10. Anlisis de la varianza

10.1. Introduccin

El anlisis de la varianza comprende un conjunto de tcnicas entre cuyas principales aplicaciones est la comparacin de medias muestrales en los casos en que los datos se hallan
clasificados en ms de dos formas o grupos. En este sentido, las tcnicas conocidas como de
anlisis de la varianza constituyen extensiones de los procedimientos para la comparacin de
pares de muestras vistos en secciones anteriores. Aqu se expondrn los conceptos bsicos en
los que dichas tcnicas se fundamentan. As como existen muchas formas de obtener y disponer
los datos de los diversos tipos de estudio, hay tambin un gran nmero de modelos para su anlisis. Sin embargo, debe tenerse en cuenta que los lineamientos generales para la comparacin
de medias, contraste de hiptesis, interpretacin de los estadsticos de prueba y de los niveles
de significacin obtenidos, son los ya vistos en las Secciones 6 y siguientes. En el anlisis de la
varianza, lo que aumenta es el nmero de hiptesis y pruebas que se evalan simultneamente
en un mismo conjunto de datos y por lo tanto, la complejidad de los procedimientos y de los
clculos numricos, que en general requieren de programas para su computacin.
Como se ver, estas tcnicas analizan la variabilidad de los datos separndola segn sus
fuentes de origen, que son la variabilidad de los individuos dentro de cada grupo, y la variabilidad entre los distintos grupos en los que se clasifican los datos. La variabilidad entre los
grupos se expresa por la variabilidad entre sus medias, y si sta es mayor que la observada
entre los individuos que los integran, se puede concluir que deben existir diferencias entre las
medias de los grupos estudiados. La variabilidad se evala mediante varianzas obtenidas de
las muestras, y de ah el nombre de este conjunto de procedimientos, que a pesar del mismo
estn dedicados a la comparacin de medias.
Por lo dems, el anlisis de la varianza, al permitir la comparacin de cada una de tres
o ms medias muestrales con todas las dems, da origen a comparaciones mltiples, que
aumentan las posibilidades de anlisis y a la vez implican limitaciones que deben tenerse en
cuenta al interpretar los resultados. Este tema se comentar con algn detalle en 10.3.
10.2. Anlisis de un factor. Tcnica para la comparacin de varios grupos
En lo que sigue se describirn los elementos bsicos hallados en el modelo conocido como de un factor, donde se analiza una determinada variable o factor, como puede ser la
glucemia o el peso corporal, en muestras o grupos provenientes de una poblacin con media
[ 282 ]

y varianza (en principio no conocidas), siendo k el nmero de muestras o grupos. Estos


pueden diferir, entre otras cosas, en el valor de sus medias, y son esas diferencias las que
suelen ser de inters para el investigador, ya que pueden reflejar caractersticas distintivas del
material en estudio, incluyendo el efecto de intervenciones experimentales o teraputicas. El
trmino factor expresa que la variable analizada se halla controlada por el experimentador.
As, la glucemia puede ser obtenida en ayunas y en varios tiempos determinados luego de una
ingesta, o en grupos de diabticos con distintos hipoglucemiantes, el peso corporal puede ser
controlado en grupos de individuos con distintos regmenes teraputicos y, en general, puede
decirse que el factor o variable presenta diferentes niveles. Cada nivel de un factor, como
puede ser la glucemia con un determinado hipoglucemiante o el peso con un determinado
rgimen teraputico, se denomina genricamente tratamiento, que no necesariamente debe
ser un tratamiento mdico sino que es el nivel o clase en que se ha tomado la variable en un
grupo en particular. En consecuencia, el trmino tratamiento tiene aqu una acepcin ms
amplia que la corrientemente utilizada en medicina. Dado que el modelo considera una sola
fuente de variabilidad (la variable o factor en estudio), este tipo de anlisis de la varianza se
conoce tambin como de una ruta (one-way analysis).
Como se ha dicho, el objetivo principal del anlisis de un factor suele ser detectar diferencias
significativas entre las medias muestrales x1, x2 , x3 , x k, de varios grupos, correspondientes a
distintos tratamientos o niveles del factor. Este mtodo puede verse como una generalizacin
del test t de Student para muestras no apareadas (7.2). Aunque este es el modelo ms sencillo
dentro del grupo de tcnicas para el anlisis de la varianza, las operaciones numricas son ms
extensas que las reseadas hasta ahora para comparaciones de pares de muestras y no se entrar en mayores detalles de clculo, ya que los programas estadsticos llevan a cabo el anlisis a
partir de mens de manejo sencillo y, por otra parte, se trata de procedimientos de inferencia
estadstica cuyos aspectos principales han sido ya examinados en secciones anteriores.
A continuacin se dan los conceptos bsicos en los que se fundamenta el anlisis de la
varianza para la comparacin de medias muestrales de una variable distribuida en varios
grupos con distintos tratamientos. Considrese una variable continua x, como puede ser el
peso corporal o cualquier otra, medida en k grupos de tamao ni donde cada grupo tiene su
media muestral x i. Como en la comparacin de pares, interesa la comparacin de las medias
entre s, para determinar si existen diferencias significativas entre ellas. Puede verse que con
tres medias las comparaciones posibles son x1 versus x2 , x1 versus x3 y x2 versus x3. Con cuatro
grupos las posibles comparaciones ya son seis y siguen aumentando con el nmero de stos.
Para realizar el anlisis, los grupos pueden disponerse en columnas de datos como se
observa en la tabla del Ejemplo 10. Dichos datos pueden considerarse sujetos a la variabilidad comn a todos los individuos que forman los grupos en estudio, y a la variabilidad
debida a posibles diferencias entre las medias de los grupos. Es decir, el modelo de anlisis
acepta que los grupos proceden de un universo con varianza comn a todos ellos, y que
por lo tanto, sus varianzas muestrales s sern estimadores adecuados (tcnicamente, insesgados) de dicha varianza universal. Ahora bien, si los distintos grupos difieren en sus
medias, esas diferencias aadirn una fuente extra de variabilidad a los datos. Esta nueva
fuente de variabilidad puede separarse por mtodos de clculo, de la variabilidad comn a
todos los grupos, y si es de suficiente magnitud obligar a descartar la igualdad de las me[ 283 ]

dias grupales y a aceptar la existencia de diferencias significativas entre ellas, que podrn
adjudicarse a diferencias entre los grupos en relacin a sus distintos niveles o tratamientos.
De esta manera, la variabilidad total de los datos puede descomponerse en la variabilidad
dentro de los grupos y la variabilidad entre los grupos. Esta ltima se calcula a partir de
las medias muestrales x i , mientras que la variabilidad dentro de los grupos se estima como
el agregado de la variabilidad en cada uno de stos. La variabilidad dentro de cada grupo
se calcula con respecto a la media del mismo, con lo que la eventual variacin entre las medias no tiene influencia en esta estimacin. En el caso de existir diferencias entre las medias
de los grupos, sus medias muestrales x i presentarn un grado mayor variabilidad que el
esperado por efectos del azar, y la variabilidad entre los grupos agrandar la variabilidad
total s de los grupos considerados en su conjunto, sin afectar la variabilidad dentro de los
grupos (o sea, sin afectar la variabilidad dentro de cada uno de los grupos). As, la razn
entre la variabilidad entre los grupos y dentro de los grupos se agrandar, dando idea de
las diferencias existentes entre las medias.

La variabilidad total del conjunto de datos se calcula a partir de las desviaciones de cada
elemento de cada grupo, de la media comn para todos los grupos, y es en realidad la varianza muestral de todos los grupos reunidos en uno solo. Se puede luego calcular la variabilidad
entre los grupos (entre las medias de los grupos) y restndola de la variabilidad total, obtener
la variabilidad dentro de los grupos. Como ya se ha dicho, si la variabilidad entre los grupos,
en comparacin con la variabilidad dentro de los grupos, excede determinados valores, se
est en condiciones de afirmar que existen diferencias significativas entre las medias de los
distintos grupos en estudio, no explicables por las fluctuaciones del azar. La comprobacin
de tales diferencias es el objeto principal de este modelo de anlisis de la varianza.
En todas estas tcnicas, la variabilidad se mide como sumas de cuadrados (esto es, desviaciones de la media elevadas al cuadrado, como las que forman el numerador de las varianzas, 2.5.2). Se cumple que:
Suma de cuadrados total = suma de cuadrados entre los grupos + suma de cuadrados dentro
de los grupos.
Cada suma tiene asociada cierta cantidad de grados de libertad en relacin al nmero y
forma de agrupacin de los datos y, dividiendo las sumas por sus respectivos grados de libertad se obtienen los llamados cuadrados medios, que en realidad son varianzas (el cuadrado
medio total es la varianza muestral de todos los casos, tal como se calcula en 2.5.2). En un
modelo con k grupos de n elementos cada uno, donde n k = N es el nmero total de datos,
los grados de libertad dentro de los grupos se calculan como N k, y los grados de libertad
entre grupos, como k 1.
Aqu aparece el punto ms importante de toda la tcnica: debido al diseo del anlisis,
si no hay fuentes de variabilidad extra entre los grupos (diferencias entre las medias), el cuadrado medio entre grupos (s entre) y el cuadrado medio dentro de los grupos (s dentro)
estimarn una misma varianza de poblacin y no sern muy diferentes entre s. Pero si hay
fuentes de variabilidad que afecten a los grupos y sus medias, el cuadrado medio entre grupos aumentar con respecto al cuadrado medio dentro de los grupos, que se mantendr sin
cambios como un estimador de , con lo cual la razn (s entre) / (s dentro) se incrementar
en mayor o menor grado. El cociente de varianzas
[ 284 ]

(s entre) / (s dentro) = F

(10.1)

sigue la llamada distribucin F, que se halla tabulada segn los grados de libertad del numerador y del denominador, proporcionando la probabilidad P de que un valor F sea excedido
por error de muestreo en el caso en que las varianzas entre y dentro de los grupos estimen la
misma magnitud .

La hiptesis nula es que las distintas medias muestrales x i no difieren significativamente entre s y que las diferencias observadas entre medias se deben al azar del muestreo.
El cociente se forma siempre con el mayor s en el numerador, de modo que F nunca es
menor que 1. El caso que interesa es aquel en que el mayor cuadrado medio es s entre, sealando una posible diferencia significativa entre las medias. Los grados de libertad de los
cuadrados medios se calculan como se expuso ms arriba, y mediante los mismos se busca en
las tablas de F la probabilidad asociada con el valor muestral hallado en el anlisis. Lo visto
hasta aqu se ilustrar con un ejemplo para aclarar ciertos aspectos de inters del procedimiento, dejando a un programa de estadstica la tarea realizar los clculos numricos.

A fin de simplificar los conceptos en todo lo posible, se da una tabla con el peso en kilogramos de tres grupos de adultos del sexo masculino con diferentes condiciones clnicas. Los
grupos se rotulan A, B y C. Cada grupo consta de 10 individuos. Sus medias figuran en la
ltima fila.
Grupo

Medias

Grupo B

Grupo C

Grupo D

86

89

101

92

84

66

100

101

64

93

95

87

87

100

73

111

94

66

104

97

72

96

65

70

84

75

53

102

99

77

95.5

89.9

72.9

El total de casos es N = 30 y el nmero de grupos k = 3.


El resultado del anlisis numrico es el siguiente:
Fuente

Grados de libertad

Suma de Cuadrados

Cuadrado Medio (s)

k1=2

2784.8

1392.4

10.39

0.0004

Dentro

N k = 27

3616.9

134.0

Total

N 1 = 29

6401.7

Entre


Los grados de libertad entre y dentro de los grupos son iguales a 3 1 = 2 y 30 3 = 27
respectivamente. En la tercera columna puede comprobarse que las sumas de cuadrados entre
[ 285 ]

y dentro de los grupos suman el total de cuadrados. Dividiendo las sumas de cuadrados por
sus respectivos grados de libertad, se obtienen los cuadrados medios, que son las varianzas
entre y dentro de los grupos. El cociente entre los cuadrados medios entre y dentro de los
grupos, 1392.4 / 134 es igual a 10.39, que es el valor muestral del estadstico F. Este es el
estadstico de prueba de la hiptesis nula de igualdad de medias grupales.
Segn tabla, para 2 y 27 grados de libertad, la probabilidad asociada con F igual o mayor que 10.39 es P = 0.0004. El cuadrado medio entre los tres grupos es significativamente
mayor que el cuadrado medio dentro de los grupos, con lo que se descarta la hiptesis nula
de varianzas iguales, y dado que el cuadrado medio entre grupos representa la variabilidad
entre las medias muestrales, se debe descartar la hiptesis nula de medias muestrales iguales. Se acepta automticamente la hiptesis alternativa de diferencias entre las muestras, en
particular entre sus medias. Surge entonces el problema de averiguar entre qu muestras, A,
B, y C, se encuentran las diferencias significativas entre las medias. Como se comprender,
las diferencias significativas podran darse entre cada una de las medias o bien slo entre
algunas de ellas. Las tres posibles comparaciones son A y B, A y C, B y C. En estos casos se
habla de comparaciones mltiples, y la diferencia hallada ms arriba puede radicar en mayor
o menor grado en los diferentes pares de muestras pasibles de ser comparados. Existen varios
procedimientos adecuados, que pueden obtenerse en forma inmediata de los programas de
anlisis estadstico y detectan los pares de medias entre los que las diferencias pueden ser
consideradas significativas, proporcionando asimismo su nivel P de significacin. Pero antes
de enumerar los ms empleados se comentar el tema ms general de las comparaciones repetidas o mltiples en estadstica.
10.3. Comparaciones mltiples

Las comparaciones mltiples aparecen frecuentemente en el trabajo con muestras, y es
necesario estar al tanto de ciertas caractersticas que les imprimen a las pruebas de hiptesis.
El hecho fundamental en las comparaciones mltiples radica en que an en el caso en que
dichas comparaciones fueran realizadas entre grupos donde no existen diferencias significativas, por ejemplo comprobando pares de medias de entre varios grupos provenientes de un
mismo universo, siempre existe la probabilidad de hallar diferencias significativas entre algunos de esos pares, simplemente por azar (6.6). Cuando se adopta un nivel de significacin
P = 0.05, las comparaciones mltiples producirn conclusiones errneas en alrededor de uno
de cada veinte ensayos realizados. La probabilidad de resultados errneos se relaciona con
el nivel de significacin adoptado al realizar las comparaciones o lo que es lo mismo, con la
magnitud del error de tipo alfa esperado, y en general no habra precauciones especiales que
tomar si las comparaciones se limitaran estrictamente a aquellas para las cuales fue diseado
el experimento y donde es razonable esperar resultados. Sin embargo, en la bsqueda de conclusiones interesantes o potencialmente tiles, es frecuente realizar todas las comparaciones
posibles entre grupos de muestras esperando obtener diferencias significativas que, en todo
caso, se procuran explicar una vez encontradas. Estos procedimientos de rastrillaje o dragado (dredging), muy empleados en la produccin de resultados, tienen el serio inconveniente
mencionado ms arriba de la obtencin de una cierta cantidad de resultados significativos
producidos por azar.
[ 286 ]

Si bien restringir las comparaciones a los grupos de inters ayuda a minimizar el problema, la solucin no es completa y cabe imaginar circunstancias en las cuales aparezcan
diferencias significativas inesperadas pero de gran importancia para el tema en estudio. Una
manera de hacer menos probable la aparicin de diferencias significativas debidas al azar, es
adoptar niveles de significacin ms altos al llevar a cabo comparaciones mltiples. Por otra
parte, se han desarrollado varios mtodos para realizar este tipo de comparaciones en grupos
de muestras, que tienen la propiedad de ser ms conservadores que la comparacin de los
mltiples pares de medias posibles mediante la reiteracin de pruebas de significacin estadstica independientes. Sin embargo, si la comparacin entre pares de grupos se realiza eligiendo
los pares segn su importancia en el diseo del experimento y con una hiptesis previa, esto
es, evitando el rastrillaje sistemtico, la diferencia entre un par de medias puede evaluarse
mediante su error estndar y la distribucin t, como se ver en el siguiente ejemplo.
Ejemplo 10 (continuacin)
Si se eligen dos medias de entre un grupo de muestras donde se ha determinado el cuadrado medio o varianza entre y dentro de los grupos, tal como se ha mostrado en la primera
parte del ejemplo, se puede poner a prueba la hiptesis nula de medias iguales mediante el
estadstico t, que se calcula como el cociente entre la diferencia de las medias y su error estndar, tal como se hizo en 7.2.
El error estndar de la diferencia se obtiene a partir del cuadrado medio dentro de los
grupos, s dentro, que toma el lugar de s en la ecuacin (7.2). Con esto, y si el nmero de
elementos n es igual para todas las muestras, (7.3) se convierte en:
ES diferencia = s dentro (2 / n)

(10.2)

con lo que la comparacin entre las medias x A y x B se hace mediante el estadstico t:


t = (xA x B ) / ES diferencia

(10.3)

con N k grados de libertad.


En el Ejemplo, para comparar las medias de los grupos A y B y siendo el cuadrado medio
dentro de los grupos igual a 134, se tiene:
ES diferencia = 134 ( 2 / 10) = 5.18
t = ( 95.5 89.9 ) / 5.18
= 1.10
Los grados de libertad son N k = 27. Como se entiende, una desviacin de tan solo 1.1 unidades estndar est lejos de apartarse en forma significativa de la hiptesis nula, y esto puede
confirmarse en las tablas de la distribucin t, donde se comprueba que P es igual a 0.28. Las
comparaciones restantes dan:
[ 287 ]

A versus C:

B versus C:

t = ( 95.5 72.9 ) / 5.18 = 22.6 / 5.18 = 4.36 P = 0.0002


t = ( 89.9 72.9 ) / 5.18 = 17 / 5.18 = 3.28 P = 0.003

y son ambas altamente significativas. Por lo tanto, de los tres pares de medias posibles, hay
dos que difieren en forma significativa y uno que no lo hace.

Debe notarse que el ES diferencia es el mismo para todas las comparaciones, ya que se trata
de un estadstico calculado a partir de todos los grupos.

La posibilidad de utilizar una nica estimacin del ES diferencia para todo el conjunto de
grupos, permite calcular la diferencia mnima que deber haber entre dos medias cualesquiera
para ser significativa. En el ejemplo, para un nivel de significacin P = 0.05, el valor de t para 27
grados de libertad (dentro de los grupos, ver antes) es segn tablas igual a 2.052 y por lo tanto,
para que una diferencia se considere significativa en ese nivel, tendr que ser igual o mayor a
2.052 veces el ES diferencia, o sea mayor que 2.052 5.18 = 10.63. Esta es la llamada diferencia
significativa mnima (LSD o least significant difference) y cualquier diferencia igual o mayor
ser significativa para el nivel de confianza adoptado (en este caso 0.05). Puede verse por inspeccin visual que esa diferencia es superada por la de los grupos A versus C y B versus C, mientras que la diferencia entre A y B es menor y por lo tanto no significativa. Un procedimiento
para chequear la significacin de un conjunto grande de diferencias consiste en disponerlas en
forma creciente o decreciente y comenzar la evaluacin por los valores extremos. Si la diferencia
resulta significativa se procede hacia los valores interiores, y una vez que una diferencia resulta
no significativa, los restantes pares comprendidos ya no necesitan ser chequeados.
Sin embargo, al aumentar los grupos aumentan los pares de datos que se pueden formar,
y para k grupos hay un total de pares igual a k (k1). Al comparar los pares por el mtodo
del error estndar de la diferencia como se hizo en el ejemplo, y al aumentar la cantidad de
comparaciones, aparece el problema de las comparaciones mltiples y debe evitarse el riesgo de obtener un exceso de comparaciones significativas a expensas de pares que difieren
por azar. Con el objeto de obtener pruebas de significacin que reduzcan dicho riesgo, se
han diseado, como se ha mencionado ms arriba, una variedad de mtodos que tienen la
caracterstica de ser ms conservadores, de modo que al evaluar un conjunto de grupos con
la misma media universal , cuyas medias muestrales difieren slo por error de muestreo, la
probabilidad de obtener un resultado significativo no exceder el nivel de significacin que el
test invoca. Los principales son los de Bonferroni, Newman-Keuls, Scheff y Tukey. Con el
mtodo de Bonferroni, el nivel de significacin que se desea evaluar se divide por el nmero
de comparaciones a realizar. Si por ejemplo se realizan 3 comparaciones, como en el ejemplo
visto antes, aceptndose un nivel de significacin P = 0.05, para que cualquiera de las comparaciones pueda ser declarada significativa en ese nivel, deber alcanzar una P = 0.05 / 3
= 0.016. En el ejemplo anterior las dos diferencias detectadas como significativas lo siguen
siendo de acuerdo al mtodo de Bonferroni, pues en ambas es P < 0.016. Sin embargo, este
mtodo, aunque fcil de realizar, tiene el inconveniente de tornarse excesivamente conservador al aumentar el nmero de comparaciones y disminuir mucho el valor de P requerido para
poder afirmar que una diferencia es significativa. Es posible que en general deban preferirse
los otros mtodos arriba mencionados. Todos ellos estn disponibles en los mens de los
programas de estadstica.
[ 288 ]

10.4. Otros modelos de anlisis con ms de una clasificacin de los datos


Existen modelos o diseos ms complejos de anlisis de la varianza, que consideran dos
o ms fuentes de variabilidad. En el caso de dos formas de clasificacin de los datos se suele
hablar de anlisis en dos-rutas (two-way). En los diseos con dos clasificaciones de los datos, la primera puede ser el factor de inters, como por ejemplo distintos procedimientos diagnsticos o teraputicos, y la segunda los individuos a los que se administran los tratamientos.
Esto puede tabularse destinando una columna a cada tratamiento y las filas a los individuos
en los que se evalan los resultados. Los datos se disponen en la misma forma que en la tabla
del ejemplo 10.1, pero en este tipo de diseo cada fila corresponde a un individuo (o una
fuente de datos en general) que proporciona una respuesta a cada uno de los tratamientos de
las columnas.
En el modelo mencionado, los individuos constituyen la segunda fuente de variacin de
los datos. Cada fila constituye una unidad o bloque experimental, y el diseo que administra
un conjunto de tratamientos a cada bloque, en forma aleatorizada, se denomina diseo de
bloques aleatorizados (randomized blocks). En general, y en especial cuando se comparan
tratamientos u otras intervenciones sobre conjuntos de individuos u otras unidades experimentales, como pueden ser muestras de sangre u otros especmenes biolgicos, la variabilidad inherente a las distintas unidades (individuos) que forman las muestras suele tener poco
inters para el investigador, aunque puede dificultar la deteccin de diferencias significativas
entre tratamientos. Al respecto, en forma anloga a lo ya visto para el anlisis de un factor,
existe el recurso de de dividir la variabilidad total de los datos en cuadrados medios debidos
a la variabilidad entre filas (individuos), entre columnas (tratamientos) y residual. De esta
manera se pueden obtener los siguientes cocientes entre cuadrados medios:
Filas (individuos o bloques) / residual = F filas
Columnas ( tratamientos ) / residual = F columnas
cuya significacin se obtiene en tablas de la distribucin F. Los grados de libertad asociados a
las filas se calculan como (nmero de filas 1), los asociados a las columnas, como (nmero de
columnas 1), y los asociados al cuadrado medio residual, como (filas 1) (columnas 1).
Con el diseo que toma en cuenta los individuos o bloques experimentales, se hace posible aislar y separar la variabilidad debida a los individuos (filas), de la variabilidad residual
(que equivale a la variabilidad dentro de los grupos del modelo visto en 10.2 y se utiliza
como estimacin de la varianza de poblacin en las pruebas de hiptesis). Al reducirse la
variabilidad residual, se hace ms probable la deteccin de diferencias significativas entre
tratamientos, que son las que suelen importar al investigador. Si bien se mencion que la variabilidad entre bloques no suele ser de especial inters en s misma, esto no es necesariamente
as en todos los casos. El hecho de existir diferencias significativas entre bloques puede sealar la importancia de factores individuales no bien conocidos, en la respuesta al tratamiento
principal representado por las columnas.
Al excluir de la comparacin entre tratamientos la variabilidad debida a las filas (individuos), el mtodo de bloques randomizados representa una generalizacin del test t de Stu[ 289 ]

dent para muestras apareadas. De este modo, es el procedimiento a elegir cuando se tienen
tres o ms muestras originadas en un mismo grupo de individuos, tpicamente, resultados
a lo largo de varios tratamientos o en varios momentos de la evolucin de una determinada
enfermedad. La variabilidad debida a las distintas modalidades de comportamiento de los
diferentes individuos queda excluida de la varianza residual contra la cual se realizan las
comparaciones de las varianzas entre grupos.
Cuando en el modelo de dos factores ambos corresponden a tratamientos o condiciones experimentales bajo el control del experimentador, el correspondiente diseo recibe el
nombre de factorial de r filas por c columnas o factorial r c. En estos casos existen dos
tratamientos, uno con r y otro con c dosajes o modos de administracin. Se dice que un tratamiento presenta r niveles y el otro c niveles. La disposicin de los datos es la misma que en la
tabla del Ejemplo, con c columnas correspondientes al tratamiento con c niveles, y r filas correspondientes a los r niveles del otro tratamiento. La diferencia fundamental con el modelo
de bloques randomizados est en que ahora el segundo factor es otro tratamiento controlado
por el investigador.

Los diferentes mtodos de anlisis de la varianza se hacen ms complejos a medida que
los modelos experimentales se van haciendo ms complicados, y el objetivo de este incremento en la complejidad es aumentar la eficacia de los anlisis y la capacidad de aislar y
cuantificar fuentes de variacin de los datos que agreguen informacin relevante acerca de las
poblaciones muestreadas. Se obtiene as una variedad de diseos o modelos experimentales,
en cuyo examen no se entrar en esta oportunidad y pueden consultarse en Armitage y Berry,
1994.
10.4.1 Interaccin

Un hecho conocido en el campo de la biologa es que en ocasiones, la aplicacin simultnea de dos tratamientos o intervenciones sobre un mismo objeto de estudio, produce un
efecto mayor que el que se podra esperar de la simple suma de los efectos de cada tratamiento aplicado en forma individual. Esto se expresa a veces como potenciacin de los efectos
y puede verse algunas veces entre dos antibiticos o entre dos frmacos empleados con un
mismo objeto. En otras oportunidades, el efecto resulta menor que el esperado de la suma de
los efectos individuales de cada tratamiento, y en estos casos se habla de atenuacin o cancelacin de los mismos. El fenmeno puede llegar a detectarse mediante el anlisis estadstico
de los datos, recibiendo el nombre de interaccin.
Para obtener una nocin de sus aspectos estadsticos, considrese un diseo factorial de
dos tratamientos, con los resultados dispuestos en una tabla con c columnas correspondientes
a los c niveles de un tratamiento A, y r filas correspondientes a los r niveles de un tratamiento
B. Supngase que hay una observacin para cada posible combinacin de los niveles de A y
B, o sea para cada celda de la tabla. Si en estas circunstancias alguna de las observaciones
en las celdas presentara un valor llamativamente diferente del resto (mucho mayor o mucho
menor), el investigador estara autorizado a sospechar la presencia de interaccin entre los
correspondiente niveles de los dos tratamientos. Sin embargo, con una observacin por celda,
la interaccin queda confundida y sumada con la variabilidad entre filas y entre columnas,
y no existe forma de ponerla en evidencia. En estos casos, obteniendo varias observaciones
[ 290 ]

o rplicas por celda, puede llegar a separarse la variabilidad entre las medias de las distintas
celdas, de la variabilidad entre las filas y la variabilidad entre las columnas. De este modo, la
eventual presencia de interaccin entre determinados niveles de las filas y columnas, puede
llegar a ponerse en evidencia mediante el examen de la variabilidad entre las medias de las
celdas. Esto aumenta la complejidad del modelo, y la variabilidad residual con la que se realizan las comparaciones debe ser re-calculada a partir de la variabilidad dentro de las celdas,
una vez aislada la variabilidad entre las mismas. Afortunadamente, los paquetes estadsticos
corrientes evitan los clculos numricos extensos y proporcionan distintos modelos de anlisis basados en diferentes estructuras de los datos. En esta seccin slo se han procurado delinear y resumir las ideas bsicas en las que se funda el conjunto de tcnicas conocidas como
anlisis de la varianza.

[ 291 ]

11. Regresin mltiple

11.1. Generalidades

Muchas veces hay asociacin entre ms de dos variables y existe la posibilidad de expresar una de ellas en funcin de las dems. Una forma de hacerlo consiste en una extensin del
mtodo de la regresin para un par de variables x e y. En este caso habr ms de una variable
independiente, cuyos valores determinarn a la variable dependiente y de acuerdo con una
ecuacin de regresin mltiple. Varias x son as utilizadas simultneamente para explicar los
cambios de la y. Las distintas variables x1, x2 , xi , suelen llamarse variables independientes
y tambin predictores o covariables. Se ha sealado que como muchas veces dos o ms de
las xi estn correlacionadas entre s y por lo tanto no son estadsticamente independientes,
la expresin variable independiente debera evitarse. Sin embargo su uso est aceptado, en el
sentido de que cada xi puede condicionar en parte los valores que adopta y.
En lneas generales, gran parte de los conceptos vistos con respecto a la regresin simple de
una sola x, se mantienen para la regresin mltiple. Con la introduccin de ms de una variable
independiente, muchas veces es posible aumentar la precisin de las estimaciones de la variable
dependiente, lo cual se explica porque cada variable independiente aporta informacin para
dicha estimacin, hecho que se traduce en una reduccin de la variabilidad residual (la que
permanece inexplicada por la regresin). Desde ya, una de las aplicaciones de la regresin
mltiple es el aumento de la precisin en la prediccin de una variable dependiente.
11.2. La ecuacin de regresin mltiple

La forma general de la ecuacin de regresin mltiple estimada a partir de los datos es:
Y = a + b1x1 + b2x 2 + + bixi + + bnxn

(11.1)

donde bi son los coeficientes de regresin mltiple o de regresin parcial de Y en xi. En forma
anloga a lo ya visto para la regresin lineal simple, estas ecuaciones se calculan para conjuntos de datos (muestras) donde se han medido la variable dependiente y las n variables independientes xi. Mediante el procedimiento de cuadrados mnimos se obtienen los coeficientes
a y bi con los que se formula la ecuacin correspondiente al conjunto de datos. Posteriormente, estas ecuaciones pueden ser utilizadas en sus varias aplicaciones, sustituyendo las x por
valores elegidos, para obtener el valor esperado o predicho de la variable dependiente y. Cada
[ 292 ]

bi estima el efecto de la correspondiente variable xi mientras se mantienen constantes las


otras x. Esto permite ensayar cuestiones del tipo qu pasara si xm aumentara (disminuyera)
mientras las dems xi se mantienen constantes?
Grficamente, una ecuacin en dos variables independientes x1 y x2 se representa por
un plano de regresin en un sistema con tres ejes ortogonales, x1, x2 e y. Con ms de dos
variables independientes la representacin grfica ya no es posible por requerir ms de tres
dimensiones espaciales, pero los resultados numricos se obtienen sin dificultad para tres o
ms variables independientes. Cuando las xi no tienen exponentes distintos de 1, se habla de
ecuaciones lineales y regresin lineal mltiple, que es ampliamente utilizada en las distintas
aplicaciones mdicas y a la cual se refieren los apartados siguientes.

Las aplicaciones de la regresin mltiple son similares a las de la regresin simple y las
principales son la descripcin de las relaciones entre las variables predictoras y la dependiente,
la interpretacin de esas relaciones, la prediccin de la variable dependiente, realizar ajustes para determinados valores de las distintas covariables y evaluar posibles interacciones
entre stas. Puede ser que no todas las variables independientes ensayadas estn relacionadas
con la dependiente, y cuando esto ocurre, la variable cuyo coeficiente de regresin mltiple no
es significativamente diferente de cero se suprime de la ecuacin, ya que su inclusin no aumenta la eficacia de la regresin. En lo que sigue se examinarn las principales caractersticas
y utilidades de la regresin mltiple, sin entrar en los algoritmos de clculo, que como es fcil
suponer, son ms complejos que los dedicados a la regresin simple y cuya fundamentacin
terica va ms all del alcance de este texto. Slo se menciona que se trata de extensiones de
los procedimientos para una sola variable independiente y que se basan en calcular los coeficientes que minimizan las sumas de los cuadrados de las diferencias entre las y observadas y
sus correspondientes estimaciones.
Ejemplo 11
En una muestra de 213 adultos de ambos sexos el ndice electrocardiogrfico de Sokolow
medido en milmetros present correlacin positiva con la masa ventricular izquierda, lo cual
permiti calcular la siguiente ecuacin de regresin simple:
MVI = 99 + 2.92 ndice de Sokolow
donde MVI es la masa ventricular izquierda en gramos, 99 la ordenada al origen y 2.92 el
coeficiente de regresin, b, de la MVI en el ndice de Sokolow. Se ha chequeado la significacin de b obtenindose P < 0.0001, de lo que se deduce que el ndice de Sokolow influye significativamente en la estimacin de MVI. De acuerdo a las unidades utilizadas en su clculo,
b est expresado en gramos/milmetro y predice 2.92 gramos de MVI por cada milmetro
que mida el ndice de Sokolow. As, un ndice de 20 mm corresponde a una MVI estimada de
99 (gramos) + (2.92 gramos/mm 20 mm) = 157 gamos. Ahora bien, como tambin se sabe
que la masa corporal tiene relacin con la MVI, pueden incluirse los pesos de los individuos
en la matriz de datos y obtenerse una ecuacin de regresin mltiple de la MVI en el ndice
de Sokolow y en el peso corporal. Con los datos elegidos para el ejemplo dicha ecuacin
resulta:
[ 293 ]

MVI = 40 + 2.3 ndice de Sokolow (mm) + 2.09 peso (kg)


donde los coeficientes de regresin mltiple para Sokolow y peso son 2.3 y 2.09 respectivamente y ambos son significativos, cada uno con P < 0.0001 (en general, si algn coeficiente
resulta no significativo, la correspondiente variable no afecta la regresin y puede ser retirada
del anlisis). Las unidades a emplear (mm y kg) quedan determinadas al elaborar la ecuacin,
y en el ejemplo proporcionan la MVI en gramos. As, si el individuo antes considerado, con
un ndice de Sokolow = 20 mm, pesara 80 kg, la MVI esperada sera igual a 40 + (2.3 20)
+ (2.09 80) = 173 gramos, mientras que si pesara 50 kg, con el mismo ndice de Sokolow,
la MVI esperada sera igual a 40 + (2.3 20) + (2.09 50) = 111 gramos. De esta manera,
las variables independientes pueden modificarse de a una por vez y comprobar su efecto con
independencia de las dems. Ntese que, sin conocer el peso, la MVI esperada a partir del
ndice de Sokolow = 20 mm es igual a 157 gramos. Este es el valor esperado que se halla sobre
la recta de regresin, y es la mejor apuesta a falta de ms informacin. En tanto, si se cuenta
con el peso corporal, a travs de la regresin mltiple puede mejorarse la estimacin: en un
individuo de 80 kg se espera una MVI = 173 g y en uno de 50 kg, una MVI de 111 g. Ambos
resultados mejoran la estimacin original.*
11.3. El coeficiente de determinacin R

Los procedimientos para aislar las fuentes de variacin de la variable dependiente en la
regresin mltiple son anlogos a los vistos para la regresin simple, aunque requieren cantidades considerablemente mayores de clculo. As, puede calcularse la suma de cuadrados de
la variable dependiente y explicada por la regresin, y la suma total de cuadrados de la y sin
tomar en cuenta la regresin (esta es simplemente la conocida suma empleada para calcular
la varianza de la Y alrededor de su media). El cociente entre ambas sumas expresa la proporcin de la variabilidad total de la variable dependiente explicada por la regresin, y se
conoce como R o coeficiente de determinacin. En trminos de sumas de cuadrados:
R = suma explicada por la regresin / suma total de cuadrados
R es anlogo al coeficiente de determinacin r visto en 9.3.1. Su raz cuadrada, R, es el coeficiente de correlacin mltiple. Como no es posible adjudicar una direccin a la asociacin
de la y con ms de una variable independiente, se da siempre a R valor positivo. Su test de
significacin se obtiene mediante el cociente entre los cuadrados medios debidos a la regresin y los cuadrados residuales, que resultan de restar los primeros del cuadrado medio total.
Dicho cociente sigue la distribucin F y la correspondiente prueba provee evidencia respecto
de la hiptesis compuesta que postula que todos los coeficientes de regresin son iguales a
cero (b1 = b2 = = bn = 0).

Volviendo a R, su valor puede variar entre 0 (las variables no aportan informacin til
para predecir la y) y 1 (la variable y queda determinada sin margen de error para cada conjun * Ntese que si se emplea el peso medio del grupo, en el ejemplo 72 kg, se obtiene MVI = -40 + (2.3 20) +
(2.09 72) = 156 g, que es el valor predicho por el ndice de Sokolow cuando no se incluye el peso en el clculo (la
diferencia con 157 g se debe a error de redondeo).

[ 294 ]

to de variables independientes x1, x2 , xn). Como para r en el caso de una sola x, R mide
la proporcin de la variabilidad total de las Y explicada por la regresin. Sin embargo, hay
una diferencia con el caso de la regresin simple y es que, en la regresin mltiple, R informa
acerca del valor global de la funcin de regresin pero no indica cul o cules de las x son las
que contribuyen significativamente a predecir la variable dependiente. Es as que an en el
caso ms simple de dos variables independientes, x1 y x2 , R no seala si ambas o slo una de
las xi son las que aportan a la regresin. Esta informacin se puede obtener de los coeficientes
de regresin mltiple, bi , cuya significacin frente a cero se evala para cada xi frente a su
error estndar, mediante la distribucin t. De lo dicho se desprende que la informacin que
da R es poco detallada y deben examinarse los coeficientes de regresin mltiple para estimar la importancia de cada variable independiente. Tambin puede evaluarse la magnitud del
cambio producido por el agregado de una variable independiente, a travs de las variaciones
experimentadas por R. Estas pueden ser o no significativas, y en el primer caso, el grado de
incremento de R permite conocer la proporcin de varianza de la variable independiente Y,
explicada por la variable independiente introducida en ltimo trmino. De manera anloga
puede evaluarse el efecto del borrado de variables independientes.
Ejemplo 11 (continuacin)
En la regresin de la masa ventricular izquierda (MVI) en el ndice de Sokolow del ejemplo anterior, el coeficiente de correlacin entre ambas variables es r = 0.35, y su cuadrado o
coeficiente de determinacin es r = 0.12. Esto significa que slo un 12% de la variabilidad de
la variable dependiente MVI es explicada por la regresin en el ndice de Sokolow. Si entonces
se agrega el peso como nueva variable predictora de la MVI, se obtiene la segunda ecuacin
del ejemplo anterior, donde cada coeficiente contribuye a explicar parte de la variabilidad de la
MVI. Para esta ecuacin con dos variables independientes se tiene R = 0.72 y R = 0.52, lo que
expresa que el 50% de la variabilidad total de la MVI queda explicada por la regresin mltiple. En este caso, la variacin de la MVI alrededor de los valores predichos por la ecuacin de
regresin para cada par de valores de Sokolow y peso, es la mitad de la que existe alrededor de
la media de MVI aislada. Queda todava un 50% de la variabilidad sin explicar, esto es, como
variacin residual alrededor de los valores predichos por la regresin mltiple. En general, el
agregado de nuevas variables independientes como pudieran ser la edad y el sexo, tender a
agrandar el valor de R, que por construccin nunca puede superar el valor de 1.
Puede verse que al agregar la variable peso, el coeficiente de regresin de Sokolow se modifica, as como el valor de la constante. Esto se explica por el hecho de que ambas variables
predictoras contribuyen a la estimacin de la variable independiente. Tambin puede notarse
que la variabilidad de la Y explicada por la regresin aumenta del 12% al 52% al agregar el
peso, lo que seala la importancia de sta variable en la regresin (corroborando esta afirmacin, en la muestra estudiada, la correlacin entre MVI y peso corporal es igual a 0.67,
mucho mayor que la observada entre MVI y Sokolow).
El agregado de variables independientes nunca har descender el coeficiente de determinacin R y en general tender a aumentarlo, aunque la variable introducida pueda tener poco
significado en la interpretacin de los cambios generados en la variable independiente. Por
este motivo se suele utilizar el coeficiente R ajustado para el nmero de variables indepen[ 295 ]

dientes, que tiende a limitar el crecimiento de R y constituye una medida ms conservadora


de la correlacin mltiple, aunque en general y para un nmero no demasiado extenso de
variables independientes, las diferencias con y sin ajuste resultan poco importantes.
En lo que sigue se comentarn algunos aspectos de importancia del trabajo con modelos de
regresin mltiple y sus aplicaciones en medicina.
11.4. Seleccin de variables independientes. Procedimientos automticos
Si bien las variables independientes que presentan coeficientes de regresin significativos
estn efectivamente relacionadas con la variable dependiente, el significado de la relacin no
siempre es evidente y est sujeto a interpretaciones basadas en los conocimientos mdicos
o biolgicos que se tienen acerca del material en estudio. Por otra parte, una variable cuyo
coeficiente de regresin no alcanza significacin estadstica puede en principio eliminarse
de la regresin por no aportar informacin a la misma, aunque como se ver, siempre debe
procederse con cautela por la posibilidad de que el comportamiento de dicha variable se halle
afectado por la presencia de otras covariables con roles semejantes, cuestin que se torna
an ms atendible si existen motivos de ndole terica vinculados con el tema del estudio,
que confieren importancia mdica a la variable en cuestin. Al respecto, dos variables importantes con algn tipo de semejanza que las vincule, pueden competir en la explicacin
de la variable dependiente con resultados diversos y a veces no esperados, como puede ser la
prdida de la significacin estadstica de una de ellas, por lo que el criterio del investigador
es fundamental para la interpretacin correcta de los resultados. Sobre este punto se volver
ms adelante.
En contraste, no toda variable cuyo coeficiente de regresin sea significativo debe ser
necesariamente importante dentro del marco de la investigacin, bien por ser sus efectos de
pequea magnitud y por contribuir escasamente a acotar los cambios de la variable dependiente, o bien por su rol en el contexto del estudio. Por ltimo, debe recordarse que la falta de
significacin estadstica de un determinado coeficiente de regresin puede tambin deberse
al ya conocido error de tipo beta, mencionado en la Seccin 4, y si hay motivos tericos para
creer que una variable pueda tener un papel de importancia dentro del sistema de datos en
estudio, no debera abandonrsela sin ulteriores verificaciones.

Los mtodos para seleccionar las variables independientes ms importantes son varios y
no existe uno que sea superior a los dems. En general se aprovecha la capacidad de clculo
que proporcionan los paquetes estadsticos. Es habitual explorar primeramente la regresin
simple de la variable dependiente en cada una de las independientes, seleccionar entre stas
la que presenta el coeficiente de regresin ms significativo, y luego ensayar todas las regresiones posibles que resulten de agregarle a la ya seleccionada, cada una de las restantes. Se
elige la regresin que produce el mayor incremento de R, se agrega una tercera variable y
as sucesivamente hasta que el agregado de nuevas variables cese de incrementar la suma de
cuadrados debida a la regresin ms all de un nivel establecido por convencin. Este procedimiento se conoce como escalonado en forma progresiva (step-up o forward entry). El
procedimiento inverso (step-down) comienza con todas las variables independientes y elimina progresivamente las no significativas hasta que quedan aquellas que lo son por encima de
un nivel preestablecido. Otro procedimiento escalonado (stepwise) selecciona las variables
[ 296 ]

como en el primer caso, pero cada vez que agrega una nueva, chequea todos los coeficientes
de regresin, ya que una variable significativa en una etapa, puede dejar de serlo cuando se
agrega otra que la reemplaza y la vuelve no significativa. Esto remite al problema sealado
ms arriba acerca del significado biolgico o mdico de cada variable, que debe ser tambin
un criterio decisivo para la inclusin y el retiro de las variables independientes. Esto debe
hacerse de acuerdo no slo con el grado de significacin estadstica, sino tambin de acuerdo
con la importancia mdica o biolgica de cada variable dentro del material en estudio. Se
mencionarn brevemente algunos aspectos relacionados.
11.5. Colinearidad. Variables reemplazantes o proxy

La situacin conocida como colinearidad o multicolinearidad ocurre cuando dos o ms
variables predictoras se hallan altamente correlacionadas entre s. La consecuencia, que slo
se enuncia, es que sus respectivos coeficientes de regresin tendrn errores estndar muy
grandes y tendern a producir resultados no significativos, pudiendo obtenerse conclusiones
y comparaciones errneas. La colinearidad es frecuente y puede esperarse cuando dos variables estiman un mismo fenmeno, por ejemplo si se incluyen como medidas antropomtricas
la longitud de la pierna y del antebrazo, o el nivel plasmtico de dos metabolitos cercanamente emparentados, situaciones en que es de esperar altos coeficientes de correlacin entre las
variables independientes (en estos casos las variables involucradas no son estadsticamente
independientes aunque conserven la denominacin, consagrada por el uso).

Muchas veces, al incluir dos variables predictoras que juegan un rol similar y se hallan
correlacionadas entre s, slo una de las dos presenta un coeficiente de regresin significativo.
En tal caso, si se retira la variable que result significativa, se suele comprobar que la otra adquiere significacin estadstica y pasa a cumplir la funcin de la que ha sido eliminada. Las dos
variables independientes se sustituyen una a otra. En estas circunstancias se tiende a considerar
como la ms importante, aqulla que retiene la significacin estadstica cuando se ensayan
conjuntamente. Sin embargo esto no es necesariamente as, ya que como se ha mencionado,
aparte de la capacidad de estimar la variable dependiente, es necesario evaluar la importancia
de las variables por su significado en el contexto del estudio, que no est relacionado en forma
obligatoria con la fuerza de su asociacin con la variable dependiente. Tambin puede ser que
ambas variables sean importantes y necesarias para el estudio, y en este caso, las posibilidades
son no incluirlas en la misma ecuacin o bien, si las variables son de la misma naturaleza, como
pueden ser las longitudes de dos segmentos corporales, emplear su promedio.

Otra eventualidad es que la variabilidad explicada por la regresin sea compartida por
las dos variables predictoras de modo tal que ambas se tornen no significativas en el modelo.
Si en un caso as se opta por suprimir directamente las dos variables, puede caer significativamente la suma de cuadrados de la regresin y deteriorarse la capacidad de prediccin de
la variable dependiente y toda la calidad del estudio. Algo anlogo puede ocurrir con grupos
de dos o ms variables que de por s no se revelan significativas en la regresin y que, al ser
retiradas en conjunto, provocan una cada significativa de R. Esto se explica porque estando
correlacionadas, la supresin de cualquiera de ellas es suplida por las restantes, pero al eliminarse todo el conjunto no quedan variables que proporcionen la informacin que aportaba el
grupo suprimido.
[ 297 ]

Como se acaba de ver, en una regresin mltiple cabe la posibilidad de que variables
predictoras correlacionadas se reemplacen entre s en una ecuacin de regresin. Esto se conoce con el trmino proxying, hablndose en tal caso de variables proxy, palabra inglesa que
significa reemplazar o actuar en lugar de. Si bien esto suele ser inconveniente, el reemplazo
entre variables con un significado parecido y correlacionadas entre s puede aprovecharse
para tener una idea del efecto de alguna variable inaccesible o de difcil obtencin, mediante
el empleo de una variable proxy. Por ejemplo, se puede estimar la severidad de un cuadro
anginoso por la cantidad de pastillas de nitritos consumidas. Por otra parte, las variables
proxy pueden presentar los inconvenientes de la colinearidad y, entre otras cosas, tender a
cancelarse mutuamente o presentar coeficientes de regresin no significativos a pesar de ser
importantes dentro del sistema de variables en estudio.
Por ltimo, debe tenerse en cuenta que es posible encontrar correlacin entre variables
que no presentan un nexo lgico claro, y donde una tienda a reemplazar a otra sin que sea evidente o an conjeturable el motivo del fenmeno. En estos casos es aconsejable profundizar
la bsqueda de los fundamentos tericos que hagan explicable en trminos lgicos la relacin
hallada y, hasta tanto esto no se logre, abstenerse de adelantar conclusiones aventuradas. Si
una variable no tiene cabida lgica en el escenario del estudio, no debera ser incluida en las
conclusiones sin ms reparos.
Existen indicadores de colinearidad sobre los que no se entrar en detalles, que se hallan
incluidos en los programas estadsticos corrientes, programas que tambin suelen alertar
sobre la presencia de colinearidad en los datos. Por lo dems, la colinearidad suele hacerse
evidente por el comportamiento conjunto de variables que en forma aislada, son importantes
y significativas. En algunas oportunidades en que la colinearidad surge como un problema
computacional, es posible redefinir la variable problema mediante transformaciones que eliminen o reduzcan la colinearidad (ver Armitage y Berry, 1994).
11.6. Regresin con variables independientes binarias o indicadoras (dummy variables)
En los estudios de regresin, como en otros campos de la estadstica, frecuentemente
se desea analizar los datos separadamente en distintos subgrupos como sexo masculino o
femenino, diabticos y no diabticos, presin arterial sistlica mayor o menor que 140 mm
Hg, etc. Estos criterios de clasificacin constituyen variables binarias o dicotmicas, y si se
introducen en la ecuacin de regresin mltiple debidamente codificadas, pueden ahorrar la
necesidad de llevar a cabo dos regresiones por separado, como una para hombres y otra para
mujeres, o una para hipertensos y otra para no hipertensos. Cuando se emplean con esta
finalidad, suelen denominarse variables indicadoras o dummy. Introduciendo una variable
indicadora z cuyos dos valores posibles sean 0 y 1, se tiene que la ecuacin de regresin mltiple ajustada a los datos se puede escribir:
Y = a + dz + b1x1 + b2x 2 + + bnxn

(11.2)

que se diferencia de la 11.1 solamente en el trmino dz, donde z es la variable indicadora y d


su coeficiente de regresin mltiple. De aqu resulta que cuando z = 1, dz = d 1 = d, y cuando
z = 0, dz = d 0 = 0. Quedan as planteadas dos ecuaciones:
[ 298 ]

Y = a + d + b1x1 + b2x 2 + + bnxn


Y = a + b1x1 + b2x 2 + + bnxn

cuando z = 1
cuando z = 0

que slo difieren en que, en el grupo en el cual la variable indicadora vale 1 (cuando la condicin que indica est presente), la cantidad d se suma a la estimacin de Y.
Si por ejemplo, la variable z se refiere a la presencia de hipertensin arterial, se puede
llamarla HTA y definir z = HTA = 1 en los hipertensos, y z = HTA = 0 en los no hipertensos.
El correspondiente coeficiente de regresin mltiple d, permanecer sin cambios (d 1) en los
hipertensos, y se anular (d 0) en los dems individuos. El mtodo puede hacerse extensivo a
variables que admiten ms de dos estados, como por ejemplo peso normal, sobrepeso y obesidad, con lo que las comparaciones posibles aumentan. En lo que sigue se vern algunos aspectos
relativos a la introduccin de una variable binaria en un modelo de regresin mltiple.

Ejemplo 11 (continuacin)
Se desea evaluar el efecto de la presencia de hipertensin arterial en las estimaciones de
la masa ventricular izquierda (MVI) del ejemplo anterior. Creando la variable binaria HTA
y definindola como HTA = 1 en los hipertensos y HTA = 0 en los restantes individuos, hallando la nueva estimacin de los parmetros de la regresin se obtiene:
MVI = -35 + 1.73 ndice de Sokolow (mm) + 2.06 peso (kg) + 29 HTA
siendo 29 el coeficiente de regresin parcial d, de la MVI en la variable indicadora HTA.
El programa estadstico informa que, al igual que los otros dos coeficientes, el ltimo es
tambin altamente significativo frente a cero (p < 0.0001). De las unidades empleadas para
medir la MVI resulta que la dimensin del coeficiente es gramos. Cada vez que HTA = 1, el
ltimo trmino ser igual a 29 1 = 29, lo que expresa que a la masa calculada mediante el
ndice de Sokolow y el peso, se deben sumar 29 gramos. Por el contrario, si se trata de un
individuo no hipertenso, la variable HTA vale 0 y su producto con el coeficiente d = 29 se
anula, de modo que no hay nada que aadir al valor de la MVI calculada en base al ndice
de Sokolow y peso. Los individuos no hipertensos constituyen as el grupo de referencia, a
cuyas estimaciones hay que sumar el valor del coeficiente de regresin para la variable HTA
cuando se trata de un individuo hipertenso. Como se ve, la regresin con una variable independiente binaria genera dos grupos, correspondientes a dos regresiones, una para cada
estado de la variable binaria.
En el ejemplo, el nuevo valor de R es 0.59, ligeramente mayor que el de 0.52 obtenido
para el ndice de Sokolow y el peso corporal antes de introducir la variable HTA. Hay una
ligera mejora en la precisin de las estimaciones de la MVI al considerar hipertensos y no
hipertensos por separado. Este leve aumento en la suma de cuadrados debida a la regresin,
que se refleja en el incremento de R, no depende de los valores del ndice de Sokolow y el peso
de cada individuo, y as, para cualquier par de valores de Sokolow y peso, la MVI debe ser
incrementada en unos 29 gramos si el individuo es hipertenso, y no hacer agregados en caso
contrario.
[ 299 ]

11.7. Interaccin
Al clasificar una muestra en dos o ms niveles o estratos segn una variable discreta d,
puede suceder que las respuestas de la variable dependiente Y a los cambios de una variable
independiente continua X, sean de diferente magnitud segn se evalen en los distintos estratos en los que se ha clasificado la muestra. Cuando esto ocurre se dice que entre las variables d y X existe interaccin. En el ejemplo considerado hasta aqu, puede interesar saber si
la relacin entre Sokolow y MVI es la misma en presencia que en ausencia de hipertensin
arterial, esto es, si entre las variables Sokolow y HTA existe interaccin. Otro tanto puede
preguntarse acerca de las variables peso y HTA.
En general, un modo de evaluar la presencia de interaccin en un modelo como el que
nos ocupa, es calcular el producto de las variables implicadas para cada uno de los casos
de la muestra, creando una nueva variable que se denomina trmino de interaccin. Si su
coeficiente de regresin mltiple resulta estadsticamente significativo, puede esperarse interaccin entre las variables en cuestin. Por ejemplo, si se desea saber si existe interaccin
entre el peso corporal y la hipertensin arterial, debe calcularse el producto peso HTA para
cada individuo de la muestra. Esta nueva variable se introduce junto con las dems variables
independientes y se evala el modelo resultante.
Para comprender el procedimiento, considrese el caso limitado a la variable binaria
HTA y la variable continua peso, como predictores de la MVI. El trmino de interaccin ser
(HTA peso). La ecuacin que estima la MVI ser entonces:
MVI = a + b1 peso + b2 HTA + b3 (HTA peso)
Si el coeficiente b3 resulta estadsticamente significativo se est autorizado a deducir la presencia de interaccin entre peso y HTA. Si bien en la muestra del Ejemplo 11 dicho coeficiente no fue significativo y no se pudo comprobar interaccin, en lo que sigue se muestran los
fundamentos del procedimiento. Cuando HTA = 0, los dos ltimos trminos de la ecuacin
anterior se anulan, y sta se reduce a:
MVI = a + b1 peso
En tanto, cuando HTA = 1, se tiene que (b2 HTA) = b2 , y (b3 [HTA peso]) = b3 peso,
y consecuentemente, en los hipertensos la ecuacin debe re-escribirse:
MVI = a + b1 peso + b2 + b3 peso

= a + (b1 + b3) peso + b2
con lo cual se observa que el coeficiente de regresin del peso resulta igual a (b1 + b3), mientras
que en los no hipertensos es igual a b1. Esto equivale a decir que el peso estimar la MVI con
distintos coeficientes en hipertensos y en no hipertensos, y la interpretacin ser que existe
interaccin entre hipertensin y peso cuando se trata de estimar la MVI. Como se ha dicho,
el requisito es que el coeficiente del trmino de interaccin ( b3) resulte estadsticamente significativo, pues en caso contrario, se elimina de la regresin y la interaccin no se confirma.
[ 300 ]

11.8. Principales aplicaciones de la regresin mltiple



Las aplicaciones de la regresin mltiple son similares a las de la regresin con una sola
variable independiente ya vistas en la Seccin 9, siendo las fundamentales la descripcin
de las relaciones entre las variables predictoras y la dependiente, la interpretacin de esas
relaciones, la prediccin de la variable dependiente para distintos niveles de cada variable
independiente, y el ajuste de la variable dependiente para una variable independiente luego
de haber controlado el nivel de las dems. La descripcin de las relaciones entre las variables
se obtiene a partir de los coeficientes de regresin mltiple para cada predictor independiente y asimismo, mediante la evaluacin del grado de cambio del coeficiente de correlacin
mltiple R al introducir o retirar una variable del modelo. Lo referido en 9.4 con respecto
a la regresin simple y su interpretacin en el contexto biolgico de los ensayos, tiene aqu
la misma vigencia y puede incluso presentar aspectos ms complicados por el hecho de que
cada variable independiente suele afectar en mayor o menor grado el comportamiento de las
dems. Esto puede comprobarse en los ejemplos, en los cambios que experimenta el coeficiente de regresin del ndice de Sokolow, primeramente al agregar la variable peso y luego,
la variable HTA. A su vez, el coeficiente de la variable peso cambia al agregar al modelo la
variable HTA.

La prediccin de la variable dependiente a partir de las independientes puede realizarse
para distintas combinaciones de los valores de stas, y en particular, manteniendo constante
el valor de algunas de ellas, lo cual permite aislar los efectos de las restantes. En este punto
deben tenerse particularmente presentes las precauciones relativas a la extrapolacin de las
estimaciones ms all del rango de las variables independientes en que fueron estimados los coeficientes de regresin, y asimismo, debe tenerse presente la posibilidad de interaccin (11.7).
En cuanto a los ajustes de las estimaciones de la variable dependiente Y, a lo expuesto en
9.4 cabe agregar que en los modelos de regresin mltiple pueden realizarse para una o ms
de las variables independientes. Por otra parte, es interesante notar que del punto de vista del
modelo estadstico es indiferente cul de las variables se elige para el ajuste, siendo el criterio
mdico el que debe orientar la investigacin, ya que la interpretacin del significado biolgico
de los resultados y su relevancia se basa siempre en el juicio del investigador. As, en el ejemplo
analizado de la estimacin de la MVI, es posible evaluar las relaciones entre sta y el ndice
de Sokolow despus de ajustar los datos para distintos valores de la variable peso y tambin,
evaluar la influencia del peso para determinados niveles del ndice de Sokolow. El significado
clnico de estos ajustes, y si alguno de ellos tiene importancia en la materia, queda a criterio
del mdico. En general, para todas las aplicaciones de la regresin mltiple es conveniente hallarse familiarizado con las nociones bsicas que se han esbozado hasta aqu, y tener presente
que se trata de una herramienta de anlisis que en ningn caso debera reemplazar al juicio
clnico fundamentado. Debe tenerse en cuenta que an la ms evidente y significativa relacin
estadstica entre dos variables no implica de por s una relacin causal entre las mismas. Ms
an, la posibilidad que una o ms variables independientes deban su importancia al hecho de
representar las fluctuaciones de otras variables no incluidas en el modelo (variables proxy)
slo puede ser decidida por el investigador.

[ 301 ]

12. Regresin logstica

12.1. Regresin con variable dependiente binaria



Muchas veces las variables binarias constituyen objetos de inters como potenciales variables dependientes, susceptibles de ser predichas o estimadas por distintas variables independientes, pero en estos casos la regresin ordinaria de cuadrados mnimos vista en las Secciones
9 y 11 presenta inconvenientes para adaptarse a una variable dependiente que solo reconoce
dos estados posibles. En efecto, si bien una gran variedad de situaciones mdicas como la presencia o ausencia de distintas patologas, la respuesta a un tratamiento, etc., pueden codificarse
como variables binarias, su inclusin en los modelos de regresin ordinaria como la variable
dependiente a ser estimada, produce resultados de interpretacin dudosa, cuando no ilgicos.
Como ejemplo, supngase que se sabe que una determinada enfermedad cardiovascular guarda
relacin con los niveles de colesterol plasmtico, siendo ms frecuente en individuos con niveles
altos de colesterol. En este caso puede llegar a interesar la posibilidad de predecir la enfermedad
a partir de los niveles de colesterol plasmtico. Una forma de intentarlo es codificar la enfermedad en cuestin como una variable binaria E (E = 1 enfermedad presente, E = 0 enfermedad
ausente) y, a partir de un grupo de individuos en quienes se conoce efectivamente la presencia o
ausencia de enfermedad, calcular la regresin de la enfermedad as codificada, en los niveles de
colesterol plasmtico. Con los mtodos vistos en la Seccin 9 se obtendr una ecuacin de tipo
E = a + b colesterol, donde E es la variable dependiente y colesterol la variable independiente.
Como sta es una variable continua, la ecuacin de regresin predecir tambin una gama continua de valores para E, lo que se halla en desacuerdo con el hecho de que E slo puede adoptar
los valores 1 o 0, ya que la enfermedad slo puede estar presente o ausente, y esto es ya un
obstculo para el empleo de la regresin ordinaria en la estimacin de variables binarias. Prosiguiendo con el ejemplo, en la figura 12.1 se observa el grfico de dispersin y la correspondiente
recta de regresin lineal para 100 individuos hipotticos, 42 enfermos (E = 1) y 58 sanos (E =
0). Puede verse que los enfermos estn dispuestos a lo largo de la lnea E = 1 y los no enfermos
a lo largo de la lnea E = 0, mientras los respectivos valores de su colesterol se leen en el eje x.
La mayor parte de la recta de regresin est comprendida entre E = 0 y E = 1, y puede verse que
a mayores cifras de colesterol la recta asciende indicando valores de E ms prximos a 1. Este
hecho es importante dado que, si bien la regresin predice valores continuos, inadecuados para
describir una variable binaria que solo toma los valores 1 y 0, esos valores continuos podran
interpretarse como la probabilidad de que la variable binaria se halle presente. En otras pala[ 302 ]

bras, el valor que toma E para los diversos valores del colesterol plasmtico, podra interpretarse como una medida de la probabilidad de la enfermedad E para los correspondientes valores
del colesterol plasmtico.
Figura 12.1. Recta de regresin lineal ordinaria ajustada para una variable dependiente binaria E ( = enfermedad cardiovascular) en funcin del los niveles de colesterol. Los valores
predichos por la recta de regresin pueden llegar a ser mayores que 1 o menores que 0.


Sin embargo, el propsito de interpretar la variable dependiente E como la estimacin
de una probabilidad, empleando la regresin lineal ordinaria, se encuentra enseguida con
limitaciones. En efecto, en la Figura 12.1 se observa que hacia sus extremos, esto es para
valores relativamente altos o bajos de colesterol, la recta de regresin lineal predice valores de
E mayores que 1 o menores que 0 (negativos), lo cual hace imposible aceptarlos como valores
plausibles para una probabilidad. Adems, hay otros inconvenientes de ndole terica en los
que no es necesario entrar, pero suficientemente importantes como para impedir el empleo de
la regresin lineal ordinaria para la estimacin de las probabilidades de una variable binaria
en funcin de variables independientes.
Sin embargo, la idea de hallar a partir de los datos muestrales algn tipo de funcin de las
variables independientes que estime, no el valor real de la variable dependiente binaria sino
sus probabilidades, ha dado origen a la llamada regresin logstica. La regresin logstica,
cuya variable dependiente es siempre binaria o dicotmica, permite determinar la existencia
de relaciones entre los valores de las variables independientes y la probabilidad de ocurrencia de la variable dependiente. En la Figura 12.2 se ilustra la forma en que se distribuyen
las probabilidades de E estimadas mediante regresin logstica, en funcin de los niveles del
colesterol, para los mismos datos de la Figura 12.1.

[ 303 ]

Fig.12.2. La curva de probabilidades predicha por el mtodo de la regresin logstica se


aplana hacia el piso y el techo de las probabilidades, sin extralimitarse.

Puede observarse que las probabilidades de E, en ordenadas, se extienden en forma continua entre 0 y 1, y tambin, que los valores bajos de colesterol se asocian con probabilidades de
E prximas a 0 y a la inversa, los valores muy altos se asocian con probabilidades prximas a
1, pero en ningn caso los valores se extralimitan, y el rango de los valores de la probabilidad
de E queda siempre comprendido entre 0 y 1. As, el modelo de regresin logstica resulta
adecuado para describir las probabilidades de una variable dependiente binaria. Dada su importancia como tcnica estadstica, se esbozarn muy someramente los fundamentos tericos
en que se basa.
12.2. Aspectos tericos y significado de la regresin logstica

Uno de los problemas que plantea la estimacin de probabilidades en variables binarias, es
que la relacin entre dichas probabilidades y sus variables predictoras no es lineal. Es as que en
el caso de la enfermedad cardiovascular (E) y el colesterol, puede esperarse una relacin ms o
menos lineal entre la probabilidad de E y los valores del colesterol cercanos al medio de la escala, pero en cambio, con valores muy altos, donde la probabilidad de E ya est muy elevada, no
debe esperarse que un aumento de 20 o 30 mg/dl de colesterol, digamos entre 350 y 370 mg/dl,
tenga mucho efecto en aumentar la morbilidad, ya de por s muy alta en este extremo. Lo mismo
puede decirse de colesteroles muy bajos, donde debe esperarse que la probabilidad de E vare
muy poco al pasar de 150 a 170 mg/dl, siendo en ambos casos muy baja. De modo que la grfica
que represente en forma realista las probabilidades de E, no debera ser una lnea recta sino
tener una forma como se muestra en la figura 12.2, donde se observa que la pendiente se hace
cada vez menor a medida que se alcanzan los valores extremos de la variable independiente,
cuando la variacin de la probabilidad ante estos valores se hace proporcionalmente menor que
[ 304 ]

en el centro de la distribucin. En la tarea de linearizar estas relaciones se ha desarrollado la regresin logstica, calculndose sus parmetros a partir de conjuntos de individuos donde cada
uno aporta una o ms variables independientes (por ejemplo, colesterol, glucemia, tabaquismo)
y asimismo el estado de la variable dependiente (E = 1, o E = 0). Se esbozarn los procedimientos
en el ejemplo que nos viene ocupando. Ya se ha visto que hallar una recta de regresin por el
mtodo de mnimos cuadrados es inadecuado para describir probabilidades, ya que fcilmente
predecir valores mayores que 1 y menores que 0. En cambio, en la regresin logstica, se halla
una ecuacin lineal de la forma y = a + bx, donde x corresponde al valor de la variable independiente (el colesterol) pero, mediante una elaboracin matemtica, en lugar de la probabilidad de
E (que no puede representarse por una recta), la variable dependiente y expresa el logaritmo de
los odds de la variable E, tambin llamado logit, de donde proviene el trmino regresin logstica. El ncleo de la regresin logstica consiste precisamente en la obtencin de las ecuaciones
lineales que estiman logits, lo que se logra mediante procedimientos especiales que difieren de
los empleados en la regresin lineal ordinaria o de mnimos cuadrados vista en secciones anteriores. Obtenidos los logits, cuyo significado es poco o nada intuitivo, es posible pasar a los
odds y probabilidades de E. Estas probabilidades son las que se han graficado en la curva de la
Figura 12.2, y se obtienen de los correspondientes logits. Contra lo que podra suponerse, esta
ltima tarea no es complicada.
En principio, los programas estadsticos calculan la funcin lineal a + bx, caracterizada
por los parmetros a y b, que proporciona los logits de la variable dependiente E a partir de
la variable independiente x (colesterol). Lo ya expresado puede escribirse:
Logit i = ln (odds i) = ln [Pi / (1 Pi)] = a + b xi

(12.1)

siendo Pi la probabilidad de la variable dependiente E cuando la variable independiente toma


el valor xi.
Para los datos el ejemplo que nos ocupa, los programas de regresin logstica proporcionan a = 25 y b = 0.11. El parmetro b se conoce como coeficiente de regresin
logstica. Si elegimos un individuo con un colesterol de 210 mg/dl se tiene, siguiendo con el
ejemplo:
L = ln (odds) = a + bx = 25 + 0.11 210 = 1.9
El valor 1.9 es el logaritmo natural de los odds (logit) de la variable dependiente (E) para
el individuo en cuestin, incmodo para trabajar pero que tiene la ventaja ser una funcin
lineal de las variables independientes (el colesterol en este caso). De esta expresin se puede
pasar a los odds de E (odds de presentar E, o sea E = 1). De (12.1) se tiene que:*
odds (E) = e a + bx = e 1.9 = 0.15
que son los odds de presentar E teniendo un colesterol de 210 mg/dl. Tambin se pasa fcil * Recurdese que dado el logaritmo de un nmero b, el nmero b se obtiene elevando la base (el nmero e en los
logaritmos naturales) al logaritmo en cuestin:
b = e ln b
y en el ejemplo
odds = e ln odds

[ 305 ]

mente a la probabilidad de presentar E con solo recordar que P = odds / (odds+1) (3.4):
P (E) = 0.15 / (0.15 + 1)

= 0.13 o 13%.
que es la probabilidad estimada para el caso en cuestin. La significacin estadstica del
coeficiente de regresin mltiple b, a partir del cual y de los valores del colesterol se deducen
logits, odds y probabilidades, se prueba con los mtodos apropiados y la interpretacin de los
resultados es la tarea ms importante y delicada que resta (ver prrafos siguientes). Es comn
obtener ecuaciones de regresin logstica para ms de una variable independiente, como pudieran ser en el ejemplo el colesterol, los triglicridos y la glucemia.
El logaritmo de los odds (logit) est dado, como se ha visto, por una expresin lineal
que puede extenderse indefinidamente sobre el eje de las x, pudiendo adoptar valores negativos o positivos arbitrariamente grandes. Ahora bien, los odds, estando dados por e elevado
a distintos exponentes, podrn tener valores positivos ilimitadamente grandes pero nunca
menores que cero, como puede comprobarse fcilmente con una calculadora de mano. Esto
concuerda con el concepto de odds como P / (1P), siendo P siempre positiva y no mayor que
1 ni menor que 0. Finalmente, al convertir odds en probabilidades mediante la frmula P =
odds / (odds+1), nunca se obtendrn valores superiores a 1, ya que el denominador es siempre
una unidad ms grande que el numerador. Por lo tanto, al convertir logits en odds se establece un piso en 0, y al pasar de odds a probabilidades se coloca un techo en 1, con lo que
la curva de probabilidades toma necesariamente la forma sigmoidea caracterstica de la Fig.
12.2, que se extiende entre 0 y 1 y ya no presenta los inconvenientes vistos cuando se intent
ajustar a los datos del colesterol una recta de regresin lineal ordinaria.
El mtodo para obtener la ecuacin que da logits como funcin de las variables independientes y posibilita todo el desarrollo terico subsiguiente, se conoce como de mxima
verosimilitud (maximum likelihood), y estima los parmetros de las funciones de regresin
logstica como aqullos que tienen la mxima probabilidad de producir los datos observados
en las muestras. Este mtodo, extensamente empleado en estadstica, difiere del mtodo de
los cuadrados mnimos u OLS (ordinary least squares) en que se fundan las tcnicas vistas
en las secciones 9 y 11, mencionadas como regresin OLS u ordinaria. Sus aspectos tericos quedan fuera del alance del texto. En lo que sigue, se intentar aclarar en lo posible la
interpretacin de los resultados y algunas aplicaciones de la regresin logstica corrientes en
medicina.
12.3. Significacin de los resultados de la regresin logstica

La significacin de los coeficientes de regresin logstica se prueba en forma anloga a
otros estadsticos, en particular a los coeficientes de regresin ordinaria vistos en las Secciones 9 y 11, siendo la hiptesis nula que el correspondiente parmetro de poblacin es igual a
cero y las diferencias observadas se han debido al azar del muestreo. Sin embargo, en el caso
de la regresin logstica las pruebas no son tan seguras como en el de la regresin ordinaria y
exigen mayores precauciones, en particular tratndose de muestras pequeas. En este sentido, los valores de P obtenidos en las pruebas de significacin de los respectivos coeficientes,
[ 306 ]

no siempre guardan una relacin estrecha con la fuerza o la importancia de una variable en
el modelo. Un estadstico de prueba para los coeficientes de regresin es el de Wald, igual al
cuadrado del cociente entre el coeficiente de regresin logstica y su error estndar, que tiene
una distribucin chi-cuadrado con un grado de libertad. Se halla incluido en los paquetes
estadsticos corrientes. Existen otros mtodos que apuntan a asegurar la validez de los hallazgos, en relacin a limitaciones como el tamao de las muestras.
Como ya se ha dicho, la estimacin de los coeficientes de regresin logstica se basa en
una tcnica llamada de mxima verosimilitud, que utiliza para el clculo una funcin llamada con el mismo nombre (maximum likelihood function) y que permite no solamente obtener
los logits sino tambin evaluar en forma global el grado de ajuste del modelo resultante
a los datos muestrales. Esto permite a su vez calibrar la importancia de cada variable en el
resultado de la regresin, observando el grado de cambio en el ajuste global de la regresin
luego de introducir o retirar la variable en cuestin (el caso anlogo en la regresin ordinaria
consiste en observar los cambios en el coeficiente de correlacin mltiple R con el agregado
o retiro de variables). Esta es otra forma de evaluar la significacin de los coeficientes de regresin logstica. Como se ve, existen numerosas alternativas para hacerlo, lo que indica que
no hay un procedimiento nico y directo, y analizar los resultados requiere alguna experiencia, as como cierto conocimiento previo del material estudiado. Lo dicho debe hacer tomar
precauciones ante la obtencin de conclusiones apresuradas o sin un anlisis cuidadoso de su
significado en el contexto de la investigacin (ver Pampel, 2000).
12.4. Algunas propiedades de la regresin logstica
Como se ha dicho, la regresin logstica proporciona ecuaciones con ciertas analogas
a las de regresin lineal ordinaria o de mnimos cuadrados tratadas en secciones anteriores,
donde la significacin estadstica de los coeficientes de regresin expresa la importancia de la
correspondiente variable independiente en la determinacin de la probabilidad de la variable
dependiente binaria. En el caso de la regresin logstica, las correspondientes ecuaciones consisten en logits, expresiones lineales en funcin de las variables independientes, que es comn
convertir en odds o en probabilidades para facilitar su interpretacin. Como se ha dicho, en
general es preferible trabajar con muestras no demasiado pequeas.

La regresin logstica presenta ms cuestiones de interpretacin que la regresin lineal
ordinaria. En la seccin 9 examin el coeficiente de regresin del peso en la talla para un
grupo de adultos de ambos sexos, y se mencion que en un experimento dado haba resultado igual a 1.14 (kg / cm), lo que significa que por cada centmetro de aumento en la estatura
se espera un aumento promedio del peso igual a 1.14 kg. En este punto es importante notar
que este aumento de aproximadamente 1 kg de peso por cm de estatura, es esperable dentro
de todo el rango de estaturas incluido en el anlisis, es decir, tanto para una persona de alta
como para una de baja estatura. En otras palabras, puede esperarse un incremento del peso
igual a 1.14 kg tanto si la estatura pasa de 150 a 151 cm como si lo hace de 195 a 196 cm
(este hecho es estadstico y su ajuste a la realidad biolgica no interviene aqu). No ocurre lo
mismo para las probabilidades predichas por los logits en la regresin logstica, donde para
cambios en los valores ms extremos de la variable independiente (en el ejemplo, el colesterol)
se esperan variaciones menos marcadas de las probabilidades que las que se observan en el
[ 307 ]

centro de la distribucin. As, se vio que un individuo con 210 mg/dl de colesterol tena 0.13 o
13% de probabilidades de enfermedad bajo las condiciones simuladas por el ejemplo; ahora,
si el colesterol aumenta en 10 mg/dl, a un nivel de 220 mg/dl, la nueva probabilidad de E se
calcula en 0.31 o 31%, con lo cual se ha duplicado largamente. En cambio, un individuo con
un colesterol en el extremo alto de la distribucin, por ejemplo 250 mg/dl, tendr una probabilidad de E estimada en 92%, y si se en este punto el colesterol se incrementa en 10 mg/dl, a
260 mg/dl, la nueva probabilidad ser igual a 97%, con lo que habr aumentado en poco ms
del 5% respecto del nivel que tena para 250 mg/dl. Esto se nota claramente inspeccionando
la curva de probabilidades en la figura 12.2, ms empinada en el centro y aplanada hacia los
extremos (no se olvide que en ningn caso podr situarse por encima de 1 o por debajo de
0). Como se ve, en regresin logstica los resultados en trminos de probabilidades u odds,
sern distintos segn se calculen en el centro o en la periferia de los posibles valores de la
variable predictora o, lo que es equivalente, segn el nivel de probabilidad P de la variable
dependiente a partir del cual se estimen los cambios. La relacin entre niveles de colesterol y
probabilidad de E no es lineal. No se entrar en las diversas cuestiones que aparecen en este
punto, mencionndose slo la conveniencia de hacer las determinaciones cerca del centro de
las distribuciones, aunque existen numerosos mtodos de abordaje para stos y otros tpicos
relativos a la interpretacin de los resultados de la regresin logstica.

Como en la regresin mltiple ordinaria, en regresin logstica las variables independientes pueden ser ms de una, y en lneas generales, muchos conceptos similares se aplican
a ambos tipos de regresin. Sin embargo, hay aspectos de importancia en los cuales los dos
mtodos difieren. El ms importante radica en que, como en la regresin logstica el valor de
cualquier variable independiente X1 condiciona el valor P de la variable dependiente, y este
valor condiciona a su vez, como se vio en el prrafo anterior, el efecto que sobre l pueda
tener una segunda variable independiente X 2 , un cambio en X1 modificar la influencia de
X 2 sobre la variable dependiente. Por ejemplo, con valores muy altos de probabilidad de E,
condicionados por niveles elevados de colesterol plasmtico (X1), cualquier cambio en una
segunda variable independiente (X 2) tendr un efecto sobre dicha probabilidad, menor que el
que cabra esperar cuando la probabilidad de E se halla en sus valores medios.

La regresin logstica puede tambin llevarse a cabo con variables independientes de
tipo binario, como por ejemplo las que resultan de codificar distintas caractersticas de los
datos como el gnero, factores de exposicin o de riesgo y cualquier otra circunstancia que
permita clasificar los datos en dos categoras (en realidad, la tcnica puede extenderse a
variables discretas con ms de dos estados, permaneciendo uno de stos como referencia a
partir del cual se comparan los restantes). As, el sexo puede ser codificado como variable
binaria independiente asignando el 1 a mujeres y el 0 a varones. Con esto, el coeficiente para
el gnero, bg, se anula cuando se multiplica por 0 (hombres) y vale bg cuando se multiplica
por 1 (mujeres). La diferencia entre ambos resultados refleja las diferencias esperadas en la
variable dependiente, expresadas en logits, que se pueden transformar fcilmente en odds o
en probabilidades. Nuevamente, deber elegirse el nivel de las otras variables independientes
o bien de la variable dependiente, donde evaluar el efecto de sexo a travs de su coeficiente bg,
pues los efectos no sern los mismos en diferentes niveles de aqullas.

[ 308 ]

12.5. Algunas utilidades de la regresin logstica. Odds ratios



Las aplicaciones de la regresin logstica son anlogas a las de la regresin ordinaria y algunas han sido esbozadas en lo que antecede. En principio, la determinacin del efecto de las
variables independientes o predictoras sobre las probabilidades de la variable dependiente, la
comparacin de la magnitud de dichos efectos y la evaluacin de la independencia estadstica
de las variables predictoras son aplicaciones importantes. As, se vio que la ecuacin de regresin logstica que relaciona la variable dependiente E con el colesterol plasmtico, expresada
como logits de E, permite pasar a odds de E y a probabilidad de E, para cualquier valor del
colesterol. Si la regresin resulta estadsticamente significativa, se puede descartar la hiptesis nula de no asociacin entre enfermedad y colesterol, y darle plena utilidad. En este punto
puede agregarse otra variable al modelo y evaluar si es significativa como la variable colesterol, y si sta conserva su significacin luego de haber introducido la nueva variable. Si es as,
se podr afirmar que ambas variables son predictores independientes de E. Tambin podr
ocurrir que una de las dos variables no sea significativa en presencia de la otra por compartir
informacin, y los conceptos vistos en la Seccin 11 son en general aplicables tambin en
regresin logstica. La comparacin del efecto de distintas variables predictoras, el estudio de
sus interrelaciones y la comprobacin de hiptesis, son aplicaciones corrientes de la regresin
logstica. Algunas de las situaciones que pueden dificultar la obtencin de resultados vlidos
son la omisin de variables relevantes, la inclusin de variables que no lo son, la colinearidad entre variables independientes, y otras condiciones de ndole formal sobre las que no es
posible extenderse, que pueden eventualmente llegar a infringir los supuestos tericos de la
tcnica (cf. Menard, 2001).

Por ltimo, se expondr una importante relacin entre la regresin logstica y el odds
ratio de la variable dependiente para dos niveles de la variable predictora. Considrese una
ecuacin de regresin logstica para una variable dependiente Y, cuyos logits estn dados por
una expresin del tipo L(Y) = a + bx, siendo a constante, b el coeficiente de regresin de x, y
sea x una variable independiente binaria. Los logits y los odds para x = 1 y para x = 0 son:

L x=1 = a + b 1 = a + b
L x=0 = a + b 0 = a

Odds x=1 = e a + b
Odds x=0 = e a

Como se aprecia, L1 L 0 = b, o sea que la diferencia entre los logits para x = 1 y x = 0, es igual
al valor del coeficiente b de la variable independiente x. Como L1 y L 0 son logaritmos de
odds, y la diferencia entre los logaritmos de dos nmeros es el logaritmo del cociente de esos
nmeros, la diferencia entre L1 y L 0 ser el logaritmo del cociente de odds. En smbolos:
L1 L0 = ln (Odds x=1 / Odds x=0)
y como L1 L 0 = b, el coeficiente de regresin de la variable binaria b es el logaritmo de la
razn de odds u odds ratio (OR) para los valores 1 y 0 de la variable independiente. Este
hecho es de gran utilidad en el anlisis estadstico y vincula la regresin logstica con otras
tcnicas que manejan odds, como el clculo del riesgo relativo en los estudios de tipo casocontrol (ver Seccin 16).
[ 309 ]


En 16.6 se analiza un estudio de tipo caso-control donde se determina el odds ratio
(OR) para el infarto de miocardio en presencia (x = 1) y ausencia (x = 0) de dislipemia, obtenindose el valor 2.70. Introduciendo los mismos datos en un programa de regresin logstica, se obtiene la ecuacin:
logit (infarto) = 1.40 ( 0.993 dislipemia )
donde 0.993 es el coeficiente b de la variable dislipemia. Como se demostr ms arriba, este
coeficiente es el logaritmo del OR entre los valores 1 y 0 de dislipemia. Por lo tanto, el OR se
obtiene tomando el antilogaritmo de 0.993:
OR = e 0.993 = 2.70
y el resultado es el mismo que se obtiene mediante el anlisis directo de la Tabla 16.1

En forma anloga a lo ya visto, cuando la variable predictora es continua, la diferencia
entre los logits para un incremento en una unidad de la variable predictora, es el logaritmo
del OR de la variable dependiente entre los dos valores de la predictora. Por lo dems, la
regresin logstica permite el manejo eficiente de modelos con distintas variables en estudio,
siendo un mtodo de anlisis multivariado de gran utilidad para abordar muchas situaciones
que se presentan en la investigacin mdica.

Con esto se han procurado delinear en forma muy esquemtica los fundamentos y las posibles aplicaciones de la regresin logstica. Si bien la complejidad de los clculos est solventada
en los paquetes estadsticos corrientes, las posibilidades y limitaciones inherentes a estas tcnicas deben tenerse siempre presentes para obtener conclusiones suficientemente slidas.

[ 310 ]

13. Mtodos no paramtricos

13.1. Introduccin
Existen mtodos que permiten la evaluacin de diversas hiptesis, en especial en pruebas
de significacin estadstica entre muestras, sin necesidad de asumir un tipo determinado de
distribucin de los datos, como podran ser la distribucin normal, la binomial o cualquier
otra. Esto significa que dichos mtodos operan sin necesidad de estimar los parmetros de
las poblaciones de donde provienen las muestras (varianza, desvo estndar), y por este motivo son conocidos como mtodos no-paramtricos (distribution-free methods). Con estos
mtodos, no slo son innecesarias las estimaciones de parmetros de poblacin, sino que
stos no intervienen en las pruebas de hiptesis.
En general, los mtodos no-paramtricos se utilizan cuando la presuncin de no-normalidad de los datos es fuerte, o cuando de ser cierta, pudiera tener consecuencias de importancia en los clculos. Su principal utilidad son las pruebas de significacin estadstica, ya que al
no estimar parmetros son menos tiles para estudiar las caractersticas de la distribucin de
una variable. Por lo tanto, se utilizan para comparar muestras, pero como se ver, no comparan sus medias, varianzas u otros parmetros, es decir, no toman en consideracin de qu
tipo de distribucin se trata en cada caso.
En ocasiones, no slo puede ser incierto el tipo de distribucin de los datos, sino que stos
pueden carecer de escalas de medicin adecuadas, y en estos casos ha demostrado utilidad
proceder a su evaluacin comparativa, sin adjudicarles medidas sino posiciones o rangos
dentro del conjunto. As, al evaluar del efecto de varios analgsicos, stos pueden ser clasificados segn su eficacia relativa respecto de los otros, en una escala de eficacia ascendente
o descendente. Otro tanto ocurre al clasificar la intensidad del del dolor anginoso de uno a
diez, o al graduar la capacidad funcional segn la informacin proporcionada por el paciente. Si bien es difcil contar con unidades precisas para la medicin del dolor o la capacidad
funcional segn escalas subjetivas, la ordenacin de las variables (analgesia, intensidad del
dolor, capacidad funcional) segn la magnitud de las distintas observaciones, suele ser eficaz
y permitir comparaciones entre distintos grupos sin ser necesario que los nmeros o rangos
asignados a cada individuo se distribuyan segn una funcin de probabilidad conocida. En
estas circunstancias tienen aplicacin los mtodos no paramtricos.
Si bien los mtodos no paramtricos tienen la ventaja de requerir menos trabajo de clculo que los dems mtodos basados en estimaciones de los parmetros de las poblaciones, y
[ 311 ]

en este sentido se consideran mtodos rpidos, los recursos de computacin con los que
actualmente se cuenta han hecho que lo sencillo y rpido del clculo pase a segundo plano y
as, la principal utilidad de los mtodos no paramtricos son los casos en donde no se puede
llegar a conocer el tipo de distribucin subyacente en las muestras, o bien no existen escalas
adecuadas para las mediciones y, en cualquier caso, la estimacin de parmetros en los que
basar los clculos no es factible.
13.2. Pruebas para datos apareados.
En estas pruebas la hiptesis nula propone que la distribucin es simtrica alrededor de
un valor central arbitrario, por ejemplo cero, y se utilizan con variables que pueden oscilar
alrededor de ste, tomando tanto valores positivos como negativos. Esta situacin es tpica
de la comparacin entre pares de datos obtenidos de una misma muestra antes y despus de
una determinada intervencin o tratamiento, donde la hiptesis nula a plantear es que el tratamiento no tiene efecto y por lo tanto las diferencias entre cada par de datos deben oscilar
alrededor de cero, con desviaciones en uno u otro sentido (positivas y negativas) en nmero
aproximadamente igual y de similares magnitudes. Supngase que se ensayan a ciegas dos
analgsicos, durante una semana cada uno, en 10 pacientes, y que al final del ensayo se pide
a cada paciente que informe cul de las dos semanas fue ms confortable (las drogas A y B
se deberan administrar aleatoriamente en la primera o segunda semana, y con un intervalo
entre ambas, para evitar en lo posible el arrastre de los efectos de un perodo al otro). Los
resultados pueden ser: A mejor que B, B mejor que A y A y B iguales. (los casos A y B
iguales no se toman en cuenta pues no proporcionan informacin en un sentido u otro). La
hiptesis nula es que, sin considerar los empates, los casos A mejor que B y B mejor que
A tienen las mismas probabilidades, o sea P(A mejor que B) = P(B mejor que A) = 0.5.
En el ejemplo, para 10 pacientes se esperan 5 casos a favor de A y 5 a favor de B (si hubiera
empates, simplemente no se cuentan y se contina el anlisis con el resto de los datos).
Supngase que para 8 pacientes result A es mejor que B y para los 2 restantes B es mejor
que A. Estos valores se apartan de los esperados por hiptesis nula, que son 5 para cada caso. Con ayuda de la distribucin binomial, haciendo p = q = 0.5 (iguales probabilidades para
A mejor y A no mejor) pueden determinarse las probabilidades exactas de obtener 8
respuestas a favor de A, y tambin las probabilidades en los casos an ms extremos: 9 respuestas a favor de A y 10 respuestas a favor de A. Un detalle importante: para que la prueba
sea a 2 colas, deben considerarse los resultados extremos tanto para los casos en que A es
mejor que B como para aqullos en que B es mejor que A, que corresponden a 8, 9 y 10
respuestas a favor de B, o sea 2, 1 y 0 respuestas a favor de A. La suma de las probabilidades
extremas para 8, 9 y 10 resultados a favor de A, ms las opuestas, en el otro extremo: 2, 1, y
0 resultados a favor de A, expresa la cantidad de veces en que deberan esperarse resultados
iguales o ms extremos que los encontrados, si no hubieran en el universo diferencias entre
las probabilidades a favor de A y a favor de B. Esta prueba se conoce como test del signo, y
en el ejemplo arroja P = 0.11 (como se ve, hay ms del 10% de probabilidades de obtener un
resultado igual o ms extremo a favor de una u otra droga).
En los casos en que el nmero de observaciones es grande, la prueba de la hiptesis nula
puede realizarse aproximando la distribucin binomial por la normal, mediante los procedi[ 312 ]

mientos vistos en la Seccin 8. En muestras de poblaciones que siguen la distribucin normal,


el test equivalente al test del signo es el test t de Student para datos apareados (7.3). Como
se ha dicho, la hiptesis nula se rechaza cuando hay suficiente evidencia de acumulacin de
datos con uno u otro signo, o sea a uno u otro lado del cero.
Con ser extremadamente til, el test del signo no aprovecha la informacin dada por la
magnitud de las desviaciones de los datos. Por ejemplo, examnese el puntaje, de 1 a 10, obtenido para el efecto ansioltico de dos drogas, A y B, probadas en seis individuos, en forma
ciega y randomizada:

Individuo

Puntos A

Puntos B

A es mejor

AB

|AB|

Rango

Si

6
2

4
9

Si
No

2
7

2
7

2
5

3
4

No

Si

No

Se observa que si bien 3 casos favorecen a A y 3 casos a B, en los casos en que B es mejor
que A, la diferencia en valor absoluto es mayor que cuando A supera a B (cuando B supera a A,
lo hace por un promedio de 6.7 puntos, mientras que cuando A supera a B, la diferencia media
es de 3 puntos). Ordenando las diferencias en forma creciente por su valor absoluto | A B |, y
adjudicndoles un nmero de orden o rango de menor a mayor, se ve que los rangos ms altos
tienden a asociarse con los casos en que la droga B fue mejor que A. Este comportamiento, que
no sera detectable por el test del signo (ya que hay igual nmero de observaciones a favor de
cada droga), puede ponerse a prueba calculando la significacin de la diferencia entre las sumas
de los rangos para A y B, que debera esperarse fueran iguales o muy similares si ambas drogas
manifestaran los mismos efectos. La prueba se conoce como test de los rangos con signo de
Wilcoxon (signed rank sum test). Los valores crticos de las sumas de rangos para los distintos
niveles de P, se hallan calculados en forma exacta y tabulados para nmeros relativamente
pequeos de casos. Para muestras con mayor nmero de observaciones existen aproximaciones
mediante la distribucin normal, que no se expondrn aqu (ver Armitage y Berry, 1994). En el
ejemplo, las sumas de rangos son, segn la ltima columna, 1+2+4 = 7 para A y 3+5+6 = 14 para
B, y si bien la diferencia no resulta significativa (consultando tablas), de continuar la tendencia
en favor de B, podra esperarse que con un mayor nmero de casos se pudiera demostrar su
significacin estadstica. El test de los rangos con signo tiene as la ventaja de tomar en cuenta
la magnitud de las diferencias entre los pares de observaciones y no slo su signo. Ntese de
paso, que el desarrollo del test no necesita de ninguna presuncin sobre el tipo de distribucin
subyacente en las poblaciones estudiadas. Como para el test del signo, el test equivalente en la
teora normal, es el test t de Student para datos apareados (7.3).

[ 313 ]

13.3. Dos grupos independientes, ordenacin por rangos


Estos procedimientos se aplican en el caso de tener dos muestras al azar, una de ellas formada por n1 elementos de una poblacin X, y la otra formada por n2 elementos de una poblacin Y.
La hiptesis que suele interesar es que las muestras provengan de distintas poblaciones, en una
de las cuales la variable estudiada tienda a ser mayor o menor que en la otra, pero sin detenerse
a considerar ni a calcular los parmetros de las poblaciones, como la media y el desvo estndar. Como se ha dicho, la ventaja de estos mtodos no paramtricos radica en que muchas
veces las variables muestrales no siguen distribuciones conocidas y sus parmetros no pueden
estimarse como para aplicar los mtodos de las secciones anteriores. En estos casos, la suposicin ms simple que se puede hacer, es que entre ambas muestras exista un desplazamiento
de los valores de sus elementos, de modo que en una de ellas los valores de la variable tiendan
a ser mayores o menores que en la otra. Esto se ilustra en la Figura 13.1, donde se observa que
los valores de la distribucin B son en general 2 unidades mayores que los correspondientes
valores de la distribucin A, sin importar que las distribuciones sean claramente no-normales.
La hiptesis nula es que no existe diferencia o desplazamiento entre las distribuciones A y B, y
debe poder ser rechazada para aceptar la validez de la hiptesis alternativa.
Figura 13.1. Las distribuciones A y B, cuyos parmetros no estn determinados, se hallan
desplazadas entre s de modo que los elementos de B se hallan en promedio 2 unidades de la
escala por arriba de los elementos de A.

Existen varios procedimientos equivalentes destinados a probar la diferencia o desplazamiento entre la magnitud de las observaciones en X e Y, que se basan en el ordenamiento
de las observaciones de acuerdo a su magnitud. Cada observacin recibe as un nmero de
orden o rango, de donde proviene el nombre de algunas de las pruebas. Si las poblaciones X
e Y no difieren entre s, los rangos de las observaciones xi y yj en las respectivas muestras, no
deberan a su vez exhibir grandes diferencias, y en esto se basan las pruebas que se mencionan
a continuacin. El equivalente de estas pruebas en la teora normal es el test t para muestras
no apareadas o independientes (7.2).
El test de la suma de rangos de Wilcoxon (Rank sum test) asigna un nmero de orden, de
menor a mayor, a las observaciones de las muestras a comparar, tomadas conjuntamente. Luego procede a sumar los nmeros de orden o rangos dentro de cada muestra. La hiptesis nula
es que, siempre que los grupos sean del mismo tamao, la suma los rangos debe ser igual o muy
[ 314 ]

semejante en ambos grupos. En cambio, si las observaciones tienden a tener valores mayores
en una de las muestras, la correspondiente suma de los rangos tambin tender a ser mayor
en esa muestra y ser una evidencia en contra de la hiptesis nula y a favor de una diferencia
entre ambos grupos. Considrense por ejemplo las siguientes observaciones correspondientes a
la fraccin de eyeccin en dos grupos de individuos, en donde interesa obtener algn grado de
evidencia acerca del aparente predominio de valores ms altos en el grupo X:
Grupo X: 24, 32, 35, 38, 39, 40, 41, 45
Grupo Y: 23, 29, 30, 31, 34, 34, 35, 37

Ordenando las observaciones de menor a mayor y asignndoles un rango, se tiene:


Observacin

23

24

29

30

31

32

34

34

35

35

37

38

39

40

41

Grupo:

55
X

Rango:

9.5

9.5

11

12

13

14

15

16

Como existe una observacin igual a 35 en cada grupo, a las que les corresponderan
como puede verse arriba los rangos 9 y 10, a cada una se le adjudica el promedio de ambos
rangos, o sea 9.5. En forma anloga se manejan los empates entre ms de dos observaciones idnticas. Ntese que en cambio, si las observaciones idnticas se repiten en un mismo
grupo, no es necesario asignarles un rango promedio: por ejemplo, en el Grupo Y se repite dos
veces el 34, que aparece con los rangos 7 y 8, aportando un total de 15 a la suma de rangos
de Y. Si se adjudicara un rango de 7.5 a cada repeticin, el total sera tambin igual a 15.
Sumando los rangos (y no el valor de las observaciones) para cada grupo y llamando a la
suma T, obtenemos:
T X = 2 + 6 + 9.5 + 12 + 13 + 14 + 15 + 16 = 87.5
Ty = 1 + 3 + 4 + 5 + 7 + 8 + 9.5 + 11 = 48.5
Como comprobacin, la suma de T X y T Y debe ser igual a la suma total de los rangos, o
sea, la suma de los nmeros naturales de 1 a 16, pues hay 16 observaciones en total. La suma
de los primeros n nmeros naturales es igual a n (n+1), lo que para n = 16 es igual a 16
17 = 136. Este valor es idntico al que se obtiene sumando los rangos en cada grupo ( 87.5
+ 48.5 ).
En el ejemplo se observa que los valores correspondientes al grupo X tienen una suma de
rangos mucho mayor que la del grupo Y, lo que sugiere que la hiptesis nula de distribuciones
iguales no es correcta, ya que con igual nmero de casos en cada grupo se esperara que la suma de los rangos para cada uno fuera aproximadamente la misma, o sea la mitad de la suma
total de los rangos, en este caso 136 / 2 = 68. En este ejemplo, las sumas se alejan bastante de
lo esperado. La significacin de las posibles desviaciones, como evidencia para rechazar la
hiptesis nula, se halla calculada y tabulada para diversos tamaos muestrales. Para el caso
del ejemplo, se encuentra en tablas que para nX = nY = 8 casos por grupo, P = 0.05 cuando la
menor de las dos sumas, T X o bien T Y, es 49. Como en nuestro caso T Y = 48.5, se concluye
[ 315 ]

que un desplazamiento en los rangos como el observado es altamente improbable por azar, y
se acepta una diferencia significativa entre los grupos, con un nivel P = 0.05. Desde ya debe
notarse que la hiptesis nula con T X = T Y se aplica en los casos en que cada grupo tiene igual
nmero de observaciones (nX = nY) pues de otra forma, T guarda tambin relacin con el
nmero de casos de cada grupo, ya que a mayor nmero corresponder mayor cantidad de
rangos sumados en T. De todos modos, en las tablas se hallan entradas para nX y nY (denominadas n1 y n2), previstas las posibles diferencias en el tamao de los grupos o muestras a
comparar. El procedimiento de consulta es siempre sencillo y no tiene especial importancia
su descripcin en este lugar. El proceso de clculo en los paquetes estadsticos corrientes es
inmediato y solo requiere la introduccin de las dos series de datos a comparar.

Las tablas corrientes con los niveles de P para diferentes tamaos de muestra han sido
calculadas en forma exacta. Sin embargo, cuando el nmero de casos en cada grupo excede
los tabulados, y si ninguno de los grupos contiene menos de 4 observaciones, puede utilizarse
una aproximacin a travs de la distribucin normal o de Gauss, sobre la cual no se tratar
en este compendio (ver Armitage y Berry, 1994).

Las pruebas de Mann-Whitney y de Kendall son equivalentes a la anterior y examinan
todos los pares que se pueden formar con una observacin del grupo X y otra del grupo Y,
contando las veces en que el mayor valor del par pertenece a X y las veces en que pertenece a
Y. El predominio de uno de los grupos constituye evidencia en contra de la hiptesis nula de
no diferencias entre grupos, favoreciendo la de un desplazamiento entre los valores de sus
observaciones, como el ilustrado en la figura 13.1. Los posibles resultados se hallan tabulados e integran los paquetes estadsticos corrientes.
13.4. Comparaciones entre ms de dos grupos
En el caso de comparaciones entre grupos formados segn un nico criterio de clasificacin con tres o ms niveles, un mtodo empleado es el de Kruskal - Wallis, que es una
generalizacin de pruebas como la de Wilcoxon o Mann-Whitney vistas en el pargrafo
anterior. Un ejemplo de su empleo es la comparacin entre tres o ms grupos de pacientes,
cada grupo adjudicado a un rgimen teraputico diferente (como podran ser dosis crecientes de un mismo frmaco o tambin, frmacos diferentes), cuando las respuestas de inters
no tuvieran distribucin normal y en cambio pudieran ser ordenadas segn rangos. El procedimiento anlogo para variables con distribucin normal, es la comparacin de medias
mediante el anlisis de la varianza de un factor o una ruta, visto en 10.2. El objeto del
anlisis es detectar diferencias significativas en los niveles de la variable en estudio, en la
forma de desplazamientos entre las distribuciones de sus rangos en los distintos grupos.

Bsicamente, el conjunto formado por los individuos de todos los grupos, se ordena de
menor a mayor segn la magnitud de la variable en estudio en cada individuo. A continuacin, a la serie de valores as obtenida se hacen corresponder los rangos constituidos por los
enteros de 1 en adelante. A partir de esta ordenacin, a cada grupo le corresponder la suma
de los rangos de sus componentes, y el anlisis procede en forma anloga al anlisis de la
varianza pero trabajando sobre los rangos y no sobre los valores originales de la variable. Se
obtiene as un estadstico de prueba que tiene una distribucin aproximada a chi-cuadrado,

[ 316 ]

con un grado de libertad menos que el nmero de grupos comparados. La hiptesis nula es
que no existen diferencias entre la magnitud de los resultados para cada grupo. En tal caso,
la suma de los rangos correspondientes tambin ser igual o muy similar en todos los grupos.
En lo que sigue se esboza la disposicin de los datos para su anlisis, que es adems la forma
habitual en la que se ingresan en los programas de clculo estadstico. Los detalles del procedimiento pueden consultarse en Armitagexy Berry, 1994.
Considrense 3 tres grupos, A, B y C, formados por cuatro individuos cada uno y tratados con diferentes concentraciones de un frmaco. El resultado se evala como el tiempo en
das hasta la curacin o la obtencin de determinado criterio que indique la finalizacin del
tratamiento, y es el siguiente:
Grupo A

Grupo B

10

Grupo C
12

15

12

21


Las cuentas de los das para cada individuo, ordenadas de mayor a menor, con su correspondiente rango y el grupo de pertenencia de cada individuo, son los siguientes:
Das

10

12

13

15

21

Rango

4.5

4.5

10

11

12

Grupo

Como existe un empate entre los grupos A y B para las observaciones cuarta y quinta, a
cada una se le adjudica el rango promedio 4.5. Reemplazando cada observacin por su rango,
la distribucin final de los rangos en los grupos es:
Grupo A

Grupo B

Grupo C

10

11

4.5

12

4.5

Esta es la forma habitual de disponer los datos en las hojas de los programas de estadstica. Ntese que se opera con los rangos y no con la variable original (cantidad de das). El
anlisis prosigue en forma similar al anlisis de la varianza para un factor (10.2). Provisto
que los casos en cada grupo no sean menos de cinco, la aproximacin dada por Kruskal
y Wallis es buena y, como se ha mencionado, el estadstico correspondiente se distribuye
segn chi-cuadrado con un grado de libertad menos que el nmero de grupos.
Cuando los datos son originados en unidades experimentales o bloques (10.4), por
ejemplo en individuos que proporcionan una respuesta a cada uno de varios tratamientos,
las respuestas de cada individuo pueden ordenarse en rangos de 1 a t, siendo t el nmero de
[ 317 ]

tratamientos del ensayo. Para evaluar el resultado stos, puede utilizarse el test de Friedman,
que es una extensin del test del signo para muestras apareadas y cuyo anlogo en la teora
normal es el anlisis de la varianza en dos rutas. Este test se halla implementado en los distintos paquetes estadsticos y no se entrar en detalles de clculo. En lo que sigue se muestra
la disposicin de los rangos en este tipo de prueba.
En la tabla se observa que cada individuo proporciona los rangos 1 a 4, segn haya sido
la magnitud de su respuesta a cada uno de los cuatro tratamientos:
Sujeto N

Tratamiento A

Tratamiento B

Tratamiento C

Tratamiento D
4

Esta es la forma habitual de disponer los datos en las hojas de los programas de estadstica. Las magnitudes originales de las respuestas han sido reemplazadas por sus correspondientes rangos. Dado que a cada individuo se le adjudica el mismo nmero de rangos, en este
caso 1 a 4 por haber cuatro tratamientos, la variabilidad entre las filas se reduce a cero y los
efectos se observan entre columnas, o sea entre tratamientos. Los estadsticos de prueba se
obtienen mediante procedimientos anlogos a los vistos en la Seccin 10, y para los detalles
del clculo puede consultarse Armitage y Berry, 1994.
13.5. Correlacin de rangos
En algunas oportunidades en que se desea evaluar el grado de correlacin entre dos
variables x e y, el coeficiente de correlacin lineal r, visto en la Seccin 9, puede no ser adecuado por varias causas, entre otras la no normalidad de las distribuciones de las variables
y la no linearidad de la asociacin entre las stas. En esos casos, si dichas variables pueden
ser ordenadas por rangos, pueden utilizarse mtodos no paramtricos entre los que se cuenta
la determinacin del coeficiente de Spearman, rs. El procedimiento es anlogo al visto en la
Seccin 9 para la determinacin del coeficiente de correlacin r, reemplazndose los valores
muestrales de las x y las y por sus respectivos rangos. Debe por lo tanto adjudicarse rangos,
de 1 en adelante, a las x, y repetirse el procedimiento con las y. Los pares originales de datos
quedan as reemplazados por pares de rangos, y el procedimiento de clculo de rs sigue como
para el clculo de r visto en Seccin 9. La significacin de rs frente a la hiptesis nula ( rs = 0)
se puede obtener en forma aproximada mediante el mismo mtodo que para el coeficiente r, dependiendo tambin de la magnitud de rs y del nmero de pares de la muestra. Asimismo existen
tablas con la significacin de rs frente a cero para distintos tamaos de muestra. Un anlisis ms
detallado de los mtodos no paramdicos puede encontrarse en Wackerly y col., 2002.

[ 318 ]

14. Pruebas diagnsticas

14.1. Pruebas positivas y negativas, diagnsticos verdaderos y errneos



Los diagnsticos de diversas enfermedades y condiciones mdicas, se basan muchas veces en pruebas diagnsticas o tests, frecuentemente de laboratorio, mediante los cuales se
puede clasificar a cada individuo como sano o afectado por la condicin investigada. En la
prctica los individuos o casos pueden clasificarse en forma dicotmica, en sanos o enfermos,
y los exmenes o pruebas, en positivos (indicando presencia de la enfermedad o condicin
particular) y negativos (no indicando su presencia). Muchas pruebas de laboratorio permiten
este tipo de interpretacin, como por ejemplo el dosaje de los niveles de creatinquinasa en la
isquemia miocrdica, que pueden considerarse como test positivo o prueba positiva al
sobrepasar un determinado valor arbitrario aceptado como mximo normal. Sin embargo,
cualquier mtodo o elaboracin diagnstica capaz de detectar la presencia de una determinada condicin o enfermedad, se comporta como una prueba o test. As por ejemplo, la
auscultacin de un soplo sistlico de cierta intensidad en los focos de la base del trax e irradiado al cuello, constituye una prueba diagnstica de estenosis valvular artica, aunque no
hayan tcnicas de laboratorio de por medio y el instrumento de diagnstico sea en realidad
el propio mdico. En cualquier caso, tanto el resultado de laboratorio como el signo clnico
auscultatorio, operan como una prueba diagnstica y cuando son positivos, clasifican a los
individuos que los presentan, como portadores de isquemia miocrdica y valvulopata artica respectivamente.
Sin embargo, es sabido que las pruebas diagnsticas pueden producir resultados errneos, ya sea por no detectar la enfermedad investigada cuando sta se halla presente, como
por sealar su presencia en individuos sanos. En base a esto, cuando una prueba resulta positiva (p. ej., creatinquinasa elevada) en un portador de la condicin anormal investigada (isquemia), se habla de un resultado verdadero positivo, mientras que si la condicin anormal
se halla ausente, el resultado se denomina falso positivo. En cuanto a los resultados negativos
de una prueba, si se obtienen en individuos que no presentan la enfermedad investigada, se
llaman verdaderos negativos, mientras que si se obtienen en individuos que realmente la
presentan, se denominan falsos negativos. Las respectivas siglas, VP, FP, VN y FN se usarn
corrientemente en lo que sigue. Una forma eficaz de visualizar estas relaciones es graficarlas
como en la figura 14.1.
[ 319 ]

Figura 14.1. Representacin de los resultados de una prueba diagnstica hipottica. El rectngulo menor representa a los enfermos y el mayor, a los sanos. El rea grisada representa
los tests que resultaron positivos, y el rea clara, los tests negativos. De las respectivas reas
se deduce que los tests positivos resultaron mayora entre los enfermos, aunque hay algunos
individuos sanos con tests positivos. Tambin se aprecia que la mayora de los individuos
sanos presentaron tests negativos, como tambin lo hicieron algunos de los enfermos. VP
verdaderos positivos, VN verdaderos negativos, FP falsos positivos, FN falsos negativos.

A todo esto, es fundamental tener en cuenta que para poder calificar los resultados de
una prueba como verdaderos o falsos, debe existir un procedimiento diagnstico que sirva
para determinar la presencia o ausencia de la patologa investigada con un alto nivel de certeza y actuar como estndar o patrn de referencia. Como se comprender, tales mtodos
de referencia suelen ser menos accesibles y muchas veces no estn disponibles al realizar las
pruebas diagnsticas en el contexto de la prctica clnica, de modo que la condicin de verdaderos o falsos de los resultados obtenidos, muchas veces slo puede ser conocida despus
de obtener nuevas evidencias, como biopsias, resultados quirrgicos, o bien por la evolucin
del cuadro clnico y el agregado de nuevos exmenes al conjunto de datos. El alto nivel de
certeza proporcionado por los mtodos de referencia y en ocasiones por otros datos clnicos,
es el que permite conocer el desempeo de una prueba diagnstica, es decir, cules son las
proporciones de sus aciertos y errores, y as, emplearla sola cuando no se dispone de mtodos
de referencia. Es comprensible que en general no exista una separacin clara entre pruebas
corrientes y mtodos de referencia, pero lo que queda claro es que stos ltimos proporcionan
un nivel de certeza diagnstica en general muy superior a las primeras, que precisamente permite clasificarlas como verdaderas o falsas. En forma muy general, es el caso de los exmenes
bioqumicos frente a la biopsia, o el de la electrocardiografa frente a la cinecoronariografa
o los estudios radioisotpicos de perfusin miocrdica. Sin embargo, el tema es complejo
y presenta aristas mdicas sobre las que no corresponde extenderse, como la pregunta que
surge muchas veces acerca de si la esencia de lo evaluado por una prueba diagnstica y el
correspondiente mtodo de referencia, es en realidad la misma.

De modo que, el comportamiento de las diversas pruebas diagnsticas frente al veredicto
de los mtodos de referencia, permite conocer sus capacidades diagnsticas e interpretar sus resultados en la forma ms correcta posible cuando se las emplea en la rutina mdica sin el apoyo
de dichos mtodos. Tales capacidades diagnsticas son la sensibilidad y la especificidad.
[ 320 ]

14.2. Sensibilidad y especificidad


Si se aplica una determinada prueba o test diagnstico para cierta enfermedad a un grupo de 100 individuos que la padecen, y 90 presentan el test positivo (verdaderos positivos),
se dice que la sensibilidad del test es del 90%. Los restantes 10 enfermos en quienes el test
falla en la deteccin de la enfermedad y resulta negativo, corresponden a falsos negativos.
La relacin entre el nmero de tests verdaderos positivos (que sealan correctamente la presencia de la enfermedad) y el total de enfermos estudiados, se llama sensibilidad del test. Por
lo tanto, sta puede expresarse como:
Sensibilidad = VP / ( VP + FN)

(14.1)

o bien
Sensibilidad = VP / total de enfermos en quienes se aplica el test
Si en otros 100 individuos, esta vez sanos, se aplica el mismo test y resulta negativo en
90 casos (verdaderos negativos), se dice que la especificidad del test es del 90%. Los restantes 10 individuos sanos en los que el test resulta errneamente positivo, corresponden a
falsos positivos. La relacin entre el nmero de tests verdaderos negativos (que sealan
correctamente la ausencia de enfermedad) y el total de individuos sanos estudiados, se llama
especificidad del test. Por lo tanto, sta puede expresarse como:
Especificidad = VN / (VN + FP)

(14.2)

o bien
Especificidad = VN / total de sanos en quienes se aplica el test
Como se desprende de lo visto hasta aqu, para conocer la sensibilidad y la especificidad
de un test o prueba diagnstica, sta debe ensayarse en individuos en los que no haya dudas
sobre su estado de salud o enfermedad, de modo de medir la sensibilidad del test en los enfermos y la especificidad en los sanos, sin posibilidad de confundir ambos estados. Una vez
conocidas (estimadas) su sensibilidad y especificidad, recin podr usarse el test para sus
fines diagnsticos, en individuos cuyo estado de salud o enfermedad sea incierto. De aqu
surge que la sensibilidad y la especificidad de las diversas pruebas diagnsticas se estiman
siempre con respecto a un mtodo estndar o patrn de referencia. Se acepta que el mtodo
estndar no producir resultados errneos. De esta manera, la sensibilidad y especificidad de
las distintas pruebas diagnsticas, como marcadores humorales o imgenes, se podrn evaluar en individuos para los que tambin se disponga, como se ha mencionado anteriormente,
de informacin diagnstica con alto nivel de certeza, entre la que se cuenta el resultado de
los mtodos de referencia. En realidad, estos estndares son tambin pruebas diagnsticas, y
la distinta jerarqua de las mismas es materia de conocimiento mdico. Asimismo, los estndares pueden ser mejorados o modificados al incorporarse nuevos conocimientos y tcnicas
[ 321 ]

en la materia. Por otra parte, si bien la seguridad diagnstica que proporciona un mtodo de
referencia es algo importante y deseable, estos mtodos patrn son en general ms complejos
y costosos que los dems, y muchos de ellos son invasivos y pueden llegar a causar dao.
Estos hechos son los que confieren su importancia al conocimiento de las pruebas diagnsticas alternativas, que por contraste resultan en general ms sencillas, baratas y repetibles.
Tambin es til recordar que los mtodos patrn o estndar, no slo pueden ser costosos, sino
a veces imposibles de obtener, como puede ser el diagnstico de certeza de alguna enfermedad cuando sta se halla en sus estadios iniciales, diagnstico que muchas veces slo podr
lograrse de la historia clnica en estadios ms avanzados, o bien, de la autopsia. En tanto,
la determinacin de la sensibilidad y especificidad de las pruebas diagnsticas permitir su
aplicacin clnica, eventualmente evitando o postergando el empleo de mtodos costosos o
invasivos.

Un test es mejor que otro cuanto ms sensible y especfico, y este criterio permite comparar tests entre s. Sin embargo, no es posible mejorar las dos propiedades a la vez en el mismo
test. Si se desea aumentar la sensibilidad ser necesario disminuir el umbral diagnstico del
test, esto es, exigirle una menor desviacin de la normalidad para tomarlo como positivo. Al
respecto debe notarse que los resultados que producen la mayora de los tests son datos continuos o que permiten gradaciones, con lo cual el valor a partir del cual se considera que un
test es positivo, conocido comnmente como umbral, es una decisin de los investigadores.
Por ejemplo, para aumentar la sensibilidad de la creatinquinasa en la deteccin de la isquemia
miocrdica, sera factible reducir el valor establecido como mximo normal o valor umbral
a partir del cual se considera que la enzima indica isquemia. Sin embargo, la contraparte
inevitable es que al hacer esto, cierta cantidad de individuos normales aunque con valores de
la enzima algo ms altos que los dems, sean incorrectamente clasificados como isqumicos,
cayendo la especificidad de la prueba. Lo inverso ocurre si se trata de obtener tests altamente
especficos, que resultarn en general tan exigentes para dar un resultado positivo, que fallarn en detectar la patologa existente en muchas oportunidades, cayendo en consecuencia la
sensibilidad del test. Para un mismo test, esta interdependencia de la sensibilidad y la especificidad es siempre la misma y es caracterstica del test, siendo lo que permite comparar la
eficacia relativa de distintos tests entre s.

Las estimaciones de la sensibilidad y la especificidad de un test diagnstico dependen
como se ha visto, de los lmites de normalidad adoptados y asimismo, dependern de la
definicin y niveles de severidad de las condiciones investigadas. Una vez establecidas estas
condiciones, la sensibilidad y la especificidad son caractersticas del test. En contraste, es
fundamental notar que la sensibilidad y la especificidad de una prueba diagnstica no
dependen de la proporcin de individuos sanos y enfermos en el grupo en el que se aplica
la prueba. Si la sensibilidad de la prueba es del 90%, detectar la enfermedad en 9 de cada
10 enfermos, o en 90 de cada 100, sin importar la proporcin de enfermos y sanos en la
poblacin estudiada. Como se ver a continuacin, este hecho contrasta con las diferentes
proporciones de resultados correctos que puede rendir una misma prueba segn se aplique a
poblaciones con distintas prevalencias de la enfermedad, esto es, con distintas proporciones
de enfermos y sanos.

[ 322 ]

14.3. Valor predictivo



Si una misma prueba diagnstica se aplica a poblaciones con distinta prevalencia de la
enfermedad en cuestin, las proporciones de aciertos y errores diagnsticos sern diferentes
para cada poblacin, aunque la sensibilidad y la especificidad de la prueba permanezcan
invariables. Lo que vara en funcin de la composicin de las poblaciones es lo que se denomina el valor predictivo de la prueba. Esto se ilustrar mediante dos ejemplos, expuestos en
la tabla 14.1.
Si se considera una muestra de 800 individuos tomada de una poblacin donde la prevalencia de la enfermedad sea del 50%, habr que esperar 400 individuos sanos y 400 enfermos. Si se aplica una prueba diagnstica cuya sensibilidad y especificidad sean ambas iguales
al 90%, detectar correctamente el 90% de los enfermos y el 90% de los sanos, esto es, 400
0.9 = 360 individuos en cada caso. En consecuencia habrn 40 falsos positivos y 40 falsos
negativos, correspondientes al 10% de los sanos y al 10% de los enfermos respectivamente
(tabla 14.1, A). En la columna correspondiente a test (+) se observa que 360 de cada 400 tests,
o 9 de cada 10, identifican correctamente a un enfermo.
Tabla 14.1. La misma prueba, cuya sensibilidad y especificidad, ambas del 90%, son constantes, se aplica a dos muestras de 800 pacientes cada una, la primera proveniente de una
poblacin con una prevalencia de la enfermedad del 50% (A) y la otra, de una poblacin con
una prevalencia del 10% (B). Se muestra el nmero de individuos esperados en cada categora
de la tabla.

A. Prevalencia 50 %

Test

Test

( + )

Enfermos

360

40

400

40

360

40

400

400

Sanos

B. Prevalencia 10 %

( )

( + )

()

Enfermos

72

80

Sanos

72

648

720

144

656

800

800

Si en cambio, la prevalencia de la enfermedad fuera ms baja, digamos del 10%, habra


que esperar que slo 80 de los 800 individuos la presenten, y que los restantes 720 sean sanos.
Esto se aprecia en la tabla 14.1, B, donde con la misma sensibilidad y especificidad del test que
en el caso anterior, es fcil calcular que habrn 80 0.9 = 72 enfermos correctamente detectados por un test positivo (verdaderos positivos) y 720 0.9 = 648 individuos sanos correctamente diagnosticados por un test negativo (verdaderos negativos). Si ahora se observa la columna correspondiente a test (+) se comprueba que de 144 tests positivos obtenidos en el total
de la muestra, 72 pertenecen a enfermos correctamente clasificados y 72 a individuos sanos
errneamente diagnosticados como enfermos. Si bien la deteccin de 72 de los 80 enfermos
es satisfactoria, ahora el nmero de falsos positivos ha aumentado casi al doble, y se trata de
individuos sanos que debern sufrir nuevos exmenes. Lo que ha ocurrido es que, al haber
una cantidad proporcionalmente muy grande de individuos sanos, aunque la especificidad
del test siga siendo del 90%, el 10% de falsos positivos esperable entre los sanos y aceptable
en el primer ejemplo, ahora produce una cifra de 72 falsos positivos. Este valor coincide en el

ejemplo con el nmero de verdaderos positivos, por lo que un test cualquiera sorteado entre
los 144 tests positivos, tiene la mitad de las probabilidades de corresponder a un individuo
enfermo y la otra mitad, de corresponder a uno sano. Este resultado, que limita la utilidad del
test para la deteccin de enfermedad, est condicionado por la baja prevalencia de la misma.*
La relacin entre el nmero de individuos enfermos correctamente identificados como tales y
el total de resultados positivos, se llama valor predictivo del test positivo y se expresa:
Valor predictivo de un test ( + ) = VP / (VP + FP)

(14.3)

En el ejemplo, como se ha visto, si la prevalencia de la enfermedad es del 50%, el valor


predictivo de un test positivo resultar igual a 360 / 400 = 0.9 o 90%, y si la prevalencia es
del 10% resultar igual a 72 / 144 = 0.5 o 50%.
Anlogamente a lo visto para un test positivo, se llama valor predictivo de un test negativo al cociente entre el nmero de individuos sanos correctamente identificados como tales,
y el total de tests negativos obtenidos:
Valor predictivo de un test ( ) = VN / (VN + FN)

(14.4)

En el ejemplo en el que la prevalencia de enfermedad es del 10%, y con una prueba con
sensibilidad y especificidad iguales al 90% (Tabla 14.1, B), se observa que se producen 648
verdaderos negativos y 8 falsos negativos, de donde resulta que el valor predictivo de un test
negativo es igual a 648 / (648 + 8) = 0.99 o 99%. Este alto valor predictivo para un test negativo es la contrapartida del bajo valor predictivo (50%) que tiene un test positivo cuando la
prevalencia de la enfermedad es baja. Se ve que la utilidad de una prueba depende, por una
parte, de su sensibilidad y especificidad y por la otra, de la prevalencia de la enfermedad en
la poblacin en estudio. Esto tiene importantes consecuencias prcticas. Se vio que una baja
prevalencia de enfermedad, al implicar una mayora de individuos sanos, favorece la presentacin de falsos positivos, puesto que stos se dan entre los individuos sanos. Esta abundancia
de falsos positivos disminuye la probabilidad de que un test positivo en esa poblacin, sea
verdadero (14.3). De este modo, aunque la sensibilidad y la especificidad de un test sean altas
y no varen, al aplicarlo al diagnstico en una poblacin con baja prevalencia de enfermedad
proporcionar una cantidad de falsos positivos que har poco til la prueba, pues habr que
proseguir con nuevos estudios para separarlos de los verdaderos positivos (enfermos).
14.4. Probabilidad previa y probabilidad posterior a un test. Teorema de Bayes
Cuando un test resulta positivo para una determinada condicin o enfermedad, es inmediato pensar que la probabilidad de padecer dicha enfermedad debe estimarse como ms alta
de lo que se juzgaba antes de realizar el test (en este tipo de situaciones, en que la probabilidad
de la enfermedad no se estima demasiado alta, resulta til una prueba diagnstica, ya que si
la probabilidad antes de la prueba se considerara muy alta, tendra menos sentido realizarla).
* Es fcil comprobar que con sensibilidad y especificidad iguales a 90% como en el ejemplo, si la prevalencia de
la enfermedad cae por debajo del 10%, un test positivo tiene mayor probabilidad de corresponder a un sano que a un
enfermo.

[ 324 ]

Ntese tambin, que para poder aceptar que las probabilidades de enfermedad han aumentado,
deba existir alguna nocin previa sobre las mismas antes de hacer el test. Al respecto, se habla
de probabilidades pre-test y post-test. El teorema de Bayes permite utilizar las probabilidades
pre-test estimadas o aceptadas para una determinada enfermedad, y los resultados de un test
orientado al diagnstico de la misma, del que se conocen su sensibilidad y su especificidad,
para estimar una nueva probabilidad de enfermedad que incluya la informacin proporcionada
por el test, la que se denomina probabilidad post-test. Aqu se expondrn sucintamente los
conceptos ms bsicos y la posible aplicacin del teorema de Bayes al anlisis de los resultados
de un test, examinando en especial la forma en que se modifican las probabilidades estimadas.
Aunque las diversas pruebas o tests pueden presentar ms de dos resultados, incluyendo series
de valores continuos, y las clases de enfermedad pueden ser varias, la descripcin se limitar
al caso ms simple de dos posibles resultados del test, que se llamarn test positivo (T+) y test
negativo (T), y dos clases posibles de diagnstico, a saber, enfermedad presente (D) y enfermedad ausente (no D). El teorema de Bayes, que admite aplicaciones en varios campos de las
ciencias, en medicina se desarrolla en su forma ms simple a partir de un test T, cuya sensibilidad y especificidad son conocidas, y cuyos dos resultados posibles son, como se mencionara,
positivo o negativo (frecuentemente, a partir de una lnea arbitraria de corte en una prueba que
rinde resultados en una escala continua). Antes de la aplicacin del test, debe tenerse una idea o
existir una estimacin, de la probabilidad de enfermedad para el individuo o caso en cuestin,
que se denomina probabilidad previa o pre-test, P(D). La prevalencia de la enfermedad en la
poblacin es frecuentemente utilizada como probabilidad pre-test.

El teorema se deriva formalmente del clculo de probabilidades esbozado en la Seccin
3, y proporciona la probabilidad de enfermedad, con la condicin de un test positivo. Este
resultado es el valor predictivo de un test positivo visto en el prrafo anterior, que se denomina habitualmente probabilidad post-test y se expresa P(D | T+), que se lee: probabilidad
de enfermedad, dado un test positivo. Su valor est dado en funcin de la sensibilidad y la
especificidad del test, y de la probabilidad de enfermedad pre-test, P(D).
Antes de examinar la ecuacin de Bayes, obsrvese que en trminos de probabilidad condicional, la sensibilidad de un test se define como P(T+ | D) o probabilidad de un test positivo, dada la presencia de enfermedad, y tiene la forma de la ecuacin 14.1. Anlogamente, la
especificidad se define como P(T | no D), que es la probabilidad de un test negativo, dada
la ausencia de enfermedad, y es idntica a la expresin dada en 14.2. Con estas premisas, la
frmula de Bayes corresponde a la siguiente ecuacin:
P(D | T+) = P(T+ | D) P(D) / P(T+ )

(14.5)

donde P(T+ | D), como se dijo, es la sensibilidad del test, en tanto que el numerador completo,
[ P(T+ | D) P(D) ], segn la regla para la multiplicacin de probabilidades resulta ser la probabilidad de (T+ y D), test positivo y enfermedad presente.* En tanto, el denominador P(T+),
es la probabilidad de un test positivo en todo el conjunto de sujetos, sanos y enfermos, que
integran la poblacin, y corresponde a la zona grisada de la figura 14.1. Se ve que la ecuacin
* Recurdese que la regla para la multiplicacin de probabilidades, esto es, para obtener la probabilidad de A y B
ocurriendo simultneamente, es: P (A y B) = P (A) P (B | A) ( 3.3.2).

[ 325 ]

de Bayes divide la probabilidad de test positivo y enfermedad por la probabilidad de cualquier test positivo, haya o no enfermedad. De esta manera, responde a la pregunta: cul
es la probabilidad de que el paciente tenga la enfermedad, si el test resulta positivo? Ahora
bien, a fin de obtener una forma del teorema en funcin de la sensibilidad y especificidad del
test, el denominador debe descomponerse en la suma las probabilidades de test positivo dada
enfermedad, y test positivo en ausencia de enfermedad:
P(T+ ) = [ P(T+ | D) P(D) ] + [ P(T+ | no D) P( no D) ]

(14.6)

de modo que reemplazando P (T+ ) en 14.5, se tiene una versin desarrollada del teorema:
P(D | T+) = P(T+ | D) P(D) / [P(T+ | D) P(D) + P(T+ | no D) P(no D) ]

(14.7)

donde, como se seal ms arriba, P(T+ | D) es la sensibilidad del test, y P(D) la prevalencia o
cualquier estimacin de la probabilidad pre-test. A su vez, P(T+ | no D) es la probabilidad de
obtener un test positivo en ausencia de enfermedad, la cual es el complemento de la especificidad y se puede por tanto escribir (1 especificidad). Por ltimo, P(no D) es el complemento
de la prevalencia P(D) y puede escribirse 1 P(D). Haciendo estas sustituciones el teorema de
Bayes queda expresado como:
P(D |T+) = sensibilidad P(D) / [sensibilidad P(D) + (1 especificidad) (1P(D)] (14.8)
que permite estimar la probabilidad de enfermedad dado un resultado positivo del test, conociendo tres datos: la sensibilidad y la especificidad del test, y la prevalencia de la enfermedad
o probabilidad pre-test.
Ejemplo 14.1.
Se ha informado que la ecocardiografa de esfuerzo tiene una sensibilidad del 68% y una
especificidad del 90% para el diagnstico de enfermedad coronaria (Hirano y col., 2006). De
acuerdo a esto, en cunto puede estimarse la probabilidad de enfermedad coronaria en un
hombre de 40 aos, asintomtico, con un ecocardiograma de esfuerzo positivo (anormal)?

Dejando de lado la exactitud de las estimaciones de la sensibilidad y especificidad del
eco de esfuerzo, el tema crucial es la asignacin de probabilidades pre-test de enfermedad
coronaria al paciente en cuestin, ya que la aplicacin de la frmula de Bayes es sencilla. La
prevalencia de la enfermedad coronaria en la poblacin general puede aceptarse, a los fines
del ejemplo, en alrededor del 7% (Diamond y Forrester, 1979). Aunque es posible tratar de
mejorar la estimacin de las probabilidades pre-test de enfermedad coronaria a partir de
mltiples factores, en particular los llamados factores de riesgo, se mostrar el clculo con
los datos mencionados. Reemplazndolos en 14.8, se tiene:
P(coronariopata | test +) = 0.68 0.07 / [ 0.68 0.07+ (1 0.90) (1 0.07)]

= 0.34

[ 326 ]

con lo que la probabilidad de padecer coronariopata luego de un ecocardiograma de esfuerzo anormal se estima en 34%. Esta sigue siendo una probabilidad no demasiado alta: la
probabilidad de estar sano es an 1 0.34 = 0.66 o 66%. La chance de estar sano, segn la
prueba, es de alrededor de 2 a 1.
Si el paciente en cuestin se presentara con angina atpica, la probabilidad pre-test podra estimarse en alrededor del 50% (Braunwald el al, 2001). En tal caso, la probabilidad
post-test sera igual a
P(coronariopata | test +) = 0.68 0.50 / [ 0.68 0.50 + (1 0.90) (1 0.50)]

= 0.87 u 87%
que es un valor relativamente alto y debera obligar a proseguir los estudios. Por ltimo, si el
paciente se presentara con angina tpica, su probabilidad pre-test rondara, segn la misma
fuente, el 90%, y el lector puede calcular como ejercicio que la probabilidad luego de un
test ecocardiogrfico positivo resulta del 98%, que es un nivel muy alto que se podra decir
prximo a la certeza, aunque teniendo presente que los clculos estadsticos se ajustan a los
datos pero no reemplazan al juicio mdico.

Mediante la aplicacin reiterada de la frmula de Bayes, realizando diversos tests (diferentes entre si), se pueden mejorar las estimaciones. Nuevamente es necesario insistir en la
cautela que se debe tener al aceptar nmeros y porcentajes para el diagnstico de un paciente
determinado.
Un punto crtico que incide mucho en la aplicabilidad de la frmula de Bayes a las situaciones reales, es la estimacin de la probabilidad de enfermedad antes de cualquier test.
Como ya se ha mencionado, una buena medida de la probabilidad pre-test es la prevalencia
de la enfermedad en la poblacin de donde provienen los casos, que es un dato numrico
derivado de la observacin (ver Seccin 16). Sin embargo, no siempre se tienen estimaciones
precisas de la prevalencia, y puede incluso que no sea determinable para las condiciones ms
o menos complejas de un paciente dado. Con frecuencia, aunque existen elementos de juicio
ms o menos claros a favor o en contra de la condicin en estudio, esos conocimientos no
son fcilmente traducibles en probabilidades, que son nmeros, y la probabilidad pre-test
permanece indeterminada. Si bien habr consenso en que un individuo joven y asintomtico
al que se le solicita una prueba ergomtrica debe tener una baja probabilidad de padecer enfermedad coronaria, la probabilidad pre-test estar mucho menos definida si se trata de un
paciente de mediana edad con sntomas dudosos y uno o dos factores de riesgo. En diversos
campos de inters, existen estimaciones de la probabilidad pre-test, elaboradas a partir de
muestras estudiadas con mtodos estndar para decidir la presencia o no de enfermedad,
en determinadas poblaciones. Para su aplicacin en el caso de un individuo en particular,
siempre hay que considerar detalladamente las caractersticas de las poblaciones de donde
fueron derivadas las estimaciones, y determinar si son suficientemente concordantes con las
condiciones del paciente en particular.

[ 327 ]

14.5. Razn de probabilidades de una prueba diagnstica (likelihood ratio)


En este apartado se describen los cocientes o razones de probabilidad de los tests,
ms conocidos por su expresin inglsa likelihood ratio, que son estadsticos que resumen en un solo nmero la sensibilidad y la especificidad de un test, y como stas, lo
caracterizan. Los likelihood ratios (LR) permiten un manejo sencillo y eficiente de la
sensibilidad y la especificidad de los tests, para obtener las probabilidades post-test, toda
vez que se tenga una estimacin de las probabilidades previas. El LR de un test positivo
resume cunto ms propensos a presentar un test positivo se hallan los individuos con la
enfermedad, que los que no la padecen. Como sabemos, la probabilidad de un test positivo en los enfermos est dada por la sensibilidad del test, y la probabilidad del mismo test
positivo, en los sanos, es el complemento de la especificidad, o sea 1especificidad. Por lo
tanto, puede escribirse:
LR (test +) = sensibilidad / (1 especificidad)

(14.9)

Puede tambin considerarse el caso de un test negativo, y en este caso, el LR expresar


la razn entre la probabilidad de un test negativo en los enfermos y de un test negativo en los
sanos. Es fcil ver que estas probabilidades estn dadas por 1sensibilidad y por la especificidad, respectivamente. Se tiene entonces:
LR (test ) = (1 sensibilidad) / especificidad

(14.10)

En lo que sigue se examinar el LR para un test positivo. En primer lugar, se observa


en (14.9), que aumentar cuanto ms sensible y especfica sea la prueba. Tambin se ve que
cuando la sensibilidad y la especificidad son ambas iguales a 0.50, el LR ser igual a 1. En
este caso el resultado del test ser irrelevante para el diagnstico. Por ltimo, si caen la sensibilidad y la especificidad, se podr dar que LR (test +) < 1, y en este caso la enfermedad ser
ms improbable con un test positivo que con uno negativo.
En el ejemplo de un test con una sensibilidad y una especificidad del 90%, reemplazando
en (14.9) se tendr
LR (test +) = 0.90 / ( 1 0.90) = 9
y para la ecocardiografa de esfuerzo (Ejemplo 14.1) donde sensibilidad = 68% y especificidad = 90%, ser
LR (test +) = 0.68 / ( 1 0.90) = 6.8
En forma muy general, likelihood ratios mayores que 10 se consideran evidencia fuerte a
favor del diagnstico de la enfermedad en cuestin. Ahora bien, los likelihood ratios cobran
su utilidad prctica en el contexto del teorema de Bayes, y su aplicacin es extremadamente
sencilla con la condicin de trabajar con odds en vez de probabilidades (3.4), para lo cual
solamente deber recordarse la transformacin: Odds = P / (1 P).
[ 328 ]


Se ha visto que el teorema de Bayes expresa la probabilidad post-test o probabilidad de
enfermedad dado un test positivo, P( D | T+), en funcin de la sensibilidad y especificidad del
test. Expresando dicha probabilidad como odds post-test a favor de la enfermedad, puede
demostrarse que (14.8) equivale a:
Odds post-test = odds pre-test likelihood ratio

(14.11)

que es una ecuacin sencilla donde deben reemplazarse las probabilidades por sus odds. A
partir de la probabilidad pre-test P(D), muchas veces estimada a partir de la frecuencia o prevalencia de la enfermedad en la poblacin, se calculan los odds pre-test, P(D) / [1 P(D)]. El
producto de estos odds por el LR corresponde a los odds post-test a favor de la enfermedad,
el resultado de la aplicacin de la frmula de Bayes expresado en odds. El pasaje de odds a
probabilidades convencionales se realiza como en (3.7): P = odds / (odds + 1).
Ejemplo 14.2.
Con los datos del Ejemplo 14.1, el clculo de las probabilidades de enfermedad coronaria
post-ecocardiograma de esfuerzo positivo puede hacerse conociendo el LR del mtodo para
un test positivo, que se ha visto ms arriba que se calcula a partir de (14.9) y para este caso
result igual a 6.8. Este valor es caracterstico para el test, y slo se requiere multiplicarlo por
una estimacin de los odds pre-test a favor de coronariopata, para obtener los odds post-test
segn (14.11).
Se ver el caso del paciente con probabilidad pre-test P(D) = 0.07. Se tiene:

Odds pre-test = P(D) / [1 P(D)]


= 0.07 / (1 0.07) = 0.075

Odds post-test = odds pre-test likelihood ratio


= 0.075 6.8 = 0.51
Probabilidad post-test = Odds post-test / (Odds post-test + 1)

= 0.51 / ( 0.51 + 1) = 0.34
como en el Ejemplo 14.1. Conociendo el LR del mtodo no es necesario emplear la sensibilidad y la especificidad, pues toda la informacin est contenida en aqul.
Se ha visto hasta aqu que la sensibilidad y la especificidad caracterizan a las pruebas
diagnsticas o tests, pero en principio slo predicen la proporcin de tests positivos y negativos que se obtendrn de individuos enfermos y sanos respectivamente. Si adems del resultado del test se tiene una idea de la prevalencia de la enfermedad en la poblacin, que estima la
probabilidad de la enfermedad sin tomar en cuenta el test, es posible mejorar la precisin de
esta estimacin calculando el valor predictivo de un resultado positivo o negativo del mismo.
La ecuacin de Bayes (14.8) proporciona estimaciones del valor predictivo donde es posible
evaluar la contribucin relativa de la sensibilidad y la especificidad de test en los resultados
obtenidos. Finalmente, los likelihood ratios resumen en un solo nmero la relacin entre
sensibilidad y especificidad de un test, y permiten un sencillo clculo de las probabilidades
post-test, con el nico requisito de expresarlas como odds.

[ 329 ]

14.6. Exactitud global de un test (overall accuracy)



La llamada exactitud global de un test (overall accuracy) expresa la proporcin de resultados correctos que se obtienen con su aplicacin, y se calcula sumando verdaderos positivos
y verdaderos negativos, y dividiendo por el nmero total de individuos examinados:
Exactitud global = VP + VN / (VP + FP + VN + FN)

(14.12)

donde el denominador corresponde a las distintas clases de resultados posibles. Se ve que la


exactitud global condensa en una sola cifra los datos empleados para estimar el valor predictivo
de un test positivo y de un test negativo, y que se obtiene sumando los numeradores y los denominadores de las ecuaciones 14.3 y 14.4. La exactitud global de un test tiene la ventaja de expresar el rendimiento en una sola cifra, pero a expensas de no discernir si los casos correctamente
identificados corresponden a verdaderos positivos o verdaderos negativos, o sea sin separar
los valores predictivos positivo y negativo del test. Esta es una importante desventaja. Por lo
dems, al igual que para el valor predictivo de un test, la exactitud global tambin depende de
la prevalencia de la enfermedad en la poblacin. En los ejemplos de 14.3 correspondientes a la
Tabla 14.1 se ha visto como los valores predictivos para un mismo test difieren marcadamente
segn la prevalencia de la enfermedad y sin embargo, la exactitud global es la misma, como
puede comprobase fcilmente sumando los aciertos en el caso A (360 verdaderos positivos y
360 verdaderos negativos) y en el caso B (72 verdaderos positivos y 648 verdaderos negativos),
que totalizan 720 diagnsticos correctos en cada una de las dos opciones. Por lo tanto, la exactitud global mezcla la informacin acerca del comportamiento de un test de un modo innecesario, y es un indicador de escaso valor, del rendimiento de una prueba diagnstica.
14.7. Curvas ROC

Las llamadas curvas ROC (receiver operating characteristc) constituyen una forma de condensar y presentar en forma visual una gran cantidad de informacin acerca del rendimiento de
un test, cuando los resultados del mismo se pueden medir en escala continua. Su fundamento
es que, dado que al variar el punto de corte de un test a partir del cual se lo considera positivo
cambiarn su sensibilidad y especificidad, y si existe una cantidad indefinidamente grande de
posibles puntos de corte arbitrarios, habr tambin una gran cantidad de niveles en cada uno
de los cuales el test funcionar con una sensibilidad y una especificidad determinadas. De esta
manera, en cada punto de corte, el test producir una determinada cantidad de resultados
verdaderos positivos y falsos positivos. Estos resultados representan la sensibilidad y el complemento de la especificidad, 1 especificidad, respectivamente. De esta manera, a cada punto
de corte o nivel del test, le corresponder un par de valores, y si los puntos se representan en un
sistema de ejes cartesianos, generan una secuencia que recibe el nombre de curva ROC y es caracterstica de cada test. En general, al evaluar un test en un solo punto de corte, por encima del
cual se diagnostica la presencia de la enfermedad, lo que se est haciendo es obtener un punto
de la curva ROC, cuyas coordenadas vertical y horizontal son las proporciones de resultados
verdaderos positivos y de resultados falsos positivos respectivamente.

[ 330 ]

Figura14.2. Curva ROC para el diagnstico de hipertrofia ventricular izquierda mediante el


ndice de Sokolow-Lyon. El eje vertical representa la sensibilidad del test y el eje horizontal el
complemento de la especificidad (1 especificidad) para los diversos umbrales posibles. Los
puntos A, B y C representan el rendimiento del test con distintos umbrales.

Para obtener una curva ROC completa se necesitan ms puntos, para lo cual hay que
variar el umbral del test de un modo continuo. Como en cualquier determinacin de la sensibilidad y la especificidad de un test, debe contarse con un mtodo estndar que proporcione
los diagnsticos de referencia. La mecnica del procedimiento se esboza a continuacin a
partir de datos presentados por Rodrguez y col, 2004.
En una muestra de 266 individuos de ambos sexos, se ensaya el ndice electrocardiogrfico de Sokolow-Lyon para el diagnstico de la hipertrofia ventricular izquierda (HVI),
pero en vez de hacerse una nica prueba con el valor de corte tradicionalmente aceptado de
35 mm (3.5 mV), se realizan varios ensayos para distintos puntos de corte. Previamente, la
presencia de HVI ha sido detectada con certeza mediante el ecocardiograma (que acta
como mtodo referencia) en 72 individuos, con lo cual hay 266 72 = 194 individuos sin
HVI. Volviendo al ndice de Sokolow-Lyon, tomando como punto de corte 35 mm (de modo
que Sokolow-Lyon 35 mm se considera diagnstico de HVI) se observan 22 resultados positivos, de los cuales 17 corresponden a HVI (verdaderos positivos) y 5 a individuos sin HVI
(falsos positivos). Con este punto de corte, la proporcin de verdaderos positivos detectados
es de tan slo 17 en 72 individuos con HVI, o sea 17 / 72 = 0.24 o 24%, en tanto que la proporcin de falsos positivos es de 5 en 194 individuos normales o sea 5 / 194 = 0.026 o 2.6%.
La proporcin de verdaderos positivos detectados refleja la sensibilidad del test con un punto
de corte en 35 mm, en tanto que la proporcin de falsos positivos, 0.026, corresponde a los
casos donde falla la especificidad, lo que se puede expresar como (1 especificidad). Si
se representan grficamente la fraccin de verdaderos positivos (sensibilidad) y la de falsos
positivos (1 especificidad) se obtiene el punto A de la Figura 14.2. Dado que 0.026 es igual
a (1 especificidad), la especificidad se calcula enseguida en 1 0.026 = 0.974 o 97.4%. Estos
datos concuerdan con la pobre sensibilidad y muy alta especificidad del ndice de Sokolow[ 331 ]

Lyon en el nivel de corte en que es corrientemente utilizado. El punto A es un punto perteneciente a la curva ROC del ndice de Sokolow-Lyon, para la muestra evaluada. Ntese que
para estas determinaciones es indispensable tener un estndar de referencia que proporcione
el veredicto acerca de la presencia o ausencia de la condicin evaluada por la prueba. En el
caso que nos ocupa, el estndar es el ecocardiograma, y la prueba bajo evaluacin, el ndice
electrocardiogrfico de Sokolow-Lyon.
Tomando otro punto de corte para el diagnstico de HVI, por ejemplo Sokolow-Lyon
25 mm, los diagnsticos verdaderos positivos son ahora 47 en 72 o sea 0.65 o 65% mientras
que los resultados falsos positivos son (por pura coincidencia) nuevamente 47, que entre 194
individuos sin HIV indican 47 / 194 = 0.24 o 24% de resultados falsos positivos. Se observa
que al reducir el umbral diagnstico a 25 mm, la sensibilidad del ndice de Sokolow-Lyon
para la HVI aumenta al 65%, pero a expensas de una cada de la especificidad a 1 0.24 =
0.76 o 76%. Estos resultados se traducen en el punto B de la Figura 14.2. Finalmente, vase
que ocurre tomando un valor umbral exageradamente bajo de, digamos, 15 mm. Ahora el
test detecta correctamente (verdaderos positivos) a 70 / 72 = .97 o 97% de los casos de HVI,
pero tambin produce 166 resultados falsos positivos, o sea 166 / 194 = .86 u 86%, lo que
implica que la especificidad ha cado al nivel inaceptable de 1 0.86 = 0.14 o 14%. Este es
el punto C de la Figura 14.2. Los programas de computacin recorren automticamente todos los valores que puede tomar el test en una muestra y para cada punto, realizan clculos
similares a los ya vistos, tomando como referencia los datos proporcionados por el mtodo
estndar, generando las correspondientes curvas ROC.
Puede verse que cunto mayor sensibilidad se obtenga con la menor cantidad de falsos
positivos, o sea, con el menor sacrificio posible de especificidad, la curva ROC se acercar al
ngulo superior izquierdo de la grfica (ntese que dicho ngulo corresponde a sensibilidad
100% y especificidad 100%). Por esta razn una medida de la eficiencia de un test es la
proporcin de rea bajo la curva en relacin al rea total de la grfica (la curva ROC para
un test con 100% de sensibilidad y especificidad, estara formada por los bordes izquierdo
y superior de la grfica, abarcando toda su rea). No se puede decir qu proporcin de rea
bajo la curva corresponde a un test bueno, muy bueno o malo, pero est claro que en general,
cuanto mayor el rea bajo la curva, mayor ser la eficacia del test. En el ejemplo del ndice de
Sokolow-Lyon, el rea es de 0.76 o 76%.

De lo visto hasta aqu, queda claro que una curva ROC proporciona el par sensibilidad especificidad para cada uno de los umbrales que puede adoptar el test, permitiendo
elegir el ms adecuado a las necesidades del investigador. El nivel de especificidad deseado,
que equivale a la proporcin de resultados falsos positivos que se est dispuesto a tolerar,
condiciona el punto de la curva en que se deber trabajar, y este punto tiene asociado un
nivel de sensibilidad que no ser posible superar con el test en cuestin. Si la sensibilidad ha
de ser aumentada, habr que se sacrificar la especificidad desplazndose a la derecha sobre
el eje horizontal, admitiendo una mayor proporcin de resultados falsos positivos, con lo
que tambin aumentarn los verdaderos positivos. Todas las estrategias posibles en materia
de sensibilidad y especificidad pueden ser as evaluadas mediante la inspeccin de la curva
ROC, para elegir la ms conveniente de acuerdo al tipo y finalidad de cada test. En los casos
en los que un diagnstico correcto es muy importante por las consecuencias que implicara
[ 332 ]

no detectar la enfermedad, se deber trabajar en un punto de la curva de alta sensibilidad,


lo que podr implicar una mayor proporcin de resultados falsos positivos. Ahora bien, si
los resultados falsos positivos obligan a estudios riesgosos, penosos u onerosos, se tendr
un lmite para incrementar la sensibilidad, puesto que ello resultar en un aumento paralelo
de tales resultados. En cualquier caso, las curvas ROC permiten elegir el o los puntos de la
misma en los cuales se obtiene el mejor compromiso entre sensibilidad y especificidad de
acuerdo a las necesidades mdicas de cada situacin, pero, como es obvio, no incrementarn
las posibilidades diagnsticas intrnsecas de cada test. Existen programas estadsticos que
generan las curvas ROC a partir de un juego de datos compuesto por los resultados del test
para un conjunto representativo de individuos, y la condicin de verdadero enfermo y
verdadero sano para cada uno de stos, dada por el estndar de referencia. Estas curvas
ROC podrn ser luego utilizadas para definir los niveles de sensibilidad y especificidad en los
que se prefiere trabajar con el test diagnstico, siempre y cuando se apliquen a poblaciones y
tcnicas comparables con aqullas empleadas para elaborarlas. Una muy buena discusin de
los aspectos fundamentales de las curvas ROC se hallar en Metz (1978).

[ 333 ]

15. Anlisis de la sobrevida

15.1. Introduccin
El anlisis de la sobrevida se refiere a un conjunto de mtodos destinados a estudiar
la ocurrencia de distintos eventos, entre ellos la muerte, en grupos de individuos seguidos
a lo largo del tiempo, esto es, longitudinalmente. Las llamadas curvas de sobrevida dan la
proporcin de individuos de un conjunto inicial, que se mantiene con vida en diferentes momentos a lo largo de un tiempo de observacin. Son muy utilizadas para tener una imagen
visual de la forma en que la mortalidad afecta a distintos grupos de individuos, por ejemplo
en el seguimiento de distintos tratamientos, en la bsqueda de diferencias que puedan tener
importancia en la futura seleccin de las mejores opciones teraputicas. Se representan en un
sistema de ejes, con el tiempo en las abscisas (x) y la proporcin de sobrevivientes en las ordenadas (y), se inician en tiempo cero y con el 100% de los individuos con vida, presentando
una forma escalonada, descendente hacia la derecha y abajo, a medida que la proporcin de
sobrevivientes disminuye con el tiempo (Fig. 2.4). Los correspondientes datos numricos en
que se originan reciben el nombre de tablas de sobrevida. Estos instrumentos proceden de los
censos, relevamientos destinados a conocer y eventualmente administrar distintos aspectos
de grandes grupos humanos como naciones o ciudades, de los cuales existen referencias histricas ms o menos lejanas. Las tcnicas censales adquirieron un gran desarrollo a partir del
siglo XVIII, pero los adelantos ms importantes en lo relacionado con las ciencias mdicas
datan de las ltimas dcadas, cuando adems recibieron la contribucin del campo del anlisis multivariado. Las curvas de sobrevida son la expresin grfica de toda una elaboracin
terica que permite su clculo numrico, incluyendo los mtodos para la construccin de
modelos matemticos que las representan, las tcnicas para la comparacin de varias curvas
entre s y tambin para la evaluacin de covariables que puedan tener influencia sobre la produccin de los eventos.
A pesar de su nombre, las curvas de sobrevida son aplicables a cualquier condicin o
evento con una probabilidad de aparicin definida, que pueda afectar a conjuntos de individuos. As, son condiciones de inters frecuente la morbilidad o aparicin de una enfermedad,
sus recadas, las intervenciones o reintervenciones quirrgicas, las internaciones y tambin
circunstancias mdicamente favorables como la remisin de determinados procesos o sntomas, etc. Tambin puede interesar el momento en que se alcanza cierto punto sobre una
variable continua, como por ejemplo el momento en que los glbulos blancos descendidos por
[ 334 ]

un tratamiento se recuperan por sobre un valor prefijado. Cualquiera de estas situaciones se


denomina evento, y las tcnicas estudian la incidencia de eventos y el tiempo transcurrido
hasta el evento. El tiempo que transcurre hasta la presentacin de los eventos se suele designar como tiempo de sobrevida, tiempo de seguimiento o tiempo al evento, siendo tambin
utilizados los trminos failure time y, en el caso de ensayos teraputicos, trial time. Este tiempo no se refiere al calendario, sino que comienza a contarse desde cero en el momento de la
inclusin del individuo en el seguimiento.
En este tipo de estudios es frecuente observar la proporcin de pacientes libre de eventos
en diferentes momentos del seguimiento. As, se puede calcular la proporcin de individuos
libre de eventos o sobreviviente, a los seis meses, al ao, etc. En otras oportunidades se informa la proporcin de individuos dentro de un grupo, que han sufrido un evento durante un
tiempo de observacin o seguimiento determinado, lo que se conoce como la incidencia del
evento durante dicho intervalo.
15.2. Curvas de sobrevida
Existen gran cantidad de tcnicas para el estudio de la sobrevida y los eventos en general, algunas de las cuales toman datos catastrales y relevan conjuntos de individuos de
distintas edades en distintos puntos del tiempo, siendo procedimientos afines a los censos.
Ms importantes en medicina son los estudios de seguimiento (follow up studies) donde
los individuos de un grupo con determinadas condiciones, como pueden ser enfermedades
o tratamientos en curso, son controlados a partir del momento de su inclusin en el estudio, registrndose el tiempo transcurrido hasta la aparicin del evento de inters. Tambin
suelen denominarse estudios de cohortes, y sus resultados pueden expresarse como tablas
y curvas de sobrevida.
En los estudios de cohortes, las tablas de sobrevida reflejan la proporcin de individuos
que sobreviven cada uno de los controles realizados durante el tiempo de seguimiento, el
que se mide desde el comienzo del estudio. Sucintamente, una curva de sobrevida puede
elaborarse como sigue. La probabilidad de sobrevida en un tiempo dado se estima como la
proporcin entre el nmero de individuos que se hallan con vida en el momento del control,
y el total de individuos ingresados al estudio. Por ejemplo, si el grupo inicial consta de 100
individuos, y en un perodo de tiempo x1 se producen 10 eventos, la estimacin de la sobrevida hasta x1 es igual a (100 10) / 100 = 0.90 o 90%. Si en un perodo subsiguiente x2 se
producen otros 10 eventos, la estimacin de la sobrevida para esa etapa tendr en cuenta
que se inici con los 90 sobrevivientes de la primera, y el clculo ser igual a (90 10 / 90)
= 0.89 u 89%. Para estimar la sobrevida a lo largo de varios perodos, se multiplican las
probabilidades para cada uno de ellos, que se tratan como probabilidades independientes
(3.5). En el ejemplo, la probabilidad de sobrevivir los dos primeros perodos es igual a la
probabilidad de sobrevivir al primero, multiplicada por la de sobrevivir al segundo, o sea
0.90 0.89 = 0.80. Puede comprobarse que si se consideran los 20 eventos ocurridos durante x1 y x2 en relacin a los 100 pacientes iniciales, el resultado es el mismo. Las tablas
suelen construirse en forma acumulativa, con los porcentajes de sobrevida observados para
los distintos intervalos del seguimiento, acumulados como porcentaje total desde el inicio
del mismo hasta cada punto de control temporal.
[ 335 ]

El ejemplo se ilustra en la figura 15.1, donde se observa la tcnica grfica corriente: la


sobrevida se representa por un segmento horizontal que indica el porcentaje de sobrevivientes
al comenzar el intervalo y se extiende hasta el comienzo del intervalo siguiente. En este punto,
el nuevo porcentaje se grafica como un nuevo segmento o escaln, discontinuo con el anterior
y que representa el porcentaje de sobrevivientes al descontarse los individuos fallecidos en el
intervalo previo. No hay as trazos oblicuos en las curvas de sobrevida. En la figura, el primer
segmento indica el 100% de individuos que inician el estudio en el tiempo x0 . En el tiempo x1
se han producido los primeros 10 bitos y el porcentaje de sobrevida del 90% es indicado por
el nivel del segmento que comienza en x1. En el tiempo x2 , cuando se han producido otros 10
eventos y el porcentaje de sobrevida alcanza el 80%, se inscribe el correspondiente escaln,
que se modificar en el tiempo x3 y as sucesivamente.
Figura 15.1. Construccin de una curva de sobrevida (ver el texto). Se expone el porcentaje de
sobrevivientes en x1 (90%) y x 2 (80%), correspondiente a los dos primeros escalones.


Debe mencionarse que el complemento de la probabilidad de sobrevida, px, es la probabilidad de bito o evento, qx, igual a (1 px ). No se entrar en detalles de construccin y clculo
de las curvas de sobrevida, pero se sealar que existen varios aspectos que surgen al poner
en prctica un estudio. Quiz el ms importante es el tratamiento de los individuos que por
algn motivo no completan el tiempo de seguimiento establecido. Las dos causas fundamentales son las prdidas de contacto durante el seguimiento (withdrawals) y el fin del protocolo
antes de que algn o algunos individuos hayan cumplido su seguimiento. Estas observaciones
incompletas se refieren frecuentemente como censored observations y hay tcnicas de anlisis para tratar con estos casos sin descartarlos del estudio, que se basan en que el individuo en
cuestin estaba vivo (informacin aprovechable) por lo menos hasta el momento del ltimo
contacto. Sin embargo, y a pesar de que dichas tcnicas son efectivas, la recomendacin es
hacer todo lo posible por no perder ningn caso (Peto y col., 1976).
15.3. Curvas de Kaplan y Meier.

Un punto delicado es la eleccin de los intervalos de tiempo en que se dividir la duracin
total del seguimiento. Si son muy grandes pierde precisin el estudio, y si son muy pequeos
[ 336 ]

el contacto con el paciente en tiempos estipulados y la recoleccin de datos se tornan engorrosos, consumidores de tiempo y costosos. El tema de los intervalos de duracin arbitraria
se evita mediante el mtodo de Kaplan y Meier, que adems proporciona herramientas de
anlisis efectivas y relativamente sencillas en sus lineamientos generales, y se resear a continuacin. Con este mtodo se considera que el tiempo de seguimiento se halla dividido en una
gran cantidad de pequeos intervalos, en general tan pequeos como puedan ser registrados
sin perder exactitud. Como frecuentemente se emplean intervalos de un da, supongamos que
ese es el intervalo elegido. El mtodo procede as: habiendo nj individuos en seguimiento, si
en un da cualquiera se producen dj eventos (uno o ms eventos), la probabilidad de evento
estimada para el tiempo t j es:

q j = d j / n j

(15.1)

y de acuerdo a lo ya expresado, la probabilidad de sobrevida ser



p j = 1 q j = 1 (d j / n j)
= (n j d j) / n j

(15.2)

El producto de todos los trminos de probabilidad de sobrevida, desde el comienzo del


estudio hasta el da tj inclusive, es la probabilidad estimada de sobrevida hasta ese punto en
el tiempo, y puede expresarse con la mayscula griega , que simboliza el producto de una
serie de trminos:

l t = p j = [ (n j d j) / n j ]

(15.3)

siendo lt la probabilidad de sobrevida entre el comienzo del estudio y el da (o intervalo) t.


Ahora bien, en los das en los que no hubo eventos, d j = 0 y por lo tanto p j = (n j 0) / n j = 1,
y como multiplicar por 1 no altera el producto, los das en que no hubo eventos no entran en los
clculos. En cuanto a las prdidas de seguimiento, simplemente se descuentan de nj. Si el da en
que hay eventos tambin se presentan prdidas de seguimiento, stas se descuentan de nj despus
de haber calculado pj, como si se hubieran producido luego de los eventos, y con esta convencin,
el procedimiento evita correcciones ms o menos complicadas en el clculo de la sobrevida.
El estimador lt se conoce como producto-lmite, por ser un producto donde a los intervalos tienden a un lmite mnimo. Por regla general, los resultados son expuestos en forma de
curvas de sobrevida, formadas por tantos escalones como das o intervalos con eventos se
hayan presentado, conocidas como curvas de Kaplan - Meier.
15.4. Comparacin de curvas: el logrank test
Es comn desear comparar dos o ms curvas de sobrevida a fin de obtener conclusiones
acerca de la incidencia relativa de eventos entre los grupos de los que provienen. Hay una gran
cantidad de mtodos con ese fin, siendo uno de los ms importantes el llamado, por motivos
tericos, logrank test. Como su procedimiento de clculo es algo complicado, y prescindible
al disponerse de mtodos computarizados de sencillo manejo, slo se darn los rasgos gene[ 337 ]

rales del mismo, que son importantes por dar una idea de la forma en que se realizan las comparaciones. El mtodo consiste en formar un conjunto nico con los datos de los dos grupos
a comparar, digamos A y B, manteniendo la identificacin de cada individuo segn el grupo
al que pertenezca. Supongamos que en un momento los grupos tienen nA = 100 y nB = 50
individuos respectivamente, y ese da se producen 3 eventos en el conjunto de ambos grupos.
La expectativa lgica bajo la hiptesis nula de no diferencia en incidencia de eventos entre los
grupos, es que 2 de los tres eventos ocurran en el grupo con 100 individuos, y el restante en
el grupo con 50 individuos, esto es, que la incidencia de eventos sea proporcional al nmero
de individuos de cada grupo. Esta es la base del mtodo, y si los eventos se presentan en cantidades proporcionales al tamao de cada grupo, no habr diferencias entre lo observado y lo
esperado. Pero si en cambio los eventos acontecen de otra forma, por ejemplo los 3 eventos en
uno de los grupos, o 2 eventos en el grupo ms chico y 1 en el ms grande, se tienen evidencias en contra de la hiptesis nula. Cada vez que se producen uno o ms eventos, se compara
el nmero observado en cada grupo con el esperado de acuerdo a la cuanta del respectivo
grupo. A lo largo de todo el estudio, se suman los eventos observados (O) y esperados (E) en
cada uno de los grupos, obtenindose las sumas OA y E A en el grupo A, y las sumas OB y E B
en el grupo B. El estadstico

X = [(OA E A) / E A] + [(OB EB) / EB]

(15.4)

se distribuye muy aproximadamente segn la distribucin chi-cuadrado con un grado de


libertad, y permite probar diferencias significativas entre los grupos A y B. La razn

h = (OA / E A) / (OB / EB)

(15.5)

se conoce como hazard ratio y es una expresin del riesgo relativo de evento en el grupo A
respecto del B.

La significacin estadstica del riesgo relativo h frente a la hiptesis nula de riesgos iguales (h = 1), se calcula mediante (15.4) y se obtiene en los paquetes estadsticos corrientes.
Como se ha visto, el anlisis de la sobrevida puede realizarse mediante diversos mtodos y en distintos mbitos. En medicina son muy comunes los estudios de seguimiento de
grupos o cohortes, muchas veces para evaluar diferencias entre grupos sometidos a distintas
intervenciones teraputicas pero tambin con otros objetivos, como evaluar la evolucin de
distintos padecimientos, o de enfermedades estratificadas segn distintos factores de riesgo.
El mtodo de Kaplan y Meier es uno de los de eleccin para analizar la sobrevida en cohortes,
y una de las pruebas de significacin ms empleadas es el logrank test. Existen otras semejantes, como la de Wilcoxon, que asimismo se obtienen en los paquetes de computacin de uso
corriente.
15.5. Mtodos paramtricos
El estudio del tiempo de sobrevida puede hacerse postulando una distribucin de probabilidades para el mismo, y estimando sus parmetros a partir de los datos de las muestras o
grupos de individuos. Es decir, se elige una frmula o modelo matemtico que se espera que
[ 338 ]

describa la forma de transcurrir el tiempo de sobrevida, y a partir de los datos reales de los
grupos se estiman los parmetros correspondientes a la distribucin previamente elegida.
De esta forma, el modelo como funcin del tiempo, describe la sobrevida observada en los
distintos grupos, en forma anloga a lo que hace una ecuacin de regresin cuando estima
la variable independiente. Dichos modelos de la sobrevida permiten una serie de inferencias
y comparaciones, as como la introduccin de mtodos multivariados a fin de controlar los
efectos de diversas covariables, siendo el tiempo la variable en funcin de la cual se expresan
las caractersticas de la sobrevida. La estimacin de los parmetros de dichos modelos se
realiza en general por el mtodo de mxima verosimilitud (maximum likelihood), que no es
dado examinar aqu. Como estas tcnicas son relativamente complejas, slo se comentarn
las caractersticas ms importantes de los mtodos paramtricos y la interpretacin de sus
resultados, en especial lo que se refiere al mtodo semi-paramtrico de Cox.

Mediante los mtodos paramtricos, se pueden construir distintas funciones F( t ) que
describen la proporcin de eventos que se van acumulando a lo largo del seguimiento hasta
cada instante t, o sea en funcin del tiempo. Siendo que una funcin F( t ) da cuenta de la proporcin de eventos, la proporcin de sobrevivientes hasta cada instante t, estar dada por la
funcin S( t ) = 1 F( t ). Por ejemplo, si F( t ) indica que a los t das de seguimiento los eventos
alcanzan al 15% del grupo original, se tendr que S( t ) = 1 0.15 = 0.85 u 85%, corresponde
a la proporcin de de sobrevivientes hasta ese instante. S( t ) se denomina funcin de sobrevida (survivor function) y su representacin grfica es similar a las curvas de sobrevida vistas
anteriormente, aunque en este caso deriva de un modelo matemtico ajustado a los datos (Fig.
15.2). Hay diversos modelos de sobrevida y una forma de describirla es a travs de la llamada
funcin de riesgo (hazard function), que relaciona el riesgo de muerte en un instante t, con la
proporcin de sobrevivientes hasta ese mismo momento.
Figura 15.2. Funcin de sobrevida para = 0.02, unidades de tiempo arbitrarias.

La probabilidad de sobrevida en un instante o tiempo t a partir del comienzo del seguimiento, est dada por la funcin f ( t ), llamada funcin de densidad de probabilidad del tiempo de sobrevida. Su integral, F ( t ), describe la proporcin de muertes o eventos producidos
hasta el instante t, y guarda con f ( t ) relaciones anlogas a las de las funciones de densidad y
de distribucin de probabilidad vistas en 4.6.1. Como ha sido mencionado, la funcin S( t )
= 1 F( t) se llama funcin de sobrevida, y su valor establece la proporcin de sobrevivientes
hasta el momento t. Por ltimo, el cociente

[ 339 ]

( t ) = f ( t ) / S ( t )

(15.6)

se conoce como funcin de riesgo (hazard function) y puede expresarse como la probabilidad
de que, habiendo sobrevivido hasta el instante t, se produzca el evento en el instante siguiente.
Existen varios modelos para ( t ), el ms sencillo de los cuales corresponde a = constante. En este caso, se demuestra que la funcin de sobrevida toma la forma
S ( t ) = e t

(15.7)

cuya grfica para = 0.02 se observa en la Figura 15.2. Sin embargo, el asumir invariable a
travs del tiempo no se considera totalmente satisfactorio y se han elaborado otros modelos,
como los de Weibull y Gompertz, en los que la funcin de riesgo se modifica en funcin del
tiempo (Armitage y Berry, 1994).
15.6. Mtodo de los riesgos proporcionales
El estudio de la sobrevida en un grupo, solamente en funcin del tiempo y sin considerar
otras condiciones que pudieran modificarla, presenta un inters limitado. En contraste, resulta muy importante la posibilidad de obtener modelos de la sobrevida que la representen, no
slo en funcin del tiempo sino tambin de otras variables individuales como pueden ser la
edad, condiciones patolgicas, tratamientos recibidos, resultados de mtodos diagnsticos,
etc. Esto expande los alcances del mtodo al control de mltiples variables y de sus interrelaciones, permitiendo estimar la llamada tasa de riesgo (hazard rate) relacionada con dichas
variables. La funcin ( t ) queda expresada como ( t, x ), donde x representa las distintas
covariables x1, x2 , xn. Los datos son as analizados en relacin al tiempo y a las n covariables. La expresin general de la funcin de riesgo puede luego escribirse:

( t, x ) = 0 e x

(15.8)

donde 0 es el componente del riesgo dependiente del tiempo y x representa la funcin de


regresin 1x1 + 2x2 + + nxk, donde las xi son los factores o covariables de inters pronstico. Cada variable xi posee su coeficiente de regresin, que representa la parte que tiene en el
riesgo total del modelo. Dado que los riesgos implicados por cada conjunto de valores de las
xi no es afectado por el tiempo, cuyo efecto est descripto por 0 , estos modelos se conocen
como de riesgos proporcionales (proportional hazards).
En estos modelos de sobrevida en funcin del tiempo y de otras variables xi , muchas veces
ocurre que el componente dependiente del tiempo no es fcil de determinar. Por otra parte,
el inters principal suele estar centrado en las covariables que caracterizan a los individuos e
influyen en la sobrevida. Esto llev a emplear modelos que dejan sin definir la porcin de la
funcin dependiente del tiempo 0 ( t ), y estiman el riesgo relativo dependiente del conjunto
de covariables en x. La funcin resultante es anloga a la (15.8), pero se ha omitido 0 por
postularse que el efecto del tiempo es el mismo para todos los individuos del grupo:

[ 340 ]

riesgo relativo = e x

(15.9)

siendo x = 1x1 + 2x2 + + nxk una regresin mltiple de las distintas covariables, cuyos
coeficientes se obtienen mediante el procedimiento de estimacin conocido como de mxima verosimilitud. Reemplazando las x por sus valores numricos y exponenciando en e, se
obtiene la estimacin del riesgo para un individuo con ese arreglo particular de los datos. En
el caso de una variable independiente dicotmica puede obtenerse el riesgo relativo entre los
dos estados posibles de la misma, como por ejemplo diabetes presente y diabetes ausente, tratamiento 1 y tratamiento 2, etc. Este mtodo, en que el riesgo para cada conjunto de variables
se considera independiente del tiempo, y relativo con respecto al valor que tomen las covariables, se conoce como mtodo de los riesgos proporcionales de Cox (proportional hazards).
A fin de ilustrar el procedimiento, considrese el caso del seguimiento de una cohorte
en la que una variable independiente binaria, codificada como normal = 0 o alterada = 1,
exhibe al final del estudio un coeficiente b = 1.2, que resulta estadsticamente significativo.
Reemplazando el valor 1.2 en la frmula (15.9), se obtiene:

variable normal ( x = 0), riesgo = e x = e 1.2 0 = e 0 = 1

variable anormal ( x = 1), riesgo = e x = e 1.2 1 = e 1.2 = 3.32

con lo que la estimacin para la variable en estado normal queda como valor de referencia y
el riesgo relativo resulta 3.32 veces mayor en los pacientes con la variable alterada.
Como el modelo de Cox no toma en cuenta el tiempo, no permite hacer predicciones con
respecto al tiempo de presentacin de los eventos, sino estimar el riesgo que implica cada
cambio en las covariables con respecto al conjunto de los datos. Estas son estimaciones del
riesgo relativo. Como se ha visto, cada coeficiente mide el cambio en el riesgo relativo por
cada incremento en una unidad de la variable correspondiente. En el caso de una variable
dicotmica, como se vio ms arriba, el cambio en una unidad implica el cambio de estado de
la variable, pero el mtodo tambin puede aplicarse a variables continuas, y cuando hay diferentes predictores independientes constituye un efectivo modelo de regresin mltiple para
la estimacin de los riesgos relativos, siempre bajo el presupuesto de que el efecto del tiempo
es el mismo para todos los individuos considerados. El grado de significacin estadstica de
los coeficientes de regresin as como sus lmites de confianza, se obtienen de los paquetes
estadsticos corrientes.

[ 341 ]

16. Enfermedades en las poblaciones

16.1. Generalidades
En forma general, la epidemiologa trata de la distribucin de la enfermedad en las poblaciones. As, uno de los temas principales de la epidemiologa es lo concerniente a la presencia de
enfermedad y a la aparicin de nuevos casos, llamadas respectivamente prevalencia e incidencia. Otro inters de la epidemiologa es el estudio de la gama de factores que pueden interactuar
con la presentacin de las enfermedades, entre los que se cuentan los ambientales, biolgicos,
socioeconmicos, etc. Un tipo importante son los factores mdicos, que incluyen las distintas
intervenciones teraputicas. Todos estos factores se llaman exposiciones. A los sujetos que entran en relacin con esos factores se los suele denominar expuestos.
En general, muchos de los mtodos de la estadstica prestan utilidades para abordar los
problemas de la enfermedad en las poblaciones, pero hay algunos especialmente aptos para
adaptarse a las situaciones tpicas de la epidemiologa, que como se entender, son mtodos
de tipo esencialmente observacional o descriptivo, en contraste con los procedimientos
experimentales o de laboratorio, donde las cosas se disponen y an se provocan, a criterio
del investigador. As, los estudios epidemiolgicos se ocupan de observar y dar cuenta del
panorama espontneamente proporcionado por la enfermedad, describiendo su modo de
aparicin, permanencia, duracin, propagacin y modificacin por diversas exposiciones.
En cambio, los estudios experimentales seleccionan el material de estudio, actan sobre l
mediante todo tipo de intervenciones, lo modifican y evalan los cambios provocados, tal
como ocurre en el ensayo de drogas o en el trabajo con animales o preparados de laboratorio.
Con todo, la distincin entre estudios descriptivos y experimentales no es neta, y hay situaciones que comparten caractersticas, como pueden ser los estudios de grandes muestras de
poblaciones en las que se ensayan distintas teraputicas, donde las tcnicas del seguimiento
suelen emplear los mtodos tpicos de la epidemiologa, y el hecho de administrarse un tratamiento controlado tiene que ver con las intervenciones experimentales.
Existen dos mtodos especialmente apropiados para el estudio de la enfermedad en poblaciones: el seguimiento de cohortes o grupos a lo largo del tiempo, y los estudios de tipo
caso-control. La primera variedad se refiere con cierto detalle en la Seccin 15, y tiene caractersticas que muchas veces la haran de eleccin, aunque no siempre su puesta en prctica es sencilla, y no hay forma de obviar el tiempo de seguimiento requerido. En tanto, los
estudios caso-control, que constituyen un mtodo propio de los estudios epidemiolgicos,
[ 342 ]

tambin presentan recursos de diseo y clculo que los hacen tiles, y sern examinados en
lo que sigue.
16.2. Prevalencia e incidencia

La prevalencia mide la frecuencia de una enfermedad existente en la poblacin en el
momento del estudio, y est dada por la razn
P = nmero total de casos / nmero total de poblacin

(16.1)

en el momento en que se hace su determinacin. Se expresa como casos por cien, por mil,
etc, segn su magnitud. Si en una poblacin hay 2 casos de una determinada enfermedad por
cada 100 individuos, la prevalencia ser de 0.02 o, expresado en porcentaje, 2%. El trmino
prevalencia no slo se aplica a enfermedades, sino a cualquier condicin o evento que pueda
estar presente o ausente en una poblacin. As, se habla corrientemente de la prevalencia de
distintos factores de riesgo para enfermedad, y tambin de caractersticas como el gnero o
el color del cabello, etc.

La incidencia mide la tasa de ocurrencia de nuevos casos de enfermedad en una poblacin durante un tiempo determinado, y se expresa como
I = nmero de casos nuevos / poblacin en riesgo

(16.2)

donde poblacin en riesgo se refiere a la poblacin, observada durante cierta cantidad de


tiempo. Como interesa especialmente el tiempo durante el cual se producen los nuevos casos,
se multiplica el nmero de individuos observados, por el tiempo de observacin y se obtiene
el tiempo total de riesgo. Si por ejemplo se observa un conjunto de 100 individuos durante
dos aos, el tiempo total de riesgo o exposicin ser igual a 100 2 = 200 individuos-aos.
De esta forma, el denominador de (16.2) expresa en individuos-tiempo. En el ejemplo, si se
producen 6 casos de enfermedad durante los dos aos del estudio, se hablar de una incidencia de 6 casos en 200 personas-ao, o tambin, de 3 casos cada 100 personas-ao.
16.3. Riesgo relativo (risk ratio) y diferencia de riesgo
Se ha visto en la Seccin 8 que el concepto de riesgo puede expresarse en forma general como la probabilidad de desarrollar una enfermedad o evento dado, en un tiempo determinado
de observacin. Tambin se vio que en circunstancias en las cuales el tiempo de presentacin
del evento es poco relevante en el contexto mdico, la simple determinacin de la proporcin
de individuos afectados en un conjunto puede constituir una estimacin adecuada del riesgo.
Sin embargo, el tiempo de desarrollo de la enfermedad suele ser de importancia, como ocurre
tpicamente en la evolucin de procesos crnicos donde el tiempo hasta la aparicin de complicaciones, bito, o remisin del cuadro o de los sntomas, suele ser crucial. En estos casos,
la incidencia de la enfermedad, que expresa la frecuencia de su aparicin entre los integrantes
del grupo en estudio, constituye una medida ms adecuada del riesgo de padecerla que la
simple determinacin de la prevalencia. Un individuo sano perteneciente a un grupo donde la
incidencia de una enfermedad es n veces mayor que en otro, tiene n veces ms probabilidades
[ 343 ]

de contraerla que un individuo del ltimo grupo. El cociente entre la incidencia de enfermedad en dos grupos se llama riesgo relativo (RR) o razn de riesgos (risk ratio):
RR = I1 / I 2

(16.3)

donde I es la incidencia y el subndice denota los grupos 1 y 2. El riesgo se refiere al grupo 1


respecto del grupo 2.

La evaluacin del riesgo relativo es especialmente til entre grupos expuestos y no expuestos a un determinado factor, siendo
RR = I expuestos / I no expuestos

(16.4)

lo que da una idea de la importancia del factor en cuanto a la probabilidad de padecer la


enfermedad en un tiempo determinado de observacin. Resulta evidente que si la incidencia
de una enfermedad es el doble en presencia del factor que en su ausencia, el riesgo relativo
asociado al factor ser igual a 2. El factor puede tambin estar asociado con una menor
incidencia de la enfermedad, y si la incidencia en expuestos fuera la mitad que en los no expuestos, el riesgo relativo sera igual a 0.5. En un caso as podra interpretarse que el factor
en cuestin tiene un efecto protector contra la enfermedad. Tambin se comprende que si
no hay diferencia entre dos grupos en la incidencia de un evento, el riesgo relativo ser igual
a 1. Ntese que RR = 1 es la hiptesis nula en la evaluacin del riesgo entre dos conjuntos de
individuos.

Una segunda forma de comparar el riesgo de una enfermedad en relacin a la exposicin
a un determinado factor, es hallar la diferencia entre las incidencias en individuos expuestos
y no expuestos. Esta diferencia de riesgo (DR) (risk difference, absolute risk reduction) expresa la variacin absoluta del nmero de casos asociada con la presencia del factor, para un
mismo nmero de individuos-ao en el denominador. La diferencia de riesgo puede expresarse como:

DR = I expuestos I no expuestos

(16.5)

En el caso en que la incidencia de un padecimiento en presencia de un factor fuera de 6


casos por 100 individuos-ao, y que en ausencia del mismo fuera de 2 casos por 100 individuos-ao, la diferencia sera igual a 4 casos ms entre los individuos expuestos. Ntese que la
misma DR se obtendra si entre los expuestos se observaran 54 casos y entre los no expuestos,
50 casos. En esta eventualidad, la misma diferencia de 4 individuos se torna menos importante. Esto aparece reflejado en el riesgo relativo (RR), que en la primera instancia es igual a 6 /
2 = 3 y en la segunda es igual a 54 / 50 = 1.08, apenas mayor que uno.
Por otra parte, el RR sera el mismo tanto si la incidencia de enfermedad en expuestos y
no expuestos fuera de 3 y 1 casos respectivamente, como si fuera de 30 y 10. En esta situacin
ser la DR la que aclare la magnitud de los efectos medidos, al valer 3 1 = 2 en el primer
caso, y 30 10 = 10, en el segundo. De lo visto se desprende que tanto el riesgo relativo como
la diferencia de riesgo son indicadores que solamente se pueden interpretar en forma com[ 344 ]

pleta cuando se conoce la incidencia del proceso en estudio en al menos uno de los grupos
que se comparan. Resulta evidente que si el riesgo de enfermedad es menor en los individuos
expuestos, como puede ser el caso si la exposicin se refiere a un tratamiento efectivo, (16.5)
proporcionar valores negativos. Este detalle formal no impide entender los resultados como
una reduccin del riesgo asociada a la exposicin.
Se ha visto en la Seccin 8, que en circunstancias donde el tiempo de presentacin de
los eventos no es el objeto principal de la investigacin, como en el estudio de la mortalidad
hospitalaria por endocarditis infecciosa en individuos con y sin insuficiencia renal, el riesgo y
el riesgo relativo pueden estimarse a partir de la proporcin de casos en los distintos grupos.
Cabe agregar que en estos casos tambin la diferencia de riesgo puede estimarse como la diferencia entre las proporciones de individuos afectados en los grupos expuesto y no expuesto,
lo cual puede expresarse como la diferencia en la mortalidad, por cada 100 individuos.
16.4. Nmero necesario a tratar
Se ha mencionado que las distintas teraputicas pueden ser consideradas exposiciones.
En tal sentido, los diversos estudios clnicos suelen comparar los efectos de diferentes tratamientos entre s, o con placebo. Dichos ensayos clnicos participan de muchas de las caractersticas de los estudios epidemiolgicos, en particular en lo que se refiere la observacin
de grupos de individuos sometidos a distintas exposiciones teraputicas, y la estimacin del
riesgo de presentar diversos eventos relacionados con la patologa estudiada. En estos casos,
es frecuente que los tratamientos reduzcan la incidencia de la enfermedad o de sus complicaciones, y en tales circunstancias el riesgo relativo entre el tratamiento y el rgimen alternativo
ser menor que 1, mientras que la diferencia de riesgo indicar el exceso de enfermedad o
eventos en los individuos no tratados.

Una medida muy empleada del xito de un tratamiento deriva de la diferencia de riesgo,
que en el caso de un tratamiento beneficioso puede entenderse como el exceso de enfermedad
en el grupo no tratado, y tambin, como el nmero de individuos que han evitado la enfermedad en el grupo tratado, siempre con referencia al nmero de individuos-ao evaluado. En
estas circunstancias puede aceptarse que si el tratamiento present una DR a su favor de 5
pacientes / 1000 individuos-ao, debern tratarse 1000 / 5 = 200 individuos durante un ao
para tener la expectativa de evitar la enfermedad en uno de tales individuos. Si la DR fuera
igual a 20 pacientes / 1000 individuos-ao, deberan tratarse 1000 / 20 = 50 individuos durante un ao para salvar de la enfermedad a uno de ellos. Estas cantidades se conocen como
nmero necesario a tratar (NNT) y como se ve, son la inversa de la diferencia de riesgo:

NNT = 1 / DR

(16.6)

En forma anloga al NNT, en el caso de efectos adversos de la teraputica puede calcularse el nmero necesario para daar, que expresa el nmero de individuos que deben recibir
el tratamiento para que uno de ellos experimente un efecto adverso. La utilidad principal de
este indicador reside en la evaluacin de efectos colaterales indeseables cuando interesa administrar el tratamiento por los beneficios derivados de sus efectos principales.

[ 345 ]

16.5. Riesgo atribuible



Las consecuencias de un determinado aumento del riesgo por la exposicin a un factor
dado, dependern tambin de la proporcin de individuos en la poblacin que presenten el
factor y estn expuestos a su influencia. Es decir, el riesgo relativo asociado con un factor de
exposicin tendr mayor repercusin en la poblacin cuanto mayor sea la prevalencia del factor. Una medida de este efecto est dada por el llamado riesgo atribuible (attributable risk),
que expresa la proporcin de casos incidentes en la poblacin, atribuibles a la presencia del
factor en cuestin, y que se estima como una proporcin o porcentaje de la incidencia global
de enfermedad. Una forma de calcularlo es estimando la incidencia entre los individuos no
expuestos del grupo (I NE), restndola de la incidencia global estimada en la totalidad del grupo (I t), y dividiendo por esta ltima:
Riesgo atribuible = ( I t I NE ) / I t

(16.7)

Existen otras expresiones del riesgo atribuible, entre ellas una que permite calcularlo en
funcin del riesgo relativo para el factor del que se trate (RR), y de la proporcin o prevalencia
del factor en la poblacin (PF):
Riesgo atribuible = [PF (RR 1)] / [ 1 + PF (RR 1) ]

(16.8)

Esta frmula es til cuando no se dispone de estimaciones de las incidencias de la enfermedad, que requieren el seguimiento en el tiempo, pero en cambio puede estimarse el riesgo relativo entre expuestos al factor y no expuestos. Esta situacin es caracterstica de los estudios
caso-control, que se examinarn en el prrafo siguiente.
16.6. Estudios caso-control
En los estudios de tipo caso-control se evala la asociacin entre enfermedad y exposicin a factores diversos, mediante la comparacin de un grupo de individuos que padecen la
enfermedad, casos, y un grupo de referencia libre de ella, controles. El objetivo es estimar si la
exposicin a un determinado factor influye en la incidencia de la enfermedad en estudio. Un
ejemplo de una serie de exposiciones o factores lo constituyen los llamados factores de riesgo
cardiovascular, como la hipertensin, diabetes, dislipemia, tabaquismo, etc. Como se ha dicho,
el aspecto que interesa estimar es la incidencia de enfermedad cuando un factor est presente y
cuando no lo est: si la incidencia aumenta en presencia del factor, el grado de aumento del riesgo se podr medir mediante el cociente de las incidencias en presencia y en ausencia del mismo,
que es el riesgo relativo visto anteriormente. Una forma natural de estimar el riesgo relativo es
seleccionar un grupo de individuos con el factor en cuestin y otro libre del mismo, y seguirlos
en el tiempo contando las veces que aparece la enfermedad en cada grupo. Este tipo de estudio,
el seguimiento de cohortes, se aborda en la Seccin 15, siendo su principal limitacin requerir
tiempos en general prolongados. Ahora bien, en los estudios de tipo caso-control, tanto la presencia de enfermedad como de exposicin, se investigan a partir de historias clnicas o archivos,
o bien realizando las correspondientes investigaciones diagnsticas en el momento del estudio.
Primeramente se eligen individuos de los que se sabe fehacientemente que presentan la enferme[ 346 ]

dad (casos) o que no la presentan (controles), y recin entonces se determina quines se hallan
y quines no se hallan expuestos al factor en consideracin. Es llamativo que, a pesar de no
contarse con estimaciones directas de la incidencia de la enfermedad, pues no hay seguimiento,
estos estudios proporcionen estimaciones suficientemente buenas del riesgo relativo, tambin
conocidas como riesgo relativo aproximado, y en esto radica su importancia. El desarrollo de
un estudio caso-control se expondr y comentar a continuacin.
En un trabajo dirigido a examinar la asociacin del infarto de miocardio con el uso de
contraceptivos (Dunn y col, 1999), se compar un conjunto de 448 mujeres que lo haban
presentado, con otro de 1728 mujeres de edad similar y sin antecedentes de infarto. Los
diagnsticos se obtuvieron en forma retrospectiva a partir de historias clnicas y entrevistas
con mdicos tratantes y pacientes. Varios factores de riesgo fueron considerados en el mismo
estudio, y en la Tabla 16.1 se muestran los datos relativos a la proporcin de dislipemia en
casos y controles, dispuestos en una tabla de 2 2.
Tabla 16.1. Tabla de 2 2. Clasificacin de casos (infarto de miocardio) y controles segn la
presencia de dislipemia, en 2176 mujeres de 16 a 44 aos de edad (Dunn y col, 1999).
CASOS

CONTROLES

Dislipemia

34

51

Total
85

No dislipemia

414

1677

2091

Total

448

1728

2176


De la tabla se obtiene la proporcin de casos y de controles expuestos a la dislipemia,
pero no las incidencias de infarto de miocardio en las mujeres dislipmicas (ya que no hay un
seguimiento en el tiempo y tanto casos como controles se han obtenido en forma independiente). As, 34 / 448 = 0.076 o 7.6%, es la proporcin de los infartos expuesta a la dislipemia,
y 51 / 1728 = 0.03 o 3.0%, es la proporcin de controles con dislipemia, con lo cual se conoce
la proporcin de dislipemia en casos y controles, pero no se sabe con qu frecuencia tender a
presentarse el infarto de miocardio en presencia y en ausencia de dislipemia, es decir, la tabla
no proporciona la incidencia de infarto en presencia y en ausencia de dislipemia, sino ms bien
el porcentaje de dislipemia encontrado en infartos y controles. Ahora bien, si casos y controles
se hubieran obtenido mediante el muestreo aleatorio de una poblacin extensa, sin elegirlos
por el diagnstico, la proporcin de casos de infarto de miocardio entre mujeres con dislipemia
podra servir para estimar el riesgo de infarto en ese grupo, y anlogamente, la proporcin de
infarto entre mujeres normolipmicas permitira tener una estimacin aproximada el riesgo de
infarto en ausencia de dislipemia, procediendo como en 8.4. El cociente entre ambos riesgos
resultara entonces una estimacin del riesgo relativo de padecer infarto de miocardio en dislipmicos y normolipmicos. Sin embargo y a pesar de que casos y controles no han sido obtenidos por muestreo aleatorio de poblaciones, es un hecho interesante y til que el riesgo relativo
pueda derivarse con suficiente exactitud de estudios caso-control, donde casos y controles han
sido obtenidos en nmero arbitrario, y muchas veces, a partir de distintas bases de datos. El
procedimiento para el anlisis de un estudio caso-control se describe a continuacin, para lo
cual es conveniente representar los casos como en la Tabla 16.2.
[ 347 ]

Tabla 16.2. Tabla de 2 2. Nmero de de casos y controles clasificados segn la exposicin.


CASOS

CONTROLES

Total

Dislipemia

a+c

No dislipemia

b+d

Total

a+b

c+d

Si los nmeros en las celdas representaran las proporciones en la poblacin, el riesgo


en el grupo expuesto podra obtenerse en forma aproximada por la proporcin de infartos
en el total de dislipemias, a / (a + c), y anlogamente, el riesgo en el grupo no expuesto (no
dislipemia) podra obtenerse como b / (b + d). El cociente entre los riesgos en expuestos y no
expuestos sera entonces una estimacin del riesgo relativo (RR):
RR = [ a / (a + c) ] / [ b / (b+ d) ]

(16.9)

Por motivos tericos, en los estudios caso-control debe usarse una aproximacin a (16.9), en
donde los casos, a y b, son suprimidos del denominador. La expresin se transforma as en la
razn de los odds u odds ratio (OR):

OR = (a / c) / (b / d)

(16.10)

que es cmodo de calcular como:


= (a d) / (b c)

(16.11)

En forma anloga a lo ya visto para el risk ratio, el OR es el cociente entre los odds de
infarto en dislipmicos y en no dislipmicos. Esta nueva estimacin del riesgo relativo por
medio del odds ratio resulta aceptable mientras el nmero de casos (enfermedad) sea relativamente pequeo en comparacin con los controles, cosa que por otra parte es frecuente en
estudios epidemiolgicos.
A fin de demostrar que la ecuacin (16.10) expresa el OR en funcin de las frecuencias de
casos y controles, obsrvese que si la probabilidad de infarto en el conjunto dislipemia est
dada por a / (a + c), su complemento (1 probabilidad) debe ser igual a c / (a + c), ya que a y c
se refieren a las dos nicas posibilidades, infarto y no infarto. Recordando que odds = probabilidad / (1 probabilidad), los odds de infarto en el grupo dislipemia estarn dados por a / (a
+ c) dividido por c / (a + c), lo que es igual a a / c, el numerador de (16.10). En forma anloga,
los odds de infarto en el grupo no expuesto resultan iguales a b / d, que es el denominador de
(16.10).
En este punto debe enunciarse un hecho fundamental, en cuyo anlisis no cabe profundizar aqu (ver Armitage y Berry, 1994, e Ingelfinger y col, 1994), que permite estimar con
suficiente exactitud el riesgo relativo (RR) an cuando no se conozcan las incidencias de la
enfermedad en los grupos expuesto y no expuesto, y no se cumpla la exigencia de muestreo
aleatorio de la poblacin de inters: en los estudios de caso-control, el odds ratio, expresado
[ 348 ]

como (a/c) / (b/d) (datos dispuestos como en Tabla 16.2), es una estimacin del riesgo relativo de enfermedad (RR) entre individuos expuestos y no expuestos.
El enunciado afirma que obteniendo conjuntos de casos y controles, la proporcin de individuos expuestos al factor en estudio en cada uno de ellos, permite estimar con suficiente exactitud
el riesgo relativo de enfermedad entre expuestos y no expuestos. Este hecho es interesante, ya
que a partir de muestras arbitrarias de casos y controles se llega a estimar el riesgo de enfermedad de acuerdo a la exposicin, y fundamenta la validez de la estimacin del riesgo relativo en
los estudios de tipo caso-control. Es notable que sus resultados se hallen de acuerdo con los que
proporcionan los estudios de seguimiento de cohortes, an cuando los estudios de caso-control
no provienen del muestreo aleatorio de poblaciones, sino que casos y controles han sido seleccionados en nmero arbitrario, frecuentemente a partir de distintas fuentes de datos.
Prosiguiendo el examen del infarto en la dislipemia, reemplazando en (16.10) se obtiene
el odds ratio:

OR = (a / c) / (b / d) = (34 / 51) / (414 / 1677) = 2.70
que es una expresin del riesgo relativo de infarto de miocardio en presencia de dislipemia,
respecto de los individuos sin dislipemia, obtenida del odds ratio.
16.7. Odds ratios y estimaciones del riesgo relativo
En este lugar debe remarcarse que el odds ratio es un estimador muy utilizado del riesgo
relativo, no solamente en los modelos caso-control que nos ocupan, sino tambin en otras
reas como la regresin logstica y algunas tcnicas del metanlisis. Sin embargo, se ha visto
ms arriba que el clculo del odds ratio implica una aproximacin a la expresin del riesgo
relativo (16.9), que resulta simplificada por la supresin de los casos en el denominador. Con
todo, la estimacin del riesgo relativo mediante el odds ratio es inevitable en estos estudios,
dado que el riesgo no puede ser obtenido mediante la ecuacin (16.9) porque entre otros motivos, casos y controles han sido obtenidos en cantidades arbitrarias fijadas por el investigador.
Afortunadamente y como ya se ha mencionado, las estimaciones del riesgo relativo mediante
el odds ratio son suficientemente precisas mientras el nmero de los casos sea pequeo con
relacin a los controles, cosa que por otra parte es frecuente en los estudios epidemiolgicos.
De todos modos, el odds ratio tender siempre a proporcionar estimaciones del riesgo relativo
ms extremas que las reales, por lo cual a veces es denominado riesgo relativo aproximado.
Por otra parte, existe una gran cantidad de modelos estadsticos donde el riesgo relativo
puede calcularse, tanto mediante la ecuacin (16.9), como mediante el odds ratio. As, en la
Seccin 8 se vio que un conjunto de individuos con endocarditis infecciosa present distinto
riesgo de mortalidad segn existiera o no insuficiencia renal asociada (ver Tabla 8.1). El riesgo relativo se calcul segn (8.9), que es una expresin equivalente a la (16.9), obtenindose
RR = 1.63. Si con los mismos datos se procede ahora a obtener el odds ratio, el lector podr
comprobar que el resultado es 1.99, con lo que el riesgo relativo estimado es algo mayor que
el obtenido mediante la ecuacin que toma en cuenta los totales marginales. Esta sobrestimacin producida por el odds ratio hace aconsejable emplearlo con precaucin en las estimaciones del riesgo relativo, pues si el nmero de casos no es pequeo en comparacin con
los controles, se apartan excesivamente del mismo. Como ya se ha observado en la Seccin
[ 349 ]

8 a propsito de los pacientes con endocarditis, si se estima el riesgo relativo de los pacientes
sin insuficiencia renal con respecto a los que la presentan, el cociente se invertir y se tendr
RR = 1 / 1.63 = 0.61, que al ser menor que cero denota una menor mortalidad en el grupo
sin enfermedad renal. En este caso, el odds ratio tambin se invertir y ser igual a 1 / 1.99
= 0.50, ahora subestimando el riesgo relativo. Es decir, el odds ratio proporciona siempre
valores ms extremos que el riesgo relativo, al que sobrestima cuando ste es mayor que 1, y
subestima cuando es menor que 1.
Sin embargo, el odds ratio es una expresin sencilla y suficientemente segura del riesgo
relativo si se toman en cuenta las restricciones numricas para su clculo. Por lo dems, el
odds ratio, que relaciona los odds a favor de un suceso entre dos grupos, es de por s una
medida de la probabilidad y aparece en distintas reas de la teora estadstica, como se ha
mencionado ms arriba. En 12.5 se tratan algunos aspectos relacionados con su rol en la
regresin logstica.
Es interesante anotar aqu que el OR es el mismo si se calcula a lo largo de las filas segn
la exposicin, que si se calcula a lo largo de las columnas, segn se trate de casos o controles.
Esta simetra explica que el OR sea el mismo si se calcula para los casos (infarto) respecto
de expuestos y no expuestos, que si se calcula para la exposicin (dislipemia) en casos y
controles. Puede decirse que el OR es una medida de asociacin entre las dos variables de la
tabla, y numricamente es irrelevante con respecto a cul de stas se calculen los odds. Tambin puede verse en (16.11), que el OR puede calcularse de la tabla en forma muy sencilla,
multiplicando en cruz y dividiendo los productos (por lo que suele denominarse cross ratio).
16.8. Evaluando la significacin estadstica del odds ratio

De no haber diferencias entre los odds, el OR para el estudio caso-control ser igual a 1,
y como estima el riesgo relativo de enfermedad (infarto) en presencia de exposicin (dislipemia), un OR = 1 significar que la expectativa de enfermedad es la misma tanto en presencia
como en ausencia del factor de riesgo o exposicin. En el ejemplo, un OR = 2.70 como el
obtenido ms arriba, significa que una paciente dislipmica tiene chances de desarrollar un
infarto en razn de 2.70 a 1 con respecto a los controles normolipmicos. Si en (16.11) se
invierten numerador y denominador, se obtiene un OR = 1 / 2.70 = 0.37, que expresa las
chances de infarto en el grupo sin dislipemia con respecto al grupo dislipmico, y por ser menor que 1, seala un efecto protector de los lpidos normales con respecto a la dislipemia.
Para evaluar la significacin estadstica de un odds ratio, se debe poder demostrar que difiere
significativamente de 1, que es el valor de la hiptesis nula. Una forma habitual de presentar
los resultados de la prueba de significacin en este tipo de estudios, es dar los lmites de
confianza superior e inferior del OR hallado, y rechazar la hiptesis nula siempre que el 1
quede por fuera de dichos lmites.
El clculo de los lmites de confianza para el valor del OR estimado, que son los lmites
para el riesgo relativo, es algo complejo porque los odds no estn normalmente distribuidos y
debe trabajarse con sus logaritmos naturales, que tienen una distribucin aproximadamente
normal y permiten aprovecharla para calcular los lmites asociados al nivel de confianza
deseado. Como en otras oportunidades, los lmites se calculan para un nivel de confianza
elegido, por ejemplo del 95%, lo que implica un nivel de significacin P = 0.05.
[ 350 ]

En el ejemplo, los lmites de confianza del 95% para OR = 2.70, son 1.73 y 4.22. Como
con los datos del ejemplo la probabilidad del OR de exhibir valores por fuera de esos lmites
es de slo el 5%, se acepta que el OR hallado difiere significativamente de 1 y se rechaza la
hiptesis nula, afirmndose que el riesgo de padecer un infarto de miocardio es significativamente mayor en las mujeres expuestas a la dislipemia, con un nivel P 0.05. A continuacin
se da una breve resea, a modo de ilustracin, de uno de los mtodos para el clculo de los
lmites de confianza para el OR, aunque stos pueden obtenerse directamente de los paquetes
estadsticos corrientes.
Clculo de los lmites de confianza para el odds ratio muestral

Dado que como se mencion, el logaritmo de los odds tiene distribucin aproximadamente normal, se trabaja con el logaritmo natural del odds ratio, ln (OR). En esta nueva
escala, la varianza del logaritmo del OR es:

Var [ln (OR)] = 1/a + 1/b + 1/c + 1/d

(16.12)

siendo a, b, c y d el nmero de individuos en cada celda, en tablas como la 16.2. El desvo


estndar (DS) es la raz cuadrada de la varianza:

DS [ln (OR)] = Var (ln OR)

(16.13)

y los lmites de confianza para el 95% se aproximan mediante la distribucin normal tomando z = 1.96, siempre sobre la transformacin logartmica:

ln (Lmite inferior) = ln (OR) 1.96 DS [ ln (OR )]


ln (Lmite superior) = ln (OR) + 1.96 DS [ ln (OR )]

Con los datos vistos para el infarto de miocardio y la dislipemia se tiene:



y

con lo que:

ln (OR) = ln 2.70 = 0.9933


Var [ln (OR)] = 1/34 + 1/414 + 1/51 + 1/1677 = 0.052
DS [ln (OR)] = 0.052 = 0.228
ln (Lmite inferior) = 0.9933 (1.96 0.228) = 0.5464
ln (Lmite superior) = 0.9933 + (1.96 0.228) = 1.4402

y para volver a los valores originales, deben obtenerse los correspondientes antilogaritmos:

Lmite inferior = antilog 0.5464 = 1.73


Lmite superior = antilog 1.4402 = 4.22

que son los valores anticipados ms arriba.

[ 351 ]

16.9. Odds ratios, factores de riesgo y marcadores de enfermedad


Se ha dicho que la evaluacin de las asociaciones entre patologas y factores de exposicin es una de las tareas tpicas de la epidemiologa, y la estimacin del riesgo es uno de
los objetivos principales. En todas esas situaciones, las estimaciones del riesgo relativo,
entre las cuales el odds ratio es muy utilizado, dan idea del aumento (o disminucin) de
las probabilidades de desarrollar la enfermedad en el grupo expuesto con relacin al no
expuesto. Cuando el odds ratio difiere significativamente de la unidad, se puede rechazar la
hiptesis nula de riesgos iguales y aceptar un efecto de la exposicin sobre la probabilidad
de enfermedad. Estos resultados permiten conocer aspectos epidemiolgicos de la enfermedad y sus relaciones con distintos factores de exposicin. As, est bien establecida la
importancia de los llamados factores de riesgo en la enfermedad cardiovascular, hecho que
se repite en las distintas reas de la medicina, en las que diversos factores de riesgo han sido
demostrados con amplios niveles de confianza. Esto ha llevado a emplear muchos factores
de riesgo como marcadores de enfermedad, es decir, como indicadores de la presencia o
desarrollo futuro de la enfermedad. Sin embargo, para que un factor de riesgo sea eficaz
para clasificar a los individuos de acuerdo a su estado de salud o enfermedad, actual o futuro, el correspondiente odds ratio debe exhibir valores que estn muy por encima de los
habitualmente hallados en los estudios epidemiolgicos (cf. Pepe y col, 2004). Esto tiene
una gran relevancia en vista de la tendencia a emplear diversas pruebas clnicas, en general
de laboratorio, como indicadores o marcadores de enfermedad, y se comenta brevemente a
continuacin.
Se ha visto ms arriba que la dislipemia se halla asociada con el infarto de miocardio
en mujeres jvenes, con un OR = 2.70. Si ahora se examina la Tabla 16.1, se observar que
34 entre 448 casos de infarto presentaban dislipemia, con lo cual, si la dislipemia se toma
como marcador de infarto, se tiene que su sensibilidad es igual a 34 / 448 = 8% (ver Seccin
14), notablemente baja para detectar la enfermedad en forma eficiente. Con la especificidad
las cosas mejoran, calculndose en 1677 controles (sin infarto) no dislipmicos entre 1728
controles en total, esto es, 1677 / 1728 = 97%. Como se aprecia, un odds ratio igual a 2.70,
estadsticamente significativo, no garantiza un buen rendimiento de la dislipemia como marcador de enfermedad en la poblacin estudiada. Sin embargo y muy importante, el aumento
de las chances de infarto de miocardio por la presencia de dislipemia es un dato de tipo epidemiolgico que tiene su valor intrnseco y ha quedado bien demostrado en el estudio.
Como segundo ejemplo, un test ecocardiogrfico de esfuerzo dedicado a la deteccin de
la enfermedad coronaria como el mencionado en el Ejemplo 14.1, con una sensibilidad del
68% y una especificidad del 90%, producir por trmino medio 68 resultados verdaderos positivos entre 100 sujetos enfermos, y 90 resultados verdaderos negativos entre 100 individuos
sanos. Disponiendo estos datos en una tabla de 2 2 y completando las casillas, se tendr:
Enfermos

Sanos

Test positivo

68

10

78

Test negativo

32

90

122

Totales

100

100

200

[ 352 ]

Totales

de donde el odds ratio se obtiene como (68 90) / (32 10) = 19, que es un valor muy grande
a pesar de la apenas moderada sensibilidad de la prueba. Por ltimo, de la Tabla 14.1 puede
calcularse fcilmente, multiplicando en cruz y dividiendo segn (16.11), que un test con sensibilidad y especificidad iguales al 90% implica un odds ratio igual a 81. Estos altos requerimientos para poder clasificar los individuos como sanos o enfermos con aceptable exactitud,
explican porqu los niveles de asociacin entre enfermedad y factores de riesgo detectados en
muchos estudios epidemiolgicos, si bien permiten relacionar enfermedad y factor, no son suficientes para clasificar a los individuos segn su estado de salud o enfermedad. En resumen,
si bien los factores asociados con mayor riesgo de enfermedad ayudan al conocimiento de la
misma y a su eventual prevencin y tratamiento, para actuar eficazmente como marcadores
de enfermedad deben exhibir odds ratios mucho mayores que los habitualmente requeridos
para demostrar asociacin. En otras palabras, el logro de los estudios epidemiolgicos de
establecer asociaciones significativas entre enfermedades y factores de exposicin, permite
en forma indudable aumentar los conocimientos y recursos mdicos, inclusive en el rea
preventiva; sin embargo, para la deteccin de la enfermedad y la clasificacin eficaz de los individuos segn su presencia o ausencia, son necesarios pruebas o tests que rindan odds ratios
mucho mayores que los habitualmente manejados en los estudios corrientes de exposicinenfermedad. La evaluacin de tales pruebas debe realizarse con los mtodos adecuados, que
se describen en la seccin 14.
16.10. Combinaciones de tablas pertenecientes a varios subconjuntos. Mtodo de Mantel
y Haenszel
En oportunidades, un mismo estudio de tipo caso-control puede llevarse a cabo en diferentes grupos de pacientes o en diferentes subconjuntos de un grupo mayor (por ejemplo, en
varones y mujeres por separado), y muchas veces se desea obtener una estimacin global del
riesgo relativo para el conjunto que resulta de acumular todos los datos. Dentro de los mtodos disponibles para tal objeto, el de Mantel-Haenszel es particularmente utilizado, entre
otras cosas, por su buena tolerancia cuando las frecuencias en algunos de los subgrupos son
relativamente pequeas (Mantel y Haenszel, 1959). Consiste en calcular los trminos (ai di)
y (bi ci) para cada subgrupo i, de la misma forma que en los estudios con un grupo nico
(16.11), y acumularlos como sigue para obtener el riesgo relativo del grupo amalgamado:
RR = (ai di / ni) / (bi ci / ni)

(16.14)

donde ni es el nmero de individuos en el grupo i. Existen varios mtodos para chequear la


significacin de este estimador, algo ms complejos que el esbozado ms arriba para el modelo no estratificado, y que se hallan disponibles para su aplicacin en los paquetes estadsticos
corrientes.
16.11. Apareamiento de casos y controles (matching)

Un tema recurrente en medicina es el control de variables ajenas al ncleo del estudio,
pero que se sabe que pueden influenciar y distorsionar los resultados por presentar distintos
grados de asociacin con las variables de inters que se estn estudiando. Tales variables no
[ 353 ]

son otra cosa que factores de exposicin como los vistos hasta aqu, pero cuyos efectos muchas veces son ajenos a los objetivos de la investigacin y cuya influencia sobre los resultados
de la misma en general se procura eliminar. Asimismo, al evaluar la influencia de un factor de
riesgo en la presentacin de una determinada enfermedad, es conveniente que otros posibles
factores (cofactores) como la edad, el sexo o la eventual presencia de distintas condiciones
fisiolgicas o patolgicas, se hallen distribuidos en forma similar en casos y controles, de
modo de balancear sus posibles efectos sobre ambos grupos. El procedimiento general es
procurar que casos y controles sean lo ms similares que sea posible en lo que se refiere a la
presencia de los factores cuya influencia se desea evitar. Un mtodo eficaz es elegir para cada
caso, un control que presente los mismos factores cuyos efectos sobre los datos se desean
neutralizar. En general, el emparejamiento o matching de casos y controles puede realizarse
para cualquier variable, en especial la edad, el sexo y aqullas condiciones que puedan tener
relevancia en la presentacin de la enfermedad en estudio, y as alterar las relaciones entre la
enfermedad y la exposicin de inters. Esto facilita el hallazgo de diferencias significativas,
atribuibles al factor de exposicin que se est investigando en cada oportunidad. A cambio
de esta ventaja, el emparejamiento renuncia a obtener informacin acerca de las variables
para las cuales se lleva a cabo: si los controles se eligen de la misma edad y sexo que los casos,
la influencia de estas dos variables en la incidencia de la enfermedad no podr ser evaluada
en el estudio.
Como se comprende, el emparejamiento de casos y controles segn ciertas variables, es
importante cuando esas variables estn asociadas a las enfermedades o a las exposiciones.
Por ejemplo, al estudiar la importancia de la exposicin a ciertos inhalantes en la incidencia
de enfisema pulmonar, puede ser importante aparear casos y controles segn sean o no fumadores, ya que esta condicin por s misma puede afectar la incidencia del enfisema pulmonar.
Este modelo, que permitir detectar con mayor eficacia los efectos de dichos inhalantes en el
enfisema, tendr como precio renunciar a obtener informacin acerca de la importancia del
tabaquismo en el enfisema pulmonar. Al respecto, cabe suponer que esta informacin es ya
conocida por los investigadores o, en todo caso, que no es el objeto del estudio. Asimismo,
una variable puede estar asociada con determinadas exposiciones de importancia y por ejemplo, la posesin de encendedores puede hallarse asociada con el hbito del cigarrillo, de modo
que la interpretacin de los resultados es siempre un punto crucial.

Debe tambin mencionarse un lmite para este tipo de procedimientos, y es que pueden
llevar a la subdivisin excesiva de los datos agotando el nmero de casos necesario en cada
clase para la obtencin de resultados consistentes. Adems, la necesidad de elegir casos y controles con las mismas caractersticas segn las cuales se realiza el emparejamiento, en general
limita las posibilidades de llevarlo a cabo para ms de unos pocos factores.
Para proceder con este tipo estudios, una vez apareados los casos y los controles, es
posible tabular cada par de acuerdo a la presencia o ausencia de exposicin en sus dos integrantes. Por lo tanto, en cada par de caso y control se podr dar: caso expuesto-control
no expuesto, caso no expuesto-control expuesto, ambos expuestos, ambos no expuestos
(Tabla 16.3).

[ 354 ]

Tabla 16.3. Estudio caso-control con datos apareados


Casos expuestos

Casos no expuestos

Controles expuestos

Total
c

Controles no expuestos

Total

Si bien las cuatro casillas de la tabla proporcionan informacin acerca de la exposicin,


el anlisis suele limitarse a los pares discordantes s y t (caso expuesto-control no expuesto
y caso no expuesto-control expuesto). Aunque no se examinar la demostracin, la razn
s/t formada por los pares discordantes arriba mencionados, estima el riesgo relativo de
enfermedad entre individuos expuestos y no expuestos en los estudios de caso-control apareados:
RR = s / t
(16.15)

La significacin estadstica del riesgo relativo as estimado se prueba frente a la hiptesis
nula s = t, que implica un riesgo relativo = 1. Cuando s t, el riesgo relativo indicado por el
cociente s / t es diferente de 1 e importa conocer si lo es en forma significativa.

La prueba de significacin consiste en determinar la probabilidad de hallar s / (s + t ) pares
discordantes, sabiendo que si s = t, dicha probabilidad ser P = 0.5 (por lo cual este es el valor
de la hiptesis nula). Esta evaluacin puede hacerse mediante el test de McNemar, que utiliza
la aproximacin de la distribucin binomial a la normal y una de cuyas expresiones es

z = | s t | / ( s + t )

(16.16)

donde z se distribuye como una variable normal estandarizada cuya probabilidad se obtiene
de las tablas de la distribucin normal. El numerador es la diferencia en valor absoluto, entre
los casos discordantes observados en s y en t, mientras que el denominador es la raz cuadrada
de su suma. Se recordar que para un nivel de significacin P = 0.05, z = 1.96, que es el valor
que debe alcanzar el test para resultar significativo en dicho nivel.

16.12. Variabilidad muestral, sesgo, factores de confusin y exposiciones

Los estudios de tipo caso-control vistos en los prrafos anteriores constituyen una clase
importante de estudio epidemiolgico, cuyo potencial puede extenderse al estudio del efecto
de distintos tratamientos, entendidos como exposiciones. En forma general, las causas que
pueden afectar la interpretacin de los resultados de los distintos procedimientos de inferencia estadstica y por lo tanto, los de los estudios caso-control, son la variabilidad muestral,
la presencia de diversos tipos de sesgo, y factores relacionados con las variables en estudio,
mencionados ms arriba como exposiciones y tambin llamados factores de confusin. La
variabilidad muestral, traducida en el llamado error de muestreo, es comn a los distintos
procedimientos que involucran muestras: su manejo se realiza a travs de distintos instrumentos orientados a limitarla y acotarla, algunos de los cuales han sido ya esbozados, como
[ 355 ]

el diseo de las muestras y la estimacin de intervalos de confianza mediante los procedimientos de inferencia estadstica (Seccin 6). Como en todas las reas de la inferencia estadstica, el problema de las comparaciones mltiples tiene la misma importancia y el mismo
potencial para producir un aumento de resultados significativos cuando la hiptesis nula es
en realidad verdadera, por lo que debe ser siempre tenido en cuenta (ver 10.3).
Por sesgo o tendencia se entiende una distorsin o desviacin sistemtica de los resultados
obtenidos, respecto de los correspondientes valores en la poblacin estudiada, y es frecuente
mencionarla con la palabra inglesa bias. Existen mltiples causas para su presentacin en los
estudios clnicos, y en los estudios de tipo caso-control puede originarse, entre otras posibilidades, al seleccionar los controles en poblaciones que no son comparables con aquella de la
que se obtuvieron los casos, en el diferente registro de las exposiciones en casos y controles,
o en errores en la clasificacin de casos y exposiciones. Por ejemplo, en pacientes con enfermedades cardiovasculares, es ms probable que las exposiciones conocidas como factores de
riesgo sean investigadas con ms profundidad que en controles cuyas historias provengan de
un consultorio de clnica general. De esta forma, la relacin entre la proporcin de expuestos
en el grupo cardiolgico y en los controles puede aparecer aumentada, por haber sido menos
investigada en los ltimos.
Con el trmino factores de confusin (confounding variables) se denominan aquellos
factores o variables que estn asociados a la vez con la enfermedad y con la exposicin, y
pueden de esa forma contribuir a la asociacin entre stas. Estos son los factores que frecuentemente requieren consideracin especial en los estudios caso-control y pueden hacer
necesario el emparejamiento o matching para controlarlos (ver ms arriba). A la par de su
tratamiento formal mediante tcnicas estadsticas como la estratificacin de las muestras y
el matching, el juicio mdico es fundamental en la interpretacin de los resultados. El sedentarismo puede estar asociado a una mayor incidencia de coronariopata (enfermedad), pero
tambin a una mayor tendencia a fumar y a un mayor grado de obesidad (exposiciones), de
donde resulta difcil adjudicar su parte como causa de enfermedad a cada uno de los distintos
factores, y si la evaluacin se centra en el rol del sedentarismo, el tabaco y la obesidad podrn
resultar factores de confusin. Como enseguida se comprende, la confusin por efecto de diversos factores puede ser notablemente complicada y tambin recproca, y por lo tanto difcil
de discernir en cada escenario clnico en particular.
Segn ha sido ya mencionado, la subdivisin de las muestras en estratos y la posibilidad
de matching se hallan limitadas en los estudios caso-control por la disminucin de casos en
cada estrato y por las dificultades para obtener controles que emparejen con los casos una
gran cantidad de factores de confusin. En general, slo ser posible comparar un factor o
exposicin de inters, y solamente se podrn controlar unos pocos factores relacionados. En
tanto, el hecho de que los estudios caso-control proporcionen estimaciones del riesgo relativo
basadas en odds, los emparenta con las tcnicas de la regresin logstica vistas en la Seccin
12, que permiten estimar el riesgo como variable binaria en funcin del logaritmo de los odds
o logit. En estos casos, introduciendo los distintos factores de inters entre las variables predictoras, el odds ratio para cualquiera de ellas se puede calcular de la ecuacin de regresin
(Seccin 12). Otros mtodos como la regresin mltiple y el mtodo de riesgos proporcionales de Cox, vistos en las secciones 11 y 15 respectivamente, resultan tiles para tratar de aislar
[ 356 ]

y evidenciar los efectos de los diferentes factores sobre distintos modelos orientados a estimar
el riesgo. Estos y otros mtodos multivariados, ayudan a remover los efectos de algunas variables para observar el de las restantes, controlando los efectos las aqullas y superando
las posibles limitaciones de los modelos caso-control.

Cuando la variabilidad muestral, los posibles sesgos y los factores de confusin han sido
controlados y pueden an detectarse efectos estadsticamente significativos relacionados con
las exposiciones en estudio, se tienen los resultados de inters para la investigacin. De este
modo podr afirmarse la asociacin de los diversos factores de exposicin, con las enfermedades o condiciones estudiadas.

Por ltimo, debe insistirse en que las consideraciones mdicas respecto de los hechos en
estudio son al menos tan importantes como los mtodos utilizados para el anlisis. El establecimiento de conexiones de causa-efecto entre los hechos observados pertenece al juicio de
los investigadores y est fundado en los conocimientos existentes acerca de tema en estudio.
Como en todas las aplicaciones de la estadstica, asociacin y correlacin no implican causalidad, y una asociacin fuerte entre un factor de exposicin y la incidencia de una determinada enfermedad no garantiza por s sola la existencia de una relacin causal entre exposicin y
enfermedad. Por otra parte, si existen motivos fundados para suponer la existencia de una relacin entre un determinado factor y una situacin clnica, la investigacin no debera abandonarse tras un estudio negativo, ya que puede deberse a insuficiente potencia de la prueba,
o a factores de confusin o sesgo, introducidos en el modelo. Solo el juicio mdico fundado
en un conocimiento slido de la materia investigada podr decidir acerca de las conclusiones
ms correctas y el camino a seguir.

Referencias
Afifi AA, Clark V. Computer-aided Multivariate Analysis. 3rd ed. Boca Raton, Florida: Chapman &
Hall/CRC; 1999.
Altman DG, Matthews JNS. Interaction1: heterogeneity of effects. BMJ 1996; 313: 486.
Altman DG, Bland JM. Generalization and extrapolation. BMJ 1998; 317: 409-410.
Altman DG, Machin D, Bryant TN, Gardner MJ (ed.). Statistics with Confidence: Confidence Intervals
and Statistical Guidelines. 2nd ed. London: BMJ Books, 2000.
Armitage P, Berry G. Statistical Methods in Clinical Research. 3rd ed. Oxford, England: Blackwell Science Ltd; 1994.
Baker SG. The central role of receiver operating characteristic (ROC) curves in evaluating tests for the
early detection of cancer. J Natl Cancer Inst 2003; 95: 511-515.
Bland M. An Introduction to Medical Statistics. 3rd ed. Oxford, UK: Oxford University Press; 2006.
Braunwald E, Zipes D, Libby P. Heart Disease. 6th ed. Philadelphia: W.B. Saunders Company; 2001.
Cox DR, Snell EJ. Analysis of Binary Data. 2nd ed. London, England: Chapman & Hall; 1992.
Diamond GA, Forrester JS. Analysis of probability as an aid in the clinical diagnosis of coronary artery
disease. NEJM 1979; 300: 1350-1358.
Diamond GA, Forrester JS. Clinical trials and statistical verdicts: probable grounds for appeal. Ann
Intern Med 1983; 98: 385-394.
[ 357 ]

Dixon WJ, Massey FJ, Jr. Introduccin al Anlisis Estadstico. 2da ed. Mexico: Libros McGraw Hill;
1973.
Dunn N, Thorogood M, Faragher B, de Caestecker L, MacDonald TM, McCollum C, Thomas S, Mann
R. Oral contraceptives and myocardial infarction: results of the MICA case-control study. BMJ
1999; 318: 1579-1583.
Feinstein AR. Clinical Biostatistics. 1st ed. St. Louis, Mo., USA: The C.V. Mosby Company; 1977.
Florey C du V. Sample size for beginners. BMJ 1993; 306: 1181-1184.
Freiman JA, Chalmers TC, Smith H, Jr., Kuebler RR. The importance of beta, the type II error and
sample size in the design and interpretation of the randomized control trial. Survey of 71 negative
trials. NEJM 1978; 299: 690-694.
Glantz SA. Biostatistics: how to detect, correct and prevent errors in the medical literature. Circulation
1980; 61: 1-7.
Gorry GA, Pauker S, Schwartz WB. The diagnostic importance of the normal finding. NEJM 1978; 298:
486-489.
Hanley JA, McNeil BJ. The meaning and use of the area under a receiver operating characteristic (ROC)
curve. Radiology 1982; 143: 29-36.
Harrel FE, Jr., Lee KL, Pollock BG. Regression models in clinical studies: determining relationships
between predictors and response. J Natl Cancer Inst 1988; 80: 1198-1202.
Hirano Y, Uehara H, Nakamura H, Ikuta S, Nakano M, Akiyama S, Ishikawa K. Efficacy of Ultrasound-assisted Stress Testing Using a Hand-carried Ultrasound Device for Diagnosis of Coronary
Artery Disease. J Am Soc Echocardiogr 2006; 19:536-539.
Hoel PG. Introduction to Mathematical Statistics. 5th ed. New York: Wiley; 1984.
Ingelfinger JA, Mosteller F, Thibodeau LA, Ware JH. Biostatistics in Clinical Medicine. 3rd ed. New
York: McGraw - Hill, Inc; 1994.
Kattan MW. Judging new markers by their ability to improve predictive accuracy. J Natl Cancer Inst
2003; 634-635.
Leung WC. Balancing statistical and clinical significance in evaluating treatment effects. Postgrad Med
J 2001; 77: 201-204.
Levy D, Labib SB, Anderson KM, Christiansen JC, Kannel WB, Castelli WP. Determinants of sensitivity
and specificity of electrocardiographic criteria for left ventricular hypertrophy. Circulation 1990;
81: 815-820.
Lusted LB. Decision-making studies in patient management. NEJM 1971; 416-424.
Mantel N, Haenszel W. Statistical aspects of the analysis of data from retrospective studies of disease. J
Nat Cancer Inst 1959; 22: 719-748.
Menard S. Applied Logistic Regression Analysis. Sage University paper series on quantitative applications on social sciences. 2nd ed. Thousand Oaks, CA.: Sage Publications, Inc.; 2000.
McPherson K. Statistics: the problem of examining accumulating data more than once. NEJM 1974;
501-502.
Markush RE. Levins attributable risk statistic for analytic studies and vital statistics. Am J Epidemiol
1977; 105: 401-406.
Matthews JNS, Altman DG. Interaction 2: compare effect sizes not P values. BMJ 1996; 313:808.
Matthews JNS, Altman DG. Interaction 3: how to examine heterogeneity. BMJ 1996; 313: 862.
Metz CE. Basic principles of ROC analysis. Semin Nucl Med 1978; 8: 283-298.
[ 358 ]

Modenesi JC, Ferreirs ER, Swieszkowski S, Nacinovich FM, Corts C, Cohen Arazi H, Kazelian L, Varini S, Ciruzzi M, Casab JH, en representacin investigadores EIRA-II. Predictores de mortalidad
intrahospitalaria de la endocarditis infecciosa en la Repblica Argentina: resultados del EIRA-II.
Rev Argent Cardiol 2005; 73: 283-290.
Mood AM, Graybill FA. Introduccin a la Teora de la Estadstica. 4 ed. Madrid: Aguilar; 1978.
Pampel F. Logistic Regression. A Primer. 1st ed. Thousand Oaks, CA.: Sage Publications, Inc.; 2000.
Passik CS, Ackermann DM, Pluth JR, Edwards WD. Temporal changes in the causes of aortic stenosis: a
surgical pathologic study of 646 cases. Mayo Clin Proc 1987; 62:119-23.
Pepe MS, Janes H, Longton G, Leisenring W, Newcomb P. Limitations of the odds ratio in gauging the
performance of a diagnostic, prognostic, or screening marker. Am J Epidemiol 2004; 159: 882890.
Peto R, Pike MC, Armitage P, Breslow NE, Cox DR, Howard SV, Mantel N, McPherson K, Peto J, Smith
PG. Design and analysis of randomized clinical trials requiring prolonged observation of each patient. I. Introduction and design. Br J Cancer 1976; 34: 585-612.
Peto R, Pike MC, Armitage P, Breslow NE, Cox DR, Howard SV, Mantel N, McPherson K, Peto J, Smith
PG. Design and analysis of randomized clinical trials requiring prolonged observation of each patient. II. Analysis and examples. Br J Cancer 1977; 35: 1-39.
Ransohoff DF, Feinstein AR. Problems of spectrum and bias in evaluating the efficacy of diagnostic tests.
NEJM 1978; 299: 926-930.
Rifkin RD, Hood WB, Jr. Bayesian analysis of electrocardiographic exercise stress testing. NEJM 1977;
297: 681-686.
Rodrguez ML, Dizeo C, Selva H, Brito M, Nordaby RA, Campo A, Garca Guiaz CA, Machado RA.
En presencia de valvulopata el ECG tiende a subestimar la masa ventricular izquierda: un resultado
de la fibrosis intersticial? Rev Argent Cardiol 2004; 72 (sup 3): 149.
Schroeder LD, Sjoquist DL, Stephan PE. Understanding Regression Analysis: An Introductory Guide.
1st ed. Newbury Park, CA: Sage Publications, Inc.; 1986.
Snedecor GW, Cochran WG. Mtodos Estadsticos. 5a ed. Mexico: Compaa Editorial Continental,
S.A.; 1970.
Talfryn H, Oakley D, Crombie IK, Tavakoli M. When can odds ratios mislead? BMJ 1998; 316: 989991.
Tukey JW. Some thoughts on clinical trials, especially problems of multiplicity. Science 1977; 198: 679684.
Turner JC. Matemtica Moderna Aplicada. Probabilidades, Estadstica e Investigacin Operativa. 1st
ed. Madrid: Alianza Editorial S.A.; 1974.
Vickers AJ, Altman DG. Analysing controlled trials with baseline and follow up measurements. BMJ
2001; 323: 1123-1124.
Wackerly DD, Mendenhall W, III, Scheaffer RL. Estadstica Matemtica con Aplicaciones. 6a ed. Mexico: Thomson; 2002.
Weissler AM. A perspective on standardizing the predictive power of noninvasive cardiovascular tests by
likelihood ratio computation: 1. Mathematical principles. Mayo Clin Proc 1999; 74: 1061-1071.
Weissler AM. A perspective on standardizing the predictive power of noninvasive cardiovascular tests by
likelihood ratio computation: 2. Clinical applications. Mayo Clin Proc 1999; 74: 1072-1087.
Zhang J, Yu KF. Whats the relative risk? JAMA 1998; 280: 1690-1691.
[ 359 ]

[ 360 ]

También podría gustarte