La Investigacion Biomedica y Sus Laberintos - Silva Ayçaguer

I
II LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS

III
LA INVESTIGACIÓN BIOMÉDICA Y
SUS LABERINTOS
EN DEFENSA DE LA RACIONALIDAD
PARA LA CIENCIA DEL SIGLO XXI
IV LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
V
Luis Carlos Silva Ayçaguer

Centro Nacional de Información de Ciencias Médicas. La Habana, Cuba
LA INVESTIGACIÓN
BIOMÉDICA Y SUS
LABERINTOS
EN DEFENSA DE LA RACIONALIDAD
PARA LA CIENCIA DEL SIGLO XXI
VI LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
«Esta obra ha sido publicada con una subvención de la Dirección General del Libro,
Archivos y Bibliotecas del Ministerio de Cultura, para su préstamo público en Bibliote-
cas Públicas, de acuerdo con lo previsto en el artículo 37.2 de la Ley de Propiedad
Intelectual».
Las Figuras 1.2, 1.3, 1.4, 1.5, 1.7, 1.8, 1.9, 1.12, 1.14, 1.16, 1.17, 1.19, 2.2, 2.4, 2.5, 2.6, 2.7,
2.9, 4.3, 4.4, 4.9, 4.11, 4.14, 4.17, 4.19, 5.2, 5.4, 6.3, 6.4, 6.6 y 6.8 fueron confeccionadas por
el autor. Las Figuras 1.10, 1.11, 1.18, 1.20, 2.1, 2.3, 2.8, 2.10, 4.12, 4.15, 5.1 y 6.7 fueron
realizadas por el autor en colaboración con Alejandro Escobar Palmer. Las Figuras 1.15, 3.1,
3.2, 3.3, 4.1, 4.2, 4.5, 4.6, 4.7, 4.8, 4.10, 4.16, 4.18, 6.1, 6.2 y 6.5 corresponden a retratos o
portadas de libros tomadas de Internet. La Figura 5.3 se ha tomado de tomado de Schulz y
Grimes (2005) y la 4.13 de Schulz y Katime (2003). El autor de la Figura 1.6 es Anthony Flores
(tomada de PLoS Medicine) y la Figura 1.13 se incluye por gentileza de Mariano Ferreyra
(«Salvador», www.salvadorhumor.com.ar).
© Luis Carlos Silva Ayçaguer, 2009

Reservados todos los derechos.
«No está permitida la reproducción total o parcial de este libro, ni su

tratamiento informático, ni la transmisión de ninguna forma o por cualquier
medio, ya sea electrónico, mecánico por fotocopia, por registro u otros
métodos, sin el permiso previo y por escrito de los titulares del Copyright.»
Ediciones Díaz de Santos

Internet: http//ediciones.diazdesantos.es
E-mail: ediciones@diazdesantos.es
ISBN: 978-84-7978-896-4
Depósito Legal: M. 44.544-2008
Fotocomposición: P55 Servicios Culturales

Diseño de cubierta: P55 Servicios Culturales
Impresión: Fernández Ciudad
Encuadernación: Rústica-Hilo
Printed in Spain - Impreso en España

VII
A Maite, por aparecer.
A mi amigo Urra, por estar siempre cuando y

donde hace falta.
A mi hijo Daniel, por recordarme a diario lo

que de veras importa.
VII
VIII LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
IX
Hay quienes observan la realidad tal cual es

y se preguntan por qué, y hay quienes imaginan
la realidad como jamás ha sido
y se preguntan por qué no.
BERNARD SHAW
IX
X LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
XI
Índice
Prólogo ............................................................................................. XIX
Introducción ................................................................................ XXVII
1. Incultura científica: una amenaza en la

sociedad contemporánea ......................................................... 1
– La incultura científica de la sociedad ................................... 1
– Ciencia versus tecnología ......................................................... 3
– La epidemia de la prescripción .............................................. 5
– Viaje al centro de la depresión .............................................. 6
Un fabuloso negocio basado en una hipótesis
dudosa ............................................................................... 6
Lo que se dice, lo que se oculta................................................ 9
Una parte de la verdad ........................................................ 13
– ¿Dr. Yekyll or Mr. Hyde? ...................................................... 23
El precio de los medicamentos y la promoción
de la enfermedad ............................................................. 25
El engaño publicitario .......................................................... 32
Apostando a posteriori ....................................................... 35
Un fraude letal ..................................................................... 42
– El conocimiento como mercancía ...................................... 47
XI
XII LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
– El nuevo conocimiento ¿vuelve a ser de todos

y para todos? ........................................................................... 52
– Internet: un recinto de contradicciones ............................. 55
Comunicación vertical y horizontal ........................................ 58
Navegar y aportar ................................................................ 59
Cantidad y calidad de la información ................................... 64
Alfabetización informática e incultura de la
sociedad ............................................................................ 69
Solidaridad con Brian .......................................................... 70
– El discernimiento crítico anestesiado ................................ 75
Credulidad y superchería ...................................................... 75
El retorno de los charlatanes ................................................ 79
El poder oculto de la casualidad ........................................... 83
Ingenuidad frente a la prensa................................................ 91
Anexo 1.1. .................................................................................. 101
Bibliografía ................................................................................. 110
2. Imposturas y sinrazones en el diálogo

científico .................................................................................... 111
– El laberinto postmoderno: de la deconstrucción
al delirio ................................................................................. 112
Apuntes para una antología del desatino ........................... 112
El nuevo desorden internacional ......................................... 118
El affaire Sokal ................................................................ 119
El rey desnudo .................................................................... 122
Después del affaire ............................................................ 125
– Claves básicas para una epistemología útil ..................... 128
– Las pautas para el debate científico .................................. 129
El poder de las pirámides... y del debate ............................ 129
El lenguaje.......................................................................... 132
La lógica del debate y los instrumentos
demarcatorios en la ciencia ............................................. 139
Los criterios de autoridad ................................................... 145
ÍNDICE XIII
El legado de Ronald Fisher ................................................ 151

Reglas básicas luego de la excursión piramidal ................... 154
– Mensaje final a los dogmáticos contemporáneos ........... 155
Bibliografía ................................................................................. 158
3. El camino hacia el nuevo conocimiento .......................... 163

– El problema de investigación ............................................ 164
– Las preguntas y los objetivos ............................................. 166
Un periplo tortuoso............................................................. 167
¿Qué aporta realmente este estudio? .................................... 169
El error más frecuente......................................................... 172
Cuando se confunden resultados y conclusiones ...................... 174
– Valoración de tecnologías médicas emergentes .............. 177
¿Toda propuesta tecnológica merece
ser evaluada? ................................................................. 177
El efecto placebo ................................................................. 179
Compro hipótesis, pero junto con los
métodos para evaluarlas ................................................ 182
– Dialéctica de lo objetivo y lo subjetivo ........................... 183
La objetividad como aspiración ........................................... 184
Las fábulas, la realidad ..................................................... 184
Subjetividad no equivale a arbitrariedad ............................ 186
Falsa objetividad ................................................................ 191
Los límites de la estadística como garantía
de objetividad ................................................................ 194
La metodología cualitativa ................................................. 198
Probabilidades subjetivas: cuando un erudito
se equivoca ..................................................................... 201
Bibliografía ................................................................................. 206
4. Los enemigos de la ciencia .................................................. 209

– Pseudociencia ....................................................................... 210
– Disociación entre creencia y evidencia ............................ 213
XIV LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
– Un dislate bíblico ................................................................. 219

Acerca de un acertijo ........................................................... 219
Nace un bestseller ............................................................... 221
El método de las secuencias equidistantes ........................... 222
Netanyahu no es asesinado ................................................. 225
Hágase el negocio, y el negocio se hizo ................................. 227
Moby Dick entra en acción ................................................. 229
La refutación estadística ..................................................... 232
Drosnin y el premio Nobel ................................................. 235
Epílogo del dislate .............................................................. 235
– Alternativa médica y medicina alternativa ...................... 236
– Homeopatía: un paradigma de acientificidad ................. 241
Orígenes y principios generales de la
homeopatía .................................................................... 242
Los fármacos homeopáticos ................................................. 245
Una tautología salvadora para salir del
laberinto ........................................................................ 251
El episodio de los basófilos ................................................. 256
Arremetiendo contra la objetividad ..................................... 260
– El fraude científico: una larga lucha contra la vileza .... 261
Algo de historia pasada y reciente ....................................... 263
Tentaciones del hombre común ............................................. 266
– El fraude bajo la pupila detectivesca de la
estadística ........................................................................ 268
Un ejercicio básico ............................................................... 271
Cyril Burt traicionado por la estadística ............................. 273
Un fraude siniestro que pudo haber sido
estadísticamente neutralizado ........................................ 276
Ley de Benford: cuando los números toman
vida propia .................................................................... 279
Anexo 4.1 ................................................................................... 285
Bibliografía ................................................................................. 286
ÍNDICE XV
5. Adocenamiento y ceremonias metodológicas ................... 293

– Rituales en epidemiología................................................... 294
– La instalación de los rituales .............................................. 296
– Huellas mentales en relación con el riesgo
y la causalidad ...................................................................... 297
Asociación .......................................................................... 299
Control de factores confusores .............................................. 300
– El misticismo ataca a los ensayos clínicos ...................... 301
Plegarias terapéuticas ......................................................... 302
Las pruebas de significación en auxilio del absurdo ..................... 306
Una diferencia significativa pero insignificante ................... 310
Una vuelta de tuerca adicional ........................................... 311
Epílogo sorprendente .......................................................... 314
– Los modelos multivariados ................................................ 315
– Explicación y predicción .................................................... 316
– Una ceremonia encumbrada ............................................... 316
El esquema de la ceremonia ................................................ 317
Cuándo y por qué su aplicación es infructuosa .................... 319
Stepwise suele ser unwise ................................................ 322
Los números no saben de donde vienen ............................... 324
Espacio para el sentido común ............................................ 328
– Tamaño de muestra ............................................................. 330
El problema ....................................................................... 330
Falsas soluciones ................................................................. 331
Cuando se tropieza con la verdad ....................................... 333
– Fichas técnicas en las encuestas de prensa ..................... 334
Mi primer encontronazo ..................................................... 335
Clonando la estafa ............................................................. 338
Bibliografía ................................................................................. 341
6. Valores p y pruebas de significación

estadística: fin de una era .................................................... 347
– Una historia turbulenta ....................................................... 349
XVI LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
Antecedentes ....................................................................... 350

Los padres de la estadística se divorcian ............................. 351
Historia después de la historia ........................................... 355
– El valor p: definición y falacias ......................................... 356
Definición de p ................................................................... 357
Transposición de condicionantes y otras
interpretaciones fantasiosas ........................................... 360
– Valoración estadística de hipótesis ................................... 365
Propuesta de Fisher: las pruebas de
significación ................................................................... 365
Enfoque de Neyman-Pearson: las pruebas
de hipótesis .................................................................... 368
Enfoque híbrido: método combinado ................................... 369
Naturaleza irreconciliable de los enfoques
originales ....................................................................... 371
– Valores p y tamaños de muestra ........................................ 372
– La lupa crítica sobre las PSE ............................................. 374
La nulidad siempre puede ser rechazada ............................ 375
Enfoque arbitrariamente binario ........................................ 380
Solucionando el problema equivocado ................................. 384
Carácter descontextualizado del análisis ............................ 389
Pseudo objetividad .............................................................. 395
– Algunas consideraciones puntuales .................................. 398
Maldad de ajuste ................................................................ 398
Grupos no balanceados ....................................................... 400
Problema de las comparaciones múltiples ............................ 401
Valoración de coeficientes de correlación o
concordancia .................................................................. 403
– Sumisión y rebelión ante la dictadura del 0,05 ............... 406
– Situación actual de las PSE ............................................... 409
¿Empate técnico? ................................................................ 410
Nuevas políticas editoriales ................................................ 410
¿Por qué sobrevive el ritual de los valores p? ...................... 413
ÍNDICE XVII
– Los intervalos de confianza como sucedáneos ............... 418

La definición del intervalo de confianza ............................. 419
Intervalos de confianza y tamaños muestrales ..................... 424
– Introducción a la racionalidad bayesiana ......................... 426
El reverendo Bayes ............................................................. 427
El enfoque bayesiano: una mirada global ........................... 429
La versión más simple del Teorema
de Bayes ........................................................................ 433
Mirando un error clásico desde la
perspectiva bayesiana ..................................................... 439
El ejemplo clásico de la sensibilidad y la
especificidad ................................................................... 442
El enfoque bayesiano y la tarea del
investigador ................................................................... 445
Bayes y la subjetividad ........................................................ 448
Aplicaciones del enfoque bayesiano ..................................... 450
Anexo 6.1 ................................................................................... 455
Anexo 6.2 ................................................................................... 457
Anexo 6.3 ................................................................................... 464
Anexo 6.4 ................................................................................... 467
Bibliografía ................................................................................. 468
Índice onomástico ....................................................................... 481
Índice de materias ....................................................................... 489

XVIII LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
XIX
Prólogo
El error ignora la crítica, la mentira le teme;

la verdad nace de ella.
JOSÉ INGENIEROS
El lenguaje ha de ser matemático, geométrico, escultórico.

JOSÉ MARTÍ
Estas dos profundamente reveladoras citas notables capturan,

en la modesta opinión de este prologuista agradecido por la defe-
rencia de serlo en esta ocasión, la singularidad de contenido y for-
ma en el nuevo y fecundo libro de Luis Carlos Silva Ayçaguer que
el lector tiene hoy en sus manos. Se trata, ésta, de una obra esen-
cialmente pedagógica en su deconstrucción temática, en la que su
autor nos invita a una excursión reflexiva por los rumbos de la in-
vestigación biomédica o, más bien, por sus acechantes y ubícuos
laberintos. La primera cita, la de José Ingenieros —familiar, sin duda,
entre la legión de asiduos lectores-alumnos de Silva, pues ha sido
invocada ya en Cultura estadística e investigación científica en el campo de
la salud: una mirada crítica1, otro de sus excelentes libros y en buena
1
Silva Ayçaguer LC. Cultura estadística e investigación científica en el campo de la salud: una
mirada crítica. Madrid: Ediciones Díaz de Santos, 1997.
XIX
XX LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
parte, como el mismo autor admite, precursor del actual— alude

directamente a los cuatro componentes temáticos fundamentales
en este novedoso libro: 1) un ideal científico, genuino e irrenuncia-
ble: la búsqueda de la verdad y su belleza; 2) un arma poderosa y
contundente cuando, como el lector inambiguamente comprobará
en Luis Carlos, la esgrimen manos —y neuronas— legitimadas por
el irremplazable criterio de la práctica: la vocación crítica, auténti-
co poder de discernimiento; 3) una vulnerabilidad tenaz, proteica,
omnipresente: el error y sus determinantes la mediocridad, la im-
provisación, la falla de rigor científico; y, 4) un enemigo mortal: la
mentira —subrepticia o pomposa— siempre fraudulenta, genera-
dora de pseudo-ciencia, pseudo-científicos y sus evitables y ver-
gonzosas consecuencias para la sociedad.
La segunda cita, la del apóstol Martí, cae como anillo al dedo a
la hora de juzgar la impecable prosa de Silva en este libro. En su
intencionalidad metafórica, lejos de anunciar una previsible expo-
sición narrativa dominada por ecuaciones, fórmulas y símbolos ma-
temáticos, la referencia martiana alude a la precisión en la palabra
escrita: «la idea ha de encajar exactamente en la frase, tan exacta-
mente que no pueda quitarse nada de la frase sin quitar eso mismo
de la idea.» Éste es, precisamente, un rasgo distintivo en toda la
obra de Luis Carlos Silva, fértil producto de la permanente puesta
en práctica de aquella máxima que revela que «escribir fuerza a
pensar» y habla con elocuencia de su legítima vocación docente.
Inevitable reconocer, así, la preocupación y la sensibilidad del au-
tor por los valores estéticos inherentes a tal práctica, propias de las
artes liberales, que no es sino la forma culta —noble, consecuente,
legítima— de hacer ciencia.
Pero es la racionalidad la que ocupa el lugar previsiblemente
más protagónico en este libro y, trascendiendo sus páginas, en la
auténtica definición de la producción científica de conocimiento
biomédico. Es la facultad de la razón humana —la cualidad de lo
racional— el conducto para la verdad y el soporte para la crítica en
PRÓLOGO XXI
la actividad científica; es también la racionalidad el conjuro contra

el error y —si y sólo si se apoya en la integridad del ethos científi-
co— contra el fraude. Silva desarrolla con éxito, un persuasivo y
elegante discurso apologético sobre la racionalidad; esto es, en de-
fensa y elogio al poder del discernimiento intelectual en la investi-
gación científica en salud.
Richard Feynman, el gran físico norteamericano, Premio Nobel
en 1965, describió al científico como un acróbata caminando en
equilibrio por las «hermosas cuerdas flojas de la lógica», recono-
ciendo que la consecuencia con los principios lógicos «es la prueba
más terrible de la capacidad humana de razonamiento» hacia el fin
supremo de esta «aventura» que es el «gozo por la belleza de la
verdad» descubierta.2 El mítico Albert Einstein, Nobel de Física 44
años antes que Feynman, ya había advertido otro rasgo característi-
co de la racionalidad en ciencia: la mentalidad intuitiva, tan rele-
vante como la lógica o, llamada así, mentalidad racional3. Destácanse,
pues, intuición y lógica científicas como los elementos —subjetivo
y objetivo— que definen y dan cuerpo a la racionalidad. Y, como
deja claro el profesor Silva en este libro, sientan las bases para ge-
nerar el saludable escepticismo crítico que aspira o debe aspirar a
tener entre sus miembros toda sociedad científicamente culta.
Desde una perspectiva más instrumental, no por ello secunda-
ria, la estadística cumple un rol insoslayable en el ejercicio de la
racionalidad y la generación de escepticismo crítico en la comuni-
dad científica biomédica. Como lo ha subrayado con elocuencia
recientemente Nassim Taleb4, un destacado profesor de Ciencias
de la Incertidumbre de la Universidad de Massachusetts en Amherst,
autor de dos extraordinarios libros —Fooled by Randomness y The Black
2
Feyman RP. The meaning of it all: thoughts of a citizen-scientist. Massachusetts: Perseus
Books , 1998.
3
«The intuitive mind is a sacred gift and the rational mind is a faithful servant. We have
created a society that honors the servant and has forgotten the gift».
4
Véase: http://www.edge.org/3rd_culture/taleb08 taleb08_index.html
XXII LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
Swan— la estadística y las ciencias probabilísticas aplicadas son el

núcleo del conocimiento, la «lógica de la ciencia», las «herramientas
aplicadas de la epistemología». Y, sin embargo, los recursos estadís-
ticos —en una de las dos acepciones etimológicas de laberinto (i.e.,
lábrys) que da el gran Umberto Eco— son literalmente un «arma de
doble filo»: no podemos ser intelectuales modernos y no pensar
probabilísticamente, pero ocasionalmente la estadística nos engaña
y puede hacernos quedar muy, pero muy mal. Este libro contiene
una convincente, pródiga y aleccionadora —diría que hasta hila-
rante, si no fuese dramática— cuidadosa selección de casos reales
que conforman un inestimable cuerpo de evidencia en ambos sen-
tidos —y bien afilados los dos, fruto de una igualmente abundante,
prolija y muy actualizada búsqueda bibliográfica.
Nada mejor pues, que la perspectiva de un profesional de la es-
tadística —un insider— para apreciar la honesta urgencia de defen-
der la racionalidad en la investigación biomédica en el vertiginoso
escenario actual y la no menos urgente necesidad de generar escep-
ticismo crítico para ir creando cultura estadística en la sociedad. Y
he aquí otro singular atributo del libro que Ud., lector, tiene en sus
manos: el autor de este libro es, ni más ni menos, un consumado
matemático-estadístico y, para mayores señas, muestrista, acadé-
mico e investigador reconocido. En esta su apología de la raciona-
lidad en la investigación biomédica de cara al futuro, Luis Carlos
hace, en mi opinión, una magistral denuncia del relativismo
epistémico o cognitivo, esa posición radical del post-modernismo
para el cual la objetividad de la ciencia moderna no es más que una
mera convención social, un «mito», y pone en evidencia el abuso
científico que sus seguidores practican al apelar al lenguaje delibe-
radamente oscuro y pomposo, la falsa analogía, la mistificación
metafórica, la tergiversación de ideas y conceptos científicos y otras
características de la pseudociencia. En una avenida distinta, pero
también legítima y racionalmente crítica, el libro exhibe una singu-
laridad claramente percibible en su quinto capítulo, dedicado a des-
PRÓLOGO XXIII
entrañar las ceremonias metodológicas y, en particular, los rituales

epidemiológicos, con que se van decorando y, no pocas veces, de-
bilitando inadvertidamente los fundamentos de la actividad cientí-
fica.
Igualmente magistral es el tratamiento crítico que el libro dedica
al sempiterno tema de las pruebas de significancia estadística (PSE):
el lector es testigo de una estocada mortal a las PSE aunque, para
ello, el autor recurra a una exposición más formal de argumentos
estadístico-matemáticos que contrasta con el carácter más colo-
quial del resto de la obra. No deja de llamar la atención la implaca-
ble y sustentada crítica hecha aquí precisamente por Luis Carlos,
acostumbrados como solemos estar al panegírico sobre las PSE como
expresión máxima de la estadística inferencial, por parte de nues-
tros colegas estadísticos. Ello habla —y bien— de la incondiciona-
lidad e insubordinación de su poder de discernimiento, lógico, ra-
cional. Lo mejor de este capítulo es que no se queda en la crítica;
ajeno a cualquier talante destructivo, el libro aquí también
deconstruye para luego recomponer propositivamente el tema. La
introducción temática al paradigma bayesiano —en su más pura
acepción Kuhniana— a la estadística bayesiana, o inferencia racio-
nal, como allí se describe, es magnífica y, quizá, el único reclamo
que podemos hacerle al autor es que nos deje con la miel en los
labios. De hecho, un tratamiento exhaustivo de la estadística
bayesiana y sus aplicaciones en la investigación biomédica y en sa-
lud pública bien merecería ser sujeto específico del próximo libro
que nos brinde Luis Carlos.
Los laberintos de la investigación biomédica —esas hachas de
doble filo y también esas labras o caminos tortuosos, cavernosos,
desorientadores y difíciles— sobre los que Luis Carlos nos llama a
la atención aquí, no son únicamente epistemológicos, ni concep-
tuales, ni metodológicos. Son también oscuros laberintos del mer-
cado, del comercio, de la ética, de los intereses para-, extra- y pseudo-
científicos. Gran parte de esos laberintos para la ciencia, los cientí-
XXIV LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
ficos y la sociedad son obra y gracia de un peculiar conglomerado

de individuos inescrupulosos y ubíquitos a quienes la comunidad
académica anglosajona identifica como bullshitters. Harry Frankfurt,
destacadísimo profesor emérito de filosofía de la prestigiosa Uni-
versidad de Princeton, en Nueva Jersey, Estados Unidos, los define
como farsantes y falsos que intentan, por medio de lo que dicen,
manipular las opiniones y actitudes de aquellos a quienes se dirigen.
A ellos les importa fundamentalmente que lo que digan sea efectivo
para consumar tal manipulación. En consecuencia, los bullshitters
son indiferentes, en mayor o menor medida, a si lo que dicen es
verdad o es falso. De acuerdo a este filósofo, el bullshit es una ame-
naza más insidiosa que la mentira para el conducto de la vida civi-
lizada: ser indiferente a la verdad es una característica indeseable y
hasta reprensible y, por tanto, el bullshitting debe ser evitado y con-
denado5.
En última instancia, me atrevería a apuntar, es el lector el verda-
dero protagonista en esta obra: es inevitable sentir la imperiosa ne-
cesidad de auto-examinarse y revisar nuestras propias prácticas cien-
tíficas al finalizar su lectura honesta. Este libro de Luis Carlos Silva
nos ofrece, en definitiva, la preciosa oportunidad de ser más cultos,
más escépticos, más críticos, más racionales, más éticos y más rigu-
rosos con nuestra propia contribución a la ciencia y la investigación
biomédica. Huelga destacar el mérito intrínseco que, por su rele-
vancia en el contexto actual —globalizado, mercantilizado,
internetizado, tecnologizado, despersonalizado, inequitativo— tie-
ne una oportunidad como ésta para transitar más segura y
exitosamente por los cada vez más complicados y sombríos labe-
rintos de la investigación en salud.
5
Véase, por ejemplo: Frankfurt HG. On bullshit. Princeton: Princeton University Press
2005; y también: Frankfurt HG. On truth. New York: Alfred A. Knopf, 2006.
PRÓLOGO XXV
En el centro —que no en el final— de todo laberinto6 está la

incontrastable belleza de la verdad. Y la verdad no sólo motiva
nuestra curiosidad, ni sólo nos libera de la duda, ni sólo nos rescata
de la banalidad. La verdad permite reconocer nuestra propia identi-
dad y, por sobre todo, hace a nuestras sociedades funcionales y ro-
bustas.
ÓSCAR J. MÚJICA, MD
PAHO/WHO
Washington DC.
Septiembre 2008
6
De todo laberinto, incluyendo los de la portada de este libro, obras de un querido
epidemiólogo y escultor gallego. Insatisfecho el yo-epidemiólogo con ese transitar continuo
y agobiante por los laberintos de la ciencia, el yo-escultor se dedica a trazarlos en sus
momentos de divagación fantástica y creadora: los recorre a ambos, con deseo y con temor,
pues sabe bien que le llevan al centro de sí mismo.
XXVI LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
XXVII
Introducción
Me permitiré comenzar con una breve reflexión que explique el

título de esta obra. ¿Por qué hay que defender a la ciencia de la irra-
cionalidad? La actividad científica parecería por definición inmune a
la irracionalidad. Se trata justamente de una actividad donde los plan-
teamientos, los procedimientos y las conclusiones prosperan en la
medida que transiten por caminos racionales. Siendo la racionalidad
un presupuesto crucial de su propio desempeño, en la medida que
sea abandonada, desdeñada o traicionada, la empresa estaría conde-
nada al fracaso y la propia realidad se ocuparía de ponerlo de
manifiesto. Es decir, el proceso científico estaría sometido al meca-
nismo corrector que su propia dinámica impone y no necesitaría, por
ende, de enmiendas exógenas ni de cautelas que se le anticipen.
Sin embargo, la realidad es otra, al menos por dos razones fun-
damentales. En primer lugar, porque la evidencia de que algunos
de sus hallazgos no funcionan o no sirven puede demorar, y mien-
tras su inefectividad se torna incontestable se producen daños
sociales. En segundo lugar, porque existen no pocos intereses es-
purios y personas que medran con la ignorancia y la credulidad de
la gente; y la sociedad está muy lejos de estar preparada para defen-
derse de ellos.
XXVII
XXVIII LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
Luego de tres decenios trabajando en materia de investigación

sanitaria, ora como asesor, ora como profesor o como investiga-
dor propiamente dicho, he venido sintiendo la creciente necesidad
de compartir diversas ideas, convicciones o dudas que dicha ex-
periencia ha ido configurando. Como es bien conocido, desde los
últimos años del siglo XX se fue observando en el campo biosani-
tario, muchas veces conservador y apegado a la autoridad, un
saludable espíritu cuestionador de aquellas opiniones y manio-
bras que se fundamentaban más en la tradición que en la reflexión
pausada y la síntesis racional. Tal es el origen y la vocación decla-
rada de la llamada «medicina basada en la evidencia», corriente
hoy consolidada. Afortunadamente, esta tendencia, aunque algo
más atenuada, no es ajena a la investigación científica en general
y a sus recursos operativos, tanto o más necesitados de iniciativas
desmitificadoras.
Animado por esa convicción, a finales del siglo pasado publiqué
un libro titulado Cultura estadística e investigación científica en el campo de
la salud: una mirada crítica. No era un libro de estadística, sino más
bien un texto sobre estadística. Antes que hacia la transferencia de
códigos de procedimiento, el libro se orientaba hacia la revisión
crítica de algunas reglas consagradas y del marco en que opera esta
disciplina.
Pero a lo largo de los pocos años transcurridos desde entonces,
he ido convenciéndome de que parte de los males que allí se de-
nunciaban tienen más entidad y más arraigo de lo que entonces
pensaba y, sobre todo, que eran expresión de problemas más gene-
rales a cuya influencia la estadística no podía escapar. Los cómodos
pero estériles rituales metodológicos, las polémicas escamoteadas,
la clonación de procedimientos, las conductas fraudulentas, la tira-
nía del mercado, el predominio de las recetas y las escandalosas
omisiones de no pocos problemas teóricos y prácticos constituyen
usual moneda de cambio en la docencia y la literatura directa e
indirectamente relacionada con aspectos metodológicos.
INTRODUCCIÓN XXIX
Aunque no faltan las advertencias en la bibliografía más reflexi-

va sobre estas realidades, a mi juicio se impone inaplazablemente
un ejercicio de deconstrucción metodológica más estructurado y
sistematizado. La noción de «deconstrucción» no es nueva. El Dic-
cionario de la Real Academia Española la registra como «Desmontaje
de un concepto o de una construcción intelectual por medio de su
análisis, mostrando así contradicciones y ambigüedades». Creo que
ese es el propósito básico del presente libro.
Sin embargo, tal proceso de desmontaje puede ser en sí mismo
estéril o dejar un dividendo escaso si no se complementa con pro-
puestas concretas que tracen las pautas para la reconstrucción sobre
nuevas bases del aparato o sistema analizado. Y puede ser fallido si
no se le sitúa y examina en el contexto en que se desenvuelve aque-
llo que es objeto de exploración. Consecuentemente, el lector
también hallará sugerencias e ideas que modestamente sugiero adop-
tar para recomponer un entramado donde la irracionalidad aparece
una y otra vez.
Sobre tales bases, el libro se ha estructurado en seis capítulos. El
primero se concentra en la ciencia como fenómeno cultural de la
sociedad y el segundo examina el encuadre filosófico en que se inser-
ta. El examen crítico de algunos de los problemas metodológicos
más generales que pautan su realización es materia del tercero. Des-
tino un capítulo completo, el cuarto, a debatir la presencia de dos
poderosos enemigos de la ciencia: el fraude y la pseudociencia. Los
últimos dos capítulos ya se concentran en la valoración de aspectos
operativos bastante específicos: el quinto se ocupa de ilustrar y hacer
patente cómo algunos investigadores se valen de procedimientos ri-
tuales que terminan por ser improductivos o perjudiciales; el sexto y
último se dedica a valorar exhaustivamente la agotada familia de las
técnicas inferenciales clásicas y concluye esbozando un nuevo para-
digma inferencial que hoy se asoma para suplirlas o complementarlas.
La Habana, septiembre de 2008

XXX LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
1
1
Incultura científica: una amenaza en la
sociedad contemporánea
La ciencia es siempre profunda y simple. Son
sólo las verdades a medias las que son
peligrosas.
BERNARD SHAW
LA INCULTURA CIENTÍFICA DE LA SOCIEDAD
Vivimos en una sociedad científicamente inculta. No me refiero

tan sólo a los países eufemísticamente llamados «en vías de desarro-
llo», algunos de los cuales, con sus pavorosas tasas de prevalencia de
seropositividad al VIH-SIDA, parecen estar más bien «en vías de ex-
tinción». Aludo también a las sociedades con altos niveles de salud,
bienestar e instrucción, cuyos integrantes son frecuentes consumidores
de bienes de todo tipo, especialmente de productos tecnológicamente
avanzados.
Obviamente, la actividad científica como tal, especialmente la de
investigación, es tarea de una élite configurada por la selecta minoría
de quienes tienen la inclinación, el talento y la formación requerida,
tal y como ocurre con los ejecutantes del violonchelo o los cirujanos
cardiovasculares. La sociedad moderna requiere y aspira a que todos
los ciudadanos alcancen no sólo un alto nivel de educación e instruc-
ción, —capacidad para expresarse por escrito, dominar idiomas,
manejar un ordenador, etc.— sino que tengan además un adecuado
nivel cultural.
Y si hay un área en que padecemos de notables carencias culturales
es la científica. Por si fuera poco, muchos parecen no considerar que la
1
2 LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS
ciencia sea parte medular de la cultura, cuando en realidad es a mi jui-

cio el papel cultural de la ciencia el que podría rescatar a la cultura de su
inquietante tendencia actual a la banalización.
Muchas personas sienten vergüenza al admitir que no han leído
El Quijote, o cuando cometen faltas ortográficas, pero a la vez es
posible que proclamen con naturalidad (y hasta con cierto orgullo)
que no saben nada de matemática. Hasta los líderes comunitarios y
políticos suelen exhibir notorias confusiones en materia científica,
tales como la de manejar intercambiablemente las nociones de cien-
cia y tecnología.
Según Marcelino Cereijido, miembro de la Academia Mexicana de
Ciencias: «Tomados en conjunto, nuestros funcionarios y líderes no
son perversos, sino analfabetos científicos a quienes se debe tratar
con el mismo respeto que merece un campesino que no ha tenido la
suerte de acceder a la escolaridad» (Cereijido, 2005). Si se le pregunta
a un indígena sobre su necesidad de consumir una dieta más rica en
ácido fólico, probablemente responderá que no le hace falta; análoga-
mente, no hay por qué esperar una respuesta lúcida de un político
científicamente iletrado a quien se le pide opinión sobre la capa de
ozono, la financiación de la investigación básica, o la defensa de los
medicamentos genéricos.
La cultura científica no sólo es una meta deseable; es una imperio-
sa necesidad. La ciencia está en el centro de nuestra cotidianidad y
gravita sobre nuestros inmediatos intereses educativos, económicos,
políticos y sanitarios. La incultura en materia de ciencia no es un mero
rasgo que requiere ser superado para mejorar la sociedad sino una
genuina adversidad cuya capacidad de estropicio se subestima, en parte
debido a la propia ausencia de cultura científica que permita aquilatar
el peligro que entraña.
En este capítulo inicial, me propongo fundamentar estas ideas en
términos generales, aunque poniendo el énfasis de las ilustraciones en
el escenario biomédico.
INCULTURA CIENTÍFICA: UNA AMENAZA EN LA SOCIEDAD... 3
CIENCIA VERSUS TECNOLOGÍA

No pocos confunden dos nociones estrechamente relacionadas pero
conceptual y prácticamente diferentes: ciencia y tecnología. El fran-
cés Jean Dausset, premio Nobel de Fisiología en 1980, insistía en la
pertinencia de tal distinción (Dausset, 1988):
"La mera enunciación del tema ciencia y tecnología pone de manifies-

to la oposición que existe entre esos dos conceptos: la ciencia guarda
relación con los conocimientos, en tanto que la tecnología se refiere
más bien a la utilización de estos."
Ahora bien, el estrecho nexo entre ciencia y tecnología, no sólo

consiste en que todo aporte tecnológico, si quiere ser eficiente, ha
de proveerse de la investigación científica. También las vincula el
hecho de que el acto de evaluación de las tecnologías es una forma
especial —de hecho una de las más importantes— de la investiga-
ción científica.
Entre quienes tienen un largo y probado currículo como hacedores
de ciencia, es bien conocido el largo y azaroso tránsito que va de la
generación de conocimiento a la producción de tecnologías, de éstas
a su aplicación y desde dicha aplicación, cuando hay suerte, al impac-
to sobre la realidad1.
La confusión entre la producción de conocimientos y la de tecno-
logías, entendida esta última, en línea con Bunge (1980), como el
proceso científico orientado a la invención, transformación y control
de instrumentos, prácticos o conceptuales, naturales o sociales, lla-
mados a modificar la realidad, tiene sus raíces en un hecho muy simple:
1
Cabe por cierto intercalar que el mesianismo obcecado de algunos, especialmente en el
marco de la pseudociencia, suele invertir este proceso: escudarse en impactos proclamados de
alguna tecnología para conferir validez a los presuntos conocimientos científicos que estarían
avalándolas.
a diferencia de los productos tecnológicos, los conocimientos no son,

al menos en principio, una mercancía. No confundir esta afirmación
con la creciente naturaleza comercial que se ha venido produciendo
en el proceso de obtener esos conocimientos.
No hay un mercado formal de conocimientos. La máxima aspira-
ción de un investigador es que sus hallazgos se publiquen lo más
rápidamente posible en espacios de máxima difusión. La mayor aspi-
ración de un tecnólogo, por el contrario, suele ser que sus resultados
permanezcan ocultos hasta que sean patentados. Puesto que la inves-
tigación per se, a diferencia de las apuestas tecnológicas, no deja réditos
directos o inmediatos a los autores, la investigación encuentra —siem-
pre ha encontrado— serios escollos para su financiación. Aunque una
parte no despreciable de la que se realiza, al menos en el campo de la
sanidad, proviene de fuentes públicas, esta circunstancia hace no po-
cas veces que los investigadores sean una especie de «rehenes» de los
entes financiadores, como se verá más adelante.
La investigación en sí —si se desarrolla adecuadamente— difícil-
mente será «peligrosa». No veo cómo puede afectarnos el hecho de
tener un nuevo conocimiento, parcial o total, cualquiera sea la esfera
en que se produzca. Los graves problemas suelen comenzar a partir
de su realización: básicamente en el modo en que se divulgan o se
ocultan sus resultados y, especialmente, en las aplicaciones tecnológi-
cas que de ella se derivan. Las preocupaciones en esta materia, por el
cordón umbilical que las une a cuestiones éticas, son multidimensio-
nales. En el campo de la salud, vienen de muy antiguo y pueden ser
materia de un tratado especializado. A los efectos del discurso que
desarrollo, sin embargo, me reduciré a comentar dos advertencias rea-
lizadas en épocas relativamente remotas (20 o 30 años señalan un
pasado lejano, si se tiene en cuenta la velocidad con que han cambia-
do la realidad y los valores que la envuelven).
En 1978 el ya fallecido salubrista austriaco Ivan Illich señalaba
que «el compromiso social de proveer a todos los ciudadanos de las
producciones casi ilimitadas del sistema médico amenaza con des-
truir las condiciones ambientales y culturales para que la gente disfru-

te de una vida autónoma y saludable; la medicina institucionalizada
ha llegado a ser una grave amenaza para la salud» (Illich, 1978). La
parafernalia tecnológica contemporánea desempeña un papel inquie-
tante, por poner un ejemplo, en el enfermo terminal, ya que contribuye
a ignorar que la postergación de la muerte no es sinónimo de prolon-
gación de la vida.
Una década más tarde, Langdon Winner, profesor de Ciencias Po-
líticas del Instituto Politécnico Renssellaer de Nueva York, resaltaba
el hecho de que «la tecnología modifica la imagen que tenemos de
nosotros como individuos y el papel de la sociedad de modos sutiles y
frecuentemente inadvertidos» (Winner, 1989). Al aceptar acríticamente
una tecnología estamos firmando un contrato social implícito cuyas
condiciones sólo advertimos a menudo mucho después de haberse
consumado. Este «sonambulismo tecnológico» permite que se vayan
remodelando las condiciones de vida humanas de modos no deseados
y con consecuencias negativas para amplias capas de la población y
para el futuro del planeta. Lo que aparentemente son elecciones ins-
trumentales (elección de técnicas) se revelan en realidad como
opciones hacia formas de vida social y política que van construyendo
la sociedad y configurando a las personas.
El abanico de posibilidades para ilustrar cómo la «grave amenaza»
denunciada por Illich y el grado en que la advertencia de Winner se
han convertido en una sórdida realidad es muy amplio. Pero el domi-
nio más expresivo acaso sea el que se relaciona con la producción,
evaluación, gestión publicitaria y comercialización de fármacos.
LA EPIDEMIA DE LA PRESCRIPCIÓN
Aunque en medios especializados es bien conocido que el número
de medicamentos realmente útiles para encarar los problemas de la
abrumadora mayoría de la población no pasa de varias decenas (OMS,
2005), la epidemia del uso de fármacos se despliega en numerosos

países (especialmente de la «perifieria»), por medio de miles de princi-
pios activos y decenas de miles de presentaciones
Durante el Seminario Internacional realizado con el sugerente títu-
lo de «El incentivo oculto en la medicina», que se llevó a cabo en
Mendoza, Argentina, en 2002, el presidente de la Asociación Médica
Federal, Miguel Matta, ironizaba diciendo «En Argentina, por ejem-
plo, existen doce mil presentaciones farmacológicas, 12 veces más
que en Suiza. Seguramente la población Suiza está muy enferma por
no disponer de nuestro abanico terapéutico». El total de especialida-
des y presentaciones farmacológicas registradas en España es incluso
un 50% mayor: asciende a 18.250 (Perancho, 2004).
Las ganancias de los laboratorios en medio de esta caótica situa-
ción son siderales. El portentoso poder económico de la industria
farmacéutica —que ocupa el tercer lugar mundial en cuanto a volu-
men de ganancias y es la industria más lucrativa en los Estados
Unidos— le permite manipular el consumo, fijar precios desmedidos,
pautar líneas de investigación a nivel internacional; e, inversamente,
tal poderío se explica en buena medida por esa misma capacidad ma-
nipuladora. El entorno de los fármacos ofrece, sin duda, la posibilidad
de hacer un recorrido excepcionalmente elocuente en torno a esa alar-
mante circularidad.
Aunque la situación es completamente general, vale la pena pro-
fundizar en alguna línea farmacológica específica para apreciar con
más claridad la situación.
VIAJE AL CENTRO DE LA DEPRESIÓN

Un fabuloso negocio basado en una hipótesis dudosa
Consideremos en lo que sigue el caso de una única gama de pro-

ducción farmacológica: los inhibidores selectivos de la recaptación de serotonina
(ISRS). Se trata de fármacos de diseño que bloquean la recaptación

de ese neurotrasmisor específico, pero no la de otros (de ahí lo de
selectivos), con lo cual se conseguiría una función antidepresiva.
Las ventas de uno de ellos, la sertralina, comercialmente bautizado
como Zoloft por la transnacional Pfizer, ascendieron en el año 2004, sólo
en Estados Unidos, a más de tres mil millones de dólares (igual al produc-
to interno bruto anual de Liberia o Sierra Leona). La situación de otros
ISRS (especialmente, de la fluoxetina contenida en el Prozac, o de la
paroxetina, principio activo del Paxil), es muy parecida. En su editorial
del 24 de abril de 2004, The Lancet cifraba las ventas globales de este
último en el orden de los cinco mil millones para el año precedente. Su
empleo está tan extendido que se ha ironizado con la idea de que toda
persona terminará por consumir alguna de estas substancias (Figura 1.1).
Figura 1.1. El deprimente destino de los automovilistas.
¿Sobre qué bases ha alcanzado el Zoloft tan notable éxito comer-

cial, hasta llegar a ser el sexto medicamento más vendido en los Estados
Unidos a lo largo de ese año?
En primer lugar porque, como es bien conocido, la depresión es

una dolencia de altísima prevalencia en sociedades desarrolladas como
la norteamericana (según el National Institute for Mental Health, la
depresión mayor afecta a aproximadamente 9,9 millones de adultos
norteamericanos cada año) y el medicamento en cuestión tiene gran
reputación como un poderoso antidepresivo.
En segundo lugar, debido a que la publicidad que destaca las virtu-
des del producto se realiza no sólo sobre los prescriptores sino también
de manera directa sobre los pacientes, con el fin de que lo demanden.
Supuestamente, este fármaco sanaría el trastorno causado por la falta
de serotonina, a su vez responsable de los estados depresivos. Así lo
proclama la publicidad de la empresa productora en la prensa plana y
televisiva: «La prescripción de Zoloft corrige el desbalance de pro-
ductos químicos naturales entre las células nerviosas del cerebro, que
pueden producir la depresión. Ud. no tiene por qué seguirla padecien-
do» (Pfizer, 2004).
En términos generales, la publicidad directamente dirigida al con-
sumidor ha crecido de manera exponencial en los últimos años. Según
Proyecto Inform (2004), el gasto por este concepto en Estados Unidos,
que ascendía a 908 millones de dólares en 1997, se duplicó en sólo
dos años, y se estimaba que en 2005 alcanzaría los 7.500 millones de
dólares.
Pero volviendo a los ISRS, aunque las suspicacias sobre su eficacia e
inocuidad no son nuevas (véase Breggin y Breggin, 1994), sólo recien-
temente se ha configurado una verdadera plataforma de impugnación.
Según documentan extensa y persuasivamente Lacasse y Leo (2005) en
la revista PLoS Medicine, no sólo no existe corroboración alguna de que
los niveles bajos de serotonina produzcan desorden mental alguno, sino
que se cuenta con evidencias significativas en contra de dicha hipótesis.
Y por si fuera poco, las cosas van bastante más lejos: no pocos
sostienen fundadamente que los ISRS pueden ser dañinos, realidad
que ha tenido grandes dificultades para abrirse paso, como se docu-
menta a continuación.
Lo que se dice, lo que se oculta
Luego de algunas exitosas escaramuzas legales y mediáticas protago-

nizadas por personas cuyos familiares habían sido dañados, según se
alegaba, por el efecto de la sertralina o la paroxetina, a comienzos del
presente siglo comenzó a configurarse un verdadero prontuario contra
los ISRS y las empresas comercializadoras, las cuales venían negando
enfáticamente cualquier efecto dañino. Pero esta vez, las acusaciones
se vertebraban en torno a investigaciones rigurosas. Melander et al.
(2003), por poner un ejemplo, conmovieron a los especialistas con la
publicación de un trabajo que daba cuenta de un notable sesgo de pu-
blicación en relación con los ensayos clínicos destinados a evaluar los
ISRS: aquellos publicados en revistas científicas exhibían un panorama
de inocuidad no compatible con lo que arrojaban los ensayos presenta-
dos a la Medical Products Agency de Suecia. Una reseña cuidadosa y
exhaustiva de ese proceso puede hallarse en lo que Peiró, Cervera y
Bernal (2005) denominan «el culebrón» de los ISRS.
A lo largo de 2003, las autoridades reguladoras del medicamento de
varios países (Gran Bretaña, Estados Unidos, Canadá, Irlanda, entre
ellos) advertían públicamente que el empleo de los ISRS (en especial la
paroxetina) debía evitarse en niños o adolescentes. En particular, la
agencia británica Medicines and Healthcare Products Regulatory
Agency basaba la advertencia en la ineficacia del fármaco para tratar la
depresión en estos casos y, sobre todo, en que su empleo incrementaba
el riesgo de lesiones autoinfligidas e intentos suicidas en no menos de
un 50% respecto de un placebo (Peiró, Cervera y Bernal, 2005), Poco
más tarde, esta misma agencia extendió la reprobación a la sertralina
y a otros ISRS. Avanzado el año 2004, un panel de expertos convoca-
do por la norteamericana The Food and Drug Administration (FDA)
estableció que las presentaciones de varios ISRS debían incluir un
llamado «recuadro negro» con la información de que un metaanálisis
de ensayos clínicos controlados arrojó que el empleo de este producto
podría duplicar el riesgo de intentos suicidas (Figura 1.2).
Figura 1.2. Zoloft y suicidio.
En este punto, cabe preguntarse, ¿fue la propia industria farmacéuti-

ca víctima de la ignorancia acerca de los posibles efectos de estas drogas
de diseño y actuaron inocentemente hasta conocer estas realidades?
Lamentablemente, no parecería ser este el caso. Aunque empresas como
GlaxoSmithKline eran acusadas de haber escamoteado los resultados
de ensayos clínicos indicativos de posibles daños inducidos por los ISRS
o de haber atenuado deliberadamente la gravedad de las consecuencias,
el tema asumió proporciones de escándalo cuando se supo acerca de la
existencia de un informe de circulación interna dentro de dicha empre-
sa donde se indicaba la conveniencia comercial de no publicar algunos
ensayos clínicos (véase Kondro y Sibbad, 2004). El asunto llega a los
tribunales: la empresa es encausada en Nueva York bajo la deshonrosa
acusación de haber cometido «fraude persistente y repetido» en esta
materia.
El asunto se salda con el típico «deal» de Estados Unidos entre la
fiscalía y la defensa: GlaxoSmithKline pagaría 2,5 millones de dólares
y declararía públicamente sus propósitos de enmienda afirmando que
habría de conducirse éticamente en futuros ensayos clínicos. Un final
muy parecido al que ha tenido en julio de 2006 el diferendo entre
varias empresas anunciadoras y Google, debido al fraude en el siste-
ma de publicidad del famoso buscador. Google obtiene más del 95%
de sus ganancias a partir de lo que el comerciante paga por cada acce-

so del internauta al enlace a su empresa. Mayor número de clicks a ese
anuncio, más dinero para Google y más publicidad para la compañía.
Pero se pudo probar el empleo de recursos automáticos para generar
accesos reiterados a sitios web que no fueron observados por ser
humano alguno. En este caso, el consabido «deal» supuso un desem-
bolso de 90 millones de dólares para Google por haber ocultado el
fraude, no haber prevenido a sus clientes del riesgo en que incurrían y
no haber instaurado método de protección alguno. La similitud con el
caso de GlaxoSmithKline es notable; la gran diferencia radica no sólo
y no tanto en que el gravamen fue casi 40 veces menor, sino en que
aquel fraude recayó sobre seres humanos, no sobre utilidades. Como
incontestablemente señalan Peiró, Cervera y Bernal (2005):
"La información útil para decidir si un medicamento es beneficioso o

perjudicial para los pacientes no puede ser secuestrada por intereses
comerciales, por legítimos que sean, y la no difusión de un ensayo
clínico es una estafa intolerable a los individuos que voluntariamente
corrieron riesgos al participar en él para que futuros pacientes se
beneficiaran de nuevos conocimientos."
En el corto lapso transcurrido desde los hechos relatados, los moti-

vos de preocupación han ido aumentando. En una valoración del estado
del arte sobre los ISRS, Moncrieff y Kirsch (2005) reseñan que los últi-
mos metaanálisis realizados hasta entonces no revelan ventajas de estos
fármacos por encima del placebo y concluyen que, teniendo en cuenta
los reparos sobre los riesgos que entrañan, las actuales recomendacio-
nes deben ser modificadas. Acaso recordando su revés legal del 2004,
GlaxoSmithKline ha hecho público un análisis (véase Carey y Harris,
2006) donde reconoce que los ensayos clínicos con adultos (pacientes
de entre 18 y 64 años) también revelan una frecuencia de intentos sui-
cidas significativamente más alta entre 8.958 pacientes tratados con
Paxil® (paroxetina) que entre 5.953 que recibieron placebo.
Pero el sustrato científico para los ISRS no ha dejado de resquebra-

jarse. Y para desesperación de los mercaderes, cada día se hace más
difícil ocultar sus notables fisuras. La prensa de todo el mundo (véan-
se, por ejemplo, Ferrado, 2008 y Laurance, 2008) se ha hecho eco
muy recientemente de un nuevo y poderoso metaanálisis. Basándose
esta vez en los ensayos clínicos, tanto publicados como inéditos, re-
gistrados por la Food and Drug Administration (FDA), un equipo
multinacional encabezado por el investigador británico Irving Kirsch
de la Universidad de Hull encontró que los antidepresivos de última
generación tienen el mismo efecto de un placebo, cuando se trata de
personas que sufren depresión leve y moderada, que son la inmensa
mayoría de los usuarios (Kirsch et al., 2008). Los resultados demos-
traron, una vez más, que tales drogas pudieran ser efectivas sólo en
un grupo muy reducido de personas extremadamente deprimidas.
Lo que viene a decir el trabajo publicado en PLoS Medicine, es que
los susodichos fármacos, en particular la fluoxetina, principio activo
de la llamada «pastilla de la felicidad» con que se elabora el Prozac,
consumida por 40 millones de personas en el mundo, es esencialmen-
te innecesaria para casi todos. A este punto hemos llegado tres lustros
después de que Peter Kramer informara al mundo a través de Listening
to Prozac –libro que, para beneplácito de la transnacional Eli Lilly,
devino en un espectacular bestseller– que cualquier persona no entera-
mente feliz podría «iluminar su estado de ánimo», mediante una dosis
adecuada de Prozac (Kramer, 1993). Aunque el Prozac fue la droga
de mayor venta en el mundo hasta que resultara superado por el Viagra,
el estudio de Kirsch pone en serio entredicho también a otros IRSR,
como el Seroxat –fabricado por GlaxoSmithKline– o Efexor, produ-
cido por Wyeth.
Temerosos al ver tambalearse la gallina de los huevos de oro, la
reacción de sus dueños no se hizo esperar. En una primicia periodísti-
ca, GlaxoSmithKline se apresuró a decir que las conclusiones del
trabajo eran «incorrectas», puesto que se había evaluado solamente
un subconjunto de todos los datos existentes. Kirsch et al. habían re-
clamado todos los datos en posesión de la FDA invocando la llamada

«Freedom of Information Act»; pero, si bien la FDA identificó 47
ensayos, por razones que aún se ignoran, dicha agencia se abstuvo de
entregar los resultados de nueve de ellos, todos los cuales habían
arrojado resultados negativos. De modo que Kirsch respondió con
elegante ironía a sus objetores: «Si se me entregaran todos los datos
disponibles, hayan o no sido publicados, yo estaría encantado de rea-
lizar un metaanálisis aún más completo para beneficio de la comunidad
médica y del público». Los detalles sobre las barreras para obtener
toda la información necesaria a las que alude Kirsch, así como sus
consecuencias, pueden captarse con claridad leyendo el trabajo de
Lenzer y Brownlee (2008).
La pregunta natural que cabe hacerse en este punto es: ¿Cómo
puede ocurrir que buena parte del conocimiento científicamente ob-
tenido en materia de salud no se traduzca en ágiles recomendaciones
o prescripciones que beneficiarían a la sociedad? ¿Qué trucos se pue-
den emplear para conseguir la inacción de la sociedad, pese a existir
fundados elementos que la desaconsejan, y eludir a la vez las posibles
consecuencias legales que entrañarían la mentira o el fraude directo?
La respuesta obligaría al análisis de una compleja madeja de determi-
nantes que abarcan diversos aspectos burocráticos, comerciales,
políticos, científicos, mediáticos y legales. A mi juicio, este es un asunto
insuficientemente examinado, pero la perla investigativa que se des-
cribe en la sección siguiente ayudará a vislumbrar que parte de la
respuesta se relaciona con la triquiñuela de dar a conocer sólo una
parte (y no cualquier parte) de la verdad.
Una parte de la verdad
Exaltada durante muchos años como un barato, seguro y eficaz

procedimiento terapéutico antidepresivo (véanse, por ejemplo, el li-
bro de McWilliams, Nordfords y Bloomfield (1997), así como el sitio
http://www.hypericum.com/), la «hierba de San Juan» («St. John

wort») es un ejemplo típico de presuntas panaceas médicas que apare-
cen aquí y allá en medio de un confuso e interminable debate enrarecido
por las pasiones que desata.
Figura 1.3. La hierba de la competencia.
En vista de que, a pesar de haberse realizado varios estudios, las

virtudes de la hierba en cuestión seguían en entredicho, a la vez que
sus defensores continuaban elogiándola a capa y espada, las autorida-
des sanitarias norteamericanas, para beneplácito de los productores
del Zoloft, decidieron tomar el toro por las astas. En octubre de 1997
una declaración del National Institute of Mental Health (NIMH) anun-
ció la realización de un esfuerzo especial para dirimir el asunto de una
vez y por todas. La declaración oficial fue:
"Esta investigación dará una respuesta definitiva acerca de la utilidad

del «St. John Wort» para combatir la depresión. Será el primer ensa-
yo clínico controlado, suficientemente grande y riguroso como para
garantizarlo."
El estudio fue encargado a un equipo coordinado por Jonathan

Davidson de la Universidad de Duke. 340 pacientes con diagnósti-
co de depresión mayor fueron asignados aleatoriamente para recibir
uno de tres tratamientos: a) la hierba de San Juan, b) sertralina (inhi-
bidor de la recaptación de la serotonina comercializado por Pfizer
con el ya mencionado nombre de Zoloft), y c) placebo. Todos los
sujetos fueron tratados durante ocho semanas.
Se aguardaban los resultados con gran expectación. Finalmente,
cinco años más tarde, se hizo público el desenlace. La información
oficial del National Institute for Health (NIH, 2002) fue la siguiente:
"La hierba de San Juan (Hypericum perforatum) no es más eficaz que el

placebo en el tratamiento de una depresión mayor de grado modera-
damente grave, según las conclusiones de un estudio el 10 de abril en
The Journal of the American Medical Association."
La conclusión citada recibió inmediata atención mediática: (véa-

se, por ejemplo, el Diario Médico de España del propio 10 de abril de
2002).
Hasta aquí todo parece normal; pero cuando se profundiza en el
estudio, nos enteramos de que, ni el Zoloft ni la hierba actuaron de
forma diferente al placebo. En rigor, en la valoración general, el place-
bo fue lo más efectivo, en tanto que los otros dos tratamientos produjeron
resultados virtualmente indistinguibles. En efecto, en el cuerpo del artí-
culo los autores (Davidson et al., 2002) comunican textualmente:
"…sólo se obtuvo una respuesta completa, considerada como una me-

jora apreciable en el 31,9% de los 116 pacientes del grupo placebo, en
el 24,8% del grupo de 109 que recibieron la sertralina y en el 23,9% del

grupo de 113 tratado con la hierba de San Juan."
Por si fuera poco, también se comunica que:
"Los pacientes que tomaron la planta de San Juan y la sertralina tuvie-

ron más efectos secundarios que los del grupo placebo, si bien no
hubo ninguna consecuencia adversa grave."
Sin embargo, el propio informe concluye asombrosamente que:
"Según los datos disponibles, el Hypericum no puede considerarse como

un sustituto de las terapias clínicas estándar, entre las que se incluyen
medicaciones antidepresivas y psicoterapias, para el tratamiento de la
depresión mayor de gravedad moderada."
Se observa una clamorosa omisión en esta conclusión: desde mi

punto de vista, muchísimo más relevante que la inoperancia de la
hierba —cuyo uso en definitiva es relativamente marginal compara-
do con la prescripción multimillonaria de que se beneficia el
Zoloft— es la inutilidad del fármaco. Al llamar la atención sobre
dicha ineficacia me ciño a lo que esta investigación arrojó. El NIMH
se había comprometido a dejar el asunto zanjado con el estudio y,
en cualquier caso, el resultado concreto que se obtuvo es que el
Zoloft carecía de utilidad. ¿Cómo explicarse tan flagrante falta de
coherencia entre los datos objetivos y la parcialidad ostensible en la
divulgación de los resultados?
Al procurar más datos sobre este enigmático hecho, nos encontra-
mos con que diez de los firmantes del trabajo, y en especial, el director
del estudio y autor principal del artículo, resultan ser beneficiarios di-
rectos de numerosas empresas y laboratorios, en particular del que
produce el Zoloft, al que la hierba de marras hace competencia. Por
más señas, el doctor Davidson posee acciones en Pfizer, American Home
Products, GlaxoSmithKline, Procter and Gamble y Triangle Pharma-

ceuticals. Ha recibido honorarios en su calidad de vocero de Solvay,
Pfizer, GlaxoSmithKline y Wyeth-Ayerst. Ha sido asesor científico de
varios laboratorios, entre ellos de Aller-gan, Solvay, Pfizer, GlaxoSmi-
thKline, Eli Lilly, Ancile, Roche, y ha recibido apoyo para la investigación
del NIMH, así como de las siguientes transnacionales del medicamen-
to: Pfizer, Solvay, Eli Lilly, GlaxoSmithKline, Wyeth-Ayerst, Or-ganon,
Forest Pharmaceuticals Inc, PureWorld, y Allergan.
Pitkin, Branagan y Burmeister (1999) habían puesto de manifiesto
este notable acto de prestidigitación al demostrar que en el 32% de
los casos, en cinco revistas de primer nivel, las conclusiones de los
autores, tal y como se notificaban en los resúmenes, no estaban res-
paldadas por los datos del cuerpo del artículo o, incluso, estaban en
directa contradicción con ellos.
Los perjuicios derivados no sólo de lo que se publica a medias sino
incluso de lo que no se publica en absoluto son patentes. Así lo ponía
de manifiesto un durísimo editorial de The Lancet en 2004, conforma-
do a partir de un metaanálisis (Wittington et al., 2004) publicado en el
propio número de la revista donde se demostraba que un perfil costo-
beneficio favorable a algunos ISRS derivado de trabajos formalmente
publicados se invertía y pasaba a ser negativo para dichos fármacos
una vez adicionada la información que aportaban estudios no publi-
cados de manera formal pero enteramente dignos de crédito.
La ingenuidad de creer en la validez de lo que aparece publicado está
mucho más extendida de lo que corresponde. Nada más peligroso. Con-
sideremos un ejemplo que lo demuestra. Se trata de un esperpento made
in Spain, que resulta elocuente de las amenazas propias del mundo real
en que a la postre, quiérase o no, se inserta la comunicación científica.
La Revista de la Real Academia de Ciencias Exactas, Físicas y Naturales, en su
primer número del año 2003, publicó un trabajo donde, según palabras
del autor «…se prueba la existencia de un Ser Superior que, directa o
indirectamente, y fuera de la Naturaleza, ha intervenido en la creación
de los seres humanos de forma que, si hay evolución, ésta es brusca y
no procede de la ley natural, y, por tanto, es milagrosa». La supuesta

prueba científica de la existencia de Dios, a cargo de este matemático,
se consigue a través de un revoltijo de teoremas (17 en total) y contiene
afirmaciones del siguiente tenor (Rodríguez, 2003):
"Ahora, después de hacer la anterior exposición religiosa, humanista y

científica con motivo de la estrella que vieron en el Cielo los magos que
fueron a adorar al Mesías, según cuenta San Mateo, hemos logrado
probar que el instante (t) del nacimiento del Mesías está determinado
por la propiedad de que en ese mismo instante la velocidad de expan-
sión del Universo es igual a la velocidad de la luz, manifestando con ello,
como ya hemos dicho, que sería Luz de Verdad."
¿Cómo explicarse algo así? ¿Qué entramado de intereses puede es-

tar detrás de la convalidación que supone la publicación en una revista
científica de semejante texto? En cualquier caso, cabe sospechar que
estamos frente a una mezcla de superficialidad, indolencia e irrespon-
sabilidad por parte de los académicos que han aprobado la publicación
de este «trabajo». El aparente deterioro intelectual que aquejaba al
profesor Rodríguez en el momento de escribir el texto es irrelevante.
A donde debe llevarnos esta flagrante y asombrosa falta de racionali-
dad es a la constatación de que el proceso de obtención y comunicación
de conocimientos científicos está tan matizado por elementos exóge-
nos a la ciencia propiamente dicha que estamos mucho más expuestos
a mensajes espurios de lo que solemos creer. El artículo reseñado no
es más que un amasijo de dislates; y resulta tan burdo, tan insólito,
que no cuesta ningún trabajo a nadie descubrir el desaguisado tras
una mirada somera. Pero a la vista del mismo, ¿qué razones pueden
tenerse en principio para creer que el artículo anterior o el siguiente
de ese mismo número de la Revista de la Real Academia de Ciencias Exac-
tas, Físicas y Naturales, cuyos entresijos acaso sean mucho más
técnicos e inaccesibles a la comprensión de los no especialistas, no es
un timo o un resultado completamente inaceptable?
Volviendo al empleo de los ISRS y aparte de los riesgos generales ya

mencionados, se adiciona uno más, en este caso concerniente a un tramo
concreto de la población: las mujeres embarazadas. Un riguroso estudio
de casos y controles llevado adelante por investigadores de la Universi-
dad de California, San Diego (Chambers et al., 2006) que involucró a más
de 1.200 mujeres vino a sumarse muy recientemente a numerosos esfuer-
zos previos que confirman la hipótesis de que el empleo de estas drogas
en la fase tardía del embarazo puede inducir diversos desórdenes, tales
como prematuridad, malformación congénita y retardo del desarrollo del
neonato. El trabajo, publicado en la prestigiosa The New England Journal
of Medicine pone de manifiesto un riesgo seis veces mayor de desarrollar
hipertensión pulmonar persistente para una consumidora de ISRS que
para una embarazada que no lo sea.
Figura 1.4. Aluvión publicitario de los ISRS.
Al mismo tiempo se publicó una investigación (Cohen et al., 2006)

en The Journal of the American Medical Association, otra revista también
perteneciente al llamado «main stream», el cual refutaría la idea bien
establecida de que el proceso del embarazo previene de manera natu-
ral la aparición de depresión; concretamente, aunque el diseño de este

estudio no incluyó enmascaramiento ni aleatorización, lo cierto es
que proclama que las mujeres que abandonan los antidepresivos du-
rante el embarazo recaen con alta frecuencia en el mencionado
trastorno. Buenas noticias para la industria de los antidepresivos, que
fueron ampliamente difundidas por la prensa y la televisión.
Los resultados de estos dos estudios no se contradicen mutuamen-
te pero, obviamente, las conductas que habrían de seguirse por parte
de una mujer con historia de depresiones, sí que habrían de ser opues-
tas en dependencia de cuál de ellos sea tenido en cuenta. Conflictos
de este tipo son bastante naturales y ocasionalmente mantienen su
vigencia durante lapsos considerables. Pero en medio del que nos ocupa,
he aquí que un periodista especializado (Armstrong, 2006) publicó
un explosivo reporte denunciando que 11 de los 13 autores del segun-
do trabajo habían eludido la obligación de comunicar sus nexos
financieros con las empresas productoras de los fármacos evaluados.
En particular, el profesor Lee S. Cohen, de la Escuela de Medicina
de Harvard y psiquiatra destacado del Hospital General de Massachu-
sets, ha estado vinculado durante años con tres empresas fabricantes
de ISRS, y ha sido portavoz e investigador a sueldo de siete de ellas.
Ninguno de estos vínculos fue declarado. Pero en general, los autores
omitieron más de 60 lazos financieros con las compañías, vínculos
que la editora jefa de The Journal of the American Medical Association
comunicó desconocer. Entre estos se destaca la doctora Adele Vigue-
ra, miembro del buró de prensa de GlaxoSmithKline, quien admitió
recibir dos mil dólares por cada una de las conferencias que cada dos
meses ofrece para promover psicofármacos producidos por la empre-
sa entre potenciales prescriptores. Asombró a todos cuando sin el menor
rubor declaró que, aunque había ocultado sus vínculos con la mencio-
nada transnacional, no conseguía apreciar cómo, cualquiera fuera su
relación con la compañía farmacéutica, dicha conexión pudiera haber
desempeñado papel alguno en lo que resultó publicado, y que no creía
que existiera conflicto de intereses. Otros autores informaron a través
de sus asistentes no estar disponibles para ser entrevistados por razones

de trabajo, vacaciones, etc.
Reconsiderando el tema de las triquiñuelas escamoteadoras, cabe
volver a mencionar el fenómeno del sesgo de publicación a favor de las
empresas productoras de los ISRS, con el que nos encontramos una y
otra vez. La publicación selectiva de ensayos clínicos, o de solo algu-
nos datos dentro de ellos, conduce, como es obvio a estimaciones
falsas sobre la efectividad de los medicamentos estudiados.
Numerosos hallazgos sobre antidepresivos con resultados negativos
no llegan a difundirse en las revistas científicas. El psiquiatra del US
Veteran Hospital de Portland (EE UU), Erick Turner, dirigió un estu-
dio donde se analizaron los 74 ensayos clínicos en poder de la FDA
sobre 12 antidepresivos prominentes que involucraban a 12.564 pa-
cientes. Se examinó la asociación entre el hecho de que fuesen
publicados y la naturaleza de los resultados obtenidos (Turner et al.,
2008). El estudio, aparecido en The New England Journal of Medicine,
refleja que, de los 74 estudios registrados por el FDA, 38 arrojaban
resultados considerados como positivos por dicha agencia y 36 pro-
dujeron datos desfavorables para los ISRS. 37 de los primeros fueron
publicados, en tanto que solo 3 de los segundos pasaron a la literatura
sin que se escondieran sus decepcionantes desenlaces.
Por si fuera poco, las revistas médicas se habían hecho eco de 11
estudios que, sin ser positivos, habían sido publicados como tales.
¿Cómo se consigue tal milagro? Si un trabajo procura evaluar la hipó-
tesis de que un ISRS es más eficaz que otro tratamiento y el resultado
no la convalida, si se observa que los efectos secundarios son mayo-
res para el segundo, se publica el estudio enfatizando su superioridad
en relación con dichos efectos y desdeñando el resultado concernien-
te al objetivo original.
Asociado al sesgo de publicación, un fenómeno en realidad mucho
más grave es el siguiente: sobre la información que se da (y que no se
da), así como sobre la interpretación de los resultados suele gravitar
vitalmente el interés de la industria farmacéutica.
Henry Stelfox de la Universidad de Toronto, por ejemplo, encabe-

zó un colectivo que estudió la relación entre las conclusiones sobre la
seguridad en el empleo de los bloqueadores del canal de calcio (Stel-
fox et al., 1998). Los investigadores examinaron 70 trabajos sobre el
tema de acuerdo a sus conclusiones: favorables, neutrales o críticas.
Una indagación sobre las fuentes de financiación arrojó que el 96%
de los que avalaban el bloqueador habían recibido dinero directamen-
te de la empresa productora; el 60% de los neutrales habían tenido
financiación de la industria y ello ocurrió en solo el 37% de los traba-
jos críticos (no siempre directa del productor en los últimos dos casos).
En otro estudio famoso, Barnes y Bero (1998) revisaron 106 artí-
culos sobre el efecto del tabaquismo pasivo. El único factor asociado
con la conclusión de que éste no era nocivo fue si el autor estuviera
vinculado a la industria del tabaco.
En cualquier caso, más allá de las suspicacias puntuales sobre
determinadas corporaciones o personas, lo que está claro es que
extirpar de las conclusiones y de los titulares de prensa exactamente
la parte inconveniente de la verdad, así como ocultar la filiación
económica de los autores con los fabricantes de los productos estu-
diados, es una clara e inaceptable falta de integridad intelectual que
se apoya en la credulidad e inocencia de la sociedad, muy insufi-
cientemente entrenada en el escepticismo crítico que sería propio
de una debida cultura científica, y que a la postre daña seriamente el
prestigio de la ciencia.
La manipulación de la información científica no se queda, la-
mentablemente, ahí. Sarah Boseley, editora de salud del influyente
rotativo británico The Guardian llamaba recientemente la atención
sobre la proliferación de «autores fantasmas», verdaderos mercena-
rios científicos que alquilan sus nombres para firmar artículos
preparados por laboratorios farmacéuticos (Boseley, 2002). El es-
cándalo es de tal magnitud que Marcia Angell quien fuera editora de
The New England Journal of Medicine, se expresaba en los durísimos
términos siguientes (Angell, 2000):
"Los investigadores actúan como consultantes de las compañías cuyos

productos se estudian, como miembros de equipos de asesores y de
mesas consultivas, se involucran en acuerdos sobre patentes, con-
cuerdan en aparecer como autores fantasmas de las compañías
interesadas, promueven drogas y dispositivos en simposios patrocina-
dos por los laboratorios y permiten que se les corrompa con regalos
suntuosos y viajes a lujosos enclaves. Muchos tienen acciones en las
empresas."
Jonathan Quick, director del programa de medicamentos esencia-

les de la OMS, ha advertido acerca de la gravedad del hecho de que
los laboratorios influyen indebidamente y de manera creciente en to-
das las fases (desde el diseño hasta la publicación) de los ensayos
clínicos controlados. Quick ha puntualizado:
"Si los ensayos clínicos se convierten en un negocio comercial en el

cual los propios intereses se imponen sobre los intereses públicos y el
deseo se impone sobre la ciencia, entonces se rompe el contrato
social que permite la investigación con seres humanos a cambio de
avances médicos."
¿DR. YEKYLL O MR. HYDE?
«La industria es una máquina de marketing para vender fármacos de

dudoso beneficio; usa su riqueza y su poder para coartar a cada institu-
ción que se cruce en su camino, incluido el del Congreso de EE UU, la
FDA, los centros académicos o la propia profesión médica» escribe
Marcia Angell, directora durante 20 años de The New England Journal
of Medicine en un libro demoledor (Angell, 2005) donde se explica
sin ambages el tramposo modus operandis de las compañías farmacéu-
ticas.
Según Angell, las transnacionales del medicamento procuran publi-

car tantos estudios como sea posible donde se exalten las ventajas de
sus productos y entregar copias a los médicos como parte de las accio-
nes con vistas a inducirlos a recetarlos; además, les pagan para que
participen en ellos y para que den conferencias en los congresos. Los
fines de semana, afirma, puede vérseles en enclaves turísticos con el
pretexto de recibir unas horas de formación, se les convida a suntuosas
cenas a cambio de escuchar una conferencia laudatoria de alguno de
sus asalariados y se les seduce con regalos (a veces valiosos, a veces
baratijas).
Todas son prácticas bien conocidas de cualquier médico activo. Lo
singular es que eso sea tan claramente denunciado por una figura pri-
vilegiadamente informada y de primerísimo nivel mundial. Según
expresa metafóricamente Marcia Angell, quien también es miembro
del departamento de medicina social de la Universidad de Harvard, el
sector se convirtió en un «gorila de 350 kilos» con una inmensa capa-
cidad de lobby sobre el gobierno, las agencias reguladoras, las revistas
de mayor renombre y la comunidad médica.
Con ese fin, las grandes empresas emplean a 15.000 científicos y
40.000 agentes comerciales, e invierten tres veces más en publicidad
que en investigación, según Philippe Pignarre, ex director de comuni-
cación del laboratorio francés Synthélabo, y autor del libro titulado El
gran secreto de la industria farmacéutica (Pignarre, 2005).
Los dos libros arriba mencionados, entre otros muchos de nueva y
vieja data (véanse Silverman y Lee, 1983; Melville y Johnson, 1984;
Langbein y Ehgartner, 2004; Moynihan y Cassels, 2005; MacTaggart,
2005; Hubbard, 2006; Jara, 2007) cumplen con creces la necesidad de
denunciar pormenorizada y documentadamente todas estas anomalías
del proceso de creación y difusión de resultados real o supuestamente
científicos. No es del caso, pergeñar aquí algo que ya está ampliamen-
te superado en calidad y rigor por ellos, pero vale la pena detenernos
en un par de ejemplos integrales y muy recientes de toda esta tragico-
media que hace que nos preguntemos con quién estamos tratando
finalmente: ¿con el intachable Dr. Jekyll o con el torvo Mr. Hyde?
Figura 1.5. Los libros denuncian a la industria farmacéutica.
El precio de los medicamentos y la promoción de la

enfermedad
Si una gran empresa productora a gran escala de cierto fármaco ca-

paz de corregir determinado trastorno o mitigar sus consecuencias tuviera
una varita mágica con la cual se pudiera erradicar totalmente la enfer-
medad, ¿qué haría con ella? Siempre he sospechado que destruiría sin
más trámite tan peligroso adminículo. Es simplemente evidente que el
negocio será más exitoso en la medida que haya muchos enfermos. Bas-
taría consultar la obra de Perogrullo para constatarlo. Melville y Johnson
(1984) resumían la situación con mordacidad: «Los fabricantes de aspi-
rinas desean que usted tenga dolor de cabeza ahora mismo».
Pero esta realidad fue advertida hace varios lustros por la Organi-
zación Mundial de la Salud cuando declaraba que las compañías
estaban bajo una intensa presión para ganar y retener mercados que
producía un conflicto de intereses estructural entre sus legítimos ob-
jetivos comerciales y las necesidades sociales, médicas y económicas
de los proveedores y el público de seleccionar y usar los fármacos de

la manera más racional.
En efecto, si una transnacional del medicamento tuviera como moti-
vación fundamental contribuir a la salud de los ciudadanos, renunciaría
a cobrar por los medicamentos mucho más de lo que cuesta producir-
los. Pero no sólo no hace tal dejación sino que suele sobredimensionar
crecientemente los precios hasta niveles astronómicos. Bastan dos
ejemplos. Los fármacos moleculares necesarios para un tratamiento
contra el cáncer que contribuya a prolongar dos meses la superviven-
cia pueden costar decenas de miles de euros (Valerio, 2005). Un
«cocktail» de fármacos contra el VIH que se considere terapéutica-
mente eficaz tiene un precio que ronda los 65.000 dólares anuales; a
diferencia de muchos otros medicamentos costosos, que se utilizan
solamente durante periodos de enfermedad aguda, los fármacos para
tratar el VIH son de uso diario y vitalicio, lo cual garantiza un flujo
permanente de dinero para las compañías farmacéuticas.
Se ha argüido que la industria farmacéutica necesita reinvertir sus
utilidades en investigación para producir nuevos fármacos. Pero la rea-
lidad bien conocida es que desde hace muchos años los nuevos productos
presentados a las agencias reguladoras caen en picado. Paralelamente,
como se ha visto, el precio de los fármacos, y por ende las ganancias,
crecen sin freno. Families USA, un grupo defensor de consumidores de
bienes y servicios de salud de Estados Unidos, denuncia que la indus-
tria farmacéutica sigue batiendo marcas de rendimientos mientras
consigue extender al máximo sus patentes, que bloquean el acceso de
los consumidores a los medicamentos genéricos (véase Pollack, 2001).
En síntesis, como se señala en Proyecto Inform (2004), la industria farma-
céutica está mucho más motivada y moldeada por Wall Street que por
el Juramento Hipocrático. En este propio informe se examina cómo la
industria monopoliza la comercialización de sus productos al amparo
de las patentes y cómo consiguen extender la vigencia de éstas.
Debido a la enorme presión ejercida por varios países africanos
que padecen terroríficas tasas de prevalencia, incidencia y mortalidad
por VIH, la Organización Mundial del Comercio (OMC), reunida en

Doha, Qatar, en 2001 decidió permitir que los países pobres pudieran
producir sus propios medicamentos genéricos sin tener la obligación
de comprar los que han sido patentados por las multinacionales. La
ironía radica en que ninguno de estos países ha desarrollado la capaci-
dad real de producirlos, y por si fuera poco, les fue negado el permiso
para comprar dichos genéricos en los escasos países que, como Brasil,
sí han conseguido fabricarlos. Por otra parte, cabe consignar que in-
cluso en casos como este, el país sólo se reduce a reproducir el proceso
tecnológico, pero no ha creado, ni probado siquiera, ninguno de los
medicamentos que elabora, con lo cual la posibilidad de una verdade-
ra competencia con la industria está seriamente condicionada.
Para cerrar este sombrío panorama, detengámonos en el fenómeno
que ha dado en llamarse «promoción de la enfermedad» (disease monge-
ring). La denominación fue acuñada en 1992 por Lynn Payer, periodista
especializada, en el libro Promotores de enfermedades: lo que hacen los médi-
cos, las compañías farmacéuticas y las aseguradoras para que se sienta usted
enfermo, (Payer, 1992) definió el concepto como «el intento de persua-
dir a las personas que están esencialmente sanas, de que están
enfermas, y a quienes tienen algún problema menor de que están muy
enfermas».
La revista PLoS Medicine ha destinado un número completo al exa-
men de este problema. Según la definen Moynihan y Henry (2006), se
trata del proceso según el cual se ensanchan los límites de la enferme-
dad con vistas a expandir los mercados para vender y proveer tratamientos
médicos. Las grandes corporaciones, en alianza con compañías de rela-
ciones públicas y grupos médicos, diseñan programas orientados a
modificar calculadamente la percepción que tiene la sociedad sobre de-
terminados problemas de salud. Ciudadanos, periodistas, profesionales
de la salud, académicos y líderes de opinión son destinatarios de estas
campañas diseñadas por los departamentos de marketing de las grandes
compañías y no por organizaciones interesadas en la salud pública. Un
pormenorizado desmontaje del modus operandi de los grandes laborato-
rios puede hallarse en el libro titulado La venta de la enfermedad: cómo las

compañías farmacéuticas del mundo nos convierten a todos en pacientes (Moyni-
han y Cassels, 2005) que recientemente ha conmovido a una buena
parte del mundo académico.
Figura 1.6. Inducción al consumo de fármacos.
Otro brillante y documentadísimo texto destinado a denunciar la

trama de las enfermedades creadas a la medida para comercializar los
fármacos supuestamente útiles para enfrentarlas, se debe al biólogo y
bioquímico alemán Jörg Blech. Se trata de Los inventores de enfermedades
(Blech, 2005), que afortunadamente ha tenido notable éxito editorial:
numerosas traducciones, cientos de miles de ejemplares vendidos y
más de un año entero en las listas de éxitos de venta en Alemania.
Los laboratorios tienen un interés extremo en colocar la línea que
separa lo normal de lo patológico lo más alejada posible de una verda-
dera e indiscutible anormalidad, pues un pequeño desplazamiento
significa un incremento de millones de pacientes y enormes beneficios.
Pero Blech no solo denuncia esta maniobra, que puede considerarse
menor al lado del rosario de verdaderos y descarados inventos nosoló-
gicos. «Ciertos médicos contratados actuando coordinadamente con

organizaciones que se presentan como independientes, pero que en rea-
lidad están financiadas por algún laboratorio», explica Blech, «van
cincelando en la opinión pública que determinado estado del organis-
mo o del ánimo, constituyen una anomalía, y todo ocurre casualmente
cuando el nuevo medicamento está a punto de aparecer en el mercado.»
Entre los numerosos ejemplos que pueden mencionarse se halla
la construcción de una dolencia que para muchos especialistas (En-
dicott et al., 1999; Daw, 2002) es simplemente inexistente, tal como
el «desorden disfórico premenstrual» (premenstrual dysphoric disor-
der) y la subsiguiente campaña financiada por Eli Lilly de que éste
puede ser resuelto, como no, con un inhibidor de la recaptación de
la serotonina (concretamente, la fluoxetina, bautizada para la oca-
sión como Sarafem, aunque en rigor es lo mismo que el Prozac).
Las compañías farmacéuticas emplean un amplio abanico de téc-
nicas publicitarias para convencer a los potenciales prescriptores de
que sus pacientes necesitan determinado medicamento. Este resolve-
ría males que en realidad no padecen. No es una práctica sólo de este
giro. Como consigna Arribas (2006), antes de referirse a lo que él lla-
ma «la industria del dopaje» en los deportes:
"¡Así funciona la sociedad de consumo. Primero se crea la necesidad.

Después, casi simultáneamente, se satisface. Una industria, un com-
plejo comercial, ya está preparada para la tarea. Para dar el servicio.
Para enriquecerse con ello… ningún detalle se deja al azar!"
La estrategia de promoción de la enfermedad no es enteramente

nueva (véase en Mintzes, 1998 un temprano análisis sobre la práctica
de desdibujar con ese fin las fronteras entre acontecimientos ordina-
rios de la vida y la enfermedad), pero en los últimos años ha alcanzado
un alto grado de perfección, con recursos tales como la conversión de
achaques o procesos naturales en serios problemas médicos, la trans-
formación de factores de riesgo en enfermedades y la sobrestimación
deliberada de las tasas de prevalencia (Moynihan, Heath y Henry,

2002).
La medicalización de procesos naturales como la caída del pelo o
la disminución de la libido han transformado a la calvicie en alopecia
(pérdida patológica del cabello) y a la pérdida de potencia sexual en
una tragedia. Para conjurar el maleficio, Merck promociona su Prope-
cia (finasteride) contra la calvicie, y Pfizer da la solución a través del
Sildenafilo (viagra). Por si algún usuario potencial pudiera ruborizarse
ante el supuesto deterioro de su apetencia sexual, Pfizer se hizo de los
servicios del futbolista más renombrado de la historia, un icono fuera
de toda sospecha de carencia de virilidad: así todos pudimos ver por
la televisión globalizada a Pelé, tristemente convertido en un asalaria-
do de dicha transnacional, afirmando: «El miedo y la inhibición
impiden a muchos hombres hablar con su médico sobre sus dificulta-
des de erección».
Figura 1.7. Pelé al servicio de Pfizer.

Eufóricos con las ganancias monumentales que producían los inhi-

bidores selectivos de la recaptación de la serotonina, la codicia de las
transnacionales que los producen los lanzó a la creación de otras en-
fermedades, ajenas a la depresión, que supuestamente también se
podían encarar con los ISRS. GlaxoSmithKline impulsó la idea de que
la timidez, rasgo que casi todos poseemos en una u otra medida, fuera
convertida en enfermedad bajo el pomposo nombre de «trastorno de
ansiedad social» (SAS) y podía ser tratado con Paxil. Lo mismo ocu-
rrió con el Prozac, que Lilly rebautizó como Sarafem, a los efectos de
combatir el «síndrome premenstrual». Originalmente inventados para
el tratamiento de las depresiones graves, como sabemos, al decir de
Blech, los ISRS se recetan para una amplia gama de trastornos «que
hasta hace poco simplemente no existían, tales como el desorden de
ansiedad generalizada, el pánico, el síndrome obsesivo-compulsivo y
el trastorno de estrés postraumático».
La maquinaria generadora de dolencias no se detiene: desde hace
poco tenemos numerosos «resultados», algunos de los cuales se
consignan a continuación, a modo de ejemplo, con sus ampulosas de-
nominaciones:
• La llamada andropausia o menopausia masculina (aging male syn-

drome), que hace de la reducción natural en la producción de
hormonas masculina un problema de salud.
• El síndrome de alienación parental, que no es más que el sufrimien-
to de algunos niños ante la separación de los padres.
• El síndrome de Sissi, quizás uno de las más portentosas conquistas
creativas. Los pacientes afectados por esta dolencia son depresi-
vos y deben ser tratados. Sin embargo, ocurre que «su abatimiento
queda enmascarado por un comportamiento especialmente acti-
vo y positivo ante la vida» (Blech, 2005). Esta asombrosa
enfermedad, que se expresa exactamente cuando no se expresa,
recibió el nombre de la emperatriz Elisabeth, pues ella encarnaba
cabalmente al arquetipo humano portador del trastorno.
• La inapetencia sexual femenina, de la cual supuestamente padece el

43% de las mujeres (Laumann, Paik y Rosen, 1999). De ser eso
cierto, el mercado para un «viagra para mujeres» sería extremada-
mente atractivo. Pero el artículo era sumamente manipulador en
cuanto a la definición de inapetencia sexual: una sola respuesta afir-
mativa a una serie de 7 preguntas del tipo «¿Ha sentido temor en
los últimos dos meses de no ser eficiente en la cama?» o ¿Se ha
sentido sin deseos de tener relaciones sexuales? era suficiente para
clasificar a la mujer encuestada como enferma. Además, luego se
supo, ¡oh casualidad!, que dos de los investigadores estaban fi-
nancieramente conectados con Pfizer.
El engaño publicitario
A lo anterior ha de sumarse una larga serie de «trucos» publicita-

rios que afloran por doquier, muchas veces de manera muy cruda.
Además de folletos y plegables que suelen repartirse a los prescrip-
tores en congresos y directamente en sus hospitales, centros de salud,
consultas, etc., la publicidad figura profusamente en las revistas mé-
dicas y es una fuente de recursos financieros para los dueños de las
editoriales que las producen. Las editoriales negocian con las empre-
sas el tamaño y el lugar del espacio que le destinarán dentro de las
revistas, y cobran más si consienten que ésta ocupe lugares prominen-
tes, en especial si queda ubicada de manera que sea difícil distinguirla
de un punto de vista editorial (Smith, 2006). El gasto total debido a
publicidad de medicamentos creció de 11.400 millones de dólares en
1996 a 29.900 millones en 2005 (Donohue, Cevasco y Rosenthal, 2007).
Una parte nada despreciable desemboca en las arcas de las editoriales
de las revistas, las cuales venden espacio para la publicidad como si
fueran plazas de aparcamiento en un garaje. La analogía es completa,
pues al igual que el dueño del aparcamiento no exigirá que los coches
tengan virtudes de ningún tipo, el espacio en las revistas se consigue,
salvo alguna situación excepcional, pagando lo que haga falta. A dife-

rencia del resto de los mensajes sanitarios (los de los artículos en sí),
éstos no pasan por ningún tipo de peer review.
El asunto, a mi juicio, ha sido poco estudiado, pero existen algu-
nos trabajos que ponen de manifiesto lo que cualquiera puede
imaginar. Varios lustros atrás, por ejemplo, se realizó una investiga-
ción (Wilkes, Doblin y Shapiro, 1992) que examinó los 109 anuncios
a página completa aparecidos en los 10 más importantes revistas
médicas así como las referencias mencionadas en ellos. Árbitros es-
pecializados examinaron minuciosamente la correspondencia entre
lo que dichos anuncios proclamaban y lo que realmente comunica-
ban las fuentes usadas para configurarlos. En aproximadamente un
tercio de los casos, estos expertos declararon que tal corresponden-
cia era incierta o inexistente, de modo que, a su juicio, el anuncio no
debería haber sido publicado.
Otro esfuerzo similar, publicado en The Lancet, es debido a un gru-
po de investigadores de España (Villanueva et al., 2003) el cual se
centró en antihipertensivos e hipolipidémicos publicitados en seis re-
vistas médicas de ese país. El examen de alrededor de 300 anuncios
arrojó que casi la mitad contenían afirmaciones no respaldadas por
las citas bibliográficas en que supuestamente se basaban. Más recien-
temente, el tema ha vuelto a despertar las alarmas (véanse Wolfe,
2002 y Hollon, 2005).
Ahora bien, los mercaderes saben que no pueden eludir los recur-
sos valorativos ya bien afincados entre los profesionales llamados a
prescribir sus productos, tales como los principios de la medicina basa-
da en la evidencia y las evaluaciones estadísticas. El manejo que se hace
de los datos estadísticos en el marco publicitario aún está débilmente
estudiado y el margen para profundizar en el manejo que de ella se
hace es enorme. Sin embargo no faltan alarmantes indicios de mani-
pulación.
Consideremos brevemente un solo ejemplo simple y elocuente: la
publicidad asociada a la vacuna contra el virus del papiloma humano.
No me propongo evaluar las virtudes o defectos posibles de esta

apuesta tecnológica (no exenta de polémica; véase Gérvas, 2007)
de la transnacional Merck. Me reduciré a dar una pincelada que
muestra la manipulación estadística en que incurre uno de sus folle-
tos. Se trata del material titulado «Gardasil, la vacuna para la
prevención de cáncer de cuello de útero» distribuido en 2007 por
sus fabricantes. En determinado punto y en el contexto de un cuida-
doso y ampuloso diseño (véase Figura 1.8), se da cuenta de los
resultados que avalan el valor preventivo de la vacuna para lesiones
vulvares precancerosas causadas por los tipos 6, 11, 16 y 18 del
virus de papiloma humano. Según arrojan estudios clínicos combi-
nados de fase II y III, se informa, después de tres años de seguimiento
a 7.771 personas vacunadas, ninguna había contraído estas lesio-
nes, en tanto que éstas habían aparecido en 8 de un total de 7.742
mujeres. De estos datos infieren que la eficacia de la vacuna es del
100% e informan un intervalo de confianza: 42%-100%. Sobre la
vacuna infieren algo, supongo, pero no lo comunican.
Ahora bien, ¿cómo fue calculado ese intervalo de confianza? No
cabe esperar que el folleto publicitario lo explique, pero lo cierto es
que resulta bastante extraño un intervalo de confianza cuyo extremo
superior sea precisamente la estimación del parámetro. Sin embargo,
lo verdaderamente impactante es que la eficacia del placebo asciende
a 99,90% (o sea, virtualmente también es del 100%). Si se está ha-
ciendo una comparación, ¿por qué los autores de este folleto deciden
no completar la comparación y solo destacan el resultado correspon-
diente a una de las ramas de los ensayos? La respuesta es obvia: porque
el resultado de la otra rama es el mismo en esencia. Se dirá que en uno
de los casos se produjeron ocho sucesos adversos y en el otro ningu-
no. Es cierto (suponemos que es cierto), pero se han hecho estimaciones, de modo
que la valoración cabal exige el cómputo de intervalos de confianza
para ambas ramas del estudio. Y ocurre que, cualquiera haya sido o
sea el procedimiento para computar dichos intervalos, el resultado de
hacerlo será el mismo, pues los resultados, estadísticamente hablan-
do, son iguales. La naturaleza amañada de la maniobra salta a la vista:

simplemente, es un acto de prestidigitación realizado en función de lo
que interesa fundamentar a toda costa.
Figura 1.8. El truco publicitario con la estadística.
Apostando a posteriori
Muy recientemente se produjo una verdadera impudicia a cargo de

la industria farmacéutica. Me refiero al escándalo del Vytorin, droga
supuestamente útil para la prevención de eventos cardiovasculares.
Los hechos se exponen a continuación con cierto detalle, ya que se
trata de un asunto que, además de ser integralmente ilustrativo so-
bre la forma en que el fraude, la manipulación, las presiones financieras
y la cacería obscena del dinero pervierten la finalidad última de la prác-
tica sanitaria, tiene implicaciones estadísticas y metodológicas como
valor añadido.
Desde tiempo atrás la empresa Merck venía comercializando la
simvastatina como droga anticolesterolémica bajo el nombre comer-
cial de Zocor. En 2002 se introduce un nuevo principio activo, el

ezetimibe bajo el nombre comercial de Zetia, en este caso comercia-
lizada por Schering-Plough. A diferencia de la estatina, Zetia inhibe
selectivamente la absorción intestinal del colesterol.
En el año 2004 se lanza un nuevo producto, que combinaba ambos
principios activos (simvastatina y ezetimibe). Es decir, Zocor y Zetia
se unen y dan lugar al Vytorin, comercializado conjuntamente por
Merck y Schering-Plough, a un precio, por cierto, dos veces mayor
que el de la droga convencional.
Sin embargo, el efecto de la adición de ezetimibe a la simbastati-
na sobre el progreso de la aterosclerosis estaba en discusión. Zocor
es una estatina, mientras que Zetia es una droga con un mecanismo
diferente. La idea era que la unión de ambas tendría un favorable
efecto sinérgico en la reducción de eventos cardíacos, gracias a la
eliminación de la placa arterial o a la desaceleración de su creci-
miento.
Aunque el Vytorin había sido prescrito a millones de personas, na-
die conocía realmente si habría de contribuir a remover las placas de
las arterias, de modo que Merck encomienda la realización del ensayo
clínico que dio en llamarse ENHANCE2 para evaluar el grado en que
dicho fármaco cumplía la misión que dio lugar a su creación.
El holandés John Kastelein y sus colaboradores (14 en total),
llevaron adelante el ensayo clínico controlado de 24 meses de dura-
ción con 720 pacientes de hipercolesterlemia familiar, donde se
compararon los efectos de una terapia diaria de 80 mg de simvasta-
tina a los que se adicionaba bien un placebo, bien 10 mg de ezetimbe,
según el paciente fuera asignado a uno u otro grupo experimental.
El estudio terminó en abril de 2006 y los resultados fueron entrega-
dos a Merck.
2
Nombre proveniente de «Ezetimiba aNd simvastatin in Hypercholesterolemia
enhANces atherosClerosis rEgression».
Luego de los dos años que duró el estudio, el 41% de los pacientes
tratados con Zocor experimentaron una reducción del LDL (el coles-
terol «malo»), algo que ascendió al 58% entre los pacientes asignados
al Vytorin. La diferencia es estadísticamente significativa por amplio mar-
gen. Sin embargo, ésta no era la evaluación declarada como objetivo
del estudio: el «endpoint» explicitado era el grosor de la media intimal
de las paredes de las arterias carótida y femoral, y el secundario era la
frecuencia de «eventos cardíacos», tales como el infarto o la muerte.
Dicho de otro modo, el estudio se había diseñado para demostrar que
el Vytorin consigue mayor desaceleración en el crecimiento de la pla-
ca arterial que la simvastatina por sí sola.
Pero he aquí que los pacientes que tomaron Vytorin tuvieron un
mayor crecimiento de dicho grosor que los que solo recibieron Zocor,
en tanto que las tasas de eventos cardíacos fueron virtualmente idén-
ticas. Terrible noticia para los vendedores de la droga. ¡Vytorin causa
una caída significativa en los niveles de colesterol, pero las placas
arteriales se incrementan!
Vale la pena, de paso, detenerse en la connotación estadística del
hecho. Se pone de manifiesto claramente que significación estadística no
equivale a significación clínica: lo que realmente importa no es que el
organismo tenga menos colesterol sino que la gente tenga menos ries-
gos y muera menos. Una disminución estadísticamente significativa
en relación con cierta magnitud unidimensional no tiene por qué ser
compatible con una mejoría sustantiva en el estado de salud de un
sujeto cuyo organismo está sometido a la complejidad de la biología
humana, que difícilmente podrá reducirse a un número.
Es obvio que los ensayos clínicos controlados constituyen «nues-
tro medio más efectivo para evaluar la eficacia de una intervención»,
como recordaban los profesores P.J. Devereaux y Salim Yusuf en el
Journal of Internal Medicine. (Devereaux y Yusuf, 2003), pero atención,
es crucial establecer racionalmente qué ha de entenderse por «efica-
cia de la intervención»: nadie quiere oír algo como esto: «Mire, el
tratamiento fue efectivo, pero su padre ha muerto».
Es evidente para cualquier mente sensata que, si los resultados

hubieran sido de signo opuesto, Merck se hubiera apresurado a desta-
carlo de inmediato. En su lugar, lo primero que intentó la empresa fue
«redefinir» a posteriori el objetivo del estudio. Se trata de una triqui-
ñuela bien conocida: decidir selectivamente, una vez en posesión de
los resultados, cuál debe ser la medida de desenlace que ha de consi-
derarse. Sin ir más lejos, en la propia definición de «endpoint» se incluye
la advertencia de que éste ha de establecerse nítidamente antes de
examinar los datos.3 Un bosquejo a muy grandes rasgos del método
científico exige que el investigador exponga primero su objetivo (o
declare la hipótesis que tiene), luego haga observaciones, y finalmen-
te saque conclusiones con base en éstas (enjuiciando la hipótesis rectora
del proceso). Merck intentó eludir este último punto mediante el ex-
pediente de permutar el objetivo inicial por otro, favorable a sus
intereses, que sí estuviera en consonancia con los resultados. Algo así
como si un jugador, al ver que el número por el que apostó en la ruleta
no resulta ganador, pretende apostar, una vez que la rueda se haya
detenido, al número que sí se produjo.
Lamentablemente, el intento de transgredir esta norma no puede
merecer otro nombre que el de estafa. Pero en este caso los investiga-
dores no se prestaron al fraude.
Al no prosperar este intento, Merck opta por dilatar el momento de
dar la información durante varios meses más. Presionada por los in-
vestigadores, asociaciones de pacientes y medios de prensa, y ante la
inminencia de una investigación en el Congreso, la empresa decide
finalmente revelar los resultados. Esto ocurrió en enero de 2008, nada
menos que 21 meses después de que el estudio se completara. Incluso
entonces, los resultados fueron publicados sólo después de que los
3
En el «Diccionario de los Ensayos Clínicos, incluido en el «CancerGuide» (véase http://
www.cancerguide.org/trials_glossary.html) figura la siguiente definición: El «endpoint» es
aquello «que un ensayo clínico intenta medir o hallar. En esencia, el objetivo del ensayo. Es
científicamente muy importante que los objetivos de los ensayos clínicos sean seleccionados y
claramente definidos de antemano».
investigadores se dirigieron por escrito a las empresas exigiendo una

explicación por el retraso. Tal demora supuso que las multimillonarias
ventas del Vytorin continuaran durante muchos meses como si nada
ocurriera.
El artículo que daba cuenta del estudio ENHANCE, fue finalmente
publicado en The New England Journal of Medicine en enero de 2008 (Kas-
telein et al., 2008). Sus resultados son aplastantes. «En ningún subgrupo,
en ningún segmento, se adicionó ventaja alguna. La droga simplemente
no funciona», declaró el Dr. John Kastelein, autor principal del estudio.
Steven Nissen, jefe del departamento de Medicina Cardiovascular de la
clínica Cleveland, último presidente del American College of Cardiolo-
gy y muy influyente personalidad norteamericana, fue lapidario: «Esta
droga no sirve y punto. Sencillamente, en lo que concierne tanto al
progreso de la arterosclerosis como a los eventos cardiovasculares, los
datos hablan en la dirección opuesta».
En franco estado de desesperación, Merck, empresa que ya había
sido demandada por ocultar y tergiversar los riesgos asociados con Vioxx
(véase apartado Un fraude letal, p. 42) no se arredra. Junto con Sche-
ring-Plough, lanza una frenética campaña publicitaria en defensa de sus
productos donde el Zocor ni siquiera es mencionado: enormes anun-
cios pagados (de dos paginas) en New York Times, Wall Street Journal y
muchos otros periódicos norteamericanos, aparecen durante cuatro días
seguidos (del 22 al 25 de enero de 2008), posteriores a la difusión de los
resultados de ENHANCE. Allí se afirma que los usuarios de Vytorin y
Zetia, «pueden estar innecesariamente preocupados debido a recientes
noticias que cuestionan el beneficio de estas dos medicinas sobre la
base de un único estudio que ha generado una gran confusión». O sea,
se atribuye un papel confusor precisamente al ensayo que la propia
empresa había encomendado para arrojar luz sobre el asunto. Desde
luego, la campaña que, según The Minneapolis Star Tribune ha costado
200 millones de dólares (MST, 2008), no hace la menor alusión a la
demora de casi dos años en comunicar los resultados, ni mucho menos
al bochornoso intento de modificar el «endpoint» del estudio. Nueva-
mente, es evidente que si el estudio hubiera arrojado los resultados es-

perados por las empresas, éstas lo hubieran exaltado como un paradigma
de rigor metodológico y no como un estudio confuso.
El aluvión de críticas y resquemores que despertó toda esta his-
toria ha sido enorme; desde prestigiosas publicaciones como la
influyente revista Time (Park, 2008), hasta relativamente modes-
tas páginas web han activado las alarmas. Por ejemplo, el 16 de
enero de 2008, en un artículo de opinión, el analista Mike Adams
escribía con dureza (Adams, 2008):
"Los únicos que aún pueden defender a la industria son idiotas, arri-
bistas, políticos o abogados (algunos cumplen las cuatro condiciones).
Ninguna persona racional puede ver en la conducta de la industria
nada que se parezca a la integridad en materia científica. La debacle
del Vytorin ha salido a la luz porque no pudieron evitarlo. ¡Imagine
todos los ensayos que sí consiguen ser ocultados, distorsionados o
retroactivamente modificados sin que nadie se entere!"
De manera bastante insólita, sin embargo, el American College of

Cardiology (ACC) salió en defensa del Vytorin. La enormemente influ-
yente sociedad de especialistas sugirió que «las decisiones clínicamente
trascendentes no deben basarse solo en los datos de ENHANCE». Si
bien tal declaración pudiera verse como una juiciosa advertencia de
índole general, realmente constituyó un paso muy inusual en la práctica
regular de dicha organización, máxime si se tienen en cuenta las apara-
tosas anomalías presentes en esta escandalosa trama. ¿Tendrá alguna
relación tal toma de partido con el hecho que informa Alper (2008)
según el cual desde 2003 el ACC recibió cinco millones de dólares
de Merck, un millón de Schering-Plough y cinco millones más directa-
mente,… de la compañía conjunta creada por ambos laboratorios para
la venta específica del Vytorin?
En 1816, el boticario Emanuel Merck empezó a preparar frascos con
medicinas para su comercialización; en solo seis años se convirtió en un
distribuidor mayorista y desde entonces la empresa que lleva su nombre

no ha dejado de crecer hasta convertirse en la poderosísima mega corpo-
ración de hoy. Refiriéndose a aquellos inicios, el alemán Rudolf Buchheim,
conceptuado como «padre de la farmacología moderna» denunciaba hace
un siglo y medio (véase Coleman, 1975) que «la industria química produ-
ce hoy día varias sustancias para las que no encuentra mercado; existe a la
vez un gran número de médicos ansiosos por contar sin ton ni son con
más y más medicamentos. En este escenario, cualquier inversor listo po-
drá enriquecerse haciendo pasar aquellas sustancias como medicamentos
si es suficientemente ingenioso en materia de publicidad».
A la luz de los elementos discutidos hasta ahora, deténgase el lec-
tor en la caracterización que hace Merck de sí misma:
"Merck & Co., Inc., Whitehouse Station, N.J., USA, que opera en mu-
chos países como MSD (Merck Sharp & Dohme), es una compañía
farmacéutica global, impulsada por la investigación, dedicada a velar
por el bien de los pacientes."
Sabiendo, como bien señalaban Melville y Johnson (1984), que «la

mayor parte de los productos concebidos en los laboratorios de las
compañías tienen como principal interés el asegurar la salud de la
propia compañía», uno no puede menos que recordar nuevamente al
Dr. Yekyll y a Mr. Hyde. ¿Demasiado duro? Juzgue Ud. mismo luego
de leer la siguiente sección.
Figura 1.9. Dr. Yekyll y Mr. Hyde.

Un fraude letal
Este segundo caso está tanto o más lleno de claves esclarecedoras

de la naturaleza inescrupulosa que singulariza a las transnacionales
del medicamento en general y a Merck en particular.
Se trata de la debacle asociada con el rofecoxib, poderoso analgési-
co usado por unas 84 millones de personas de todo el mundo y que
salió a la venta desde 1999 en más de 80 países comercializado por
Merck bajo el nombre de Vioxx.
Vioxx se usaba para tratar los síntomas de osteoartritis, artritis reu-
matoide, dolor agudo y menstruaciones dolorosas, en tanto bloqueador
de la enzima Cox 2 que genera las prostaglandinas en el cuerpo.
En el año 2000, la revista The New England Journal of Medicine se
hizo eco del estudio VIGOR4 en el que habían participado 8076 pa-
cientes, parte de los cuales (4.029) fueron asignados aleatoriamente
al grupo que recibiría 500 mg de naproxeno (antiinflamatorio no este-
roideo de vieja data) dos veces al día, en tanto que al resto (4.074) se
le administraría 50 mg de rofecoxib una vez al día (Bombardier, Lai-
ne, Reicin et al., 2000). El «endpoint» eran los efectos adversos
gastrointestinales, precisamente porque la gran ventaja supuesta del
medicamento residía en que permitía tratar el dolor de enfermedades
crónicas sin los efectos gastrointestinales indeseables de los analgési-
cos clásicos (eso sí, con un precio casi 10 veces superior).
Según se supo mucho después, Alise Reicin, vicepresidenta de in-
vestigación clínica en Merck y firmante del estudio citado, había
propuesto en un documento interno de la empresa en 1997 que en el
ensayo clínico que planeaban realizar con el fármaco, se excluyese a las
personas con problemas cardiovasculares previos «para que las diferen-
cias de complicaciones entre los que tomasen Vioxx y los que recibiesen
un analgésico clásico no fuesen evidentes». Esto prueba claramente
que Merck no solo conocía con anterioridad la existencia de una posi-
4
Así llamado por las siglas de «VIoxx Gastrointestinal Outcomes Research».
ble toxicidad miocárdica sino que planificó un sesgo en la selección

para que dicha complicación no se pusiera de manifiesto en el ensayo.
Para satisfacción de Merck, los efectos adversos gastrointestinales
(úlceras gástricas sintomáticas y obstrucción o hemorragia gastroin-
testinal) se produjeron dos veces más entre los usuarios de naproxeno
que entre los del producto novedoso. Este resultado fue crucial para
que Merck consiguiera ventas fabulosas (más de 100 millones de pres-
cripciones) de la que fue calificada como una «superaspirina». Según
comunica Smith (2006), Merck compró a The New England Journal of
Medicine nada menos que un millón de separatas (reprints) de dicho
artículo para apuntalar la promoción de Vioxx. La venta de reprints es,
por cierto, una de las fuentes más productivas de ganancias para las
grandes empresas editoras; en este caso, estima Smith, este contrato
puede haber producido cientos de miles de dólares a la revista.
Pero he aquí que, pese a que el VIGOR había seguido la inescru-
pulosa sugerencia de Reicin, el propio estudio reveló también que el
grupo tratado con rofecoxib presentó una tasa de acontecimientos
cardiovasculares de naturaleza trombótica (infarto de miocardio, an-
gina de pecho inestable, accidente isquémico transitorio, trombosis
arteriales y venosas periféricas) mucho mayor que la que exhibió el
grupo que había recibido naproxeno.
Aunque, como más tarde se supiera, en la documentación interna de
Merck se reconocía que «los riesgos de Vioxx están claramente presen-
tes en el estudio», el hecho fue interpretado por la empresa no como
que el Vioxx producía más daños que el analgésico convencional, sino
como que este último tenía un efecto cardioprotector independiente,
de modo que esa posible consecuencia letal fue cuidadosamente esca-
moteada: la empresa presentó los datos de manera que pasara
inadvertida5.
5
Hechos como este han llevado a Journal of the American Medical Association a la saludable
exigencia de que, además de que se informe sobre el papel de los financiadores en un estudio,
los datos sean analizados por un estadístico no empleado por dichos financiadores. Desconcer-
tantemente, esta regla ha sido impugnada (Rothman y Evans, 2005) en virtud de su presunto
carácter discriminatorio y su inviabilidad.
El truco no funcionó, sin embargo, para especialistas no compro-

metidos con los intereses lucrativos de Merck. En agosto de 2001,
una extensa revisión en Journal of the American Medical Association cues-
tiona la seguridad cardiovascular del analgésico; en septiembre de 2001,
la FDA amonesta a Merck por no advertirlo en la publicidad dirigida a
los médicos directamente, y unos meses después le ordena que en el
etiquetado y prospecto de Vioxx se incluya una advertencia clara so-
bre los riesgos cardiovasculares.
En ese contexto, Joan Ramón Laporte, director del Instituto Catalán
de Farmacología y asesor de la Organización Mundial de la Salud denun-
ció la situación en el Butlletí Groc, de la Fundació Institut Català de
Farmacología. El propio título del artículo caracterizaba sin paños calien-
tes la situación: «Las supuestas ventajas de celecoxib y rofecoxib: fraude
científico» (Laporte 2002). Allí se ponía de manifiesto que desde los pri-
meros estudios experimentales usados por Merck para promocionar las
virtudes del rofecoxib se conocían sus nefastos efectos cardiovasculares.
Merck demandó a la fundación y al doctor Laporte por las supues-
tas falsedades que dañaban su imagen y exigió una rectificación. El 22
de enero del 2004, los tribunales desestimaban la demanda de Merck.
La empresa perdió el juicio, pero ganó un año. ¿Y qué pasó a lo
largo del mismo? Vioxx resultó ser un fabuloso éxito comercial: nada
menos que 2.500 millones de euros ingresados en el 2003. La cifra es
astronómica en sí misma; pero si se tiene en cuenta que representa
casi la mitad de todos los beneficios de la empresa en ese año (ascen-
dente a 5.700 millones de euros según Núñez y Navarro, 2005), se
comprende más fácilmente el empecinamiento de Merck en ocultar el
peligro que Vioxx entrañaba. Pero la impresionante conquista mer-
cantil supuso un devastador fracaso sanitario: su letal influencia en
ataques cardiacos, según estimaba David Gram, investigador de la
FDA en una entrevista con el diario británico Financial Times, Vioxx
produjo «la mayor catástrofe debida a medicamentos en la historia:
entre 90 y 139 mil estadounidenses podrían haber fallecido o tenido
trastornos cardiacos por concepto del fármaco.
Figura 1.10. Decenas de miles de muertos debidos a Vioxx.
En agosto de 2004 se presentan los datos de un estudio (APPRO-

Ve ), que concluye que «quienes consumen la dosis más alta de
6
rofecoxib tiene su riesgo de dolencias cardíacas duplicado». Ante esta

situación, el 30 de septiembre de 2004, Merck anuncia la retirada en
todo el mundo de su medicamento.
A estas alturas, diversos artículos expresaron alarma, ya no por los
riesgos inherentes al consumo del producto sino por todas las bajezas
que los acontecimientos ponían de manifiesto (véanse Waxman, 2004;
Good y Kelley, 2005).
Pero por si todo lo anterior fuera poco, en abril de 2008 el prontua-
rio de Merck se vio incrementado con dos nuevos delitos. A raíz de
las investigaciones judiciales a que se ha visto sometida la empresa se
develó que Merck había representado erróneamente el perfil de ries-
go-beneficio de Vioxx en dos ensayos realizados con pacientes que
padecían mal de Alzheimer o deterioro cognitivo, realizados en 2001.
Cuando los resultados fueron publicados en 2004 y 2005, se había
ocultado el riesgo de muerte que entrañaba el fármaco. «De hecho»,
señalan los doctores Bruce Psaty y Richard Kronmal, de la Universi-
dad de Washington en Seattle, «en ninguno de dichos estudios se
incluían análisis estadísticos de los datos de mortalidad y los dos con-
6
Adenomatous Polyp Prevention on Vioxx.
cluían que rofecoxib era bien tolerado» (Psaty y Kronmal, 2008). La

total objetividad del análisis de estos autores está fuera de toda duda,
ya que ponen a disposición de los lectores todos los datos.
Por otra parte, la propia revisión de la documentación que la em-
presa presentó en los tribunales judiciales reveló que la redacción de
los ensayos clínicos y las revisiones científicas publicadas sobre el
fármaco correspondían en su mayoría a empleados de la empresa o
personas que luego no figuraban en el estudio. La lista de autores
principales incluía a un investigador con afiliación académica que
habría tenido una mínima participación y que no siempre informaba
el apoyo económico recibido. «Merck utilizó una estrategia sistemáti-
ca para facilitar la publicación de literatura médica con autores
invitados y fantasmas», afirmó el equipo dirigido por el doctor Joseph
Ross, de la Escuela de Medicina Mount Sinai. Los análisis de los en-
sayos clínicos demostraron que los investigadores de Merck preparaban
a menudo los manuscritos y luego buscaban investigadores con afilia-
ción académica para colaborar como autores invitados. Así, el sombrío
Mr. Hyde aparece en las revistas bajo la bondadosa fisonomía del Dr.
Yekyll. Más de 250 empleados de Merck trabajaron solos o con la
ayuda de empresas editoras para escribir y gestionar los informes ante
las revistas, los cuales fueron firmados posteriormente por los fantas-
mas; es decir, por universitarios que no participaron pero que fueron
remunerados a cambio de que su nombre figurara en los trabajos (Ross
et al., 2008).
Figura 1.11. Los autores fantasmas en

auxilio de Merck.
Pero quizás lo más destacado de ese misma edición de Journal of

the American Medical Association sea la indignación expresada en un duro
editorial firmado por Catherine De Angelis y Phil Fontanarosa, direc-
tores de dicha revista, en el que se afirmaba «Cuando la integridad en
la ciencia o en la práctica médica se ve cuestionada o amenazada,
como acaece debido a la influencia de la industria, tanto pacientes
como médicos e investigadores están en riesgo a la vez que se daña la
confianza pública en la investigación» (De Angelis y Fontanarosa,
2008).
EL CONOCIMIENTO COMO MERCANCÍA
Como toda actividad humana, la investigación científica se desarrolla

en cada momento, necesariamente, en el marco histórico, social y econó-
mico que le corresponde. Sin embargo, puesto que su cometido es el de
hallar nuevos conocimientos, el de descubrir la verdad pese a quien le
pese, convenga o no al poder, afecte unos u otros intereses, se parte del
principio de que sus derroteros no deben estar determinados por elemen-
tos ajenos a dicho cometido. Otra cosa es lo que luego se comunica o
socializa y los medios por los cuales se hace. La investigación no debería
ser un acto mercantil en sí mismo, más allá de las implicaciones comercia-
les que sus resultados puedan luego tener.
Históricamente, la investigación científica se desarrolla predomi-
nantemente en ambientes académicos, lo cual garantiza –al menos en
teoría– que el proceso investigativo discurra según niveles de autono-
mía, integridad y decoro mínimos. Entre muchos otros, el ejemplo
que vimos en el apartado Apostando a posteriori, p. 35, de los investiga-
dores exigiendo por escrito a la empresa Merck que cesara de inmediato
la moratoria de la publicación de los resultados de un estudio, lo ilustra
de alguna manera.
Para las transnacionales del medicamento, el vínculo con las uni-
versidades y centros de investigación es atractivo, desde luego. Pero
también es a veces incómodo. Cuando consiguen «fichar» a ciertas

personalidades académicas y ponerlas a su servicio de manera casi
incondicional, como hemos visto profusamente en secciones prece-
dentes, no hay grandes problemas; pero la obsecuencia no siempre
está garantizada. Un ejemplo que lo ilustra de manera especialmente
notable es el del acoso de que fue objeto la doctora canadiense Nancy
Olivieri, experta en enfermedades hematológicas, cuando persevera-
ra en denunciar a la compañía que intentaba suprimir resultados
inconvenientes (Smith,2006).
En este contexto, ha surgido el inquietante fenómeno de la llama-
da Contract Research Organization (CRO). Se trata de empresas que
realizan investigación por encargo con atractivas ventajas para las trans-
nacionales del medicamento: su único objetivo declarado es ganar
dinero, son rápidas y no pretenden tener la menor independencia con
respecto a los datos, ni a la manera en que se difundan (o no) los
resultados. No es extraño entonces que hayan ido desplazando a las
instituciones tradicionales (universidades e institutos de investigación).
Aunque existen desde hace varios lustros, el crecimiento experi-
mentado en los últimos años ha convertido a los CRO en un verdadero
boom, como se expresara recientemente en The New England Journal of
Medicine (Shuchman, 2007). En el año 1993, por ejemplo, las CRO
realizaban el 28% de los ensayos clínicos (fases I, II y III); en 2003, ya
se ocupaban del 64%. Bodenheimer (2000), un pionero en la denun-
cia de este maridaje comercial, señala que en el año 1991, el 80% del
dinero abonado por la industria para los ensayos clínicos iba a parar a
los centros académicos, cifra que cayó estrepitosamente al 40% hacia
el año 1998. Y pasaron de tener 12.000 asalariados a 94.000 entre
1992 y 2001 (Mirowski y Van Horn, 2005). Se trata de un mercado
altamente competitivo, desde luego. Actualmente un millar de CRO
se disputan los miles de millones de dólares que pagan las empresas
por sus servicios. Los cuatro CRO más exitosos (Quintiles, Covance,
Pharmaceutical Product Development y Charles River) obtienen ga-
nancias por encima de los 1.000 millones de dólares al año.
Los CRO han generado agudas suspicacias en lo que hace a califi-

cación de su personal, sus principios éticos y su dependencia respecto
de sus contratadores. En Doval (2007) puede leerse:
"La fuerza de trabajo que utilizan es inadecuada para el estándar aca-

démico, ya que en general son profesionales más jóvenes, menos
experimentados, menos diestros y menos educados que los investiga-
dores académicos; esta utilización de personal poco adiestrado les
permite pagar salarios bajos, que a su vez determinan la alta tasa de
renovación del personal y es así que a veces cambian todos en el
curso de un solo proyecto o bien los trasladan de un proyecto a otro
según sus necesidades, por lo cual nunca pueden adquirir la experien-
cia y la pericia en un proyecto u objetivo específico."
El sesgo a favor de los productos de las empresas es sistemático

cuando (y solo cuando) son éstas las que directa o indirectamente
financian los estudios, incluso en caso de que dicha financiación be-
neficie a actores del mundo académico. De hecho, es cuatro veces
más frecuente que los estudios financiados por las compañías arrojen
resultados favorables a ellas que los que son financiados por otras
fuentes (Lexchin et al., 2003). Resultados incontrovertibles como este
han sido demostrados una y otra vez a lo largo de los últimos 20 años
(entre muchos otros, véanse Davidson, 1986; Coyle, 2002; Cho y
Bero 1996; Stelfox et al., 1998; Als-Nielsen et al., 2003; Nieto et al.,
2007; Tungaraza y Poole, 2007; Turner et al., 2008). Siendo así, ¿qué
se puede esperar de un modelo donde los «investigadores» son direc-
tamente vendedores de servicios investigativos?
Con la aparición de la mítica revista Philosophical Transactions, de
la Royal Society de Londres, se inauguró en 1665 la era de las revis-
tas científicas. Se trataba de cubrir la necesidad de intercambiar ideas
y validar los trabajos a través del llamado «arbitraje científico», o
peer review para los anglosajones, expresión que podría traducirse como
«revisión crítica de los resultados de un científico a cargo de sus
pares», el cual abarca la actividad de árbitros y editores orientada a

determinar si un trabajo será o no publicado. A ellos toca, entre
otras cosas, evaluar si las preguntas de investigación son pertinen-
tes, si la metodología es correcta y los resultados constituyen un
aporte a lo que ya se conoce, si se han hecho las referencias debidas
y si la obra responde a las normas éticas vigentes. El sistema no está
exento de aristas conflictivas; así lo demuestran algunos tropiezos
dramáticos como el que tuvo en 1937 el trabajo de Hans Krebs so-
bre el ciclo del ácido cítrico, originalmente rechazado por Nature, y
que más tarde sería la pieza clave para que el autor fuese galardona-
do con el premio Nobel; pero parecería ser lo menos malo con que
podemos contar.
Cientos de miles de revistas han ido apareciendo desde entonces.
La mecánica que se ha ido entronizando y generalizado, y con pocas
excepciones, consiste en esencia en lo siguiente: el investigador envía
un artículo con la esperanza de que sea admitido, la revista acoge el
trabajo si éste supera el proceso editorial, y el lector paga por el acce-
so al material publicado.
Pero una vez más, el incremento de los precios de las suscripciones
a las revistas no se detiene; asciende a un 12% anual, lo que está
provocando una cancelación masiva de suscripciones por parte de las
universidades, que no pueden seguir este ritmo. Sólo cinco grandes
bibliotecas universitarias americanas han cancelado ya más de trece mil
títulos (Martínez, 2003). La solución evidente a esta crisis parecía ser el
empleo del soporte electrónico e Internet. La posibilidad de gestionar
ágil y muy económicamente la información que ofrece este soporte au-
guraba un cambio radical en la materia, pero sorprendentemente no fue
así: si bien surgieron y se desarrollaron numerosas revistas electrónicas
o versiones digitales de las convencionales (no existe virtualmente nin-
guna que no haya emigrado totalmente o en régimen mixto hacia dicho
soporte) el acceso a sus contenidos exige un desembolso económico
apreciable, muchas veces prohibitivo, y la escalada de precios se ha
mantenido inconmoviblemente.
El gran valor añadido por el cual en cierto sentido se está pagando

es que dichas revistas mantienen un alto factor de impacto (FI) y un
proceso editorial supuestamente muy exigente a través del ya mencio-
nado peer review. Ello no sólo estaría garantizando un alto estándar de
calidad y seriedad a los contenidos sino que también concede enorme
crédito a todo investigador que consiga publicar en dichas revistas.
Sin embargo, también en este terreno se produce un cierto círculo
vicioso: la revista se comercializa gracias al factor de impacto, pero
éste se reconfigura artificialmente en función de los intereses comer-
ciales de las revistas.
Para comprender mejor este asunto es menester entender bien cómo
se calcula el susodicho factor, algo que, a pesar de ser muy empleado
para valorar a investigadores y revistas, no es frecuente que muchos
conozcan rigurosamente. La fórmula en cuestión puede verse en el
Anexo 1.1. Como se deriva claramente de la definición, un problema
serio radica en que el FI depende crucialmente de cuáles son las pu-
blicaciones que la empresa Thomson Scientific ha indexado y sobre
todo, de lo que la propia empresa considere como artículo «citable».
Esto es así porque el FI es una razón cuyo numerador no depende del
número de artículos citables (todas las citas que recibe la revista en el
último bienio agrandan el numerador, y por ende el FI), pero el deno-
minador se reduce (y el FI se agranda) tan pronto la empresa en cuestión
conceptúe menos artículos como susceptibles de ser citados en dicho
bienio. Thomson Scientific es una verdadera transnacional de pro-
ductos bibliométricos, que ha ido tragándose a sus competidores desde
que en 1992 adquirió al Institute for Scientific Information (ISI) fun-
dado por el mítico Eugene Garfield en 1960; sus beneficios ascendieron
sólo en 2002 a 7.600 millones de dólares (Aréchaga, 2005).
Las críticas al factor de impacto son numerosas, pero la que acabamos
de bosquejar es especialmente inquietante, pues el FI de las revistas
suele usarse para decidir si un autor es o no promovido, o mantenido en
su cargo, o merecedor de una subvención; de modo que publicar en una
revista cuyo FI sea muy alto es en extremo atractivo para los investiga-
dores. Y aquí aparece el problema más grave: es bien conocido que los
editores de muchas revistas siguen diversas estrategias manipuladoras
para que sus trabajos no caigan en la categoría de «citables». Tal cir-
cunstancia que se ve agravada por el hecho de que Thomson Scientific
se niega a hacer público el proceso para determinar cuáles artículos son
o no citables. Esto ha llevado a PLoS Medicine Editors (2006) a concluir
que «la ciencia está en la actualidad valorada por un proceso que es en
sí mismo subjetivo, no científico y subrepticio». Así, lo que empezó por
ser un intermediario metodológico para medir indirectamente la cali-
dad de una revista, está terminando por convertirse en una meta que
distorsiona las decisiones en materia de publicación, hoy más en manos
de administradores de la ciencia que de los propios científicos.
Refiriéndose al caso de España, el director de la revista The Interna-
tional Journal of Developmental Biology, Juan Aréchaga, llamaba la
atención acerca de que los investigadores españoles son frecuente-
mente evaluados sobre la base de los factores bibliométricos de las
revistas en que publican, de los cuales el FI es sin duda el más nota-
ble, a los efectos de la concesión de complementos de productividad
y la aprobación de solicitudes financieras para proyectos de investiga-
ción. Siendo así, razona, no es de extrañar que sólo se planteen enviar
sus artículos a una revista nacional cuando éstos son de muy escasa
calidad o han sido rechazados reiteradamente por las revistas extran-
jeras de la especialidad, en lo que constituye «un círculo vicioso nefasto
para el progreso científico en España y, en particular, para sus publi-
caciones profesionales» (Aréchaga, 2005).
EL NUEVO CONOCIMIENTO ¿VUELVE A SER

DE TODOS Y PARA TODOS?
Así las cosas, investigadores y comunicadores se han involucrado

crecientemente en proyectos de nuevo tipo, orientados al rescate del
acceso universal y gratuito al nuevo conocimiento, que por otra parte
no deje al margen del juego a las comunidades con menor tradición

científica y, sobre todo, menos recursos. En un entorno así, desde
luego, la manipulación de las transnacionales del medicamento, por
ejemplo, tienen menos oportunidades de gravitar.
El acceso abierto a la información científica ha contado con el
apoyo explícito de decenas de miles de académicos de todo el mundo
y ha fructificado en iniciativas como Pubmed Central o BioMedCentral
cuyo éxito ha causado sorpresa y consternación a los mercaderes de la
producción científica. En ese contexto ha surgido un ejemplo para-
digmático de los nuevos tiempos: la revista PLoS Medicine, publicada
por la organización no lucrativa Public Library of Science (PLoS), de
ahí su nombre. PLoS Medicine sigue los exitosos pasos de PLoS Biology,
que hubiera sido fundada exactamente un año antes (en octubre de
2003).
Se trata de un producto que responde al modelo que ha dado en
llamarse «de acceso abierto». Esto quiere decir, en primer lugar, que
sus contenidos son enteramente accesibles para cualquier persona del
mundo a través de Internet, en todo momento, sin costo alguno. De
hecho, sus promotores y editores instan a los ciudadanos no sólo a
leer sus contenidos, sino a «bajarlos», reproducirlos, diseminarlos, tra-
ducirlos y republicarlos con la única condición de dar los debidos
créditos a los autores originales.
Tal posibilidad, sin embargo, es familiar para cualquier internauta:
millones de sitios web contienen información a la que se accede gra-
tuitamente y sin restricciones. ¿Cuál es entonces la singularidad de
este proyecto?
En primer lugar es una publicación internacional y multidisciplina-
ria que abarca todo el espectro de las disciplinas relacionadas con la
salud (desde las Ciencias Básicas hasta la Salud Pública, pasando des-
de luego por la Investigación Clínica) con un nivel de arbitraje (peer
review) tan exigente como el de las más encumbradas revistas médicas.
Este último dato no es en absoluto desdeñable, habida cuenta de la
enorme polución informativa que inunda la red en materia de salud
(datos falsos, información confusa, sensacionalismo, mensajes caren-

tes de respaldo científico, etc.). Por otra parte, PLoS Medicine nace con
una explícita vocación de enfrentar las más espurias tendencias que
lamentablemente se consolidan cada vez más en los grandes Journals
del mundo biomédico, crecientemente desvirtuados, como se ha vis-
to, por intereses comerciales tales como los de las transnacionales del
medicamento. La feroz reacción que el patrón de acceso abierto ha
despertado en no pocos polos de poder económico y en algunas de
sus expresiones editoriales clásicas, es elocuente reflejo de la natura-
leza altruista, novedosa y antihegemónica que le caracteriza.
El modelo que ha prevalecido desde el siglo XIX hasta nuestros días es
exactamente el opuesto al elegido por PLoS Medicine: en aquél, el autor
pone sus resultados en manos de los mercaderes de la información, éstos
lucran con los nuevos conocimientos y el lector paga por ello; en éste, el
proceso editorial es ajeno al lucro, el lector o usuario no paga absoluta-
mente nada y al autor se le pide que gestione los recursos necesarios para
llevar adelante el siempre costoso proceso de arbitraje, revisión, edición,
producción, etc. No se espera, sin embargo, que los autores se hagan
cargo personalmente de estos gastos, sino que apelen a las propias agen-
cias de gobierno, instituciones, fundaciones, hospitales o universidades
que hayan financiado las investigaciones —o que tengan entre sus propó-
sitos promover la ciencia— para que destinen recursos con ese fin. De
hecho, ya está probado que tal expectativa es perfectamente viable. Por
otra parte, los editores afirman que bajo ningún concepto bloquearán la
publicación de trabajos de calidad que provengan de autores que decla-
ren no haber hallado estos apoyos. Los editores señalan (http://
www.plosjournals.org/) que cuentan incluso con recursos para respaldar
económicamente las publicaciones de investigadores de decenas de na-
ciones en desarrollo. Aunque en su fase inicial se publicará sólo en inglés,
la expectativa de los editores es abrirla a otras lenguas más adelante.
Además de publicar trabajos altamente especializados del mayor ni-
vel, PLoS Medicine incluye secciones concebidas para mantener un estilo
imaginativo, fresco, abierto al debate, provocador del pensamiento in-
dependiente, con valor educativo, dirigido tanto a médicos como a pa-

cientes, a gerentes como a estudiantes y profesionales. Va más lejos:
proclama su deseo de ser la revista médica «más rápida, más rigurosa y
más honrada», y aspira nada menos que a convertirse en «la mejor revis-
ta médica del mundo». Naturalmente, ignoramos si este proyecto podrá
alcanzar tan ambiciosos y loables propósitos, pero sus primeros resulta-
dos son impactantes. Partiendo de una financiación inicial de nueve
millones de dólares donados por una fundación y del apoyo de figuras
como Harold Vermur, ganador del premio Nobel, ha conseguido en
muy pocos años un notable nivel de implantación. Un creciente núme-
ro de donantes, entre los que se incluye la fundación Welcome, está
dispuesto a costear el proyecto. Debe decirse, por otra parte, que ha
revolucionado al mundo biomédico mediante la denuncia científica-
mente fundamentada de fenómenos que han estado en gran medida
ausentes de las tribunas manejadas por las transnacionales de la infor-
mación científica. Basta un repaso a varias de las citas que en este propio
capítulo se han hecho a sus artículos para convencerse.
Obviamente, una iniciativa como esta no tuvo ni pudo haber tenido
sostenibilidad alguna si no se contara con lo que constituye el fenómeno
intelectual más asequible, dinámico y abarcador que se haya creado nun-
ca para el intercambio de información entre profesionales, instituciones y
ciudadanos en general: Internet. La experiencia ilustra excelentemente
cómo un pequeño equipo de personas puede producir una verdadera re-
volución que pocos años antes hubiera supuesto costos imposibles de
encarar. Pero no podemos llamarnos a engaño, la red de redes, como ha
dado en llamársele, es una realidad inquietante con no pocas trampas.
INTERNET: UN RECINTO DE CONTRADICCIONES

Desde luego, no pretendo caracterizar acabadamente el complejí-
simo fenómeno social, cultural y tecnológico de Internet. Me propongo,
en cambio, hacer algunas modestas reflexiones acerca de su relación
con la cultura científica de la sociedad, que no es más que una de las

aristas sociales sobre las que dicha manifestación tiene un impacto
tangible y directo. El solo hecho de tratarse de un formidable edificio
informativo, que se ha ido autoconfigurando, aunque haya sido y esté
siendo de manera esencialmente caótica, lo convierte en un aconteci-
miento cultural de primer orden, sobre todo por el ejercicio intelectual
de abstracción, conceptualización y estructuración que ha exigido a
millones de personas, pero también por las exigencias de conocimien-
to técnico y operativo que ha demandado e inducido.
La prodigiosa facilidad con que ahora podemos identificar textos,
sonidos e imágenes, conservarlos en nuestra propia computadora per-
sonal, así como modificarlos o compartirlos con otros colegas, abre
oportunidades para la cultura científica hasta hace muy poco insospe-
chadas, especialmente en la zona sur del planeta. Y en el caso específico
de los investigadores, ellas se potencian con las listas de distribución
mediante correo electrónico, el acceso a las muchas revistas de cual-
quier disciplina, conexión con bases de datos y registros con
información (por ejemplo, demográficos y epidemiológicos), acceso a
instituciones académicas, centros de investigación y páginas o blogs
individuales de personalidades científicas.
Cervera (2001) hacía notar uno de los rasgos más alentadores que,
pese a sus numerosos problemas, nos hacen reverenciar a Internet:
"Internet está aquí; ya no puede ser desinventada. Los ordenadores y

las redes son una herramienta que puede permitir al Tercer Mundo
encontrarse en algunos aspectos en pie de igualdad con el Primero.
Con los satélites de comunicaciones de órbita baja todo el planeta
tendrá una infraestructura de comunicaciones equivalente. El Tercer
Mundo tiene la oportunidad histórica de pasar de una economía agra-
ria a otra de la información ahorrándose la era industrial."
Quizás para que se produzca ese notable paso, haya que esperar.
Pero desde ya, como académico residente en un país en desarrollo,
necesitado de información actualizada, que hasta hace pocos años

sólo podía ser mirada desde lontananza, puedo testimoniar que en
muchos sentidos las posibilidades que la revolución informativa libe-
ra nos han colocado en una situación cualitativamente muy superior a
la que sufríamos antes de la existencia de Internet. Nunca nos hemos
sentido tan a la par de nuestros colegas europeos o norteamericanos
en cuanto a este aspecto; como nunca antes, al menos los que no
dependemos de grandes recursos tecnológicos para la investigación,
sentimos cierta equidad a los efectos creativos en materia social, inte-
lectual y cultural.
Es frecuente que oigamos alusiones a las llamadas «avenidas de la
información» por las que circulan todos los recursos arriba menciona-
dos. Nada más ajeno, sin embargo, a una avenida que los caminos por
los que se transita en Internet. Una avenida suele ser una arteria prin-
cipal a la cual tributan calles secundarias y que sirve como referente
para orientarnos en una ciudad. En Internet no existe tal. Hay puntos
de partida más notorios que otros, quizás, pero el enmarañado amasi-
jo de caminos se torna de inmediato inesquematizable.
No sólo es imposible establecer un «mapa» por razones estructura-
les sino por la labilidad de los componentes mismos de esta estructura.
Se trata de un proceloso entramado informativo que ha crecido verti-
ginosamente y sin reglas directrices para su configuración, y mucho
menos para su mantenimiento. Tal indisciplina conduce a que la infor-
mación que hasta hace poco estaba en una determinada dirección no
tiene porqué mantenerse hoy, a la vez que un sitio que ha perdido
toda vigencia puede permanecer activo sin que nadie se ocupe de
retirarlo de los circuitos de acceso.
Una aproximación a esta problemática en tanto fuente para la
conformación de un avance cultural ordenado, coloca de inmediato
sobre el tapete una larga lista de conflictos, cuyo examen puede ser
útil para atisbar los desafíos que Internet abre, los peligros que en-
traña y las oportunidades que ofrece. Organizaré la exposición
valiéndome de los polos que conforman cada miembro de un corto
conjunto de «contradicciones». En rigor, como se verá, quizás no se

trate de verdaderas contradicciones, sino de alternativas que operan
en ejes perpendiculares que, en el fondo, es posible (y conveniente)
conjugar para configurar nuevos planos operativos en el poliédrico
mundo de Internet.
Comunicación vertical y horizontal
A mi juicio, el rasgo más novedoso de Internet desde el punto de

vista sociocultural es que, si bien conserva elementos de la estructura
vertical, propios de cualquier sistema de información conocido, gesta
y promueve significativas posibilidades de participación en flujos ho-
rizontales de intercambio informativo. He aquí la primera pareja de
polos contradictorios y complementarios.
A la vez que el usuario estará inexorablemente inserto en una jerar-
quía electrónica (que por estar oculta, suele instalar en él una falsa
ilusión de total albedrío), lo cierto es que Internet ha demostrado in-
contestablemente ser el más poderoso y pujante medio de intercambio
y comunicación horizontal entre individuos que haya existido en la
historia de la humanidad.
Los usuarios están potencialmente sometidos al control de sus
actividades, puntos de vista, intereses y acciones, como nunca lo
habían estado. Esto no quiere decir que un «gran hermano» nos esté
escudriñando de continuo cuando, estando conectados, transmiti-
mos nuestro perfil social a través de lo que compramos, comentamos,
leemos, transmitimos o desdeñamos. Quiere decir que tal espionaje
es posible. Como afirma el sociólogo catalán Manuel Castells quien,
como pocos, ha trabajado el tema con notables lucidez y capacidad
de anticipación: «un poder político, judicial, policial o comercial (de-
fensores de derechos de propiedad) que quiera actuar contra un
internauta determinado puede interceptar sus mensajes, detectar sus
movimientos y, si están en contradicción con sus normas, proceder
a la represión del internauta, del prestador de servicios, o de los

dos» (Castells, 2001). Técnicamente, Internet es una arquitectura
de libertad, pero socialmente, sus usuarios pueden ser reprimidos y
vigilados mediante la propia red.
Se acusa, y no sin razón, a Internet de permitir y promover una
especie de autismo social, donde la imagen del ciudadano navegan-
do libremente por la red de redes sería menos verdadera que la
realidad del sujeto atrapado en las redes de la red. Es una falsa dico-
tomía: si bien es cierto que algunos se atrincheran en el reducido
espacio físico de su computadora, el abanico de posibilidades comu-
nicativas interpersonales interactivas, que no ha hecho más que
empezar a desplegarse, es enorme. El correo electrónico, los blogs y
páginas web personales, la metodología wiki (véase siguiente Sección),
las tertulias electrónicas (chat), el intercambio entre condiscípulos en
cursos a distancia y los grupos de discusión, no son más que algunos
ejemplos.
Navegar y aportar
La dicotomía navegar-aportar encarna de hecho otro nudo en cier-

to sentido contradictorio: la propia convocatoria a «navegar» que se
hace desde la publicidad es engañosa, pues tiende a cincelar en los
usuarios la idea de que Internet es exclusivamente un espacio de bús-
queda y aunque, obviamente, constituye una fuente invaluable para
hallar información, ofrece también una singular oportunidad para in-
tervenir y gravitar. De los pilares en que descansa la llamada «revolución
digital», Internet es lo que mejor encarna el carácter convergente, parti-
cipativo e interactivo que singulariza de manera excepcional a este medio,
aunque sólo una minoría de los usuarios aprovecha la posibilidad de
hacer aportes.
La potencialidad sinérgica de este recurso trae a la memoria la cé-
lebre frase de Bernard Shaw:
"Si Ud. tiene una manzana y yo tengo una manzana, y si nosotros

intercambiamos esas manzanas, entonces Ud. y yo nos mantendre-
mos ambos con una manzana. Pero si Ud. tiene una idea y yo tengo
una idea e intercambiamos esas ideas, entonces cada uno de nosotros
tendrá dos ideas.»"
No obstante, estamos presenciando un espectacular y hasta hace

poco inimaginable proceso de construcción colectiva a través del des-
pliegue de numerosas y fructuosas aportaciones a un mismo artefacto,
que muchas veces hallan cauces de coherencia difíciles de creer si no
tuviéramos pruebas tangibles. Los orígenes nos llevan a Richard Sta-
llman, investigador del Massachusetts Institute of Technology e
iniciador del movimiento vertebrado en torno al proyecto GNU y el
respaldo legal de la Free Software Foundation, creada en 1984 para
divulgar y generalizar la liberación de los sistemas operativos de los
ordenadores, mediante el empleo gratuito de códigos abiertos. El sis-
tema operativo de libre acceso conocido como Linux (en rigor, GNU/
Linux), resultado del trabajo de miles de programadores de todo el
planeta que aúnan esfuerzos a través de Internet y con el que operan
hoy cientos de millones de computadoras y servidores de todo el mun-
do, surgió precisamente de la convergencia de intereses entre Stallman,
quien considera que no hay otra forma de evitar que los usuarios sean
controlados por los desarrolladores, con el finlandés Linus Torvalds
de la Universidad de Helsinki, un ingeniero que estima que no hay
otra forma de hacer software con calidad.
El núcleo de Linux no utiliza ni una sola línea del código de AT&T
o de cualquier otra fuente de propiedad comercial, pero su desarrollo
entraña complicados aspectos técnicos cuyos entresijos sólo pueden
ser dominados por una élite. Lo relevante, a los efectos del asunto
que más interesa, la cultura científica de la sociedad, es su potenciali-
dad para gestar productos de gran impacto social.
Vale la pena detenerse en alguna expresión concreta de esta filoso-
fía de contenidos abiertos. Acaso la más elocuente sea Wikipedia, una
enciclopedia multilingüe, nacida bajo el amparo de la corporación no

lucrativa Wikimedia, creada por Jimmy Wales con el objetivo de desa-
rrollar proyectos de contenido libre. La idea proviene de la llamada
«tecnología wiki», nacida en 1995 y que según su creador, Ward Cun-
ningham, es «una colección de páginas Web libremente extensible, un
sistema hipertextual para guardar y modificar información, una base
de datos en la cual cada página es fácilmente modificable por cual-
quier usuario con acceso a un navegador».
Figura 1.12. La emergencia del acceso abierto.
Wikipedia incluye millones de artículos en decenas de idiomas des-

de su creación en 2001. Es frecuente que la nueva entrada sea creada
por iniciativa de un colaborador no especializado; poco después van
interviniendo los expertos hasta dejarla, en un plazo muy breve, con
un nivel muy decoroso. La versión inglesa tiene decenas de miles de
usuarios registrados. En octubre de 2005 era el sitio que ocupaba el
lugar 37 en visitas a nivel mundial. En una entrevista concedida a El
País de España, Jimmy Wales afirmaba que el sitio tenía un millón de
visitas al mes y daba una idea de la magnitud del proyecto, señalando
que Wikipedia en inglés tenía 200 millones de palabras, de modo que
ya por entonces era mayor que las enciclopedias Británica y Encarta

juntas (Fernández, 2005).
¿Cómo puede funcionar un sistema así? ¿Cómo conseguir que la
enciclopedia mantenga altos niveles de calidad? Es difícil de explicar,
pero —aparte de algunas medidas cautelares mínimas— la clave pa-
rece estar en que los propios colaboradores se ocupan de acrisolarla y
que lo hacen en mayor y más rápida medida que los depredadores que
pudieran deteriorarla. «En el fondo, el hecho de agregar vandalismo o
contenido negativo no resulta gratificante para la gente por la sencilla
razón de que otros lo eliminan muy rápidamente», señala su creador.
En la mencionada entrevista concedida a El País comentaba textual-
mente:
"La manera de gestionar la Wikipedia tiene una mezcla de consenso,

en el que hay que llegar a un acuerdo final; democracia, mediante una
votación informal; aristocracia, según la cual las decisiones de los usuarios
más respetados pesan más; monarquía, es donde entro yo; y una dic-
tadura benévola, en la que al final hay que tomar decisiones. La idea es
que cada vez haya que utilizar menos esa manera dictatorial hacia
formas más de consenso. Si alguien rompe la confianza y el respeto,
ahí entro yo, como por ejemplo cuando grupos neonazis han inten-
tando imponer su ideología."
Cuando se descubrió una reseña biográfica de John Seigenthaler,

quien fuera periodista y asistente del asesinado Robert Kennedy, don-
de se le vinculaba falsamente con el crimen de su hermano John, saltó
la polémica. El artículo, que había sido escrito anónimamente —algo
inicialmente posible pero ya regulado— se mantuvo durante cuatro
meses sin que fuera descubierto el error.
Desde luego, con el paso del tiempo todo irá adoptando nuevas
formas determinadas por la vida misma. De hecho, a finales de 2005
se empezó a valorar la existencia de dos versiones de la Wikipedia,
una estable y controlada, y otra en permanente actualización. Los
problemas son muchos: desde artículos con insultos o faltas orto-

gráficas introducidas por algún editor, hasta el enfrentamiento a los
ya mencionados actos de vandalismo, pasando por cuestiones rela-
cionadas con el copyright de las fotos, presencia de ambigüedades,
reiteraciones y un largo etcétera. Se han ido adicionando regulacio-
nes que endurecen las normas editoriales, aunque el espíritu original
se ha respetado en lo esencial. Desde junio de 2006, por ejemplo,
Wikipedia ha decidido proteger las entradas que verosímilmente pu-
dieran ser objetivo de adulteraciones malintencionadas o disputas.
Algunos artículos se cerrarán por completo hasta solucionar los pro-
blemas y otros permanecerán semi protegidos y sólo podrán ser
editados por usuarios registrados con determinada antigüedad (Re-
ventós, 2006). Es muy difícil imaginar cómo va a ser y cómo va
funcionar este portentoso esfuerzo colectivo. Lo único seguro es que
no será como es hoy, pero también que seguirá creciendo cuantitati-
vamente (en marzo de 2008, por ejemplo, la Fundación Alfred P. Sloan
ha donado 1,9 millones de euros para el proyecto).
Pero de momento, lo cierto es que un análisis comparativo entre
Wikipedia y la Enciclopedia Británica publicado en la revista Nature
(Giles, 2005) arrojó resultados sorprendentes. Se eligió un variado
conjunto de 42 términos. El contenido que para cada uno de ellos
figuraba en Wikipedia fue enviado a respectivos expertos mundiales, y
otro tanto se hizo con los contenidos que para dichas entradas figura-
ban de la Enciclopedia Británica. Cada uno de los 84 expertos consultados
ignoraba la procedencia de la información recibida. Sólo fueron de-
tectados ocho errores graves, cuatro correspondían a una y los otros
cuatro a la otra. Los errores menores contenidos en esas 42 entradas,
tales como omisiones o confusiones, fueron 291: 168 para Wikipedia
y 123 para la Británica.
Este resultado es altamente relevante, pues vino a desautorizar la
polémica opinión vertida por el célebre semiólogo italiano Umberto
Eco un año antes al diario alemán Die Welt, cuando expresó que existe
«el peligro de que 6.000 millones de personas tengan 6.000 millones
de enciclopedias distintas» y ya no puedan entenderse entre ellos en

absoluto, de manera que Internet, al imposibilitar los referentes cultu-
rales comunes, puede generar una incomunicación a nivel global.
Para desesperación del imperio de Microsoft, que posee su propio
código para productos cuyo empleo exige el pago de regalías, actual-
mente se sigue desarrollando la plataforma Linux, y la tecnología Wiki
se extiende con proyectos como Wikictionary, un diccionario con defi-
niciones, sinónimos y antónimos; la Wikiquote, un repertorio de citas
célebres, Wikibooks, libros de texto de todo tipo y nivel, o la Wiki-
news, con noticias de actualidad.
No en balde Microsoft es uno de los principales «enemigos» de Sta-
llman y su movimiento por el software libre, el cual no depende de
actualizaciones periódicas realizadas por expertos contratados, como
ocurre con el de pago. Éstas, por otra parte, a menudo no aportan nada
nuevo fuera de algunos oropeles, e incluso suelen lanzarse con errores y
vulnerabilidades, ya que la esencia del movimiento del código abierto
es la actualización permanente a cargo de «todos».
Cantidad y calidad de la información
Contar con más información ofrece en principio un notable rédito

potencial, pero también puede significar más confusión. Javier Busta-
mante, profesor de la Universidad Complutense de Madrid decía que
tal vez se produce aquí «la paradoja de que la avalancha de informa-
ción no es la solución para superar la ignorancia, justo lo contrario de
lo que ocurre con otras necesidades humanas, que se sacian con una
mayor afluencia de aquello de lo que se carece» (Bustamante, 1999).
La polución informativa es avasallante y los grandes ahorradores
de tiempo que son las computadoras personales e Internet, constitu-
yen trampas que pueden conducir a la dilapidación del tiempo y al
hallazgo de informaciones falsas que incautamente pudiéramos con-
ceptuar como válidas. Ya es casi un lugar común la advertencia de
que sobran motivos para recelar de la veracidad de los datos o el rigor

de quienes los difunden. La manera históricamente más eficaz de com-
batir la información espuria o desacertada ha sido la de proveer
información genuina y correcta, pero el gran desafío consiste en des-
lindar una de la otra. Como se ha señalado (Terceiro, 2003), Internet
no es una fuente de información, es un medio de información cuya
fiabilidad es la de las fuentes de las que procede. Los recursos que
puedan crearse para resolver este dilema serán cruciales para que se
consiga una plena inserción de Internet en la cultura científica de la
sociedad.
Es menester intercalar que, aunque lento y trabajoso, el sistema de
las revistas científicas convencionales, vertebrado en torno al peer re-
view, ofrece en principio una garantía de rigor que resulta ser un bien
nada desdeñable, y que se echa más en falta en la medida que vivimos
este aluvión informativo que suele desarrollarse con más rapidez que
nuestra propia capacidad para asimilarlo racionalmente. Gradual y
despaciosamente, la red ha ido esbozando, sin embargo, sus propios
cauces organizativos, su propio tímido ordenamiento, y algunos re-
cursos para que podamos orientarnos en lo que a fidedignidad
concierne, aunque por lo general a la zaga de los acontecimientos. Las
revistas y publicaciones electrónicas surgieron, por poner un ejemplo,
mucho antes de contar con normas acerca de cómo citarlas, pero lo
cierto es que tales normas ya existen.
La credibilidad de una fuente se puede, no obstante, más o menos
anticipar; pero no siempre. Basta recordar la jugarreta de Brandom
Williams, un estudiante de la Universidad Estatal de Carolina del
Norte, quien a finales de 2003 inventó un estudio en el que supuesta-
mente se demostraba que la fellatio es una práctica que reduce el riesgo
de contraer cáncer de mama. Colocada en la página web de la Univer-
sidad como una broma, la noticia con todos los detalles de la supuesta
investigación despertó tanta atención que fue reproducida y manteni-
da como cierta por CNN hasta que se reveló la verdadera historia
(véase Wolfe et al., 2003).
Un tema que se vincula directamente con la dudosa calidad de la

información y que despierta ingenua seducción es el de los sondeos
realizados a través de la Web.
El valor de esos datos es sumamente dudoso, ya que tales encues-
tas se realizan en un marco completamente ajeno a todo rigor científico.
Las cinco razones más evidentes son las siguientes:
a) Lo que ocurra en una muestra nunca interesa. Lo que interesa

es la población de la que ella pudiera ser una representación.
Cuando se usan técnicas de muestreo científicamente estructu-
radas, se parte de una población y se elige una muestra que la
represente. En estas encuestas de Internet se procede exacta-
mente al revés: se obtiene una muestra (autoconformada por
los propios integrantes) y en el mejor de los casos se especula
acerca de qué población podría estar representada por ella.
b) Aun cuando tal especulación fuera correcta, terminaríamos «en-
terándonos» de lo que piensan o hacen aquellos que no nos
interesan. Los «votantes» en este tipo de indagaciones son en prin-
cipio aquellos que cumplen ciertos rasgos tales como, entre otros,
haber entrado en el sitio en el momento oportuno, no sentirse
apremiados con el tiempo de conexión, estar especialmente moti-
vados con el tema de la encuesta o tomarse el trabajo de votar.
c) Las estimaciones, cuando se hacen de manera científica, tienen
un margen de error asociado, solo calculable si la selección se
hizo por un método riguroso, llamado «probabilístico» en el len-
guaje técnico de la especialidad. Ello exige el uso riguroso del
azar en algún punto del proceso de selección de quienes inte-
gran la muestra. Nada de esto está ni puede estar presente en
este tipo de sondeos. Vale decir, no podemos conocer qué signi-
ficado real tiene, por ejemplo, un porcentaje, ya que no sabríamos
los márgenes de error que lo aquejan.
d) Aparte de los posibles sesgos mencionados, todo ese proceso se
realiza sin ningún control sobre los errores ajenos al muestreo,
al que tanto esfuerzo se destina en las encuestas serias, tales

como la corroboración de que el que responde entiende lo que
se le pregunta, por poner un solo ejemplo.
e) Una de las más graves endebleces metodológicas de estas en-
cuestas consiste en que casi inevitablemente son manipulables
por cualquiera que lo desee. Por la naturaleza del contacto, una
misma persona puede votar muchas veces si lo desea; basta con
que pulse varias veces su voto. Los administradores del sitio que
lleva adelante la encuesta no pueden, por lo general, saber la iden-
tidad de quien entró7.
Desde luego, realizar encuestas es en principio válido para los más

diversos propósitos. Esta práctica se entronizó con éxito en la década
de los 50 del siglo pasado en la medida que la teoría del muestreo fue
consolidándose. El empleo de Internet para realizarlas dista de ser
erróneo; por el contrario, es un medio que en entornos especializados
se mira con interés y expectativa. Sin embargo, no es defendible como
procedimiento científico poner cuestionarios en las páginas web para
que quienes lo deseen se pronuncien.
Es cierto que ellas aportan algo de información,… pero casi con
seguridad equivocada. Nadie adquiere unos zapatos cuatro centíme-
tros menores que el correspondiente a su pie; no vale ningún argumento
del tipo «ha de tenerse en cuenta que son muy bonitos», o «al fin y al
cabo son de muy buena calidad» o «hacen juego con el traje que uso».
Simplemente no le sirven. Con las encuestas de este tipo ocurre lo
mismo: no sirven porque pueden conducir a que se radique un error
de percepción, una convicción errónea. Es preferible no saber algo
acerca de cierta realidad que creer que ella es como no es. Con 3.000
7
Ocasionalmente podría adoptarse alguna medida, tal como llevar el registro de la IP desde
la cual se hizo la conexión para evitar más de un voto desde dicha dirección; pero un usuario
puede usar más de una IP si dispone de esa posibilidad; además, se estableciera tal restricción,
diferentes personas estarían limitadas para expresar su opinión si dependen de una misma IP (a
veces un nodo completo responde a una dirección única).
personas bien seleccionadas (muestreo probabilístico) se puede vati-

cinar adecuadamente, por ejemplo, el desenlace de la votación de 120
millones de participantes en unas elecciones en Estados Unidos: sin
embargo, muchos textos serios sobre técnicas muestrales alertan so-
bre el problema que estamos mencionando y lo ilustran con ejemplos
ya muy clásicos para los especialistas, tales como las encuestas –falli-
das precisamente por padecer de los problemas de «autoselección»
que tienen las que nos ocupa– que precedieron a la aplastante victoria
de Franklin Delano Roosvelt en su primer mandato y que lo declara-
ban como un seguro perdedor.
Para cerrar esta reflexión, reparemos en un ejemplo real y re-
ciente. En ocasión de las elecciones generales de España de 2008,
se realizó un debate televisivo entre los dos candidatos con más
posibilidades de éxito: José Luis Rodríguez Zapatero y Mariano
Rajoy. Concluido el programa, algunos periódicos se precipitaron
a realizar sondeos en sus versiones digitales para que sus visitan-
tes opinaran acerca de quién habría sido el «ganador». He aquí los
resultados que se podían leer al día siguiente: en El País (contabi-
lizados 39.000 votos, los porcentajes de quienes opinaban que el
ganador había sido Zapatero y Rajoy ascendían a 58% y 41% res-
pectivamente; en El Mundo (tras 187.044 votos) dichos porcentajes
eran 42% y 58%. Es decir, estos periódicos daban resultados si-
métricamente opuestos8. Ni es posible ni interesa saber quién tenía
«la razón», desde luego: lo que importa destacar es que los resulta-
dos son incompatibles entre sí, algo que, habida cuenta de todo lo
que se ha expuesto, no puede sorprender pero pone de manifiesto
la esterilidad de realizar ese ejercicio y hasta de prestarle la menor
atención.
8
Debe decirse que debajo de las cifras El País aclaraba: «Esta encuesta no es científica,
responde tan sólo a las respuestas voluntarias de los lectores que desean exponer su opinión»,
en tanto que El Mundo consignaba que era un «resultado provisional pendiente de revisión de
votos fraudulentos».
Alfabetización informática e incultura de la sociedad
El número de internautas crece a pasos agigantados. El analfabe-

tismo informático se reduce rápidamente; basta atender a las
estadísticas que se publican a diario (véase http://www.argo.es/noti-
cias/estadisticas.html). El proceso de asimilación de una verdadera
cultura digital, sin embargo, es otra cosa: ha sido poco estudiado y,
pudiera, paradójicamente, estar experimentando retrocesos parciales.
A mi juicio, la incorporación masiva de usuarios «digitalmente incul-
tos» que se produce a diario aporta, en lo inmediato, caos. La
propagación de virus, por ejemplo, tiene un terreno mucho más abo-
nado cuantos más recién alfabetizados se incorporen.
Si algo parecería caracterizar al mundo que nos ha tocado vivir en
este comienzo de siglo es la velocidad con que se suceden los reempla-
zos tecnológicos y el creciente monto de información que —muchas
veces banalizada o manipulada— suele aturdir más que esclarecer a los
ciudadanos. La tentación de apretar teclas sin pensar demasiado es enor-
me. A todos nos ha pasado; a todos nos pasa en una medida u otra.
En un libro de muy fácil lectura aunque por muchas razones polémi-
co, Cebrián (2000) escribía que se nos transmite, incluso contra nuestra
voluntad, una cantidad abusiva de informaciones; se nos bombardea
con hechos y datos, que distorsionan nuestro ideal de conocimiento, el
cual es fruto de la abstracción y resulta de un esquema organizado que
nos permite relacionar unas cosas con otras, unas ideas con otras, y
referirlas a un contexto, a una situación o una realidad determinadas.
Todo ello requiere un tiempo para la reflexión y un espacio para la duda.
Bustamante (1999) recuerda al escritor británico Arthur C. Clarke
cuando expresaba la idea de que la simple posesión del conocimiento
científico-técnico no garantiza una dimensión humana más profunda,
ni una ética que nos recomiende en qué dirección y con qué ritmo ese
conocimiento debe ser empleado. Y en ese contexto subraya «la profun-
da asincronía existente entre un ritmo de innovación tecnológica con
una tasa exponencial de crecimiento, y la capacidad humana de asimila-
ción, de reflexión, de comprensión de las nuevas situaciones y adapta-

ción a ellas mediante la creación de nuevos valores, normas y estilos de
vida renovados, que crece en proporción aritmética, si es que crece».
A esta realidad hay que agregar la existencia de una gran cantidad
de personas que deberían estar seriamente involucradas en el debate
sobre estos temas (especialmente dirigentes políticos y líderes socia-
les) pero que son verdaderos indigentes digitales. Estos individuos,
cuya principal culpa sería haber nacido antes de tiempo (aparte de su
falta de formación y escasa curiosidad intelectual), son con frecuen-
cia incapaces de usar las tecnologías de información, no entienden
sus impactos socioculturales, pero toman decisiones en la materia in-
cluso sin procurarse debida asesoría. (Terceiro, 2003).
Hace unos años disfruté de la película Blade runner. La trama en sí me
pareció una mera excusa prescindible. El verdadero protagonista no es
el policía encarnado por Harrison Ford sino el escenario en que se mo-
vía: una inquietante mezcla de tecnología y mugre en la que deambulan
seres diversos (humanos o, indistinguiblemente, de diseño). Basura,
humo y hacinamiento configuran el entorno de unos personajes técni-
camente dotados de recursos y conocimientos, pero culturalmente
adocenados. Allí se anunciaba un mundo que hoy veo encarnado mu-
chas veces en la red. Ya no me causa asombro hallar en ella, por
ejemplo, un documento de alto vuelo técnico pero infestado de erro-
res sintácticos y faltas ortográficas. Así me ocurrió, por ejemplo, con
un excelente manual de un programa informático para el manejo de
recursos gráficos, colocado altruistamente en la red para consumo
universal desde un aislado enclave latinoamericano. Es la realización
palpable de la cultura que anunciaba la película: deslumbrante tecno-
logía en medio de la indigencia cultural.
Solidaridad con Brian
Detengámonos en un tema puntual que ilustra directamente la

falta de entrenamiento para la crítica de que adolece un importante
sector de los usuarios de tecnologías de alto nivel, como la que en-

carna la red.
Internet ha resultado ser un espacio y un medio propicio para pro-
palar textos apócrifos y falsedades diversas. El acceso generalizado a
este potente instrumento tecnológico, junto con todas las oportuni-
dades informativas que ofrece, abre las puertas a todo género de
mentiras que candorosamente se consumen y redistribuyen.
La vía más empleada para difundir tales patrañas es sin duda el
correo electrónico, y en la inmensa mayoría de los casos, de un modo
u otro, se insta al receptor a que reenvíe el propio mensaje a otras
personas. De tal suerte, se generaría una cadena de enormes propor-
ciones. El lector los habrá recibido en cuantía directamente
proporcional al tiempo que lleve operando con el correo electrónico,
puesto que esta práctica es de vieja data.
Muchas veces se trata de advertencias sobre supuestos virus infor-
máticos contenidos en mensajes electrónicos en cuyo subject o asunto
figure determinado texto; dichos virus destruirían información con-
tenida (o causarían graves trastornos) en nuestros equipos o redes.
Tales advertencias son falsas y la difusión que muchos hacen de ellas
se debe en buena medida a la enorme ignorancia que los usuarios
tienen sobre los virus informáticos, así como a la inseguridad que
produce moverse en medios apenas conocidos.
Muchos de estos mensajes, los más burdos, que parecen diseñados
por y para retrasados mentales, anuncian grandes desgracias a quienes
no los reenvíen y no menores ventajas para los que lo hagan (suele
figurar la alusión a personas que perdieron el empleo al interrumpir la
cadena, o ganaron la lotería cuando cumplieron las indicaciones). A
través de esa primitiva técnica de alternar palo y zanahoria, explotan
la asombrosa propensión de muchísima gente a creer que hay fuerzas
oscuras que rigen su destino y pautan su futuro.
Otros se ocupan de reproducir documentos apócrifos que se atri-
buyen a escritores o figuras famosas, como ocurrió con el texto La
marioneta que se atribuyó a Gabriel García Márquez, supuestamente
escrito ante la inminencia de su propia muerte. Mucha gente lo creyó,
reprodujo y difundió, incluso después de que el propio escritor des-

mintiera su autenticidad y declarara: «Lo que me puede matar es que
alguien crea que escribí una cosa tan cursi. Esto es lo único que me
preocupa».
Aunque no agoto la lista, finalmente, mencionaré los mensajes en
que se comenta la situación de una persona que atraviesa por una
coyuntura de infortunio o fatalidad y cuya suerte podría cambiar si el
receptor cumple con alguna indicación (casi siempre, reenviar el men-
saje a otros receptores).
Vale la pena examinar someramente un ejemplo que nos ayude a
profundizar en el problema. Hacia 2004 circuló con cierta intensidad
el siguiente mensaje electrónico:
Asunto: SOLIDARIDAD CON BRIAN
Brian, un chico de Buenos Aires, tiene una malformación del

corazón y precisa un transplante. El coste de la operación es de
$115,200. Las ISP (Internet Service Provider) dentro del país o
en el extranjero pagaran $ 0,01 por cada e-mail que se envíe con
este titulo: SOLIDARIDAD CON BRIAN. Es preciso actuar
rápidamente. Se necesitan 11,5 millones de mensajes electróni-
cos para financiar la operación. Se le ha puesto a Brian un
Notebook al lado de su cama con un modem para que pueda ir
contando. Si lo enviáis a todas las personas que conocéis, tarda-
reis 2 minutos y, sin embargo, esto ayudará a salvar la vida de un
niño. Os ruego que no rompáis la cadena y que, sobre todo, no
olvidéis poner el mismo titulo, ya que es la única forma de con-
trol para las ISP. Muchas gracias.
Unos minutos de reflexión, que uno normalmente no tiene tiempo

de destinar al asunto, y una lectura detenida de lo que dicen estos
mensajes, que el vértigo en que vivimos no nos permite muchas veces

hacer, acaso convenzan rápidamente de que lo que allí se escribe no
tiene ni pies ni cabeza.
¿Quién y cómo va a poder rastrear mensajes que tengan ese
subject relacionado con el tal Brian en todo el globo terráqueo? ¿Y
con qué objeto? ¿Cómo Brian va a ir contando desde su notebook
los mensajes que una persona envía de un punto del planeta a otro
hasta llegar a once millones y medio? Si contara un mensaje por
minuto, suponiendo que el pobre Brian tuviera la posibilidad téc-
nica, que tuviera una salud de hierro y que no durmiera nunca,
tendría que estar 22 años contando mensajes sin parar. Si hubiera
unos sujetos dispuestos a dar ese dinero, ¿por qué diablos no se lo
dan de una vez al presunto niño enfermo en lugar de exigir un
estéril flujo de mensajes que carecen de todo sentido, salvo el de
dilatar su curación, sin contar lo despiadado que sería el procedi-
miento con el supuesto enfermo?
Hace poco leía en una novela una cínica afirmación que decía: las
personas se dividen en dos grupos: los que quieren dinero y los que no
saben lo que quieren. No la comparto, pero creo que —aunque haya más
grupos aparte de los dos mencionados— los autores de estos engen-
dros pertenecen a uno de los dos citados subconjuntos.
Hay unos individuos empecinados en que se construyan cadenas
de este tipo, no sé debido a qué extraña entidad psiquiátrica (quizás
sólo aspiren a tener el placer orgásmico de recibir un día desde Singa-
pur el mismo mensaje que un día generaron desde alguna aislada oficina
de Cochabamba o desde un aburrido ático de Iowa). El autor de la
cadena de Brian probablemente es uno de los que la padece.
Algunos sujetos están tan empeñados en conseguir esa hazaña que
generan trucos más o menos ingeniosos como aducir que Bill Gates
necesita probar un detector (tracker) de mensajes y argumentos de esa
índole. Muchos de los avisos sobre peligrosos virus anunciados «ayer»
por American on line o Microsoft y que «destruyen el disco duro» son
sumamente burdos (sólo la falta de entrenamiento en el pensamiento
lógico puede no irritar a alguien que lea un documento que, sin estar
fechado, aluda a lo que pasó «ayer» o «este año»).
La interpretación de que los gestores de las cadenas no saben bien
lo que desean es una de las dos posibles. Pero hay otra: el autor perte-
nece al conjunto de los que quieren dinero a costa de nuestra energía,
nuestra ingenuidad, nuestras buenas intenciones y nuestro tiempo (el
que destinamos a estas cadenas).
Cuando se envía el mensaje reproducido a nuestros corresponsales
electrónicos habituales, estamos difundiendo por la red esa lista de
nombres y direcciones. Esta es una información potencialmente útil
para los mercaderes. Todos recibimos mensajes que no sabemos cómo
pueden haber llegado a nuestro buzón; no se trata de cadenas de este
tipo sino de informaciones comerciales u ofertas de cosas sorpren-
dentes (el llamado spam, que tantos quebraderos de cabeza da a los
administradores de red). Sospecho que han tomado nuestras direccio-
nes de mensajes que circulan con nuestros nombres por la vía
mencionada.
A mi juicio, tan pronto veamos los síntomas que anuncian que
estamos frente a una de estas expresiones, lo razonable es borrar el
mensaje y no enviarlo a nadie. Salvo alguna excepción, la única cade-
na que realmente tendría sentido desarrollar, en mi opinión, sería una
en que se comentara que todo esto de las cadenas es casi siempre una
trampa, con la cual, por otra parte, se puede quizás colapsar la red (o
introducir ruido en ella), así como una prueba irrefutable de la pre-
sencia ubicua de la mediocridad que nos ataca por todos lados, o bien
de intereses mercantiles, no menos agresivos. Para defendernos de
esa mediocridad y de esos intereses tenemos que estar atentos, pues
el embate es permanente, sostenido y se aprovecha tanto de nuestra
buena voluntad como de que vamos perdiendo la costumbre de re-
flexionar pausadamente los textos que tenemos delante.
Finalmente, cabe aclarar que hay cadenas que se orientan a denun-
ciar (o apoyar) causas políticas o de otra índole cuyos autores consideran
injustas (o justas). Ellas han sido generadas probablemente por perso-
nas que sí saben lo que quieren y eso que quieren no es dinero. Obvia-
mente, esto es otra cosa; cada cual puede decidir sumarse o no a ellas de
acuerdo con sus puntos de vista; hacerlo no necesariamente entraña
haber caído en una trampa como las comentadas.
EL DISCERNIMIENTO CRÍTICO ANESTESIADO

Para concluir este capítulo abordaremos someramente varios fenó-
menos perniciosos que sólo sobreviven gracias a la ausencia de una
cultura científica elemental que provea a los ciudadanos de mecanis-
mos básicos de autodefensa. Algunos de ellos serán tratados más
adelante con detenimiento.
Credulidad y superchería
El primero que ha de mencionarse es el azote de la pseudociencia,

fenómeno que se aborda pormenorizadamente en el Capítulo 4. Como
su nombre sugiere, puede considerarse como tal a cualquier sistema
de ideas que, aparentando —explícita o implícitamente— ser una ex-
presión de la ciencia, dimana del pensamiento fantástico de sus
creadores o paladines, antes que de un vínculo verdadero con la reali-
dad objetiva. Sus cultores no suelen presentarse como elegidos por la
providencia sino que sustentan sus puntos de vista a partir de presun-
tas leyes científicas que otros no conocen o no han alcanzado a
comprender (no en balde muchos se autoproclaman expertos en «cien-
cias ocultas»).
La prédica de estos charlatanes explota la credulidad de la gente
llana y, de las múltiples expresiones que tiene la pseudociencia, las
supersticiones y sus innúmeras formas específicas configuran el expo-
nente más primitivo. Es a esas expresiones, las que tienen más impacto
social, que dedicaré algunas reflexiones en esta Sección, ya que, la-

mentablemente, son también las que gozan de mayor crédito entre
amplias franjas de población, en buena medida porque a esa perpe-
tuación del oscurantismo contribuyen activamente la prensa y la
televisión. Shamos (1995) da cuenta de que, de 1.600 periódicos que
se publican en los Estados Unidos, alrededor de 1.400 contienen una
columna diaria con el horóscopo; de ellos, menos de 50 consignan
que éste se presenta exclusivamente con el fin de entretener a los
lectores y carece de fundamento científico.
La creencia en adivinadores, mediums e iluminados reposa casi
siempre en anécdotas que se difunden de boca en boca y anestesian el
discernimiento crítico de los azorados receptores. Sin reparar en que
tales personajes hacen uso de toda una serie de recursos basados en
su penetración psicológica, los clientes dan muestras del asombroso
potencial, probablemente congénito, que posee el ser humano para la
ingenuidad.
Según recoge Hernández (1993), la organización española Alter-
nativa Racional a las Pseudociencias ha clasificado a los videntes en
tres categorías: el lógico, el sensacionalista y el generalizador. Las ca-
racterizaciones respectivas se exponen a continuación:
– Lógico: Utiliza, sobre todo, el sentido común. Dispone de buena

información general y con cada cliente va creando un auténtico
archivo de datos. Es el de más éxito y el más sistemático en su
trabajo. Debe ser buen psicólogo y observador para captar las emo-
ciones de sus clientes y saber cuándo sus predicciones gustan a
quien le paga.
– Sensacionalista: No le importa hacer predicciones sobre cualquier
cosa; el caso es hacerse famoso. Es muy poco riguroso, pero, a
pesar de que sus equivocaciones son sonadas, suele conseguir po-
pularidad.
– Generalizador: Es el más clásico. Predice o adivina en abstracto:
habla de un problema familiar, un viaje, un dolor de cabeza, algo
que sucede a todos un montón de veces. Sus clientes, muy suges-

tionables, escuchan en sus abstracciones las predicciones que
quieren oír.
Figura 1.13. Videncia y negocio.
Puesto que por lo general tales sujetos se conducen según pautas

oportunistas y sus profecías no se ajustan al lenguaje y las categorías de
la ciencia, es casi imposible encarar sus manejos con recursos formales.
En general llama la atención cómo la suspicacia contra la super-
chería se adormece más fácilmente cuando atañe a la esfera médica.
Cuando en medio de una contienda bélica se filtra una información
secreta, nunca se piensa en la posibilidad de una exitosa interferencia
telepática del enemigo: se trata, sin más, de identificar al traidor o al
espía que lo hizo posible.
En Silva (1997) se recordaba acerca de un artículo publicado en
1994 por el rotativo Der Spiegel que incluía el relato, presuntamente
verídico, que creo que vale la pena reproducir.
Durante un viaje de negocios a Nueva York, un hombre de Califor-

nia sufre una súbita y aguda dolencia bucal como consecuencia de la
cual se ve obligado a visitar con urgencia a un estomatólogo. Este
diagnostica una grave inflamación periodontal e indica un tratamien-
to de urgencia.
Antes de recibir acción terapéutica alguna, el enfermo decide con-
sultar telefónicamente a su distant healer, que se halla en el otro extremo
del país. El sanador se informa detalladamente del caso y coordina
con su cliente una consulta a distancia: exactamente a las ocho de la
noche, en la habitación de su hotel, el enfermo habría de concentrarse
y entrar en «contacto» con el sanador. El terapeuta, por su parte, esta-
ría exactamente a esa misma hora enviando energías positivas y
restauradoras al paciente. El hombre de negocios hace lo que se le ha
indicado y, unas horas después, el dolor desaparece totalmente. A la
mañana siguiente regresa a ver al dentista para que lo examine. El
especialista neoyorquino primero no puede creer lo que oye, pero des-
pués no puede creer lo que ve: no hay rastros de la infección. ¿Se ha
producido una cura milagrosa? Presa del asombro, decide llamar a
California y consultar al responsable de tan portentoso efecto psico-
somático para preguntarle qué diablos había hecho el día anterior a
las cinco de la tarde (ocho de la noche, hora de la costa Este).
«¿Ayer a las cinco?» preguntó, sin comprender, el sanador. «Sí:
¿cómo procedió para tratar a distancia esa gingivitis?». La respuesta
fue: «¿Curación a distancia? ¡Demonios, se me olvidó por completo
esa cita!».
La pregunta relevante es: ¿se produjo un efecto placebo o se iba a
verificar la curación de todos modos? Sólo la experimentación con-
trolada y rigurosa puede responder genéricamente a esta pregunta. Y
finalmente cabe cuestionarse: si se hubiera verificado el intento tele-
pático y el paciente no se hubiera curado, ¿se hubiera acaso difundido
el fracaso como reguero de pólvora? Por otra parte, si el terapeuta no
hubiera olvidado «la cita», ¿duda alguien de que se le hubiera «apunta-
do» este éxito?
Se supone que la policía vele por nuestra seguridad, pero en algunos

países sus integrantes pueden ser más peligrosos que los delincuentes,
la forma en que funciona el aparato de justicia parece diseñado para
garantizar la perpetuación de lo injusto, o los periódicos concebidos
para informar la verdad, se ocupan de deformarla. Con más o con me-
nos razón, es así que en casi cualquier entorno social muchos ciudadanos
han aprendido a recelar de las promesas de sus políticos, de las virtudes
que atribuye la publicidad a los productos, de la honorabilidad de los
abogados, de la honradez de los comerciantes, de la rentabilidad que
prometen los bancos o de la pureza de los sacerdotes. Consecuente-
mente, se crean poderosas organizaciones de autodefensa popular,
asociaciones de defensa al consumidor, o fundaciones para exigir el
cuidado del medio ambiente, e incluso, estructuras oficiales para garan-
tizar que se respeten los derechos del ciudadano. ¿Ocurre algo similar
con los embates a la cultura científica? No parece ser este el caso. A mi
juicio, la sociedad contemporánea está esencialmente indefensa ante
los videntes, síquicos, profetas, astrólogos, curanderos, chamanes y far-
santes de toda laya que se autoproclaman benefactores del prójimo sin
despertar mayores suspicacias. Es cierto que hay algunas organizacio-
nes que intentan denunciar estos fraudes, pero suelen ser entidades
débiles que bregan aisladamente y sin apoyos sólidos. Para lidiar con
intereses tan poderosos en medio de tantas carencias culturales de las
víctimas hace falta mucho más.
El retorno de los charlatanes
Los trucos fotográficos nacieron casi con la fotografía misma. Y el

engaño a los incautos, haciéndoles creer en cosas sobrenaturales por
ese conducto, tampoco demoró mucho. Un ejemplo célebre, especial-
mente debido al involucramiento de Arthur Conan Doyle, fue el caso
de las «Hadas de Cottingley». Los hechos comenzaron cuando se di-
fundió la noticia de que dos adolescentes de Cottingley (Yorkshire)
habían tomado contacto con algunas hadas, de lo cual se tenían prue-

bas fotográficas. El proceso de certificación de la autenticidad de dichas
fotos fue controvertido, pero el personal respaldo de Doyle fue cru-
cial para que las susodichas fotos ganaran enorme fama como pruebas
de que las ideas en boga por entonces acerca del más allá y lo sobrena-
tural no eran mera charlatanería.
Acaso perturbado por una trágica secuencia de adversidades per-
sonales, Doyle había coqueteado durante años con los postulados
del espiritismo, que por entonces experimentaba creciente respaldo
de la población, hasta que en 1916 anunciara públicamente su adhe-
sión a dicho movimiento y comenzara a dar conferencias para
difundirlo (Capanna, 2004). Y en diciembre de 1920 aparece un artí-
culo en la revista Strand Magazine, donde Conan Doyle daba vehemente
aval a la existencia de hadas y gnomos en los bosques británicos, todo
lo cual se fundamentaba en las cinco fotos, incluidas en el trabajo,
que se habían tomado tres años antes. Un bienio después, publicó el
libro El regreso de las hadas donde perseveraba en el dislate al escribir
en la presentación que lo que se contaría en el libro tal vez «muestre
que estos hechos constituyen un hito de la historia de la humani-
dad».
Figura 1.14. Las Hadas de Cottingley y el respaldo de Conan Doyle.
Con los años se acumularon pruebas irrefutables del carácter frau-

dulento de las fotos, incluyendo el descubrimiento de un libro infantil
publicado en 1915 cuyas ilustraciones contenían las mismas hadas

que aparecían en las fotos presuntamente tomadas un año más tarde,
así como la confesión en 1982 de una de las autoras: las hadas no eran
más que figuras de papel colgadas de las ramas o puestas frente a la
cámara (véase Figura 1.14).
Los hechos relatados pueden mirarse con cierta condescendencia,
ya que acaecieron en una época en que, recién concluida la Primera
Guerra Mundial, reinaba en Europa un estado de enorme confusión
emocional, además de que el espiritismo conservaba una cierta au-
reola de ciencia experimental. Pero, resulta sorprendente que en pleno
siglo XXI haya que lidiar con realidades no muy diferentes.
La catástrofe del 11 de septiembre de 2001 a raíz del ataque terro-
rista contra las torres gemelas de Nueva York produjo no pocos
desvaríos sensacionalistas. Uno de ellos fue una foto que circuló por
Internet donde se veía un joven turista instantes antes de la primera
colisión (Figura 1.15).
Figura 1.15. Foto supuestamente tomada el 11 de septiembre de 2001.

Aunque muchos creyeron el bulo, éste fue desmontado debida-

mente a través de argumentos tales como que la ropa de invierno del
joven que aparece era incompatible con la benevolencia del clima el
día del atentado. También se halló la foto original del avión que se
hubiera empleado para realizar el fotomontaje, además de que luego
un joven húngaro, quien había tomado la foto cuatro años antes, se
declaró autor del truco a la vez que circuló otra foto suya tomada en
dicha ocasión (Figura 1.16).
Figura 1.16. Foto original del avión empleado y del autor del fotomontaje.
Entre los sitios web dedicados a desmontar historias falsas y vario-

pintas maniobras concebidas para explotar, casi siempre con
desembozado afán de lucro, la candidez de la gente, me llamó la aten-
ción la del periodista y narrador mexicano-español Mauricio-José
Schwarz. Entre otras cosas, en el blog nombrado «El retorno de los
charlatanes» se puede encontrar un curioso ejercicio fotográfico don-
de el autor explica detalladamente cómo cualquiera puede construir
una foto en la que figure un espíritu debidamente insinuado allí donde
deseemos. Tal esfuerzo se inscribe dentro del proceso de denuncia a
un famoso promotor de lo paranormal (Iker Jiménez) entre cuyas ha-
zañas se encuentra la de intentar (y lamentablemente, quizás conse-

guir) persuadir a su audiencia de la extraña aparición de «fantasmas»
en el cementerio de Navalperal de Pinares, un pequeño pueblo abu-
lense. ¿Con qué pruebas? Pues, cómo no, con una foto muy similar a
la que consiguió hacer caer en la trampa al famoso escritor británico.
Tales trucos son hoy más fáciles de realizar gracias a recursos
gráficos de la informática y la fotografía digital, y también quizás
más fáciles de desenmascarar, como se demuestra en el mencionado
blog. Pero quizás sigan teniendo similar acogida entre la ingenua
masa de personas magnetizadas por lo esotérico. En cualquier caso,
vale la pena ver en su blog cómo Schwarz consigue enrejar a la mo-
delo brasileña Isis Mosca dentro de una iglesia, de manera que termina
insinuada, como corresponde a un espíritu que se respete (Schwarz,
2005).
El poder oculto de la casualidad
Como es bien conocido, cada cuatro años se realiza una elección

presidencial en Estados Unidos. Cada dos décadas, el acto electoral
se realiza en un año terminado en cero. Desde antaño se llamó la
atención acerca de que todas aquellas personas que fueron elegidas o
reelegidas en un año múltiplo de diez morían antes de terminar su
mandato. En efecto, la lista de presidentes y sus respectivos desenla-
ces fatales era la siguiente:
1840: William Henry Harrison, falleció de muerte natural el 4 de abril

de 1841.
1860: Abraham Lincoln, fue ultimado en abril de 1865.
1880: James Abram Garfield, falleció luego de ser tiroteado en julio
de 1881.
1900: William Mc Kinley, murió tras un atentado perpetrado el 6 de
septiembre de 1901.
1920: Warren Gamaliel Harding, falleció el 2 de agosto de 1923 en

forma inesperada.
1940: Franklin Delano Roosevelt, falleció de un derrame cerebral en
abril de 1945
1960: John Fitzgerald Kennedy, fue asesinado el 22 de noviembre de
1963.
No pocos norteamericanos llegaron a creer ciegamente que se tra-

taba de una especie de maldición ineluctable. En la medida que se
acumulaban corroboraciones de tal «maldición», las apelaciones a la
racionalidad y las reflexiones sobre el concepto de azar daban cada
vez menos resultados: si la elección se había producido un año múlti-
plo de diez, el destino trágico de los presidentes durante su mandato
estaba garantizado. Hubo que esperar hasta 1985 para que quedara
demostrado el absurdo. Cuando Ronald Reagan, electo en 1980, re-
sultó gravemente herido de bala en un pulmón a raíz de un atentado el
30 de marzo de 1981, la profecía parecía cumplirse… pero he aquí
que sobrevivió y terminó felizmente su mandato. Por si acaso alguien
aún pensaba que el destino había cometido un pequeño error, el caso
de George W. Bush, electo en 2000 acabó de persuadir a los ilusos
cuando concluyó su mandato sin novedades.
Aquí la pregunta crucial es: ¿constituye una gran casualidad la se-
cuencia de muertes ocurridas a los presidentes electos entre 1840 y
1960? Sí y no. Sobre todo, no. Vale la pena intentar una breve explica-
ción. La casualidad existe, no cabe dudarlo. La muerte es un hecho
muy singular en la biografía de las personas y en este caso se observa
un patrón curioso. Pero a la vez se trata de una regularidad observada
a posteriori, como puede haber muchas otras. Quizás todos los Presi-
dentes tuvieron algo en común durante el tercer año de su mandato,
tal como que en ese lapso nació su primer nieto, o tal vez todos aque-
llos cuyos apellidos comenzaban con H (cinco hasta ahora), quedaron
viudos dos años antes de fallecer. Hallar regularidades de este tipo
sería muy fácil si tuviéramos una base de datos biográficos detallados
para cada uno de los 43 sujetos que han presidido ese país desde George
Washington hasta la fecha.
Profundicemos en esta idea. Consideremos primero una supuesta
conexión cósmica que ha circulado intensamente por Internet entre
los destinos de los presidentes Abraham Lincoln y John Fitzgerald
Kennedy. Se trata de la «prueba» de que estas personalidades estaban
milagrosamente conectadas, consistente en una serie de emparejamien-
tos de datos biográficos correspondientes a estos dos personajes. A
modo de ejemplo, elijo diez, pero el lector puede encontrar muchos
sitios en la red con sólo poner los nombres de ambos en cualquier
buscador. He aquí la lista:
1. Abraham Lincoln y John Kennedy fueron designados congresis-

tas en 1847 y 1947 respectivamente.
2. Lincoln fue elegido presidente en 1860, justo cien años después,
en 1960, fue elegido presidente Kennedy.
3. Ambos medían 1,83 metros.
4. Sus apellidos tenían siete letras.
5. El secretario de Lincoln se apellidaba Kennedy, y el de Kennedy,
se apellidaba Lincoln.
6. Fueron asesinados en viernes, por balazos en sus cabezas, dispa-
rados desde atrás en presencia de sus esposas; mujeres con las
que perdieron un hijo durante su estancia en la Casa Blanca.
7. Booth disparó a Lincoln en el teatro Ford y se refugió en un alma-
cén; Oswald disparó a Kennedy —que viajaba en un coche Lincoln
de la casa Ford— desde un almacén y se ocultó en un teatro.
8. Los nombres completos de sus presuntos asesinos, nacidos en
1839 y 1939, suman quince letras cada uno, eran sureños y fue-
ron asesinados horas después de los asesinatos —sin haber
confesado su culpabilidad— por respectivos vengadores.
9. Sus sucesores Andrew Johnson y Lindon Johnson (nombres de
seis letras) eran senadores, demócratas del sur y nacieron, el pri-
mero, en 1808 y, el segundo, en 1908.
10. La semana anterior a su muerte, Lincoln había estado en Mon-

roe, Maryland; y la semana antes del asesinato de Kennedy, éste
había estado con Marilyn Monroe.
Figura 1.17. ¿Reencarnación 100 años después?
¿Es una gran casualidad o una mano suprahumana cinceló esos

destinos paralelos? La idea que se sugiere es que se trata de dos almas
gemelas, o de que el destino ha decidido reproducir en Kennedy lo
acaecido a Lincoln, o incluso que ¡aquél es una reencarnación de éste!
(véanse detalles de este desatino en www.near-death.com).
Desde luego, algunas de estas observaciones son mucho más ridí-
culas que intrigantes. No me ocuparé de desmitificar los componentes
de la lista, señalando la naturaleza falsamente asombrosa de cada una
de ellos. Kilty (2000) desmonta el mito de las esotéricas coinciden-
cias analizándolas una a una. Pero vale la pena encarar el asunto desde
una perspectiva más general.
En primer lugar, es obvio que si consideramos otro conjunto de
atributos (conjunto que podría ser infinito), éstos no coincidirían. Si
hubieran nacido o hubieran muerto el mismo día con 100 años de

diferencia, o en el mismo estado, seguramente tal similitud se hubiera
incluido en la lista de esotéricas coincidencias. Pero no se menciona
tal disimilitud, como no se menciona que sus perros no se llamaban
igual o que no coincidían los nombres de sus primogénitos, que los
grupos sanguíneos no eran los mismos, ni que una viuda se volvió a
casar y la otra no.
En segundo lugar, como expresé arriba en relación con la falacia
de los fallecimientos presidenciales, el hallazgo de coincidencias
resulta muy fácil si se cuenta con detalladas bases de datos biográfi-
cos de un par de personas con actividades afines y un simple programa
informático. De hecho, así ha sido: en el número de primavera de
1992 de la revista The Skeptical Inquirer se convocó a un concurso en
el que los participantes enviarían coincidencias similares entre otro
par de presidentes. Uno de los ganadores, Chris Fishel, consiguió
hallar una lista similar de coincidencias para cada uno de 21 pares
de presidentes.
Más allá de la reticencia de muchos a considerar argumentos racio-
nales que pudieran echar abajo sus supersticiones o sus prejuicios
místicos favoritos, en este caso ha de lidiarse con el hecho de que no
pocos norteamericanos adoran las cábalas relacionadas con su siste-
ma electoral. Recientemente, unas horas después de las elecciones
primarias en Ohio para elegir el candidato demócrata a las elecciones
de 2008, Hillary Clinton se apresuró a proclamar ante la multitud:
«nunca un presidente ha llegado a la Casa Blanca sin ganar las prima-
rias de Ohio», mientras las pantallas de televisión del Ateneo de
Columbus, mostraban los resultados: 54% para ella y 44% para el
senador Barack Obama.
Cuando Evelyn Adams ganó la lotería de Nueva Jersey dos veces,
los periódicos comunicaron que la probabilidad de tal hazaña sería de 1
en 17 trillones. Pero puesto que millones de personas compran boletos
de la lotería del estado constantemente, es estadísticamente demostra-
ble que resulta «prácticamente seguro» que a alguien, en algún lugar, le
tocaría el primer premio en dos ocasiones. Una cosa es la probabilidad

que de antemano tenga Evelyn Adams de ser dos veces ganadora, y
otra la probabilidad de que ello ocurra a alguno de los millones de ciu-
dadanos que cada día apuestan.
Nuestra intuición, como se explica en (Myers, 2002), es muchas
veces incapaz de apreciar que las secuencias aleatorias casi necesaria-
mente incluyen rachas, regularidades o patrones dentro de su azarosa
configuración. Cuando tales manifestaciones son observadas, nos
negamos a creer en principio que ello pueda ser obra de la casualidad.
Myers comunicaba que su «coincidencia favorita» era el siguiente he-
cho, poco conocido: en el salmo 46 de la Biblia de King James,
publicada el año en que Shakespeare cumplía 46 años, la palabra 46ª
es shake y la palabra 46ª desde el final es spear. Pero mucho más ex-
traordinario que esta coincidencia, apostillaba, ¡es el hecho de que
alguien la haya notado!
Pienso que algunos interesantes ejemplos adicionales contribuyen
a comprender mejor la idea. Imaginemos que un profesor propone a
sus 40 alumnos el siguiente ejercicio:
"Cada uno de ustedes traerá mañana al aula una secuencia de 200 ceros
y unos escritos en un papel. Al llegar a su casa, cada alumno contará
cuántos tíos tiene; llamémosle T a dicho número. Si T es un número
par, el alumno lanzará una moneda 200 veces e irá registrando en un
papel los resultados (Caras y Escudos) según se vayan produciendo; tras
cada lanzamiento, anotará un 1 en caso de que salga cara y un 0 en caso
contrario. Si T es un número impar, el alumno inventará los resultados
que a su juicio «pudiera» haber obtenido si los 200 lanzamientos de
moneda se hubieran llevado a cabo. Al comienzo de la clase de mañana,
ustedes me entregarán sus respectivos papeles con sus nombres sin
decirme si las series fueron obtenidas con la moneda o inventadas. Tras
una rápida mirada de unos segundos a cada uno de los papeles, yo le
diré a cada cual si usó verdaderamente una moneda para configurar la
serie, o si ésta fue producto de la imaginación."
¿Cómo puede el profesor arriesgarse de ese modo? ¿Qué método

emplearía para cumplir tamaña promesa? Simplemente, clasificaría
como «construida mentalmente» aquellas secuencias dentro de las
cuales no figuren rachas de seis o más signos iguales. Las secuencias
donde la alternancia de unos y ceros sea tal que aparezca al menos
alguna racha de este tipo (por ejemplo 111111 o 000000000), se de-
clarará verdaderamente aleatoria. El profesor no acertará quizás en
los 40 casos, pero seguramente podrá «adivinar» casi todos. Ello se
debe a que la mayoría de las personas creen que si han sido configura-
das mediante estricto azar, tales rachas no se producirán. Siendo así,
al inventar los resultados, procurarán no incluirlas; pero lo cierto es
que en una secuencia de 200 experiencias es casi seguro que al menos
una de tales rachas habrá de aparecer. Que esto ocurra, por ejemplo,
en los primeros seis lanzamientos es bastante poco probable (concre-
tamente, la probabilidad es inferior al 6%), pero que ocurra en algún
punto de la serie, es casi seguro. Como se ve, la idea es muy simple, y
funciona debido, precisamente, a que la comprensión de la verdadera
naturaleza del azar no parece integrar el repertorio natural de nuestras
intuiciones (véase Bar-Hillel, 2001).
Un último ejemplo útil para hacer entrar en razón a las víctimas de
los charlatanes es el siguiente. Como es bien conocido, el famoso nú-
mero π tiene la propiedad de ser trascendente (es un número real que no
es raíz de ningún polinomio con coeficientes enteros). La famosa cons-
tante, que comienza con la secuencia π = 3.1415926535... tiene infinitas
cifras decimales sin incluir periodicidades de índole alguna. Además de
trascendente, todo indica que π es normal: vale decir, que los diez dígitos
aparecen con igual frecuencia entre sus decimales. Aunque está pen-
diente una posible demostración, lo cierto es que los exámenes realizados
hasta ahora con millones y millones de decimales no contradicen esa
conjetura. En fin, los estudios demuestran que los dígitos de π se com-
portan como si se tratara de una tabla de números aleatorios.
Numeremos consecutivamente las letras del alfabeto castellano, de
manera que a la «a» le corresponde el 1, a la «b» el 2, y así sucesivamente
hasta la «z», letra a la cual le correspondería el 28. Mi nombre es Luis

Carlos Silva. Según esa correspondencia, la palabra «Luis» podría escri-
birse con los números la secuencia de los 13-23-10-21; análogamente, a
«Carlos» y a «Silva», les corresponderían las secuencias 3-1-20-13-17-
21 y 21-10-13-24. Por otra parte, yo nací el día 27 de mayo de 1951, lo
cual significa que mi fecha de nacimiento pudiera denotarla mediante
27-5-1951. La pregunta que podría hacerse es: ¿Se hallarán estos datos
personales en algún punto de la expansión del número π? Si así fuera,
¿sería ello un indicio de que soy un elegido cuya identidad estaba oculta
en el fascinante número? La respuesta a la primera pregunta es que sí;
estos números necesariamente estarán en algún punto de la intermina-
ble expansión (véase una explicación en Landart, 2003). La respuesta a
la segunda es que quien así piense podría corroborar casi con seguridad
que él mismo sería también un elegido. Claro, lo malo es que cuando
todos somos «elegidos», nadie lo es.
Figura 1.18. Un Iluminado desentraña mensajes dentro de π.

¿Cómo hacer tal corroboración? Nuevamente, Internet viene en

nuestra ayuda. Ud. puede acudir al sitio www.angio.net/pi/piquery
y pedir que se haga una búsqueda en los primeros 200 millones de
dígitos de la expansión de π. Por ejemplo, la cadena 27051951, indi-
cativa de mi fecha de nacimiento que mencioné arriba, se halla en la
posición 65.920.418 contando desde el primer dígito posterior al
punto decimal.
La lección medular que puede sacarse de todo esto es que un even-
to particular (una «coincidencia») identificado de antemano, es
improbable que se produzca dentro de un proceso regido por el azar;
pero lo contrario, que se pueda identificar algún acontecimiento muy
llamativo como parte de tal proceso, es algo casi seguro. Por eso las
coincidencias extraordinarias, atribuibles a fuerzas esotéricas, siem-
pre son exaltadas a posteriori; cuando son vaticinadas de antemano,
tarde o temprano resultan desmentidas por los hechos, como ocurrió
con el caso de los presidentes muertos. El notable matemático norte-
americano John Allen Paulos, expresaba agudamente en su libro
titulado Anumerismo que «La más asombrosa coincidencia imaginable
sería la completa ausencia de coincidencias» (Paulos, 1988).
Un análisis particularmente transparente y bonito del fenómeno
que nos ocupa desde el punto de vista probabilístico puede hallarse
en Walker (2002), cuya lectura sugiero enfáticamente a cualquier lec-
tor interesado en el tema.
Ingenuidad frente a la prensa
Para cerrar el tema de la incultura científica de la sociedad, quiero

mencionar una expresión de ciega credulidad que nada tiene que ver
con la pseudociencia pero que, talvez por eso mismo, tiene más vícti-
mas potenciales, pues abarca incluso a quienes no se dejan embaucar
por ella. Se trata de que muchísima gente acepta sin reflexión casi
cualquier información cuantitativa que aparezca en la prensa.
Ocasionalmente, se trata de informaciones cuya inconsistencia no de-

bería ofrecer dudas. Por ejemplo, un artículo publicado por Associated Press
el 15 de febrero de 2003 se titulaba «Miles de personas a lo largo del
mundo protestan contra la guerra de Iraq». En el subtítulo se podía leer:
«Cientos de miles a lo largo del mundo contra posibles acciones militares
en Iraq». Y el texto comenzaba diciendo: «Millones de personas, muchos
de ellos en capitales de países tradicionalmente aliados de Estados Uni-
dos marcharon el sábado contra los posibles planes norteamericanos de
atacar Iraq». En otros casos, la falta de rigor pasa de contrabando.
Recientemente el periódico El País de España publicaba un artícu-
lo (Gualdoni, 2007) subtitulado «Miles de venezolanos huyen del país
ante la inseguridad y la incertidumbre política». El autor fundamenta
tal afirmación mediante el dato de que «el número de venezolanos
empadronados en España se ha multiplicado por seis desde que go-
bierna Chávez». Citando al Instituto Nacional de Estadística (INE),
se informa que tal crecimiento se concreta en que de 9.482 empadro-
nados en 1999 se pasó a 52.178 en 2006. Sin embargo, el analista
oculta información que cualquier demógrafo hubiera tenido en cuen-
ta y susceptible de ser obtenida en la propia fuente del INE, donde se
puede constatar que el incremento de ciudadanos de dos países veci-
nos de Venezuela (Colombia y Ecuador, ambos limitados, incluso por
restricciones migratorias que no afectan a los venezolanos) es muchí-
simo más acusado: los 9.997 colombianos empadronados en 1999
pasaron a ser 258.726 en 2007 (un número 25 veces mayor), y el
número de ecuatorianos pasó de 3.972 en 1999 a 421.384 en el mis-
mo lapso (el total se ha multiplicado por 106) (Figura 1.19.).
Si alguna actividad científica toca casi a diario los intereses ciuda-
danos más inmediatos, ésta es la de las encuestas que ofrece la prensa.
Por ser sumamente expresiva de la indefensión cultural de la socie-
dad, me detendré en una de las muchas áreas en que esto se pone de
manifiesto.
Entre los muchos ámbitos de trabajo en los que se emplea el mues-
treo fuera de la investigación biomédica se hallan las encuestas
electorales, aquellas que se realizarán sobre una población de votan-

tes, ya sea para estudiar «la intención de voto» como para vaticinar los
resultados. Tal vaticinio, a su vez, puede hacerse en un momento pre-
vio pero ya muy próximo al acto electoral, o en un momento posterior
a la votación, antes de contar con resultados oficiales (las llamadas
«sondeos israelitas»).
Figura 1.19. Ciudadanos de Venezuela, Colombia y Ecuador empadronados

en España en 1999 y 2006 según el INE.
A veces, tales encuestas consiguen identificar aceptablemente con

antelación los resultados (el ganador de la presidencia, el reparto de
escaños, la respuesta que emerge victoriosa tras un referéndum, o el
desenlace que sea). Con sospechosa frecuencia, sin embargo, se pro-
ducen aparatosos fracasos de las empresas encargadas de hacer el
vaticinio, como ocurrió en ocasión de la derrota del Sandinismo en la
elección presidencial de Nicaragua en 1991. En aquella ocasión se
atribuyó el fiasco a la falta de cultura política de la población nicara-
güense, a la tendencia secular a ocultar sus verdaderos pensamientos
y a una larga serie de explicaciones de ese tenor. Pero he aquí que
fenómenos muy similares se produjeron años después en el Reino Unido

en 1992, en España e Italia en 1993, y en Francia en 1995. En este
último caso, todas las encuestas sin excepción anunciaron que Jacqes
Chirac sería el ganador con el 25% de los votos; Edouard Balladour
alcanzaría alrededor del 20%, en tanto que Lionel Jospin, no llegaría
siquiera a esta última cifra; el resultado fue otro: Jospin ganó con más
del 23% y quien no llegó al 19% fue Balladour.
No me extenderé demasiado en un tema que, desde otra perspecti-
va, será tratado más adelante (véase Capítulo 5); cabe ilustrar ahora
cómo muchas de las susodichas encuestas que aparecen en diversos
medios de comunicación se dan por válidas sin que exista un verdade-
ro fundamento. Más bien al revés, que existen motivos sobrados para
dudar de ellas. Traté este tema con extensión en Silva (2000).
A modo de ilustración inicial, la Tabla 1.1 recoge lo acaecido en las
elecciones generales de España en la primavera de 1997, durante las
cuales se disputaban 350 escaños parlamentarios.
El día 3 de marzo de 1996 se celebraron las elecciones generales
en el estado español en las cuales se disputaban 350 escaños parla-
mentarios. Conquistar al menos 176 de ellos por parte de uno de los
partidos significaba contar con la «mayoría absoluta» y poder, conse-
cuentemente, prescindir de alianzas políticas. De antemano, solo el
Partido Popular parecía tener posibilidades reales de alcanzar dicha
cifra. En las semanas previas se produjo la consabida avalancha de
encuestas preelectorales, cada una de las cuales, al precio de más de 4
millones de dólares, intentaba vaticinar los resultados.
El panorama de lo acaecido resulta en extremo interesante, no sólo
por el estruendoso fracaso de dichos vaticinios, sino por el patrón que
exhibían. Hagamos un sucinto resumen de lo más significativo; para
simplificar la exposición nos circunscribiremos a las predicciones con-
cernientes a las dos grandes formaciones políticas españolas: Partido
Popular (PP) y Partido Socialista Obrero Español (PSOE).
El día 14 de febrero, el periódico ABC publicó los resultados de
una «macroencuesta» conducida por el Centro de Investigaciones So-
ciológicas (CIS) según los cuales el PP alcanzaría una apabullante vic-

toria con más de 50 escaños de ventaja, en tanto que al PSOE
correspondería el número más bajo de su historia. Esta encuesta se
basó en 25.000 entrevistas, y sus responsables se adelantaban a de-
clarar que «El fenómeno de voto oculto al PSOE, encuestados que
no reconocen su intención de volver a votar a ese partido, se tiene
muy en cuenta en todos los estudios después de las anteriores eleccio-
nes» y adicionaban que «La gran cantidad de entrevistas con que se
hace la macroencuesta del CIS permite afinar más que las empresas
privadas a la hora de distribuir escaños» (ABC, 1996).
Las Tablas 1.1 y 1.2 recogen vaticinios y realidades para los dos
grandes partidos.
Tabla 1.1. Vaticinios realizados por las empresas contratadas por grandes medios de
prensa españoles del número de escaños que alcanzarían el PP y el PSOE en las
elecciones generales de 1996.
Periódico PP PSOE
ABC 176 - 184 117 - 125
El país 170 - 178 118 - 128
El Mundo 170 - 179 113 - 123
La Vanguardia 160 - 170 135 - 145
El periódico 165 - 175 119 - 129
Resultados reales 156 141
Tabla 1.2. Porcentajes de votos vaticinados para el PP y el PSOE por las empresas
contratadas por los grandes periódicos españoles en las elecciones
generales de 1996.
Periódico PP PSOE Diferencia

ABC 44,1 32,5 11,6
El país 42,4 33,4 9,0
El Mundo 42,3 31,4 10,9
La Vanguardia 41,0 35,0 6,0
El periódico 41,2 33,5 7,7
Resultados reales 38,8 37,5 1,3
Como puede apreciarse, el fiasco no sólo es enorme y palmario,

sino sorprendentemente uniforme: mientras la diferencia real en el
porcentaje de votos fue un escaso 1,3%, todas las encuestas anticipan
una diferencia enorme (de 6,0 puntos la que menos yerra, y nada me-
nos que de 11,6 la que se equivoca de manera más sensacional).
Por si fuera poca «coincidencia», debe notarse que si bien las en-
cuestas mencionadas en la Tabla 1.1 se realizaron días antes de la
votación, tres estudios realizados «a pie de urna», una vez consuma-
da la votación, arrojaron resultados parecidos, como se aprecia en la
Tabla 1.3.
Tabla 1.3. Resultados de las encuestas a pie de urna sobre el número de diputados
alcanzados por el PP y el PSOE en las elecciones generales de 1996.
Empresa PP PSOE
Tábula V 164 - 174 120 - 132
Demoscopía 160 - 171 125 - 135
Sigma 2 164 - 174 124 - 131
De hecho, los seis intervalos que supuestamente contemplan los

márgenes máximos de incertidumbre estuvieron muy lejos de «atra-
par» al parámetro.
Ante el estupor de legos y especialistas producido por tal desaguisa-
do, las reacciones de los responsables de los sondeos y las estimaciones
son diversas y harto elocuentes. No creo que valga la pena examinarlas
exhaustivamente, pero sí apreciarlas a grandes rasgos.
Una de las explicaciones más mencionadas consiste en que existía
un «voto oculto»; es decir, un «voto vergonzante» de quienes no están
dispuestos a admitir el que a la postre sería su voto verdadero (en este
caso, desde luego, atribuible a votantes del PSOE). La notable con-
sistencia del error hace pensar en una clara sistematicidad. Si el error
fuera aleatorio, no se hubiera escorado siempre hacia el mismo lado,
de modo que la explicación en sí misma es bastante verosímil. Lo que

ella no explica es el fallo de las encuestas.
Por una parte, tal eventualidad no pudo haber sido imprevista, como
refleja el texto de ABC arriba citado. Por otra parte, algunos llegan por
ese camino a culpar al electorado de su fracaso. Por ejemplo, el res-
ponsable de la encuesta realizada por Tábula V, la más desatinada de
todas, comunicó que «creía hasta ahora que estaba en una democracia
estable». Es como decir: «la responsable del error es la realidad, no el
instrumento que he empleado para conocerla». Algo similar había de-
clarado Fréderic de Saint Sernin, responsable de la encuesta encargada
por Jacqes Chirac en 1995, cuando las urnas desmintieron espectacu-
larmente su vaticinio: «la gente puede comportarse de manera
totalmente irracional cuando acude a votar». Esto es como si al equi-
vocarse en el pronóstico del tiempo, el Instituto de Meteorología
comunicara que la culpa del error la tuvieron las nubes.
El Centro de Investigaciones Sociológicas, institución estatal es-
pañola, no se queda atrás en materia de fracasos predictivos. En el
2004 pronosticó que 76 de cada 100 españoles votarían en las elec-
ciones europeas. Diez días después, sólo acudió a las urnas el 46%
(Peregil, 2004).
Si un equipo técnico de muestristas y analistas se propone hacer un
vaticinio electoral, no puede escudarse en tales excusas: parte de su
responsabilidad consiste precisamente en conducirse con el rigor nece-
sario para contemplar la realidad tal como es. Esto significa, en primer
lugar, que han de emplearse tamaños muestrales adecuados; en mi opi-
nión, por ejemplo, una muestra nacional en España que se proponga
«repartir escaños» no puede bajar de 20.000 sujetos, y casi todos estos
estudios trabajaban con menos de 5.000. Pero mucho más importantes
son: el método de selección (¿son realmente probabilísticos los dise-
ños?, ¿se adoptan medidas para que no haya sobrerrepresentación de
encuestados «fáciles», como pueden ser ancianos o amas de casa?), el
manejo de la no respuesta (¿se manejan técnicas adecuadas de imputa-
ción, reducción de las tasas de no respuesta y corrección de estimadores
con acuerdo a éstas?), la realización de controles de calidad rigurosos

del dato primario (¿se retribuye adecuadamente a encuestadores y su-
pervisores?, ¿se controla con rigor su desempeño?, ¿se hacen reencuestas
de control?). Es imposible responder estas seis preguntas, ya que la
transparencia metodológica es nula, (véase apartado Fichas técnicas de
las encuestas de prensa, p. 334) aunque no sea imposible imaginarse las
respuestas. Personalmente, sospecho que las contestaciones a todas o
casi todas esas interrogantes son esencialmente negativas.
Figura 1.20. Las encuestas en la prensa.
En lo adelante me ceñiré a una situación que conmovió a buena

parte del mundo, y especialmente a Hispanoamérica: los horrendos
atentados perpetrados en los trenes de cercanía de Madrid poco antes
de las elecciones generales del 2004 en España.
Como se recordará, en dichas elecciones salió victorioso el Partido
Socialista Obrero Español, el cual desplazó del Gobierno al Partido Po-
pular. En muchos círculos se dio y se sigue dando por sentado que, de no
haber sido por el terrible sabotaje y la manera en que el Partido Popular

gestionó el problema en las 72 horas siguientes, éste último hubiera ven-
cido en los comicios, ya que los resultados de la mayoría de las encuestas
habían venido augurando consistentemente dicho desenlace.
Es muy probable que el atroz acontecimiento y, muy especialmen-
te, la manera en que se manejó ante la opinión pública, hayan restado
votos al Partido Popular; pero lo cierto es que no hay fundamento
razonable alguno para confiar en ninguna de las encuestas previas.
Desafortunadamente, debido a un conjunto de insuficiencias técni-
cas, que no es del caso detallar aquí, la calidad de los sondeos que
suelen realizar las empresas que operan en España es paupérrima (véase
Silva, 2000).
Pero resulta que todas las encuestas realizadas a pie de urna el
propio día electoral se equivocaron aparatosamente. En efecto, los
cuatro sondeos conducidos por respectivas empresas una vez con-
cluido el sufragio pero antes del escrutinio oficial, arrojaron resultados
absolutamente errados. Por ejemplo, Demoscopia (empresa contrata-
da por la emisora Tele 5) anunció que el PP habría obtenido 169
escaños y el PSOE 141; unas horas después, se supo que los resulta-
dos reales eran exactamente los contrarios. Véase Tabla 1.4.
Tabla 1.4 Resultados de las encuestas a pie de urna sobre el número de diputados
alcanzados por el PP y el PSOE en las elecciones generales de 2004.
Partidos
Medios de prensa (y empresas) PP PSOE
TVE/RNE (Ecoconsulting) 150/154 154/158
ANTENA 3/ONDA CERO (Sigma 2) 153/161 152/159
TELE 5 (Demoscopia) 169 141
PULSÓMETRO (Opina) 154/160 151/159
El «detalle» para la reflexión es el siguiente. Normalmente, en las

encuestas se hacen preguntas a la ciudadanía, y a partir de los resulta-
dos se infieren estimaciones del tipo «el 23% de los ciudadanos no

está de acuerdo con la medida X» o «la valoración media entre 1 y 10
que los electores hacen del candidato tal ascendió a 8,2», o «el 45%
de los adultos afirman que votarán por Fulano en las próximas elec-
ciones». El problema está en que virtualmente nunca se podrá conocer
cuánto se acercaron esos datos a la realidad (el verdadero porcentaje
de personas que comparten la medida, o el verdadero puntaje medio
que se otorga a cierto candidato o la verdadera magnitud porcentual
de la intención de voto). Sólo podemos confiar en que el procedi-
miento muestral y los métodos inferenciales fueron correctos dentro
de determinado margen de error. Pero hay algunas excepciones.
El caso de la estimación «a pie de urna», una vez realizado el sufra-
gio, es una de ellas. Aquí no se indaga sobre la intención de voto sino
sobre lo que efectivamente se votó. En esas circunstancias, unas ho-
ras después de la encuesta se puede saber con toda certeza el valor
verdadero del dato que dicha encuesta procuraba estimar. A la luz de
los datos que recoge la Tabla 1.4, cabe preguntarse: ¿Qué razones hay
para confiar en que las encuestas previas a los comicios realizados por
estas mismas empresas estaban en lo cierto, si cuando se tiene la opor-
tunidad excepcional de valorarlo, los resultados son nítidamente
equivocados?
En síntesis, valga el análisis realizado en torno a esta situación espe-
cial para mostrar hasta qué punto es necesario un incremento de nuestra
cultura científica general si se quieren encarar adecuadamente las de-
mandas de la vida cotidiana. Lo verdaderamente inquietante no es tanto
el hecho de que los datos públicamente aportados por empresas y me-
dios de prensa sean significativamente erróneos como que su legitimidad
casi nunca es puesta en duda ni por los ciudadanos ni por los líderes
políticos, ni siquiera por el personal más especializado.
ANEXO 1.1
PROCEDIMIENTO PARA COMPUTAR EL FACTOR DE IMPACTO QUE
CORRESPONDE A UNA REVISTA CIENTÍFICA EN UN AÑO DADO.
Supongamos que se quiere calcular el factor de impacto FIN para el

año N en una revista específica. Los artículos publicados por dicha
revista han sido citados cierto número de veces a lo largo de dicho
año; una parte de ellos corresponde a artículos aparecidos en los dos
años anteriores; llamemos C(TS)N a ese último número. Supongamos,
por otra parte, que la revista en cuestión ha publicado P(TS)N artícu-
los a lo largo del año N. El factor de impacto es el resultado de dividir
el número de citas recibidas durante el año de interés entre el número
de artículos publicados en los dos años precedentes. O sea:
Las letras TS que figuran entre paréntesis en la notación se han

elegido para subrayar que no cualquier cita es válida para ser contabi-
lizada en el numerador, ni cualquier artículo puede hacer aportes a los
sumandos del denominador. Las citas del numerador han de proceder
de revistas indexadas por la compañía Thomson Scientific y los artí-
culos contabilizados en el denominador sólo son aquellos que la
susodicha compañía considera «citables».
Supongamos, por ejemplo, que en el año 2004 una revista ha publica-
do 97 artículos que Thomson Scientific considera «citables», y que ese
número resultó ser 89 en el 2005. Asumamos que las revistas indexadas
por esta empresa han acumulado 1.786 citas a trabajos publicados por
esta revista en el curso del bienio 2004-2005. En ese caso, tendremos que
el factor de impacto de esta revista para el 2006 sería:
BIBLIOGRAFÍA
ABC. La macroencuesta del CIS encargada por el Gobierno reconoce

al PP una ventaja de más de 50 escaños. Periódico ABC, 14 de
febrero, Madrid. 1996.
Adams M. Merck committed scientific fraud in delays, distortions of Vytorin
drug trial. Accesible en: http://www.naturalnews.com/022505.html
en mayo de 2008.
Alper P. Vytorin is in the news again. Chance News 35 2008. Accesible en:
http://chance.dartmouth.edu/chancewiki/index.php/
Chance_News_35#Vytorin_is_in_the_news_again en mayo de 2008.
Als-Nielsen B et al. Association of funding and conclusions in rando-
mized drug trials: a reflection of treatment effect or adverse events?
Journal of the American Medical Association 2003; 290:921-928.
Angell M. Is academic medicine for sale? The New England Journal of
Medicine 2000; 342:1516-1518.
Angell M. The truth about the drug companies: how they deceive us and what to
do about it. New York: Random House. 2005.
Aréchaga JM. Las revistas profesionales como claves para el desarro-
llo de la ciencia, la medicina y la tecnología en España. Panace@.
2005; 4(19).
Armstrong D. Financial ties to industry cloud depression study. Perió-
dico The Wall Street Journal del 11 de julio, 2006, New York.
Arribas C. La gran industria del dopaje. Periódico El País del 7 de
agosto, 2007, Madrid.
Bar-Hillel M. Subjective probability judgments. En: International En-
cyclopedia of the Social and Behavioral Sciences 2001. Amsterdam:
Elsevier Science; (páginas:15247-15251).
Barnes DE, Bero LA. Why review articles on the health effects of
passive smoking reach different conclusions? Journal of the Ameri-
can Medical Association 1998; 279: 1566–1570.
Blech J. Los inventores de enfermedades. Cómo nos convierten en pacientes.
Barcelona: Destino. 2005.
Bodenheimer T. Uneasy alliance: Clinical investigators and the phar-

maceutical industry. The New England Journal of Medicine 2000;
342:1539-1544.
Bombardier C et al. VIGOR Study Group. Comparison of upper gas-
trointestinal toxicity of rofecoxib and naproxen in patients with
rheumatoid arthritis. The New England Journal of Medicine 2000;
343:1520-1528.
Boseley S. Scandal of scientists who take money for papers ghost-
written by drug companies. Periódico The Guardian del 7 de febrero,
2002. Londres.
Breggin P, Breggin GR. Talking back to Prozac: what doctors won’t tell
you about today’s most controversial drug. New York: St. Martin’s
Paperbacks. 1994.
Bunge M. Epistemología. Barcelona: Ariel. 1980.
Bustamante J. Dilemas éticos en la sociedad de la información: apun-
tes para una discusión. Revista Española de Ciencia, Tecnología y Sociedad,
y Filosofía de la Tecnología 1999; 2:169-183.
Capanna P. Un cuento de hadas. Periódico Página/12 del 3 de abril,
2004. Buenos Aires.
Carey B, Harris G. Antidepressant may raise suicide risk. Periódico
The New York Times del 12 de mayo, 2006. Nueva York.
Castells M. Internet: ¿una arquitectura de libertad? Libre comuni-
cación y control del poder. Conferencia inaugural del curso
académico 2001-2002 de la UOC. 2001. Accesible en: http://
www.uoc.es/web/esp/launiversidad/inaugural01/ en agosto de
2007.
Cebrián JL. La red. Barcelona: Suma de Letras. 2000.
Cereijido M. Analfabetismo científico. Accesible en: http://
www.comunicacion.amc.edu.mx/a-ciencia-cierta/analfabetismo-
cientifico/ en junio de 2008. 2005.
Cer vera J. Una botella medio llena. Accesible en http://
www.ucm.es/otros/especulo/numero8/lared.html en agosto de
2007. 2001.
Cohen LS et al. Relapse of major depression during pregnancy in

women who maintain or discontinue antidepressant treatment. Jo-
urnal of the American Medical Association 2006; 295:499-507.
Coleman V. The medicine man. Londres: Temple Smith. 1975
Coyle S (2002). Physician industrie relations. Part 1: Individual physi-
cians. Annals of Internal Medicine 2002; 136:396-402.
Chambers CD et al. Selective serotonin-reuptake inhibitors and risk
of persistent pulmonary hypertension of the newborn. The New
England Journal of Medicine 2006; 354:579-587.
Cho MK, Bero LA. The quality of drug studies published in sympo-
sium proceedings. Annals of Internal Medicine 1996; 124:485-489.
Dausset J. Respetar el patrimonio genético del hombre. El Correo XLI:
16-20. 1988.
Davidson JRT et al. Effect of Hypericum perforatum (St John’s Wort)
in major depressive disorder: A randomized controlled trial. Journal
of the American Medical Association 2002; 287:1807-1814.
Davidson RA. Source of funding and outcome of clinical trials. Jour-
nal of General Internal Medicine 1986; 1:155-158.
Daw J. Is PMDD real? Monitor on psychology 2002; 33:58-60.
De Angelis CD, Fontanarosa PB. The adverse effects of industry influen-
ce. Journal of the American Medical Association 2008; 299:1833-1835.
Devereaux PJ, Yusuf S. The evolution of the randomized controlled
trial and its role in evidence-based decision making. Journal of Inter-
nal Medicine 2003; 254:105-13.
Donohue JM, Cevasco M, Rosenthal MB. A decade of direct-to-con-
sumer advertising of prescription drugs. The New England Journal
of Medicine 2007; 357:673-681.
Doval HC. ¿Es fiable lo que leemos en las revistas médicas? Resulta-
dos diferentes según el patrocinio de los ensayos clínicos. Revista
Argentina de Cardiología 2007; 75: 498- 502.
Endicott J et al. Is premenstrual dysphoric disorder a distinct clinical
entity? Journal of Women’s Health and Gender-Based Medicine 1999;
8:663–679.
Fernández A. Entrevista a Jimmy Wales. Periódico El País del 14 de

julio, 2005. Madrid.
Ferrado ML. El Prozac es sólo placebo. Periódico El País 27 de febre-
ro, 2008. Madrid.
Gérvas J. La vacuna contra el virus del papiloma humano desde el
punto de vista de la atención primaria en España. Revista Elec-
trónica de Portales Médicos.com, Accesible en: http://
www.portalesmedicos.com/, publicaciones en junio de 2008.
2007.
Giles J. Internet encyclopaedias go head to head. Nature 2005; 438:
900-901.
Good CB, Kelley CL. The Vioxx debacle revisited. American Journal of
Medicine 2005; 118: 1055-1056.
Gualdoni F. Los balseros del aire. Periódico El País, 24 de julio, 2007.
Madrid.
Hernández A. Científicos contra videntes. Conocer 1993; 131: 4-9.
Hollon MF. Direct-to-consumer advertising: a haphazard approach to
health promotion. Journal of the American Medical Association 2005;
293:2030-2033.
Hubbard B. Secretos de la industria farmacéutica. Barcelona: Terapias Ver-
des. 2006.
Illich I. Némesis médica. México DF: Joaquín Ortiz. 1978.
Jara M. Traficantes de salud: cómo nos venden medicamentos peligrosos y juegan
con la enfermedad. Barcelona: Icaria. 2007.
Kastelein JJP et al. Simvastatin with or without ezetimibe in familial
hypercholesterolemia. The New England Journal of Medicine 2008;
358:1431-1443.
Kilty KT. The Lincoln/Kennedy cosmic connection 2000. Accesible
en: http://www.kilty.com/l_and_k.htm en agosto de 2007.
Kirsch I et al. Initial severity and antidepressant benefits a meta-analysis
of data submitted to the food and drug administration. PLoS Medi-
cine 2008; 5(2): e45.
Kondro W, Sibbad B. Drug company experts advised staff to withhold

data about SSRI use in children. Canadian Medical Association Jour-
nal 2004; 170:283.
Kramer P. Listening to Prozac. New York: Viking. 2003.
Lacasse JR, Leo J. Serotonin and depression: a disconnect between the
advertisements and the scientific literature. PLoS Medicine 2005; 2:e392
Landart JM. Mensajes ocultos en pi.2003. Accesible en: http://
tiopetrus.blogia.com/2003/092201-mensajes-ocultos-en-pi.php en
agosto de 2007.
Langbein K, Ehgartner B. Contra Hipócrates. El cártel médico. Los siete
pecados capitales de la industria de la salud. Barcelona: Ediciones Ro-
binbook. 2004.
Laporte JR. Las supuestas ventajas de celecoxib y rofecoxib: fraude cien-
tífico. Butlletí Groc 2002. Accesible en: http://www.icf.uab.es/
informacion/boletines/bg/bg154.02e.pdf en mayo de 2008.
Laumann EO, Paik A, Rosen RC. Sexual dysfunction in the United
States. Prevalence and predictors. Journal of the Amercian Medical As-
sociation 1999; 281:537-544.
Laurance J. Antidepressant drugs don’t work: official study. The Inde-
pendent, 6 de febrero de 2008.
Lenzer J, Brownlee S. Antidepressants: An untold story? British Medi-
cal Journal 2008; 336: 532-534.
Lexchin J et al.. Pharmaceutical industry sponsorship and research
outcome and quality: systematic review. British Medical Journal 2003;
326:1167-1170.
MacTaggart L. Lo que los medicos no nos dicen: los riesgos de la medicina
moderna. Barcelona: Terapias Verdes. 2005.
Martínez D. La crisis de las revistas científicas e Internet. Periódico El
País del 26 de febrero, 2003. Madrid.
McWilliams P, Nordfors M, Bloomfield HH. Hypericum (St. John’s Wort)
and Depression. New York: Prelude Press. 1997.
Melander et al.. Evidence b(i)ased medicine: selective reporting
from studies sponsored by pharmaceutical industry: review of
studies in new drug applications. British Medical Journal 2003;

326:1171-1175.
Melville A, Johnson C. Peligro mortal. Efectos de la prescripción de fárma-
cos. Barcelona: Planeta. 1984.
Mintzes B. Blurring the boundaries. Accesible en: http://haiweb.org/
pubs/blurring/blurring.intro.html. en agosto de 2007. 1998.
Mirowski P, Van Horn R. The Contract Research Organization and
the commercialization of scientific research. Social Studies of Science
2005; 35: 503-548.
Moncrieff J, Kirsch I. Efficacy of antidepressants in adults. British
Medical Journal 2005; 331:155-157.
Moynihan R, Cassels A. Selling sickness: how the world’s pharmaceutical
companies are turning us all into patients. New York: Nation Books.
2005.
Moynihan R, Heath I, Henry D. Selling sickness: The pharmaceutical
industry and disease-mongering. British Medical Journal 2002; 324:
886–891.
Moynihan R, Henry D. The fight against disease mongering: Genera-
ting knowledge for action. PLoS Medicine 2006; 3:e191.
MST. Ads, research undermine Vytorin. Editorial de The Minneapolis
Star Tribune en abril de 2008. 2008.
Myers DG. Intuition: Its Powers and Perils. New Haven: Yale University
Press. 2002.
Nieto A et al. Adverse effects of inhaled corticosteroids in funded
and nonfunded studies. Archives of Internal Medicine 2007; 167:2047-
2053.
NIH. Study shows St. John’s wort ineffective for major depression of
moderate severity. 2002. Accesible en: http://www.nih.gov/news/
pr/apr2002/nccam-09.htm en agosto de 2007.
Núñez M, Navarro C. Las prácticas inconfesables de los laboratorios
farmacéuticos. Vioxx, la punta de un gran iceberg. Integral, 2005;
Número 305 (accesible en: www.larevistaintegral.com en mayo de
2008).
OMS. Medicamentos esenciales. Lista Modelo de la OMS (14ª edición, revi-

sada en marzo de 2005). Ginebra: OMS. 2005.
Park A. Is Vytorin a failure? Revista Time del 15 de enero, 2008. New
York.
Paulos JA. Innumeracy. New York: Random House. 1988.
Payer L. Disease-mongers: How doctors, drug companies, and insurers are making
you feel sick. New York: Wiley and Sons. 1992
Peiró S, Cervera P, Bernal E. Los inhibidores selectivos de la recapta-
ción de serotonina en la depresión infantil: un «culebrón» que refleja
importantes problemas de seguridad de los medicamentos. Gaceta
Sanitaria 2005; 19: 401-406.
Perancho I. El bolsillo de los españoles notará poco la rebaja del pre-
cio de los medicamentos. Periódico El Mundo del 27 de noviembre,
2004. Madrid.
Peregil F. ¿Sirven de algo las encuestas del CIS? Periódico El País del
20 de junio, 2004. Madrid.
Pfizer. Zoloft advertisement. Burbank (California): NBC. 2004.
Pignarre P. El gran secreto de la industria farmacéutica. Barcelona: Gedisa.
2005.
Pitkin RM, Branagan MA, Burmeister LF. Accuracy of data in abs-
tracts of published research articles. Journal of the Amercan Medical
Association 1999; 281:1110-1111.
PLoS Medicine Editors. The impact factor game: It is time to find a
better way to assess the scientific literature. PLoS Med 2006; 3:
e291.
Pollack R. Harm to Consumers from the Patent Extensión. 2001. Ac-
cesible en: http://www.familiesusa.org/index.html en agosto de
2007.
Proyecto Inform. La crisis en los precios de los medicamentos. 2004.
Accesible en: http://www.thebody.com/pinf/pinfpage.html en
agosto de 2007.
Psaty BM, Kronmal RA. Reporting mortality findings in trials of rofe-
coxib for alzheimer disease or cognitive impairment: A case study
based on documents from rofecoxib litigation. Journal of the Ameri-

can Medical Association 2008; 299:1813-1817.
Reventós L. Wikipedia se defiende de los vándalos. Periódico El País
del 20 de junio, 2006. Madrid.
Rodríguez B. Sobre los Big Bangs y el principio y el final de los tiem-
pos del Universo. Revista de la Real Academia de Ciencias Exactas,
Físicas y Naturales 2003; 97:147-60.
Ross JS et al. Guest authorship and ghostwriting in publications rela-
ted to rofecoxib: a case study of industry documents from rofecoxib
litigation. Journal of the American Medical Association 2008; 299:1800-
1812.
Rothman KE, Evans S. Extra scrutiny for industry funded trials. Bri-
tish Medical Journal 2005; 331:1350-1351.
Schwarz MJ. Tutoriales fotográficos paranormaleros de Nocturno: Fantasma
de clase N-Ávila. 2005. Accesible en: http://charlatanes.blogspot.com/
2006/01/tutoriales-fotograficos-paranormaleros.html en agosto de
2007.
Shamos MH. The myth of scientific literacy. New Jersey: Rutgers Univer-
sity Press. 1995.
Shuchman M. Commercializing clinicals trials– Risk and benefits of the
CRO boom. The New England Journal of Medicine 2007; 357:1365-
1368.
Silva LC. Cultura estadística e investigación científica en el campo de la salud:
Una mirada crítica. Madrid: Díaz de Santos. 1997.
Silva LC. Diseño razonado de muestras y captación de datos para la investiga-
ción sanitaria. Madrid: Díaz de Santos. 2000.
Silverman M, Lee PR. Píldoras, ganancias y política. México: Siglo XXI.
1983.
Smith R. The trouble with medical journals. London: Royal Society of
Medicine Press. 2006.
Stelfox HT et al.. Conflict of interest in the debate over calcium-chan-
nel antagonists. The New England Journal of Medicine 1998;
338:101-106.
Terceiro JB. Internet: luces y sombras. Periódico El País del 31 de

mayo, 2003. Madrid.
Tungaraza T, Poole R. Influence of drug company authorship and
sponsorship on drug trial outcomes. British Journal of Psychiatry 2007;
191:82-83.
Turner EH et al. Selective publication of antidepressant trials and its
influence on apparent efficacy. The New England Journal of Medicine
2008; 358:252-260.
Valerio M. El elevado coste de los nuevos fármacos contra el cáncer.
Periódico El Mundo del 29 de abril, 2005. Madrid.
Villanueva P et al. Accuracy of pharmaceutical advertisements in
medical journals. The Lancet 2003; 361:27-32.
Walker J. An introduction to probability and statistics. Calculation
and chance. 2002. Acesible en: http://www.fourmilab.ch/rpkp/
experiments/statistics.html en agosto de 2007.
Waxman H. The lessons of Vioxx: Drug safety and sales. The New
England Journal of Medicine 2004; 352: 25-27.
Wilkes MS, Doblin BH, Shapiro MF. Pharmaceutical advertisements
in leading medical journals: Experts’ assessments. Annals of Inter-
nal Medicine 1992; 116:912-919.
Winner L. Science, technology and the theory of progress. En: S.L.
Goldman (ed.), Science, Technology and Social Progress. Bethlehem:
Lehigh University Press. 1989, pp.48-64.
Wittington CJ et al. Selective serotonin reuptake inhibitors in childho-
od depression: systematic review of published versus unpublished
data. The Lancet 2004; 363: 1341-1345.
Wolfe A et al. CNN Blows! Periódico The New Yorker Observer, del 27
de diciembre, 2003. Nueva York.
Wolfe SM (2002). Direct-to-consumer advertising: education or emo-
tion promotion? The New England Journal of Medicine 2002;
346:524-526.
111
2
Imposturas y sinrazones en el
diálogo científico
A los académicos se les paga por ser lúcidos, no
por estar en lo cierto.
DONALD NORMAN
e parece imperativo reflexionar acerca de cuestiones históricas

M y filosóficas no pocas veces desdeñadas o directamente igno-
radas por muchos colegas, quienes centran su interés en la investigación
práctica, la docencia o la comunicación social de la ciencia. Creo que
buena parte de las confusiones y malentendidos que hoy padecemos
tienen su origen en dicho desinterés y, a la vez, que ningún intercam-
bio podrá prosperar de manera enteramente racional en materia de
investigación si no se asienta en presupuestos conceptuales claros y
explícitos aceptados a partir de la experiencia secular.
No está en mi ánimo —quizás tampoco en mi capacidad— exten-
derme sobre este medular y ciertamente especializado asunto. Pero
me propongo hacer una modesta contribución al compartir algunos
puntos de vista sobre aspectos generales de la epistemología y reflexio-
nar sobre sus derivaciones sociales básicas, especialmente las que
conciernen a la integridad académica. Se trata de un saludable ejercicio
teórico inicial, porque esa insuficiente reflexión crítica acerca de los
más generales problemas, en especial epistemológicos, sobre los que
se asienta la práctica, a veces se aderezan con ingredientes peores que
la mera ignorancia: imposturas y oportunismos de diverso pelaje.
Para la exposición me valdré de dos pasajes tomados de la reali-
dad. Por una parte, rememoro una breve reseña histórica de ciertas
111
perniciosas tendencias que rigieron en las últimas décadas del siglo

pasado y que tuvieron su punto de inflexión en una peculiarísima tri-
quiñuela académica protagonizada por un físico neoyorquino, de la
que escribí en otro sitio (Silva, 2004). Por otra, me referiré a una polé-
mica desarrollada en Cuba relacionada con la llamada «energía
piramidal».
EL LABERINTO POSTMODERNO: DE LA DECONSTRUCCIÓN

AL DELIRIO
Apuntes para una antología de desatinos
Con toda razón, en la etapa final de su vida, Karl Popper advertía

que los intelectuales tenían una responsabilidad esencial y anterior a
cualquier otra: «hacer conocer los resultados de sus estudios, tan sen-
cilla, transparente y modestamente como fuesen capaces», e iba más
lejos al señalar que lo peor que podían hacer era conducirse como
grandes profetas dedicados a impresionar al prójimo con razonamien-
tos inextricables y borrosas elaboraciones filosóficas. «Quien sea
incapaz de hablar claro», apostillaba, «debe callar hasta poder hacer-
lo» (Popper, 1992).
Esto nos lleva de la mano al estructuralismo, movimiento que alcan-
zó relevancia en un entorno de 1965. Fue encabezado por el pensador
belga Claude Lévi Strauss, su mayor exponente y autor del famoso
libro Antropología Estructural (Lévi-Strauss, 1968). Dicho movimiento
se centraba en el reconocimiento de la existencia de sistemas suprain-
dividuales, de diferente tipo: estructuras económicas, históricas,
psíquicas, lingüísticas, antropológicas o étnicas. La idea primigenia se
condensa en que el ser humano está sometido a estructuras que lo
superan y, por ende, puede ser estudiado «desde fuera». Pero podría
decirse que dicha corriente surge como consecuencia de una profun-
dización de la lingüística y se apoyó en la desconcertante idea de que
IMPOSTURAS Y SINRAZONES EN EL DIÁLOGO CIENTÍFICO 113
el lenguaje, como un sistema cerrado, constituye el único medio dis-

ponible para acceder al mundo de los objetos y a la realidad. Este
carácter autorreferencial que el estructuralismo atribuía al lenguaje,
fue distanciando del mundo real a sus seguidores (Jacques Lacan, Mi-
chel Foucault y Louis Althusser, entre los más destacados), a pesar de
la presunta capacidad explicativa que, según proclamaban, el lengua-
je poseía. Poco a poco se fue arribando así al llamado postestructuralismo y,
como no, al postmarxismo.
Pero poco importan los «postbautizos» intermedios. Lo cierto es
que desde los años setenta del siglo XX el estructuralismo fue evolu-
cionando (involucionando, en rigor) en dirección opuesta a la claridad
que muchos años más tarde reclamara Popper, con un discurso cada
vez más críptico y caótico, centrado en el análisis de los textos en sí
mismos. De manera que el análisis de la realidad se concentraba en (y
muchas veces se suplía con) el examen del lenguaje.
Díaz (1998) comenta acerca de un seminario en la Universidad de
Buenos Aires donde se señalaba que los intelectuales estaban «habi-
tuados a complejizar la realidad, cuando en realidad debieran simplificar
aquello que en la misma realidad aparece como complejo... Si hace-
mos un discurso más complejo que la realidad misma, nos volveremos
analistas de textos, para comprender los complejos textos que expli-
can esa realidad simple». No se denunciaba una mera expresión
fenomenológica sino un sistema vertebrado en torno a preceptos ex-
plícitamente formulados.
Por ejemplo, el connotado sociólogo de la ciencia, Harry Collins,
había escrito algo que resulta insólito para cualquier mente sensata: «El
mundo natural desempeña un minúsculo o inexistente papel en la cons-
trucción del conocimiento científico» (Collins, 1981). Sin embargo no
se trata de un contrasentido coyuntural; aludo a todo un cuerpo teórico
cultivado por diversos pensadores, como los famosísimos Bruno La-
tour y Steve Woolgar, quienes solían «ilustrarnos» con descabelladas
afirmaciones, tales como que «La realidad es la consecuencia y la causa
de la construcción social de los hechos» (Latour y Woolgar, 1979).
Eran las bases teóricas o los precedentes de lo que se ha dado en

llamar «postmodernismo» en el terreno de la ciencias sociales1. Con
respecto al término postmodernismo, el filósofo argentino Mario Bunge
se expresaba muy cáusticamente cuando decía que con él «simple-
mente se puso nombre a esa gran fábrica de basura intelectual que hay
en París, la mayor exportadora de basura intelectual del mundo» (Se-
rroni, 1989). Por su parte, Alan Sokal, físico de la Universidad de
New York a quien aludiremos más adelante, señalaba (Midence, 2000):
"Hay que distinguir entre «teoría de la postmodernidad», y «posmo-

dernismo» como corriente filosófica e intelectual. Según ciertos
sociólogos, ha habido en las últimas dos décadas se han producido
cambios sociales, económicos y culturales tan profundos que es lícito
decir que vivimos en una nueva fase histórica, la «postmodernidad»…
Otra cosa es la corriente –llamémosle «postmodernismo» a falta de
un término mejor– caracterizada por el rechazo más o menos explí-
cito de la tradición racionalista de la Ilustración y por elaboraciones
teóricas desconectadas de cualquier prueba empírica, por discursos
oscuros y a veces francamente surrealistas, así como por un relativis-
mo cognitivo que considera que la ciencia moderna no es nada más
que una «narración», un «mito» o una mera construcción social."
Con base en la idea de que la racionalidad carece de valor, de que

la ciencia no pasa de ser una construcción social y de que la conexión
entre las palabras y el mundo es arbitraria, se desemboca, con Jacques
Derrida a la cabeza, en una corriente intelectual que defiende las ela-
1
Cabe aclarar que con el término «postmodernismo» se designa a un amplio abanico de
movimientos artísticos, culturales, literarios y filosóficos del siglo XX, definidos en esencia por
su oposición al modernismo. En sociología sin embargo, casi todo el mundo sobreentiende que
el término alude al proceso que se explica en este capítulo. Siendo así, cuando a lo largo del
texto se emplea tal vocablo, ha de entenderse que me refiero a esta acepción, en buena medida
ajena a su origen relacionado con la arquitectura y con otras ramificaciones de la literatura y el
arte.
boraciones teóricas desconectadas de toda corroboración empírica y

que se caracteriza por un acusado relativismo epistémico y cultural,
concretado con el tiempo en un amasijo de filosofía, diletantismo lin-
güístico, crítica literaria y desvaríos psicoanalíticos.
En este contexto, no pocos teóricos de la ciencia, muy especialmente
algunos prestigiosos cultores de determinadas modas psicoanalíticas del
mundo francófono, se dedicaron por años a predicar desaprensivamente
ideas caracterizadas por un cada vez más sospechoso hermetismo. Usan-
do un lenguaje supuestamente erudito, con frecuencia incoherentemente
atravesado por nociones de la matemática abstracta, pero sobre todo ca-
racterizado por un amontonamiento anonadante de palabras, se fue
edificando un sistema. He aquí algunos ejemplos notables.
Jacques Lacan, acaso el más encumbrado precursor de los actuales
pensadores postmodernos, nos había explicado en clave psicoanalíti-
ca, nada menos que lo que llamó «la verdadera génesis numérica del
dos» (Lacan, 1970). Vale la pena leerlo:
"Es necesario que este dos constituya el primer entero que aún no ha
nacido como número antes de que aparezca el dos. Y lo habéis hecho
posible, ya que el dos está ahí para dar existencia al primer uno, poner
el dos en lugar del uno y consiguientemente, en el lugar del dos veréis
aparecer el tres. Lo que tenemos aquí es algo a lo que puedo llamar
marca. Ya tenéis algo que está marcado o algo que no está marcado.
Con la primera marca tenemos el estatuto de la cosa. Exactamente
de este modo Frege explica la génesis del número; la clase que está
garantizada por ningún elemento es la primera clase; tenéis el uno en
el lugar del cero y luego es fácil comprender cómo el lugar del uno se
transforma en el segundo lugar, que deja sitio para el dos, tres y así
sucesivamente… Para nosotros, la cuestión del dos es la cuestión del
sujeto, y es aquí donde llegamos a un hecho de la experiencia psicoa-
nalítica, dado que el dos no completa el uno para hacer dos, sino que
debe repetir el uno para hacer posible la existencia del uno."
Lacan no sólo era capaz de producir antológicos galimatías como

este; pudo llegar a extremos tales como afirmar (Lacan, 1971) que «el
órgano eréctil es equivalente a la raíz cuadrada de (-1)», una declara-
ción que merece pasar directamente al mármol.
Figura 2.1. Jacques Lacan explica el significado de la raíz cuadrada de (-1).
Luce Irigaray es una prominente filósofa feminista belga, destaca-

da por el estudio de las influencias del género de los investigadores
científicos en la elección de sus temas de investigación. Siempre se ha
ironizado sobre la esterilidad de discutir acerca del sexo de los ánge-
les. Pues bien, Irigaray no se corta un pelo para discutir ¡si una ecuación
matemática tiene o no sexo!; por ejemplo, destina una reflexión de
este tipo a la famosa fórmula de Einstein que establece que la energía
es igual al producto de la masa por el cuadrado de la velocidad de la
luz. Textualmente Irigaray (1987), reflexiona:
"¿Es la ecuación sexuada? Tal vez lo sea. Hagamos la hipótesis afirmati-

va en la medida en que privilegia la velocidad de la luz respecto de
otras velocidades vitalmente necesarias para nosotros. Lo que me
hace pensar en la posibilidad de la naturaleza sexuada de la ecuación
no es directamente el hecho de que sea empleada en los armamentos

nucleares, sino más bien el hecho de que se haya privilegiado lo que va
más rápido."
Figura 2.2. Luce Irigaray y la naturaleza sexuada de las fórmulas.
Jean Baudrillard, afamado teórico francés de la sociología y uno

de los impulsores radicales del postmodernismo, solía hablar del «si-
niestro vacío de todo discurso», sin reparar en que ese sayo venía de
perilla a muchos de sus propios textos. Aparentemente, creía poner-
los a salvo de toda vacuidad por el solo hecho de colocar aquí y allá
citas borrosamente relacionadas con conceptos de alto nivel mate-
mático que ni siquiera dominaba. En cierto momento, por ejemplo,
identifica el espacio euclídeo como «el progreso rectilíneo de la Ilus-
tración», y el no euclídeo como un espacio en que las trayectorias se
desvían por una «curvatura maléfica». Así, Baudrillard (1991) dice
sobre la primera Guerra del Golfo que «el espacio de la guerra es
definitivamente no euclidiano». Esto resulta ser algo así como va-
lerse de la gramática para concluir que un plátano es una fruta
decididamente esdrújula mientras que un salchichón es un embuti-
do inequívocamente agudo.
Con ese ropaje se fueron ataviando a lo largo de los años los reyes
posmodernos.
El nuevo desorden internacional
Con los sucesos de honda connotación social y política que se pro-

dujeron en la última década del siglo XX en Europa Oriental,
extraviados no pocos referentes históricos y sociales, habiendo que-
dado el mundo a merced del poder unipolar, con los mercaderes de la
manipulación sintiéndose a sus anchas, y en un caldo de cultivo ópti-
mo para el florecimiento de la banalidad y la indolencia, sobrevino
una verdadera crisis de valores, donde el rigor informativo ha venido
siendo una de las más castigadas víctimas.
La sociedad toda se veía de pronto neutralizada por nociones tales
como el famoso «fin de la historia» y conceptos de análogo tenor,
hijos de una profunda conmoción histórica, graciosamente victorio-
sas debido a la incomparecencia orgánica de contendientes, en buena
medida aturdidos por la avalancha de los acontecimientos.
Una de las tantas expresiones del sinsentido concierne a la distin-
ción artificial que los postmodernos hacen entre la «gran ciencia»
(supuesto instrumento de las oligarquías), y la «pequeña ciencia», tam-
bién bautizada como «ciencia alternativa» o «ciencia democrática».
Esta última expresión es especialmente ridícula, pues pretende dema-
gógicamente desconocer que, nos guste o no, la ciencia es una actividad
de élite (como lo es la que desarrollan los grandes literatos o los me-
dallistas olímpicos). ¿Creerán acaso sus defensores que las disputas
científicas deben dirimirse mediante el voto de todos los ciudadanos
y las ciudadanas?
Las respuestas a este estado de cosas, aunque existían, eran más
bien tímidas y desarticuladas. En su libro Ciencia y Relativismo, el filó-
sofo Larry Laudan, procedente de la Universidad de Princeton
(actualmente en el Instituto de las Investigaciones Filosóficas de la
Universidad Nacional Autónoma de México) expresaba que la susti-

tución de la idea de que los hechos y la evidencia son cruciales para el
progreso del conocimiento, por la idea de que todo se supedita a los
intereses subjetivos y a la perspectiva desde la que los hechos son
apreciados, es «la manifestación más prominente y perniciosa de anti-
intelectualismo de nuestro tiempo» (Laudan, 1990).
Algunos comprendían que las consecuencias culturales más graves
del relativismo radical concernían a su aplicación en las ciencias so-
ciales. El afamado historiador inglés Eric Hobsbawn lo había
denunciado por esa misma época en términos tan elocuentes como
tajantes. En Hobsbawn (1993), por ejemplo, se advierte:
"…el crecimiento de las modas intelectuales posmodernas en las uni-

versidades occidentales, sobre todo en los departamentos de literatura
y antropología, que hacen que todos los «hechos» que aspiran a una
existencia objetiva sean, simplemente, construcciones intelectuales.".
Sin embargo, el desconcierto era predominante. En este confuso

contexto asistíamos al momento más glorioso de un relativismo gno-
seológico cuyas raíces venían de antaño.
El affaire Sokal
En 1995, el destacado físico de la New York University, Alan Sokal,

envía a una publicación académica de alto nivel, la revista Social Text,
un artículo pomposamente titulado: «Transgredir las fronteras: hacia
una hermenéutica transformativa de la gravedad cuántica»2.
2
Adviértase que el propio título aludía a la descabellada posibilidad de que la gravedad
cuántica pudiera verse transformada por lo que tal vez constituya el ejercicio intelectual más
abstracto, menos material, que existe: la mera interpretación de un texto.
El artículo estaba redactado en el más puro estilo ininteligible que

tipifica la producción intelectual del postmodernismo. Deliberadamen-
te, Sokal (1996a) atiborró el trabajo de textos abstractos vertebrados
en las citas más estúpidas que pudo hallar donde la matemática y la
física hubiesen sido descaradamente empleadas por los prominentes
intelectuales enrolados en la empresa postmodernista, a quienes de
paso ensalzaba con reverencia.
Aderezó el material con unos cuantos disparates formales desde el
punto de vista de la física, y dejó así pronta la carnada. Personalmen-
te, creo que se arriesgó bastante a que alguien sospechara la farsa,
pues llegó a incluir afirmaciones que son tan cómicas como descabe-
lladas, de lo cual la siguiente es un ejemplo espectacular: «La pi de
Euclides y la G de Newton, que eran consideradas constantes univer-
sales, ahora se perciben en su ineluctable historicidad». Los editores
de Social Text, no obstante, se tragan el anzuelo. El trabajo fue publi-
cado en la primavera de 1996 dentro de un número monográfico
especialmente dedicado a lo que por entonces se llamaba «la guerra
de las ciencias». No fue siquiera objeto del escrutinio regular de las
revistas científicas (peer review), pese a que Sokal había incluido cruda
y llanamente (sin el menor atisbo de fundamentación) afirmaciones
tales como que «la realidad física… es en definitiva una construcción
social y lingüística».
Tres semanas después, un segundo artículo denominado «Los Ex-
perimentos de un Físico con los Estudios Culturales», es publicado en
la revista Lingua Franca (Sokal, 1996b). Allí comunica que el trabajo
inicial no era más que una parodia y explica su motivación principal
para confeccionarla: denunciar la retórica huera y la patética moda de
disfrazar las incoherencias con ropaje científico. En él ironizaba: «Cual-
quiera que crea que las leyes físicas son meras convenciones sociales,
está invitado a que pruebe a transgredir dichas convenciones desde la
ventana de mi apartamento (vivo en un piso 21)».
Sokal envía después un nuevo artículo a la revista Social Text, titu-
lado «Trasgrediendo las Fronteras: una Post Data». Como era previsible,
los editores se negaron a la publicación de este segundo trabajo. Fue

incluido, sin embargo, en el segundo semestre de 1996 en la revista
Dissent (Sokal, 1996c).
Figura 2.3. El físico neoyorkino Alan Sokal.
Al menos tres cosas habían quedado demostradas:
• que en ciertos ambientes académicos de alto nivel se profesaba

un culto casi ciego al lenguaje altisonante, algo más propio del
ocultismo o de la prensa sensacionalista que del marco racional
que la ciencia exige,
• que algunas revistas científicas pueden actuar al margen de las
reglas estandarizadas (peer review) para conseguir prosélitos a cier-
tas ideas, a la usanza de los políticos que pactan con ciertos
enemigos para vencer a otros enemigos más peligrosos,
• que un conjunto de ideas suficientemente condimentadas con jerga
matemática, si procede de un académico reconocido, podría al-
canzar reverente reconocimiento, aunque careciera de sentido.
Quizás el asunto no hubiera llegado más lejos pero, dada a conocer

la triquiñuela, se había abierto la caja de Pandora. Se produjo un ver-
dadero terremoto académico, tanto en la Duke University (institución

que cobija y publica Social Text), como en los medios especializados
conexos. Como es natural, no faltaron intentos de sacudir al propio
Alan Sokal, rápidamente acusado de haberse conducido de manera
poco ética, así como de estar influido por un sentimiento de francofo-
bia y de ser un intelectual de derecha. Sobre la naturaleza ética o no
de su actuación, habría mucho que discutir… si tuviera sentido; la
aversión a los franceses es ridícula por carecer de todo fundamento
objetivo, aparte de su conocida colaboración con científicos de ese
origen; su condición de derechista, irrelevante (aparte de que siempre
ha sido un hombre de izquierda, quien había incluso colaborado duran-
te años con universidades nicaragüenses durante la etapa sandinista).
Pero lo que sobrevivió por encima de todo fue un espacio propicio
para el examen crítico de quienes hasta entonces eran casi universal-
mente conceptuados como esclarecidos eruditos, que se apoyaban en
complejos hallazgos de la física y la matemática para fundamentar sus
doctrinas.
Más tarde, uno de los editores (Robbins, 1996) admitió que real-
mente no habían entendido el trabajo que habían publicado, pero que
se habían dejado seducir por el hecho de que el autor era, en sus pala-
bras, un «aliado convenientemente acreditado».
El rey desnudo
El artículo era una falta de respeto a la pseudoautoridad, una irre-

verencia adorablemente típica de los niños o del célebre Idiota de
Dostoievsky. Es imposible no recordar la famosa parábola de Hans
Christian Andersen sobre el rey desnudo. Es tan perfecta la analogía
que no me abstengo de recordarla a grandes rasgos.
Unos avispados impostores propusieron a un poderoso rey que
adquiriese un atuendo confeccionado con un paño maravilloso pro-
cedente de lejanas tierras. Con él alcanzaría los máximos niveles de
elegancia. Explicaron que el paño, además, era mágico: sería invisi-

ble para malhechores e hijos de dudosa paternidad. Sumido en su
vanidad, el soberano accedió y en su momento comenzó a desfilar
en la corte con el traje inexistente ante todo el pueblo que se había
aglomerado para embelesarse con el traje maravilloso. Los súbditos,
desde el más modesto al más encumbrado, vieron con estupor que el
rey estaba desnudo; pero también con espanto, ya que cada cual
corría el riesgo de ser percibido como un truhán o un sujeto de igno-
minioso linaje. Nadie se atrevió a decirlo, hasta que un niño comenzó
a preguntar inocentemente a voces cómo era posible que el sobera-
no se paseara desnudo. Mientras muchos se apresuraban a traer ropa
verdadera para cubrir al monarca, los impostores escaparon con el
botín.
Acaso avergonzados al ver que a los venerados maestros se les hu-
biera señalado públicamente que sus distinguidas vestiduras eran
inexistentes, algunos psicoanalistas han sugerido que la ridiculización
de ciertas afirmaciones se basa en que han sido sacadas de contexto
(véase un ejemplo de tal defensa en Said, 2005). Pero la verdad es que
estos disparates resultan aun más notables cuando se ponen en su con-
texto, ya que se insertan en una auténtica maraña de divagaciones. Juzgue
el lector lo que textual (y contextualmente) Lacan (1971) había escrito
en relación con la famosa cita antes mencionada:
"Es así como el órgano eréctil viene a simbolizar el lugar del goce; no del
goce en sí mismo, ni siquiera en cuanto imagen, sino como parte que falta
de la imagen deseada: consecuentemente, es equivalente al significado
obtenido más arriba, del goce que restaura, a través del coeficiente de su
enunciado, a la función de carencia de significante: (-1)."
Tal despliegue de supuesta sabiduría dejaba deprimidos a los jó-

venes estudiantes que aspiraban a ilustrarse por su conducto, a la
vez que despertaba admirados ditirambos en ciertos círculos de la
intelectualidad francesa. Por poner un solo ejemplo, Althusser, quien
sostenía que «la historia es un proceso sin sujeto», afirmó: «Lacan

dota, finalmente, al pensamiento de Freud de los conceptos científi-
cos que exige» (Althusser, 1993) Muchos sospechaban íntimamente
que toda esa palabrería no quería decir nada, pero temían pasar por
incapacitados para adentrarse en tan elevados conceptos, de modo
que callaban.
Figura 2.4. Los reyes postmodernos.
La mayor deuda que tenemos con Alan Sokal no se debe, desde

luego, a que haya protagonizado un divertido episodio; ni siquiera a que
haya desmontado una patraña de considerables proporciones y larga
duración. La verdadera deuda radica en que Sokal, al aprovechar un
intersticio del sistema para realizar una maniobra de alta trascendencia,
dejó un precedente invaluable en la lucha contra la impunidad intelec-
tual, ejercida desde pedestales tímida o inoperantemente cuestionados
hasta entonces. Por otra parte, al haber ganado notoriedad mundial,
consiguió dar análoga prominencia a cuestiones metodológicas de su-

prema importancia. Pudo esclarecer (y lo hizo con encomiable lucidez)
un conjunto de medulares premisas y conceptos.
Por estafar a los estafadores, al menos yo, le concedo a Sokal todo el
siglo XXI de perdón. Lo merece, aunque solo fuera por su contribución a
la defensa de la integridad académica y al descrédito de una corriente de
anarquía cultural que deteriora las exigencias de rigor y responsabilidad,
a la vez que beneficia el oscurantismo y la charlatanería. En lo perso-
nal, considero, además, que atribuirle deshonestidad debido al recurso
empleado sería como acusar a un investigador policial de no ser recto y
honrado cuando escamotea lo que sabe al presunto criminal al que inte-
rroga o no comunicar a un deportista todas las sustancias prohibidas
que es capaz de detectar la prueba antidopaje que se le practica.
Después del affaire
Al año siguiente, ve la luz el libro Impostures Intellectuelles, escrito

por Sokal junto con su colega belga, de la Universidad de Lovaina,
Jean Bricmont. Los autores (Sokal y Bricmont, 1997), obviamente
incentivados por los entredichos y por el estupor de muchos que se
preguntaban si sería realmente cierto que el rey estaba desnudo, des-
enmascaran documentada y convincentemente las asombrosas
imposturas de los más connotados precursores y adalides del postmo-
dernismo francés (Jacques Lacan, Bruno Latour, Jean-Pierre Lyotard,
Julia Kristeva, Jean Baudillard, Gilles Deleuze, Felix Guattari y Paul
Virilio, entre otros).
En efecto, allí se presenta un despiadado repaso del uso descomedi-
do, y muchas veces trasnochado, que hacen de las ciencias «duras» estos
filósofos, teóricos de la sociología y psicoanalistas. Sokal y Bricmont no
se andan con paños calientes; son directos y ríspidos. Por ejemplo, refi-
riéndose a Virilio, escriben: «...lo que se presenta como ‘ciencia’ es un
cóctel de confusiones monumentales y fantasías delirantes. Además, sus
analogías entre la física y las cuestiones sociales son de lo más arbitrario

imaginable, cuando simplemente no se intoxica con sus propias palabras»3
Estos acontecimientos favorecieron acciones tales como un en-
cuentro al que acudieron figuras de la talla de Susan Haack, Gerald
Holton, Mario Bunge, Robin Fox y Stephen Cole, auspiciado por la
New York Academy of Sciences y convocado con el nombre «The
Flight from Science and Reason». Las intervenciones fueron más tar-
de recogidas en un volumen del mismo nombre en Gross, Levitt y
Lewis (1996). Dos años más tarde se publicaría el libro Higher Supers-
tition. The Academic Left and Its Quarrels with Science, donde Gross
y Levitt (1998) comunican un estado de virtual zozobra por las des-
viaciones y exageraciones que parecían hacer metástasis en algunos
recintos universitarios y que ponían en serio peligro la integridad inte-
lectual, consustancial de una genuina Universidad.
Figura 2.5. Bricmont y Sokal se explican.
3
Los textos de la obra de Sokal y Brickmont que se citan corresponden a la versión en
castellano publicada por la Editorial Paidós. No puedo dejar de exaltar la excelsa traducción
que Joan Carles Guix realizó en 1999 de la versión en inglés, lo cual hace de la lectura algo
doblemente disfrutable.
Y un año más tarde, una de las participantes en aquel encuentro,

Noretta Koertge, especialista en filosofía de la ciencia, publicó una
valiosa recopilación de reflexiones bajo el sugestivo título de A House
Built on Sand. Exposing Postmodernist Myths About Science (Koertge, 1998).
Más allá de estos acontecimientos académicos, se produjo un inten-
so intercambio de opiniones. En la página web que el propio Sokal creó
al efecto, se recogen la mayoría de ellas (http://weber.u.washington.edu/
~jwalsh/sokal/). El apoyo a la maniobra fue casi universal. Sin embar-
go, no faltaron defensores de Lacan y su larga lista de seguidores, incluso
mucho después de los acontecimientos relatados.
Por ejemplo, el profesor argentino Roberto Follari, si bien reconoce
la validez de parte de las críticas del físico neoyorquino, desarrolla a su
vez algunas impugnaciones a su trabajo tales como que «no se puede
refutar la copiosa obra de Lacan en 15 cuartillas». Aparte de muchas
endebleces (y algunos aciertos) de la secuencia de reflexiones conteni-
da en Follari (2000), lo que me interesa destacar es que no es lo mismo
errar que ser deshonesto. Por muchos errores que pudiera tener la argu-
mentación de Sokal, nunca se le podrá tildar de impostor; y por muchos
méritos que pueda haber acumulado Lacan, nunca se le podrá exonerar
de haberse conducido como tal. Eso es lo que resulta verdaderamente
relevante y por lo cual traigo el affaire a este libro: la importancia crucial
de conducirse con honradez intelectual en una actividad, la ciencia,
cuya finalidad es precisamente descubrir la verdad.
Además, se mire por donde se mire, afirmar o convalidar algo tan
disparatado como que «la realidad física no es más que una construcción
lingüística» es tan insólito que parece una burla. No puede existir ninguna
sesuda reflexión, ningún mérito pretérito, ningún texto, por muchas pala-
bras altisonantes que tenga, que justifique tamaña afirmación.
Desde luego, la exitosa jugarreta de Sokal y los numerosos aportes
posteriores en la misma dirección, no dejan enteramente resuelto el tema
del oportunismo académico ni del oscurantismo pseudocientífico.
En efecto, el psicólogo Eduardo Said, arriba citado en relación con
el famoso apotegma lacaniano que hacía equivaler el falo humano a la
raíz cuadrada de (-1), asume la condición de exegeta del susodicho pa-

saje y se da a la tarea de esclarecernos mediante un conceptuoso
recorrido, del cual elijo un párrafo ciertamente fascinante que reza así4:
"La parte faltante de la imagen deseada, aquello que va del pene fan-
tasmatisado a la madre, al niño en el lugar de falo que obtura la falta
del Otro, cobra en ello en tanto carencia-ausencia imaginarizada un
valor equivalente a la designación de imaginario para el campo más
ajustado de la lógica matemática."
CLAVES BÁSICAS PARA UNA EPISTEMOLOGÍA ÚTIL

Como se ha enfatizado oportunamente, la filosofía de la ciencia
comprende aspectos que, si bien están íntimamente relacionados, di-
fieren en su alcance y naturaleza. De hecho, operan en diferentes
niveles y por ende guardan relaciones jerárquicas entre sí. Su desco-
nocimiento ha sido fuente de notables insuficiencias y no pocos
despropósitos.
En el primer nivel se halla la ontología, que se ocupa de determinar
cuáles son los objetos que realmente existen en el mundo que nos
rodea. La energía que pudieran liberar o transformar determinadas
maniobras terapéuticas, tales como la «imposición de manos» o la
«moxibustión», por ejemplo, empieza por ofrecer un problema ontoló-
gico, ya que si tal energía no pudiera ser registrada o medida, a la par
que su presunta existencia careciera de fundamento racional, enton-
ces sobrarían motivos para sospechar que no existe.
Por ejemplo, un remedio homeopático resulta ser indistinguible del
agua común por ningún procedimiento de la química ni por conducto
de recurso alguno (tal y como ocurre con el «agua bendita», que por
mucho que se examine, estando a solas con ella, no puede determi-
4
Juro que es textual.
narse si ha sido o no bendecida). Análogamente ocurre con otras ex-

presiones terapéuticas, tales como la llamada «energía piramidal», a la
que nos referiremos en la siguiente sección.
La epistemología por su parte estudia los procesos según los cuales el
ser humano obtiene el conocimiento de la verdad sobre ese mundo
existente, así como el modo de evaluar la fiabilidad de dicho conoci-
miento. Repárese en el carácter jerárquico arriba mencionado: ¿qué
sentido pudiera tener el estudio de la posible influencia fisiológica de
una energía inexistente? En tal caso, su estudio operaría en el vacío.
Otro nivel, sin embargo, concierne a la sociología del conocimien-
to, que atañe al grado en que las verdades conocidas o susceptibles de
serlo (incluyendo presuntas verdades, y hasta aquellos conocimientos
que se sabe que son falsos) están influidas o determinadas, en un
contexto social dado, por factores políticos, culturales, socio-econó-
micos, e ideológicos. Consecuentemente, es una esfera cuyo examen
convoca, entre otros, a sociólogos, historiadores, comunicadores, eco-
nomistas, juristas y filósofos.
En el nivel menos primario, finalmente, se halla la ética de la inves-
tigación, que abarca a su vez dos niveles operativos: el individual y el
social; con base en ella, el científico o el tecnólogo elige qué tema de
investigación debe abordar o rechazar, y cómo hacerlo; las estructu-
ras sociales por su parte, la tendrán en cuenta para establecer qué tipo
de investigación debe ser socialmente estimulada o financiada, y cuál
debería ser desmayada, gravada o prohibida.
LAS PAUTAS PARA EL DEBATE CIENTÍFICO

El poder de las pirámides... y del debate
El famoso físico norteamericano Robert Park advertía reciente-

mente (Park, 2001) que lo que más necesitan las personas no es tanto
extender sus conocimientos técnicos como consolidar una adecuada
cosmovisión científica que les persuada de que vivimos en un univer-

so ordenado. Mal conseguiremos ese propósito si el debate científico
no se ajusta a normas lógicas y racionales. En otro sitio (Silva, 2006)
desarrollé algunas ideas a partir de una situación peculiar que se ha
dado desde hace algunos años en Cuba. Lentamente, a lo largo de
unos diez años se ha venido produciendo en Cuba un proceso de difu-
sión de la llamada energía piramidal y de los extraordinarios beneficios
que se derivarían, o que supuestamente se han derivado, de su aplica-
ción.
Figura 2.6. Park señala el camino de la estupidez al fraude.
Según sus propulsores (véase, por ejemplo, Sosa, 2004), una pirá-
mide construida con cualquier material no ferromagnético, aluminio,
madera, cartón, etc., cuya base sea un cuadrado y cuya altura sea igual
al lado del cuadrado dividida por 2,57, tan pronto se coloque de ma-
nera que cualquier lado de la base se ubique perpendicularmente a la
dirección Sur-Norte, comienza a acumular energía en su interior.
Las propiedades y efectos atribuidos a esta energía han sido califica-
dos como asombrosos por algunos de sus promotores, quienes suelen
acompañar sus afirmaciones con anécdotas y testimonios de los resul-

tados alcanzados. Se afirma que tal energía tendría influencia tanto sobre
seres vivos (rehabilitar personas o gallinas) como sobre entes inanima-
dos (afilar tijeras, reparar disquetes para almacenamiento magnético de
la información, o recuperar baterías alcalinas ya agotadas). En particu-
lar, se ha destacado el posible efecto terapéutico de esa energía debido
a las propiedades miorrelajantes, analgésicas, sedantes, bacteriostáticas
y antiinflamatorias que se le atribuyen. Con esta energía se curarían o
mitigarían males tan diversos como la depresión, la escabiosis, el herpes
simple, los trastornos ulcerosos, la ciatalgia, el insomnio, el tabaquismo,
la cervicitis, la cefalea, la psoriasis, la bursitis, la conjuntivitis, la hernia
hiatal, la hipertensión, la dermatitis y la impotencia. Tales reclamos han
sido presentados oralmente en jornadas científicas y han aparecido tan-
to en la prensa nacional (Pradas, 1998; Atiénzar, 2001, Fernández, 2001;
Alemany, 2004) como en algunos artículos o notas publicadas en revis-
tas científicas o divulgativas (Sosa, Castro y Salles, 1999; Orbera, 2003;
Orbera y Sosa 2003; Ameneiro, 2003).
A lo largo del último lustro, varios científicos cubanos del ámbito
de la física (de Melo, 2003; González 2002; Hart, 2002; Desdín, 2004)
han expresado objeciones a las bases conceptuales esbozadas o desa-
rrolladas en los trabajos arriba mencionados. Sus disparos se han
dirigido a la línea de flotación de la teoría: se refuta la existencia pro-
piamente dicha de la energía presuntamente responsable de los logros
testimoniados.
En este punto se perfilaba un interesante debate científico. Sin
embargo, varios años después no se había publicado ninguna respues-
ta estructurada y abarcadora a los artículos contestatarios. Sólo tengo
conocimiento de una réplica formal, ubicada en Internet, escrita por
el doctor Ulises Sosa Salinas, especialista en Ortopedia y Traumato-
logía, y experto en «Piramidoterapia», titulada Respuesta a los nihilistas
que desconocen los efectos de las pirámides (Sosa, 2005).
Más allá de la legitimidad de las pirámides como tales o de sus
posibles propiedades, la forma en que se ha desarrollado la discusión
sobre el tema ofrece un excelente marco para reflexionar en torno a

las pautas universalmente aceptadas para el debate científico. Tengo
la impresión de que no hay una sola de las reglas propias de un debate
adecuado que no haya sido transgredida en este ejemplo que, por esa
misma razón, expondré con cierto detalle.
Figura 2.7. El poder de las pirámides y del debate.
El lenguaje
El descalificador adjetivo de nihilistas que el doctor Sosa atribuye a

quienes afirman tener razones convincentes para no compartir deter-
minadas aseveraciones, es de por sí inquietante. El nihilismo es la
negación de toda creencia o principio. Sin embargo, el propio hecho
de disentir de ciertas afirmaciones y de hacerlo mediante argumentos
racionales —equivocados o no— pone de manifiesto que quienes han
discrepado están lejos de no creer en nada. No creen a priori en el
poder de las pirámides, pero creen que la encomienda de la ciencia es
construir representaciones precisas de la realidad (siempre imperfec-

tas y siempre perfectibles) y en el intercambio de opiniones sobre bases
rigurosas como una de las herramientas para conseguirlo. De sus re-
flexiones se deriva, además, que creen en la necesidad de hacer
mediciones y contrastaciones objetivas, así como en los mecanismos
de validación externa. Son precisamente estas creencias las responsa-
bles de aquella incredulidad.
Los problemas científicos no se dirimen con adjetivos dirigidos a
las personas. La argumentación ad hominem es absolutamente inacep-
table en el marco de la ciencia. Esta es la falacia lógica consistente en
atacar las reflexiones de otro mediante el intento de desacreditar a
quien las expone y procurar por esa vía que los demás desestimen sus
puntos de vista. Ha de evitarse toda descalificación personal, empleo
de insultos o imputaciones personales para «refutar» las opiniones de
aquel con quien se polemiza. Afirmaciones o insinuaciones tales como
que la persona es ignorante, inculta, charlatán, analfabeto, orate, nihi-
lista, etc., no agregan nada; solo abaratan los argumentos de quien los
usa y descalifican a quien emplea tales adjetivos, cuya debilidad psi-
cológica y precariedad de argumentos se pone de manifiesto, en casos
extremos, cuando alguien solo consigue comunicarse mediante la agre-
sión verbal.
Quienes dudan de un resultado o teoría, o creen que están ante una
expresión de pseudociencia, están en el deber de hacer respetuosamen-
te las preguntas o los juicios conceptuales que consideren pertinentes
sin emitir opiniones sobre los autores del resultado criticado (salvo, cla-
ro está, que posean pruebas de que han cometido fraude); si a quien
sostiene tal teoría o expresión se le formulan objeciones o preguntas
bien delimitadas, lo único que corresponde es que intente rebatirlas o
contestarlas honrada y respetuosamente.
En la respuesta del doctor Sosa, figura el siguiente párrafo:
"Los argumentos en que más insisten los autores se refieren al as-

pecto semántico de utilizar la palabra «energía» cuando nos referimos
al efecto piramidal. No se esgrime ningún argumento en torno a la

demostración no científica de los cientos de resultados obtenidos
hasta la fecha. Se escamotea la esencia bajo un manto discursivo en
torno a la definición de un vocablo (energía), el cuál reconozco
desde ya que en el ámbito de la disciplina de la física posee sus regu-
laridades."
El párrafo cierra con una oración ciertamente desconcertante, donde

el autor reconoce que «en el ámbito de la física el vocablo energía
posee sus regularidades». Resulta casi imposible imaginar qué se que-
rrá decir con esta críptica afirmación. Tampoco queda claro qué ha de
entenderse por «demostración no científica» de un resultado. Son pre-
cisamente las vaguedades de ese tipo las que hacen del lenguaje un
obstáculo y no una vía de comunicación, las que más dificultan un
intercambio inteligible.
José Ingenieros, insigne pensador argentino señalaba (Ingenieros,

2003):
"El estilo que anhela expresar la verdad se estima por su valor lógico:
su claridad es transparente, sus términos precisos, su estructura críti-
ca. Es el lenguaje de las ciencias… Más vale decir una palabra
transparente que murmurar mil enmarañadas. Nunca se construye-
ron templos con filigranas, ni se ganaron batallas con fuegos artificiales."
Una cita de otro propulsor de la energía piramidal reza así (Ame-

neiro, 2003) «las pirámides son una cavidad resonante donde se
modulan todas las energías, tanto cósmicas como telúricas, dando lu-
gar a esta nueva energía de una altísima frecuencia,… y los que la
hemos podido constatar sabemos que la energía piramidal es inmen-
sa, inconmensurable en sus potencialidades». A juicio de González
(2002) este pasaje es un galimatías incomprensible, donde se hace un
uso arbitrario y estrafalario de los términos científicos.
Figura 2.8. Incoherencia piramidal.
A la mayoría de los testigos de este debate nos gustaría contar con

definiciones y explicaciones que permitan presenciar un diálogo flui-
do. Pero para ello se necesitarían respuestas a las siguientes preguntas:
¿Qué significa «modular energías»? ¿Qué es la «frecuencia de una ener-
gía»? ¿Qué ha de entenderse exactamente por «constatar una energía»?
¿Cómo se ha llegado a la conclusión de que la energía piramidal es
«inmensa» y de que su frecuencia es «altísima»? ¿En qué unidades han
sido medidas la energía y su frecuencia? ¿Cómo han conseguido ha-
cerlo, a cuánto ascienden estas magnitudes y cuál fue el margen de
error con que se hicieron las mediciones?
Pocos vicios entorpecen más el debate que el empleo de un lenguaje
ambivalente o carente de sentido. No es válido introducir términos in-
definidos ni nociones inasequibles. El afamado ex editor del British Medical
Journal, Richard Smith sostenía (Smith, 2006): «Soy suspicaz ante las
ideas que son supuestamente tan profundas y complejas que no pueden
ser expresadas en un lenguaje que todo el mundo puede entender. Pue-
de ser que existan tales ideas, pero yo no conozco ninguna».
A juzgar por el contenido del párrafo que he reproducido de la

respuesta del doctor Sosa, aparentemente él no comprende que cuan-
do se impugna la afirmación de que en el centro de las pirámides se
concentra una prodigiosa energía, supuestamente de origen «cósmi-
co» o «telúrico», la discusión no se está centrando en aspecto semántico
alguno, sino en un problema ontológico. Es decir, la cuestión no radi-
ca en el vocablo, sino en si tiene o no sentido hablar de tal energía.
De hecho, me pregunto con cierta perplejidad ¿cómo puede afirmar-
se que un físico está concentrado en un problema semántico cuando
señala (González, 2002) que en las comunicaciones sobre el tema «las
referencias acerca de las mediciones y el valor numérico del campo en
el interior de la pirámide y fuera de ella siempre están ausentes» o cuan-
do fundamenta por qué piensa que «el campo magnético es
absolutamente incapaz de transmitir la supuesta energía»? El profesor
Arnaldo González, Doctor en Ciencias Físicas de la Universidad de La
Habana pudiera estar en lo cierto o no, pero lo que sostiene no es que
haya un problema con la palabra «energía» sino que quienes usan tal
palabra no intentan medir la magnitud que ella evoca, así como que
hacen bien en no intentarlo, pues será imposible medir lo que no existe.
La doctora Hart, profesora de la misma Facultad escribía(Hart, 2002):
"Energía en la más burda de sus acepciones, con ésta basta, no es otra

cosa que la medida común de las diversas formas de movimiento de la
materia. En su uso práctico la energía está asociada a un sistema con-
creto. De esta forma se habla de energía mecánica, electrostática,
magnética, etc. Cobra importancia práctica este vocablo cuando tiene
apellidos. Pero energía piramidal ni se define ni puede definirse."
¿Cabe reducir esta objeción a una discrepancia de índole semánti-

ca?
El Doctor en Ciencias Físicas, Luis Felipe Desdín, Investigador
Titular del Centro de Aplicaciones Tecnológicas y Desarrollo Nuclear
de Cuba plantea (Desdín, 2004) que los creyentes en el poder de las
pirámides «profesan el dogma de que una vez construido un objeto de

forma piramidal, respetando determinadas proporciones y orientación,
se genera en su interior una energía de las formas, que sólo se materializa
en esas circunstancias». La peyorativa condición de dogmáticos que
el doctor Desdín atribuye a priori a los defensores de la energía pirami-
dal es a mi juicio improcedente, y no contribuye a establecer un diálogo
ecuánime. En cambio, sí lo favorece cuando acude a argumentos ra-
zonados como los siguientes:
"Pero los fundamentos de la energía piramidal son irreconciliables

con la Ley de Conservación de la Energía (principio, irrebatiblemente
demostrado por la práctica). En la naturaleza sólo se conocen las
denominadas gravitatoria, electro-débil (que tiene sus manifestacio-
nes en los fenómenos electromagnéticos y en determinados procesos
de desintegración que transcurren muy lentamente en el micromun-
do) y nuclear… Según sus postulados, la energía piramidal proviene
de la forma, de manera que está asociada a un concepto geométrico
y no a la materia en sí. Pero como la energía es una medida del movi-
miento —y este no existe separado de la materia—, aceptar la
existencia de la denominada piramidal significa admitir que la Ley de
Conservación de la Energía no es cierta."
El profesor de la Facultad de Física de la Universidad de La Haba-

na, doctor Osvaldo de Melo, formula preguntas que tampoco pueden
considerarse de naturaleza léxica (de Melo, 2003):
"¿cómo se propagan las energías piramidales o vitales?; ¿a través de

qué mecanismo o de qué substancias se transmiten?; ¿de dónde vie-
nen y hacia dónde van? Y luego, está el asunto de la detección: ¿con
que instrumentos se detectan? Y el de la transformación: ¿cómo se
pueden transformar en otras energías más conocidas? ¿Pudiéramos
obtener un poco de electricidad a partir de la piramidal?"
Donde parecería que si asistimos a una operación semántica es cuando

los defensores de la «energía piramidal», aparentemente a raíz de los
cuestionamientos, emigran de ese concepto hacia el de «efecto pirami-
dal». No se consigue anular de un plumazo la controversia suprimiendo
una palabra conflictiva y supliéndola por otra, como si con ello queda-
ran resueltas las objeciones. Por otra parte, la noción de efecto piramidal
es tanto o más conflictiva que la de energía piramidal, pues todo efecto lo
es de una causa, y si nos circunscribiéramos a hablar del efecto, entonces
la causa que lo produce quedaría en un misterioso limbo.
Cabe recordar que no son pocos los trabajos donde los profesiona-
les adheridos a la terapia de las pirámides aluden una y otra vez a la
«energía piramidal», noción que, por más señas, figura en el título de
la monografía sobre el tema que hace poco ha hecho pública en ver-
sión electrónica el propio doctor Sosa. Allí se consigna (Sosa, 2004)
que «la energía piramidal no es más que energía acumulada en el cen-
tro de la pirámide que se origina dentro y alrededor de ella, por la
forma y orientación de la pirámide». Otro tanto ocurre, por poner
algunos ejemplos adicionales, en notas publicadas con y sin su cola-
boración, destinadas justamente a comunicar las «evidencias de la
energía piramidal» (Obrera, 2003) o a dar cuenta de su «presencia en
la medicina cubana» (Obrera y Sosa, 2003).
Ante esta «evolución» semántica uno no puede menos que re-
cordar al científico norteamericano Charles Fort, famoso en el siglo
XIX por dedicarse a la investigación de hechos no solucionados por la
ciencia, cuando dijo: «Las disciplinas no científicas siempre ha tenido
épocas difíciles, hasta que se establecen y cambian de nombre».
Ocasionalmente, en lugar de respetar el hilo del debate, aceptando
o refutando la impugnación que se le ha hecho, al ver que no tendría
más remedio que admitir su error, uno de los polemistas ignora esa
línea del debate, o bien atribuye a su contendiente lo que éste no ha
dicho. Tal estrategia enturbia el intercambio y revela en definitiva la
endeblez de quien así actúe, algo que a la postre cualquier lector aten-
to habrá de advertir.
La lógica del debate y los instrumentos

demarcatorios en la ciencia
El doctor Sosa plantea: «…quisiera preguntar a estos notables físi-

cos tan preocupados por la generalización del uso de las pirámides:
(1) ¿Cuántos protocolos investigativos metodológicamente correctos
han realizado para demostrar la supuesta ineficacia del efecto pirami-
dal? (2) ¿Dónde han sido publicados esos resultados?».
En estas demandas anida una confusión acerca de cómo funciona
la ciencia. Como atinadamente ha señalado un destacado columnista
de Scientific American (Shermer, 1997) no es a los destinatarios de re-
volucionarias propuestas a quienes corresponde, en principio,
demostrar su falsedad; es a quienes las realizan a los que —evitando
tanto las anécdotas como el empleo de categorías difusas— corres-
ponde demostrarlas.
Alan Sokal sugería (véase Midence, 2000):
"Si yo afirmo algo, tengo la obligación de sostener mis afirmaciones

con razonamientos lógicos … de explicar por qué es razonable creer
lo que estoy diciendo. Y si mis explicaciones no resultan convincen-
tes, se me deben pedir más explicaciones, hasta que mi interlocutor
pueda configurar su propio juicio racional."
No pongo en duda la honradez y buenas intenciones ni de unos ni

de otros participantes en este debate. Pero, si queremos llegar a la
verdad, no pueden violentarse las reglas bien establecidas para todo
intercambio de argumentos científicos, por muy altruistas que pue-
dan ser los propósitos de quienes intervengan en él.
El intento de invertir el curso de la discusión, solo sirve para sabo-
tear el debate. A veces, tal «estrategia» se torna simplemente patética.
Para poner un ejemplo burdo pero elocuente, imaginemos que alguien
afirma que en su vivienda habitan fantasmas. Si cuando se le pide que
fundamente teóricamente, o que ponga a prueba experimentalmente
dicha aseveración, quien la proclama procede a exigir al objetor que

demuestre que tales fantasmas no existen, simplemente se estaría ofen-
diendo la racionalidad más elemental. Si en calidad de «prueba» de
que efectivamente existen, se esgrimiera que hay varias personas asus-
tadas por los susodichos fantasmas, el absurdo círculo autorreferencial
se habría completado del modo más insensato.
Si alguien plantea una teoría o hace una afirmación que a juicio de
otro investigador es errónea o disparatada, y este último fundamenta
las razones de su objeción, lo que toca al primero es analizar —oca-
sionalmente rebatir— esa fundamentación. Los científicos no están
en la obligación de dedicarse, cada vez que creen que algo no existe, a
demostrar que en verdad no existe; ni a demostrar que una propuesta
tecnológica no funciona cada vez que creen que no funciona. Lo que
sí deben hacer es evaluar tanto teórica como prácticamente los resul-
tados científicos presuntamente conseguidos siempre que éstos hayan
sido seriamente fundamentados y transparentemente documentados.
A lo que más puede aspirar quien hace una propuesta es a que otros
investigadores reproduzcan los experimentos que presuntamente la
respaldan. No puedo dejar de recordar la broma que hacen los norte-
americanos cuando, en alusión al slogan presente en sus billetes, dicen
«In God we trust, but all others must bring data»5.
Por ejemplo, se han proclamado las propiedades terapéuticas del
«agua piramidal» para encarar diversas dolencias hepáticas, renales y
gástricas. Según se afirma (Sosa, 2004), bastan 24 horas de exposi-
ción bajo la pirámide para que el agua obtenga propiedades piramidales
lo cual «se puede comprobar mediante la radiestesia» y también me-
diante lo que se califica como «la más simple experiencia», descrita
textualmente del modo siguiente:
"Coger un trozo de carne algo deteriorada y dividirlo en dos mitades,

sumergiendo uno de ellos en agua tratada y el otro en agua común. Al
cabo de un par de días, comprobaremos que en la primera ha desapa-
5
«En Dios confiamos, pero todos los demás tienen que venir con datos.»
recido el mal olor, la carne ha dejado de descomponerse y el agua se

conserva limpia; en cambio la carne sumergida en agua común sigue
descomponiéndose y el agua queda completamente turbia."
Se agrega que debe evitarse el consumo de agua que haya sido

colocada en la mitad que se halla al sur de la base de la pirámide, pues
se ha demostrado que en tal caso, el agua se contaminaría, y que lo
correcto por lo tanto es colocarla en la zona norte. Ya que el texto no
contiene explicación alguna al respecto, es bastante natural que se
quieran conocer las razones que asisten a su autor para creer que en el
primer caso el agua no es potable mientras que en el segundo sí, qué
propiedades químicas adquiere o pierde el agua en cada caso, cuál es
el agente contaminante, con qué recursos experimentales se puede
distinguir una de otra. Cuando hayan sido respondidas esas cuatro
preguntas cobrará mayor sentido enjuiciar o valorar la pertinencia del
mencionado precepto.
En cambio, aunque tampoco se dé una explicación teórica sobre la
piramidalización del agua, afortunadamente el texto sí sugiere, como
hemos visto, una manera concreta de valorar si el agua ha adquirido
condición piramidal o no. Con ello se satisface la conocida y crucial
premisa de «falsabilidad» formalmente establecida por Karl Popper
(que sea factible evaluar su posible falsedad), con la que ha de cum-
plir toda hipótesis para consentir una evaluación (Popper, 1972).
Vale la pena poner un par de ejemplos reales que ilustren el daño
que pudiera causar el abandono de los cauces racionales en el debate.
Un ejemplo muy socorrido es el de Ignatz Semmelweiss y el desdén de
que fueron objeto sus sugerencias de adoptar medidas antisépticas en
los hospitales. Para ver detalles al respecto, véase apartado Subjetivi-
dad no equivale a arbitrriedad, p. 186.
Ahora repasemos brevemente el famoso suceso de la «fusión fría».
En marzo de 1989, Stanley Pons y Martin Fleischmann, ambos elec-
troquímicos de la Universidad de Utah, convocaron a una conferencia
de prensa en Salt Lake City (procedimiento informativo bastante in-
sólito, por cierto) para presentar un descubrimiento prodigioso. De

acuerdo a la visión tradicional de los físicos, para conseguir que dos
núcleos de deuterio se aproximen tanto como para fusionarse, se re-
querirían temperaturas de decenas de millones de grados Celsius. Los
científicos mencionados anunciaron el logro del proceso de fusión a
temperatura ambiente mediante el empleo de una batería conectada a
un par de electrodos de paladio sumergidos en agua. En términos
prácticos, esto significaría una producción fabulosa de energía a bají-
simo costo. Superado el estupor generalizado inicial, se les enfrentó a
varias inconsistencias teóricas y se les pidió que expusieran con deta-
lle cómo habían sido los experimentos que demostraban la posibilidad
de producir la susodicha fusión, conocida como cold fusion en inglés.
Los autores de la propuesta hicieron todo tipo de trucos para enma-
rañar, dilatar y dificultar tanto la discusión teórica (pues el resultado
contradecía más de un principio de la física) como la corroboración
práctica, pero nadie puede eludir sine die las reglas admitidas y exigidas
por la comunidad científica sin quedar desacreditado, de modo que ac-
cedieron a dar la información requerida. Hubo unas pocas y confusas
convalidaciones parciales, pero se produjeron innumerables informes
con resultados sólidamente negativos. Poco a poco, la aparatosa falta
de sustento teórico, las evidencias de maniobras espurias y el hecho de
que los resultados de los experimentos no podían ser reproducidos, fue-
ron conjugándose hasta que la fusión fría fuera categóricamente calificada
como «ciencia basura». En cuestión de pocos meses, Pons y Fleisch-
mann habían completado el ciclo que involuciona de la convicción a la
obcecación y de ésta a la superchería, de modo que a la postre resulta-
ron concluyentemente desenmascarados como los protagonistas de uno
de los más sonados andamiajes fraudulentos en la historia de la ciencia.
Para tener una descripción detallada de este bochornoso episodio, pue-
den consultarse diversos libros (di Trochio, 1995; Park, 2001; Taubes
1993) y muchos miles de sitios de Internet.
Por derecho propio, «no tergiversar deliberadamente la verdad» ha
de ser necesariamente la primera de las reglas de cualquier debate. El
propósito más general de la ciencia es, en esencia, develar o descubrir

la verdad. Siendo así, la introducción premeditada de falsedades de
cualquier índole resulta simplemente una felonía con la que se ofende
la médula misma de la empresa científica. Desde luego, esto no debe
confundirse con la idea equivocada de que cuando dos puntos de vista
se oponen, uno responda a la verdad y el otro a la mentira. Nuestras
representaciones son siempre perfectibles y, en esa medida, es suma-
mente peligroso que algo sea declarado como definitivamente establecido.
La naturaleza gradual con que se consolida el conocimiento no des-
miente, sin embargo, la validez de una regla que establece con claridad
que lo que resulta inadmisible es la introducción ex profeso de informa-
ciones falsas.
Las reglas de juego de la ciencia verdadera no admiten que el autor
inicial se desentienda de una objeción concreta y, en lugar de conti-
nuar el hilo del debate, aceptando o refutando la impugnación que se
le ha hecho, exija al objetor que demuestre la invalidez de lo que pro-
clama. En el caso específico de las pirámides, varios físicos, como se
ha visto, argumentan por qué consideran insensato pregonar una teo-
ría que a juicio de ellos contradice el principio de conservación de la
energía. Un defensor de la teoría vertebrada en torno a la energía pira-
midal está en su derecho a pensar que los doctores en ciencias físicas
están equivocados cuando convergen en esa opinión, pero a lo que no
tiene derecho es a pasar por alto sus argumentaciones, sacrificando la
lógica del debate en el altar de sus convicciones previas.
Es decir, una respuesta consecuente, lo que debería contener en el
plano teórico son juicios sobre si los argumentos críticos que se han
dado son correctos o no y responder a las preguntas formuladas. Que
no se tengan todas las respuestas, puede comprenderse; actuar como si
esas preguntas concretas no se hubieran formulado, no es admisible.
En el marco empírico, en lugar de exigir que se demuestre que la
energía piramidal no existe, sus descubridores deberían explicar con
nitidez los experimentos que demuestran su existencia para que pue-
dan ser convalidados o refutados. De modo que la primera pregunta
que debe responderse es: ¿en qué revistas de indiscutido prestigio han
sido publicados por cubanos o por extranjeros de cualquier lugar del
planeta los experimentos que demuestren la existencia de la susodi-
cha energía?
En este contexto, procede adicionar que las afirmaciones científicas
atendibles se consagran fundamentalmente en publicaciones realizadas
en revistas arbitradas, susceptibles de ser examinadas pausadamente, y
fundamentadas en experimentos reproducibles, nunca en difusas decla-
raciones verbales o testimonios personales, independientemente de cuán
espectaculares o enfáticas sean.
Hace ya veinte años, Hebe Vessuri, Directora del Departamento de
Estudio de la Ciencia del Instituto Venezolano de Investigaciones Cien-
tíficas, recordaba el conocido aforismo según el cual «la investigación
científica que no está publicada no existe» y agregaba (Vessuri, 1987):
"La publicación en una revista de prestigio reconocido asegura la prio-

ridad en la producción de un resultado, acrecienta el crédito académico
de un científico, legitima su actividad y permite la existencia de siste-
mas de comunicación científica ligados a procesos activos de persuasión,
negociación, refutación y modificación."
Análoga demanda cabe hacer en relación con sus proclamados efec-

tos terapéuticos. ¿Existen ensayos clínicos realizados en algún sitio
del mundo bajo estándares universalmente aceptados y posteriormente
publicados con una explicación detallada de su metodología? Por lo
pronto, sólo conozco un artículo favorable a la EP que haya sido pu-
blicado en una revista científica arbitrada (véase Sosa, Castro y Salles,
1999) donde se exponga con detalle —de manera que pueda ser re-
producida— la metodología de una investigación empírica.
Lamentablemente, dicho artículo es ciertamente heterodoxo, en su
estructura (ajena a las pautas sugeridas por el Comité Internacional
de Editores de Revistas Médicas, 2004) y lastimoso en su metodolo-
gía, ya que en él se reseña una mera descripción de resultados y no un
experimento riguroso; ni siquiera se incorporó al estudio un grupo de

control, de modo que tampoco se aplicaron los pilares esenciales de
todo ensayo bien realizado: las técnicas de enmascaramiento y la asig-
nación aleatoria. En cambio, hay al menos tres (Rebullido, Silva y
Benet, 2006; Hernández, Perera y Ulloa, 2007; Álvarez et al., 2007)
donde sí se contemplaron dichas demandas, todos los cuales arrojan
conclusiones opuestas a las afirmaciones de los piramidólogos.
Los criterios de autoridad
Obviamente, el rango, el currículo o los honores académicos que

pueda exhibir un científico, querámoslo o no, gravitan subjetivamente
sobre el grado de credibilidad que alcanzan en principio sus afirma-
ciones. En ese sentido, los criterios de autoridad pudieran sin duda
tener algún valor orientativo. Sin embargo, bajo ningún concepto sir-
ven por sí mismos como árbitros en la ciencia. El nombre de un
científico, por muy afamado que sea, o por muy importante que sea la
publicación que acogió sus ideas, no agrega solidez por sí mismo a sus
puntos de vista.
Basta recordar el ejemplo de Wollfang Pauli, premio Nobel de Físi-
ca, cuando sin una base seria, se apresuró a declarar que la idea del
joven colega Ralph Kronig acerca del concepto de spin (un momento
angular asociado a las partículas en la mecánica cuántica) era «muy
penetrante, pero, carente de la menor relación con la realidad». Pues-
to que tan cáustica descalificación provenía de una voz muy
autorizada, Kronig se abstuvo de mantener sus reclamos. Pero Pauli
había dado una opinión, no una refutación teórica. De modo que ello
no bastó para dar por cerrado el asunto. Meses más tarde, los holande-
ses George Uhlenbeck y Samuel Goudsmit, en quienes no hizo mella
la retórica de Pauli, llegaron a las mismas conclusiones que había an-
ticipado Kronig. El concepto constituye hoy un elemento de medular
importancia en la física cuántica, con trascendentes aplicaciones, ta-
les como las que se han verificado en el campo de la resonancia mag-

nética nuclear. Para mayor ironía, el susodicho concepto de spin fue
más tarde formalizado por el propio Pauli.
Otro tanto ocurre con las fuentes: no recibe a priori igual acepta-
ción un artículo de The New England Journal of Medicine o de Science
que uno aparecido en Anales de Pediatría de Teruel. Pero el hecho de
que haya sido publicado en Science no garantiza ni su rigor ni su vera-
cidad, como acaba de ponerse mundialmente en evidencia con el
caso de Woo-suk Hwang, el impostor coreano que consiguió publi-
car varios trabajos fraudulentos sobre obtención de células madre
en dicha revista. En fin, los criterios de autoridad, aunque pudieran
tener algún valor orientativo, no sirven por sí mismos como árbitros
en la ciencia.
Esta parecería ser otra grieta metodológica de la respuesta del doc-
tor Sosa. En su nota dirigida a los físicos tildados de nihilistas, informa
textualmente que:
"En el año 2000 se realizó un Simposium Internacional de Física Teórica y

Biológica, publicado en Internet, donde se dedicó gran espacio a la dis-
cusión sobre la «energía de las formas» llegándose a la conclusión
«sobre la existencia de la radiación del hadrón y magnetismo del ha-
drón, producidos por las partículas nucleares del hadrón, protón y
neutrón…"
Y en la monografía ya mencionada antes el propio autor decía (Sosa,

2004):
"En fecha relativamente reciente, se realizó en los Estados Unidos de

Norteamérica, un Simposium de Física Teórica (Symposium of Theoreti-
cal Physics and Biology) en que se llegó al consensus de que la radiación
energética concentrada en las pirámides y en otras formas geométricas
es una energía magnética producida por las partículas nucleares hadrón
de los protones y neutrones procedentes de los cuerpos cósmicos."
Puesto que este acontecimiento se esgrime como un argumento

persuasivo, procede que nos detengamos en él. Desgraciadamente, el
doctor Sosa no emplea esta información con acuerdo a las exigencias
de una discusión científica rigurosa. Veamos.
Efectivamente, se realizó este symposium sobre física teórica y
biología. Pero no se produjo en el año 2000 sino en 1999. No se cele-
bró en Estados Unidos, sino en Kiev. No fue internacional sino
organizado por dos instituciones locales y todos los miembros de los
comités Organizador y Científico eran ucranianos. Tres imprecisiones
que pudieran considerarse laterales. Sin embargo, hay otras que no lo
son.
En el symposium se presentaron 35 trabajos. Tanto el programa
inicial detallado como el texto de todos los resúmenes (no así el de los
trabajos completos) pueden encontrarse en Internet (Adamenko y Lev-
chook, 1999). Sólo en uno de esos 35 resúmenes se menciona la energía
de las formas y se alude a las pirámides. Más concretamente, para la
última hora y media del último día del symposium se programó la
exposición y discusión de cinco presentaciones orales; la que nos ocu-
pa fue una de ellas. ¿Por qué decir que se dedicó «gran espacio» a la
discusión sobre la energía de las formas?, ¿y con qué fundamento se
afirma que tras esa discusión se llegó a una conclusión y a un consen-
so sobre la energía piramidal? Tales distorsiones son bastante serias,
resulta difícil entenderlas sino como un esfuerzo de avalar a cualquier
precio una idea preconcebida.
Por otra parte, el hecho de que en una jornada científica se haya
presentado un trabajo en el que se defiende la energía de las formas o
de las pirámides no otorga, desde luego, ningún género de aval a nada.
Mucho menos constituye una respuesta a las objeciones concretas de
los físicos. En el mejor de los casos, sólo pondría de manifiesto que
hay otras personas que opinan del mismo modo que quienes han sido
refutados por ellos. Ya vimos que aunque hubiese sido publicado in-
cluso en la más prestigiosa revista, ello no bastaría en sí mismo como
argumento.
Cabe recalcar, sin embargo, que la publicación de un artículo, con-

siente por lo menos un escrutinio detallado. Es evidente y está
universalmente aceptado que las presentaciones orales, los trabajos
presentados en congresos o ante tribunales (por ejemplo, tesis de maes-
tría o doctorado) e incluso aquellos textos aparecidos en espacios
informales (haya o no resúmenes a los que se pueda acceder), si no
han sido concretados en publicaciones formales arbitradas, suscepti-
bles de ser detenidamente examinadas por parte de cualquier
participante del debate o integrante de la audiencia que lo sigue, no
aportan elementos útiles para el análisis. Además de correcta y preci-
sa, la información ha de ser, sobre todo, accesible. Tal exigencia procede
para cualquier zona del debate o del texto que lo recoge, pero resulta
especialmente pertinente cuando concierne a las citas o referencias
bibliográficas.
Pero lo cierto es que el mencionado trabajo Adamenko y Levcho-
ok, simplemente, nunca ha sido publicado, ni ha sido citado en revista
indexada alguna en los nueve años posteriores a su presentación.
Desafortunadamente, esto no es todo. A juzgar por la opinión que
personalmente me hiciera llegar poco tiempo atrás el Doctor en Cien-
cias Físicas y Matemáticas Sergey N. Volkov, organizador del symposium,
y sobre todo por el resumen que figura en Internet, todo indica que la
ponencia de Adamenko y Levchook no pase de ser una típica pieza de
nítido corte pseudocientífico. En efecto, las pocas líneas de que consta
dicho resumen están plagadas de alusiones a descabelladas posibilida-
des, tales como que se puede burlar la ley de gravedad a través de la
telekinesis y la levitación, y que se puede establecer comunicación ex-
trasensorial y conseguir curación a distancia mediante un llamado «sexto
sentido». Y por si fuera poco, en la propia ponencia se reivindican los
efectos de la «fusión fría» cuya escandalosa historia, como vimos, ya
había transitado por sus más deshonrosos pasajes en el momento en
que se celebraba el symposium de Kiev.
A propósito de esto último, cabe intercalar que no es extraño que los
autores de supercherías académicas sobrevivan a su desenmascaramiento.
Baste consignar que, aunque la abrumadora mayoría de los científicos

recuerdan con rubor el episodio de la fusión fría, lo cierto es que pervi-
vió una especie de enfebrecida secta que ha seguido insistiendo en ello,
procurando, y ocasionalmente consiguiendo, financiamiento, incluso
hasta nuestros días. Tanto así, que revistas del llamado mainstream (re-
vistas de primer nivel) se ven obligadas a rechazar constantemente
artículos sobre el tema y, por ejemplo, dos de ellas, Scientific American y
Nature , publicaron sendos artículos en marzo y octubre de 2005 res-
pectivamente denunciando una vez más la patraña. En enero de 2006,
varios órganos de prensa de máxima influencia (por ejemplo The Was-
hington Post, The Guardian y la revista Time) publicaron nuevos
artículos advirtiendo a los neófitos que la farsa estaba de antiguo
desenmascarada.
Vinculado al tema de los «criterios de autoridad», pero con conno-
taciones especiales, es el caso de la sorprendente entrevista realizada
por el Sunday Times en octubre de 2007 a James Watson, uno de los
ganadores del Premio Nobel en los años 50 por el descubrimiento de
la estructura de doble hélice del ADN. Este señor afirmó que «la inte-
ligencia -IQ- de los africanos es inferior y por tanto no deben ser
considerados para promociones laborales dadas sus bajas calificacio-
nes genéticas». El científico aseguró que es pesimista respecto al futuro
de África, «porque la totalidad de nuestras políticas sociales están
basadas en el hecho de que su inteligencia es la misma que la nuestra,
cuando todas las pruebas demuestran que no es así».
Virtualmente todo el mundo ha reaccionado acusando al encum-
brado científico de racista. Y casi con seguridad tienen razón. Pero a
mi juicio la convicción expresada por Watson no es falsa por ser racis-
ta, sino que es racista por ser falsa. Esta sutil distinción procura llamar
la atención sobre otro matiz acerca de cómo debería desarrollarse el
debate científico.
La mayor parte de las reacciones partieron axiomáticamente de
que una supuesta supremacía blanca en materia intelectual tiene al-
gún valor moral, lo cual me parece irracional. El asunto esencial no
reside en precipitarse a valorar si la afirmación es racista o no, sino en

si hay motivos para considerarla verdadera. Esto no niega que las
connotaciones sociales que se den a una convicción cualquiera o el
uso que se haga de ella (sea o no incierta), sí tienen, desde luego, una
dimensión moral que ha de tenerse en cuenta. Vale la pena extenderse
un poco en el caso que nos ocupa.
Algunos creen, por ejemplo, que avanzado el siglo XXI casi todos
los jugadores de las ligas europeas de fútbol serán negros africanos y
de otros países. Estiman que ellos tienen más potencialidades para
dicho deporte (más elasticidad, mayor resistencia y superior potencia-
lidad muscular), y que solo es cuestión de tiempo (poco tiempo) que
adquieran el oficio y la técnica necesarios para que tal superioridad se
exprese de manera avasallante. No hay pruebas; es solo una presun-
ción, empíricamente fundada, eso sí, por las tendencias que se observan
en los «fichajes». Ahora bien, como tal punto de vista «favorece» a los
negros, no hay mayor riesgo de que se tilde de racistas por ello a quie-
nes lo sostienen. Pero si esto no se descarta a priori como posibilidad
en cuanto al físico, ¿por qué dar por sentado que la inteligencia de
todas las etnias es la misma? Creo que en todo esto rige la idea de que
hay que rechazar de antemano que la realidad pudiera ser como ha
afirmado James Watson. O sea, se trataría de un apriorismo típico,
basado en lo que hoy se considera «políticamente correcto».
Al examinar en sí mismas las afirmaciones generales del afamado
investigador, se aprecia que, amparado en su bien ganado prestigio,
Watson nos endilga vagas consideraciones anecdóticas en calidad de
prueba, lo cual ya empieza a ser altamente sospechoso. Por otra parte,
cabe recordar que sus estridentes consideraciones llueven sobre mo-
jado. Ya antes nuestro personaje se había declarado admirador de la
obra de Charles Murray y Richard Herrnstein, los autores de The Bell
Curve, un tratado de más de 800 páginas (Herrnstein y Murray, 1994).
Allí se pretende demostrar que los pobres no solo se caracterizan por
su escasez de recursos sino, también y sobre todo, por su menguada
inteligencia, doctrina que tiene como piedra angular las pruebas de
inteligencia. Si la obra mencionada tuviera verdadero sustento cientí-

fico, al menos yo no le vería ninguna connotación ética a lo que ella
concluye, como no se la veo a que los humanos de raza negra pudie-
ran tener más elasticidad. Pero la naturaleza acientífica y paralógica
del trabajo de estos neoeugenésicos ha sido profusa e inequívoca-
mente demostrada con argumentos sólidos (Gould; 1994; Fraser, 1995;
Muntaner, Nieto y O'Campo, 1996; Fischer et al., 1996; Silva, 1997a),
no con meras palabras alarmadas por la veta racista que lo atraviesa,
tales como la de proclamar la esterilidad de procurar ayuda a los niños
con mayor retraso, en especial a los de raza negra.
La advertencia tiene interés, en mi opinión, porque en este caso los
juicios de valor hechos al margen de la ciencia coinciden con los que
dimanan de la propia ciencia, pero no faltan ejemplos en que esta
última se ve asfixiada por el apriorismo de aquéllos.
El legado de Ronald Fisher
Hace unos años opiné (Silva, 1997b) que prestar mecánica aten-
ción a toda propuesta terapéutica, por descabellada e infundada que
sea, no sería una regla de conducta racional, aunque sólo fuera por
mero afán de ahorrar recursos humanos y materiales. Agregué que, sin
embargo, en ciertas circunstancias, pudiera ser aconsejable valorar ri-
gurosamente y con estándares demarcatorios indiscutibles algunas de
ellas, especialmente cuando han alcanzado notoriedad o implanta-
ción social y cuando los procedimientos valorativos no resulten
onerosos. Señalé finalmente que, aunque no tuvieran más cimiento
que el testimonio reiterado de sus virtudes, ocasionalmente pudieran
contener elementos de verdad, lo cual pudiera justificar dicho esfuer-
zo valorativo.
Creo que en este caso, además de reclamar que se encauce el deba-
te llamado a cubrir las numerosas lagunas conceptuales y empíricas
que se han señalado sobre la existencia de la energía piramidal y sobre
la validez de las terapias asociadas, procede que se realicen algunas

experiencias independientes debidamente protocolizadas. También se-
ría muy atractivo que se realizaran esfuerzos conjuntos en esa dirección.
Con ello se contribuiría, bien a fundamentar mejor su posible viabili-
dad, bien a conjurar los riesgos que su aplicación pudiera entrañar
para quienes aplazan el empleo de recursos terapéuticos convencio-
nales o prescinden de ellos.
En la citada respuesta a los físicos, se plantea:
"No creo que debiera existir polémica alguna entre físicos y médicos
sobre este tema. Al contrario, deberíamos aunar esfuerzos para lo-
grar demostrar de una vez y por todas, que este efecto o energía o
como quieran llamarlo es efectivo."
Aunar esfuerzos para desestancar la polémica y prosperar en el

conocimiento me parece una magnífica propuesta del doctor Sosa. Si
el desenlace de ese empeño conjunto contribuyera a fundamentar que
la energía existe o que su influencia es efectiva para resolver algunos
problemas, se habrá llegado a una situación sumamente interesante y
promisoria. Sin embargo, tal esfuerzo realizado en común tiene senti-
do, precisamente, porque no se pueden garantizar de antemano sus
resultados, y porque unos y otros experimentadores abrigarían expec-
tativas muy diferentes. Por otra parte, cualquiera sea el desenlace de
dichas experiencias, resulta aventurado vaticinar que el asunto que-
daría zanjado «de una vez y por todas»; la historia prueba que sólo la
paciente acumulación de datos y evidencias puede ir perfeccionando
las representaciones que la ciencia hace de la realidad objetiva.
Cada cual tiene el deber de atender seriamente las reflexiones aje-
nas, liberándose de sus propios prejuicios que, como el propio término
indica, son juicios previos, anteriores a lo que «el otro» pueda expo-
ner. La discusión científica ha de renunciar a la imposición mesiánica
de las ideas y a todo género de apriorismo. La prepotencia no tiene
cabida en el debate.
En casos como este se dan condiciones especialmente favorables

para la experimentación, ya que, por ejemplo, valorar si las baterías
alcalinas agotadas recuperan o no su capacidad tras ser colocadas dentro
de una pirámide de cartulina es algo muy fácil de realizar con un vol-
tímetro, no ofrece barrera ética alguna y está eliminado el peligro de
un efecto placebo. De hecho, poco tiempo después tal experimento
fue realizado (Hernández, Perea y Ulloa, 2007) con resultados com-
pletamente opuestos a las afirmaciones de los «piramidólogos».
La mera lectura de los manuales sobre energía piramidal permite
concebir muchos otros experimentos igualmente simples y útiles para
valorarla, que no exigen en principio la participación de pacientes.
Tal es el caso, por poner un solo ejemplo, de la obtención de agua
piramidal. Con ese fin, los investigadores podrían emular la celebérri-
ma y emblemática propuesta que en 1929 hiciera el eminente estadístico
Sir Ronald Fisher, pionero en la teoría del diseño experimental, para
evaluar si cierta dama, después de probar un té con leche, tenía o no
el don de identificar el orden en que los dos ingredientes fueron verti-
dos dentro de la taza (véase el reciente libro de Salsburg (2002) inspirado
en la famosa metodología introducida por Fisher).
Figura 2.9. La dama catadora de té.

Bastaría mantener bajo la pirámide durante cierto lapso convenido

(24 horas, en opinión de Sosa) cierto número de recipientes con agua
—por ejemplo, 50— y luego preparar un número igual de recipientes
no sometidos al supuesto influjo de la pirámide. Tras aleatorizar el
orden de las 100 muestras y, habiendo puesto a buen resguardo los
códigos que identifican una y otra condición, entregarlas en su totali-
dad a los especialistas en pirámides. Transcurrido cierto lapso también
convenido —un par de días o una semana— durante el cual aplica-
rían la radioestesia, la prueba de la carne arriba descrita o el
procedimiento que deseen, ellos comunicarían cuáles habían sido co-
locadas bajo la pirámide y cuáles no. El cotejo público entre tal
comunicación y el contenido del sobre permitirá valorar nítidamente
la hipótesis y prosperar en la configuración del juicio que nos merez-
ca. Una formulación rigurosa de este posible experimento, que se puede
llevar adelante sin la participación de terceros que sirvan como garan-
tes de la integridad del proceso y que incluye una detallada exposición
del método estadístico para valorar el resultado, puede encontrarse en
Silva (2008a).
Reglas básicas luego de la excursión piramidal
Para concluir, me permito reproducir (Tabla 2.1) una enumeración

básica de aquellas reglas universalmente admitidas —y, de hecho, exi-
gidas— para el desarrollo del debate científico en los enclaves
académicos de avanzada.
Sin pretensión de exhaustividad, en un artículo reciente (Silva,
2008b) intenté hacer una contribución al enunciado sistematizado de
las reglas que han de pautar el debate científico. Como hemos visto en
las secciones precedentes, éstas no provienen de un mandamiento
arbitrario ni de una posición personal, sino de aquello que la experien-
cia histórica aconseja, tras muchos siglos de esfuerzos de los científicos
por avanzar en la comprensión de la realidad objetiva y de las leyes
que la gobiernan y, como un corolario natural, de su afán por enten-

derse mutuamente.
Son pocas y simples. Algunas, demasiado obvias, tales como las
relativas al empleo de amenazas, imposiciones inquisitoriales u otras
modalidades de amedrentamiento igualmente repugnantes, que no han
sido ajenas a ciertos pasajes de la historia de la ciencia, no han sido
incluidas.
Tabla 2.1. Pautas básicas para el desarrollo adecuado del debate científico.
1. La verdad ha de ser un valor sagrado del que nadie puede

jamás apartarse deliberadamente, ni por conducto de menti-
ras, ni de omisiones selectivas, ni de subterfugios o sofismas.
2. Todo sentimiento personal de ser poseedor absoluto de la
verdad ha de abandonarse.
3. Los adjetivos y juicios sobre las personas deben ser erradicados.
4. El lenguaje empleado ha de ser simple, inteligible e inequívoco.
5. Una objeción concreta no puede ser pasada por alto como si
no se hubiera realizado, ni encararse de manera esquiva, usan-
do recursos oblicuos o elusivos.
6. La información externa a que se apele durante la discusión
debe ser correcta, completa, precisa y accesible.
7. El renombre de un científico no ha de invocarse como algo que
agrega solidez por sí mismo al punto de vista que se defiende.
8. Los razonamientos teóricos y las evidencias estadísticas no
han de suplirse con anécdotas ni esgrimir estas últimas como
argumentos de peso contra los primeros.
MENSAJE FINAL A LOS DOGMÁTICOS CONTEMPORÁNEOS

Francis Bacon afirmaba que «La verdad emerge más fácilmente del
error que de la confusión». Vale decir: en el marco de la ciencia, errar
Figura 2.10. Persuadiendo a Galileo
es una contingencia natural; lo que no cabe admitir es la falta de rigor.

Con mucha frecuencia surgen opiniones encontradas, ideas o re-
portes novedosos que son contradictorios en una u otra medida con
puntos de vista prevalecientes. Llegar a un criterio universalmente
aceptado puede tomar tiempo. Nuestro deber es resolver esas contra-
dicciones con la mayor celeridad posible, y lo más importante es
aprender que la ruta crítica para ello exige, además de una metodolo-
gía adecuada, la observación de principios tales como empleo de un
lenguaje transparente, el respeto por el hilo lógico de la discusión,
pulcritud en las citas y afán de inteligibilidad.
Es natural que toda controversia desate pasiones. Pero, a diferencia
de ciertas discusiones políticas o sentimentales, el científico tiene casi
siempre la posibilidad de reflexionar pausadamente sus posicionamien-
tos. Dispone por tanto de oportunidad sobrada para domesticar impulsos
que le alejen conscientemente de la verdad o le induzcan a permitir que
la pasión interfiera con la razón. Cuando alguno de estos males compa-
rece de modo deliberado, entonces estaremos por lo general ante un
simple impostor, de alguien que actúa de manera directamente delicti-
va. Pero en ocasiones surge como resultado de una incapacidad quizás

innata para sacudirse el dogmatismo. Para estos últimos, comparto un
lúcido mensaje final que tomo prestado de Félix Ovejero, profesor de
Ética y Economía de la Universidad de Barcelona (Ovejero, 2006):
"El prejuicio, en realidad, no consiste en el juicio precipitado que co-

metemos todos, incluidos, por cierto, los estadísticos en buena parte
de sus razonamientos cotidianos. El prejuicio aparece en un segundo
momento: en la falta de disposición a dudar, en la resistencia a recti-
ficar. La persona razonable, cuando se le muestra su error, corrige su
opinión. Al cabo lo que nos interesa no es mantener nuestras opinio-
nes, sino mantener opiniones correctas, lo que conlleva la disposición
a someter nuestras ideas al escrutinio de los buenos argumentos y a
cambiarlas a su luz. La mirada prejuiciada se detecta en la transición
entre opiniones. El caso más común es el de quien no transita, de
quien no parece dispuesto a modificar un milímetro sus ideas. Ante
nuevos datos, sólo registra los que refuerzan sus convicciones. Sus
opiniones no son el resultado final de ponderar la información, sino la
criba para seleccionarla o valorarla. No ve más que lo que quiere ver.
Sólo le interesa el punto de llegada, la compatibilidad con su prejui-
cio… Pensar requiere, antes que otra cosa, punto de vista, capacidad
para cribar, para atender las razones. Sin plataforma desde donde
mirar no cabe siquiera la idea de problema por resolver, idea que
necesita un marco de preguntas y categorías. Sólo entonces se respe-
tan las ideas, sólo entonces se pueden discutir, sólo entonces se está
en condiciones de «destruir una idea sin rozar la piel de su autor»,
como reclamaba Bernard Shaw. Nuestros dogmáticos, día a día, pe-
leando consigo mismos, acaban desollados. Eso sí, sin rozar una idea."
BIBLIOGRAFÍA
Adamenko AA, Levchook YN. On the new direction in biophysics. Po-

nencia presentada en el Syposium Theoretical Physics and Biology, Kiev.
1999. Resúmenes accesibles en: www.gluk.org/biophys/TPB-99/ en
agosto de 2007.
Alemany E. ¿Creer en cuatro varillas? Periódico El guerrillero del 17
de julio de 2004. Accesible en: http://www.guerrillero.co.cu/pi-
nardelrio/2004/julio/creer.htm en agosto de 2007.
Althusser L. Ecrits sur la Psychanalyse: Freud et Lacan. Paris: Stock/IMEC.
1993.
Álvarez J et al. Ausencia de "efecto piramidal" sobre cardiomiocitos
aislados de rata. Revista Cubana de Investigaciones Biomédicas 2007;
26:3. (accesible en: www.fisica.uh.cu/rationalis/piramidal/cardio-
citos/cardiocitos.pdf en junio de 2008).
Ameneiro J. La energía piramidal: un alivio para varias tribulaciones Revista Futu-
ros 2003; Vol 1, Nº3. Accesible en: http://www.revistafuturos.info/
futuros_3/energia_pir_2.htm en agosto de 2007.
Atiénzar E. Los «misterios» de la pirámide. Periódico Granma del 14
de febrero, 2001. La Habana.
Baudrillard J. La Guerre du Golfe n’a pas eu lieu. Paris: Galilée.1991.
Collins HM. Stages in the empirical programme of relativism. Social
Studies Science 1981;11: 3-10.
Comité Internacional de Directores de Revistas Médicas. Requisitos
uniformes para la preparación de manuscritos. Revista Panamericana
de Salud Pública 2004; 15:541-570.
De Melo O. Energías vitales y piramidales. El espejismo de las seudo-
ciencias. Semanario Orbe. 2003; Año V, No. 26.
Desdín LF. La energía piramidal y el esqueleto del unicornio. Suplemento
científico-técnico del periódico Juventud Rebelde. 2005. Accesible
en: http://www.jrebelde.cubaweb.cu/secciones/en-red/mayo-
2004/laenergia-9.htm en agosto de 2007
Di Trochio F. Las mentiras de la ciencia. Madrid: Alianza. 1995.
Díaz H. Alan Sokal y las preciosas ridículas. 1998. Accesible en: http:/
/www.org.ar/po/po590/alan.htm en agosto de 2007.
Fernández L. Más allá del enigma faraónico. Periódico El Habanero
del 1 de octubre 2001, La Habana. Accesible en http://
www.elhabanero.cubaweb.cu/2001/octubre/nro210_01oct/
cienc_1oct042.html, en agosto de 2007.
Fischer CS et al. Inequality by design: cracking the bell curve myth. Prince-
ton: Princeton University Press. 1996.
Follari S, Alan S. La insuficiencia de pruebas. Cinta de Moebio 2000;
8:142-162.
Fraser S. The bell curve wars: race, intelligence and the future of America.
New York: Basic Books. 1995.
González A. Falsas energías, pseudociencia y medios de comunica-
ción masiva. Revista Cubana de Física 2002; 19:68-73.
Gould SJ. Curveball. Revista The New Yorker del 28 de noviembre. 1994.
Gross P, Levitt N. Higher superstition. The academic left and its quarrels with
science. Baltimore: The John Hopkins University Press. 1998.
Gross P, Levitt N, Lewis M. The flight from science and reason. Baltimore:
The John Hopkins University Press. 1996.
Hart C. Analfabetismo científico en la nueva era imperial. 2002.Acce-
sible en: http://www.nodo50.org/haydeesantamaria/docs_ajenos/
celia_hart2.htm# en agosto de 2007.
Hernández PL, Perera A, Ulloa A. Una valoración experimental de la
energía piramidal. Implicaciones para la práctica médica. Revista de
Medicina General Integral 2007; 23 (accesible en: http://scielo.sld.cu/
scielo.php?script=sci_ar ttext&pid=S0864-
21252007000400004&lng =es&nrm=iso en junio de 2008).
Herrnstein RJ, Murray C. The bell curve: Intelligence and class structure in
American life. Nueva York: The Free Press. 1994.
Hobsbawn E. The new threat to history. New York: Review of Books.
1993.
Ingenieros J. Las fuerzas morales. Buenos Aires: Editorial Prometeo.
2003.
Irigaray L. Sujet de la science, sujet sexué? En: Sens et place des connais-
sances dans la société. Paris: CNRS. 1987.
Koertge N. A house built on sand. Exposing postmodernist myths about scien-
ce. Oxford: Oxford University Press. 1998.
Lacan J. Of structure as an in mixing of an otherness prerequisite to
any subject whatever. En: The languages of criticism and the Sciences of
Man. Baltimore: Johns Hopkins University Press. 1970.
Lacan J. Postion de l’inconscient. Ecrits 1971; 2. Paris: Seuil.
Latour B, Woolgar S. Laboratory life: The social construction of scientific
facts. London: Sage. 1979.
Laudan L. Science and relativism: Dialogues on the philosophy of science.
Chicago: University of Chicago Press. 1990.
Lévi-Strauss C. Structural anthropology (reimpreso de la edición d 1958,
por Allen Lane, New York: The Penguin Press. 1968.
Midence C. Ocaso de la posmodernidad/posmodernismo. Periódico
El Nuevo Diario del 4 de diciembre, 2000. Managua.
Muntaner C, Nieto FJ, O'Campo P. The bell curve: On race, social
class, and epidemiologic research. American Journal of Epidemiology
1996; 144:531-536.
Orbera L. Evidencias de la energía piramidal. Revista Cubana de Medi-
cina General Integral 2003; 19: 208-209.
Orbera L, Sosa U. La energía piramidal y su presencia en la medicina
cubana. Revista Cubana de Medicina General Integral 2003; 19: 111-113.
Ovejero F. El dogmatismo de la flexibilidad. Periódico El País del
lunes 30 de enero, 2006. Madrid.
Park RL. Ciencia o vudú. De la ingenuidad al fraude científico. Barcelona:
Grijalbo Mondadori. 2001.
Popper KR. In search of a better world: Lectures and essays from thirty years.
London: Routledge. 1992.
Popper KR. Objective knowledge: An evolutionary approach. Oxford: Cla-
rendon Press. 1972.
Pradas T. Energía piramidal. Los faraones de Cárdenas. Revista Bohe-
mia 1998; 90:24-27.
Rebullido PD, Silva LC, Benet M. Valoración experimental del efecto

de la energía piramidal sobre el agua. Medisur 2006; 4:44-47.
Robbins B. Social text and reality. These Times 1996; 20:28-29.
Rodríguez B. Sobre los Big Bangs y el principio y el final de los tiem-
pos del Universo. Revista de la Real Academia de Ciencias Exactas,
Físicas y Naturales 2003; 97:147-160.
Said E. La «broma» de Alan Sokal y el Psicoanálisis lacaniano. 2005.
Accesible en: http://www.psyche-navegante.com/numero1-2/
deotrasescuadras.htm en agosto de 2007.
Salsburg D. The lady tasting tea: How statistics revolutionized science in the
twentieth century. New York: W.H. Freeman & Co. 2002.
Serroni R. Encuentros con Mario Bunge. Buenos Aires: Ediciones Adip. 1989.
Shermer M. Why people believe weird things New York: W. H. Freeman.
1997.
Silva LC. Cultura estadística e investigación cientifica en el campo de la salud:
una mirada crítica. Madrid: Díaz de Santos. 1997a.
Silva LC. Ciencia y pseudociencia: una distinción crucial. Revista Cu-
bana de Investigaciones Biomédicas 1997b; 16:78-82.
Silva LC. Apuntes sobre la búsqueda de una epistemología sin impos-
turas. Revista Cubana de Salud Pública 2004; 30:233-240.
Silva LC. Las pautas para el debate científico: reflexiones a raíz de
una controversia sobre la energía piramidal. Revista Cubana de Salud
Pública 2006; 32:32-47.
Silva LC. Sobre la existencia del llamado "efecto piramidal". Revista
Cubana de Física 2008a; 25:28-33.
Silva LC. Claves para el desarrollo del debate científico. Revista Cuba-
na de Física 2008b; 25:9-12.
Sokal A. Transgressing the boundaries: Toward a transformative her-
meneutics of quantum gravity. Social Text 1996a; 46/47:217-252.
Sokal A. A physicist experiments with cultural studies. Lingua Franca
1996b; 62-64.
Sokal A. Transgressing the boundaries: An afterword. Dissent 1996c;
43:93-99.
Sokal A, Brickmont J. Impostures intellectuelles. París: Odile Jacob. 1997.

Sosa U. Energía piramidal terapéutica: ¿Mito o realidad? 2004. Acce-
sible en: http://www.bvs.sld.cu/libros/energia_piramidal/
indice_p.htm en agosto de 2007.
Sosa U, Castro A, Salles G. Terapéutica piramidal en Ortopedia, ¿mito o
realidad? Revista Cubana de Ortopedia y Traumatología 1999; 13:83-89.
Sosa U. Artículo de respuesta a los nihilistas que desconocen los efectos de las
pirámides. 2005. Accesible en: http://www.piramicasa.com/ en
agosto de 2007.
Taubes G. Bad science: The short life and weird times of cold fusion. New
York: Random House. 1993.
Vessuri H. La revista científica periférica. El caso de Interciencia.
Acta Científica Venezolana 1987; 12:124-134.
163
3
El camino hacia
el nuevo conocimiento
Quien procura hallar métodos sin tener en
mente un problema bien definido estará
haciendo una búsqueda vana.
DAVID HILBERT
iscutidos el marco social y epistemológico en que ha de des-

D empeñarse la investigación científica en general y biomédica
en particular, me parece oportuno hacer algunas observaciones sobre
ciertas zonas de la metodología que distan de ser ajenas a mitos e
incomprensiones.
Se ha dicho —y ello encierra más verdad de lo que parece— que el
planteamiento adecuado de un problema supone haber hallado la mi-
tad de su solución. Lo que no ofrece dudas es que formularlo
erróneamente garantiza la aparición de dificultades en el proceso sub-
siguiente. De ahí la atención privilegiada que debe conferirse a esa
tarea en cualquier esfera, muy especialmente en el marco de la inves-
tigación científica.
Los procedimientos para resolver dicho problema, como es obvio,
son muy numerosos y dependientes de cada disciplina, de cada pre-
gunta planteada, de la creatividad o ingenio del investigador, pero
también de los recursos disponibles. No obstante esta versatilidad, se
harán reflexiones muy generales al final del presente capítulo, y aque-
llos aspectos más específicos que merecen un juicio crítico serán
especialmente tratados en los últimos dos capítulos del libro.
163
EL PROBLEMA DE INVESTIGACIÓN
El entomólogo norteamericano Edward Wilson, profesor honora-
rio de la Universidad de Harvard, definía la ciencia como la empresa
sistematizada de reunir conocimientos sobre el mundo, así como de
organizarlos y sintetizarlos en leyes y teorías comprobables (Wilson,
1988). Si admitimos esta elegante y sencilla definición, entonces po-
dremos decir que la investigación científica, única forma racional de
obtener nuevos conocimientos, es la fuente nutricia de la ciencia.
El planteamiento de un problema de investigación supone necesa-
riamente, bien la formulación de preguntas claramente configuradas
sobre un dominio concreto, bien, si el alcance del problema y la ma-
durez del autor lo consienten, la formulación de hipótesis que
demanden del método científico para su evaluación rigurosa.
El método general de que se valen los profesionales de la ciencia
para plantearse problemas interesantes no siempre resulta de una com-
pleja elaboración intelectual para la que debe estarse particularmente
dotado; con frecuencia sólo demanda de cierta disposición crítica para
idear preguntas y adecuada cultura científica básica en la disciplina
del investigador.
En principio, tal formulación del problema entraña tres elementos
insoslayables:
• exponer tanto el marco teórico en que se inscribe el problema

como los antecedentes en que reposa;
• comunicarlo nítidamente mediante preguntas o hipótesis;
• fundamentar la necesidad de encararlo y esbozar los beneficios
que dimanarían de su solución.
Lo que se expone a continuación se inspira en un artículo publica-

do hace varios lustros (Silva, 1991), retomado recientemente con
algunas variaciones (Silva, 2004). Se trata de enunciar, comentar e
ilustrar las deficiencias básicas que con más frecuencia obstaculizan o
EL CAMINO HACIA EL NUEVO CONOCIMIENTO 165
malogran el proceso de completar estos tres momentos complemen-

tarios de la formulación del problema de investigación.
El primer problema estriba en que muchas veces no se informa
detalladamente el origen del problema y se omite un fundamento teó-
rico bibliográficamente respaldado.
Reproducir un estudio puede ser, desde luego, legítimo, particular-
mente si lo que se procura es adicionar evidencias en torno a una
hipótesis todavía dudosa o, simplemente, someterla a un proceso adi-
cional de constatación empírica para contribuir a su evaluación. Pero
en este caso, quizás más que en ningún otro, procede ser especialmen-
te escrupuloso en la acreditación y análisis de esfuerzos precedentes.
Toda «novedad» lo es porque existe un marco referencial antiguo,
viejo, que le confiere ese carácter. No puede producirse, por tanto, lo
nuevo, sino sobre el reconocimiento de los antecedentes sobre los
que se erige. La creatividad es la antítesis del quietismo o la reproduc-
ción inercial de lo existente; pero lo nuevo nunca nace de la nada,
emerge del propio modelo llamado a ser refutado o recreado. Rara-
mente las rupturas maximalistas y estridentes producen valores
perdurables. Lo verdaderamente creativo irrumpe como una sutil re-
composición del pasado a través del afán de renovación.
Cada nuevo conocimiento es una conquista para todos. Este «avan-
ce colectivo» demanda estudio y reflexión, supone búsquedas, exige
sobre todo una posición profundamente crítica ante lo que ya se ha
alcanzado. Cuando se prescinde de lo que ya se ha conseguido en un
dominio dado, se está abriendo la puerta de la pseudociencia, tema
del próximo capítulo.
Es verosímil pensar que aquél que no exhiba una conducta ética-
mente rigurosa en la fase inicial del trabajo desemboque en la búsqueda
a toda costa de aval estadístico para sus deseos. Usará entonces la
táctica a que se refería Kitiagorodski (1970) cuando escribía: «El esti-
lo habitual de trabajo de un fanático que desea demostrar su razón
recurriendo a la estadística, consiste en que él omite los datos que
son, a su modo de ver, desafortunados y, en cambio, tendrá en cuenta
los acertados». Puede incluso ocurrir que el propio investigador llegue

a creer en la veracidad de lo que ha engendrado. Se atribuye a una
figura tan remota como Julio Cesar haber dicho que los hombres creen
gustosamente aquello que se acomoda a sus deseos.
LAS PREGUNTAS Y LOS OBJETIVOS

Antes de realizar algunas puntualizaciones relacionadas con la for-
mulación de las preguntas, considero útil detenerme en la relación
conceptual que guardan preguntas y objetivos. Estos últimos consti-
tuyen una herramienta relativamente reciente. Se impusieron más como
una modalidad en la estructuración de los proyectos que como una
necesidad per se. Las preguntas, en cambio, son consustanciales al pro-
ceso investigativo. En el fondo, investigar es en esencia responder
preguntas. Toda pregunta se puede poner en forma de objetivo, pero
no viceversa.
Por ejemplo, la pregunta de investigación ¿Cuáles son las causas funda-
mentales que conducen a un intento suicida en los adolescentes de nuestra comunidad?
se puede convertir si se quiere en un objetivo con sólo quitar los signos
de interrogación y emplear un verbo en infinitivo adecuado. Así, podre-
mos construir el objetivo: Identificar las causas fundamentales que conducen a
un intento suicida en los adolescentes de nuestra comunidad.
Lo contrario, desde luego, no es cierto. Todo programa de salud,
por poner un ejemplo, ha de tener objetivos (reducir la mortalidad
infantil, o incrementar el conocimiento de los adolescentes sobre las
enfermedades de transmisión sexual, o disminuir las tasas de suicidio,
etc.). Es obvio, sin embargo, que no hay manera de poner estas for-
mulaciones en forma de pregunta.
Puesto que con no poca frecuencia los proyectos de investigación
confunden una cosa con otra, doy una sugerencia a los investigadores
noveles (muchas veces alumnos que realizan sus tesis de maestría o
doctorado): si el objetivo que usted ha construido no se puede trans-
formar en una pregunta, entonces algo anda mal: replantéese el pro-

blema, pues éste no puede ser un objetivo de investigación.
Los ejemplos mencionados son típicos del campo de la investiga-
ción de corte médico-social, epidemiológica, antropológica o de la
salud pública. Es a éste tipos de estudios a los que me referiré funda-
mentalmente en adelante.
Un periplo tortuoso
Ocasionalmente las preguntas no son explícitas, quedan subsumi-

das dentro de un borroso planteamiento general.
Supongamos que un investigador plantea su problema en términos
como los siguientes: Estudiar el desempeño de la enfermera hospitalaria. No
hay un problema planteado; solamente se ha mencionado un dominio
de interés. No comprender la diferencia entre un verdadero problema
de investigación y el mero hecho de consignar el área en que éste se
ubica, garantiza el desconcierto futuro. El curso natural de un proceso
de investigación con tal punto de partida suele ser el siguiente:
(a) Redacción de un cuestionario en que de manera más bien

caótica se articula una serie de preguntas relacionadas con
ese dominio, pero cuya función real es difusa. Debe recordarse
que no hay nada que sea «importante» en abstracto, de modo que
decir que cierta pregunta se incluye en un cuestionario «porque es
importante» es más o menos lo mismo que decir que se incluye por-
que se incluye. El único recurso que puede ayudar a decidir si una
pregunta debe estar incluida o no en un cuestionario es la valoración
sobre si la investigación abarca o no un interrogante que exija del
conocimiento que dicha pregunta específica procura producir.
(b) Acopio de un gran monto de información que a la pos-

tre será en gran parte desechada. Innumerables veces he
visto cómo se ha configurado un largo cuestionario con varia-

bles llamadas a ser medidas en las unidades de análisis o con
preguntas que se formulan a los pacientes o ciudadanos de la
muestra, las cuales luego no son empleadas en el análisis. El
cuestionario se construye muchas veces incluyendo preguntas
por si acaso, sin que se sepa claramente de antemano qué se hará
con las respuestas de cada una de ellas. Por lo general esa reali-
dad dimana de una especie de pereza intelectual, dejando «para
después» aquello que tendría que ser la primera tarea del inves-
tigador. El pensamiento sistémico y racional obliga a conducirse
en la etapa de planificación exactamente al revés que en la fase
práctica: primero determino las salidas que deseo obtener, y sólo
entonces defino las entradas que, debidamente procesadas, con-
ducirán a los resultados que se quieren.
(c) Convocatoria a un bioestadístico que explique al inves-

tigador qué ha de hacer con sus datos. Es típico que se pregunte
al estadístico o metodólogo qué tablas se deben construir con
los datos obtenidos. Lo peor es que ésta es la persona menos
indicada para desfacer el entuerto, ya que el hecho de que haya
trabajo de terreno, bases de datos y demás no resuelve el escollo
cardinal: la formulación de verdaderas preguntas rectoras sigue
siendo un capítulo pendiente. Las tablas u otras medidas de re-
sumen serán sólo un intermediario expositivo de las respuestas
que se hallen, pero éstas a su vez sólo pueden ser determinadas
por el investigador. Los estadísticos pueden colaborar metodo-
lógicamente en el alumbramiento de los nuevos conocimientos,
pero suele empleárseles como si fueran torturadores de los da-
tos para que ellos confiesen algo inesperado.
El origen de los planteamientos vagos es diverso: en primer lugar

puede ser una forma de deshonestidad (consigo mismo o con los de-
más); desde el punto de vista ético, ésta sería la peor variante. Pero
desde la perspectiva metodológica hay una más grave: el investigador

ni siquiera ha tomado conciencia de que no está formulando un ver-
dadero problema. Tal desorientación suele conducir a ciertas formas
de «monumentalismo»: en lugar de procurar dirimir algo bien concre-
to, puntual, concentrado, por ejemplo, en una sola variable clave cuya
influencia sobre determinado proceso o realidad se quiere esclarecer,
se suele desembocar en una tediosa acumulación de tablas a las que
no se sabrá exactamente qué partido sacar.
¿Qué aporta realmente este estudio?
Otra demanda que suele pasarse por alto es la de no establecer con

nitidez el aporte real, la necesidad que se cubre. La comunicación de
los beneficios que cabe esperar una vez que las preguntas planteadas
se hayan respondido es parte de la formulación del problema. No es
raro que no se aluda a ello, o que se haga de manera vaga, insuficiente
o directamente errónea.
Supongamos que, al indagar sobre el tema de trabajo investigativo
elegido en un hospital materno, se nos comunica que el problema que
se aborda es «determinar los factores de riesgo de la hipoxia del recién
nacido con el fin de tomar medidas a partir de sus resultados con
vistas a reducir la aparición de este fenómeno entre los niños que allí
nacen».
Tal afirmación es, sin duda alguna, falsa. Es absurdo suponer que
será esa investigación la que va a determinar dichos factores de riesgo,
que esos investigadores son los llamados a dejar zanjado el asunto. La
investigación científica, como instrumento para el conocimiento del
mundo, de la naturaleza o la sociedad (y en particular, de las leyes que
rigen sus procesos) es un recurso colectivo y universal: nadie hace la
ciencia aisladamente. Si se quieren adoptar medidas orientadas a dis-
minuir la aparición de hipoxia, el camino no es la investigación, sino
el estudio de todo lo que ya es ciencia constituida sobre el tema para
confeccionar un programa de intervención. Sólo excepcionalmente

un investigador consigue a la vez nuevos conocimientos y nuevas tec-
nologías a partir de ellos. La idea de que con una investigación
específica se pueden obtener conclusiones definitivas está arraigada
en alguna medida, pero no es más que un pernicioso mito (véase apa-
tado Carácter descontextualizadodel análisis, p. 389).
Pero para ver con más claridad cuán absurda resulta la promesa de
que «al terminar esta investigación podremos tomar las medidas opor-
tunas…», volvamos al ejemplo del hospital. Un resultado de ese estudio
pudiera ser (no es probable, pero sí posible) que el hábito de fumar en la
embarazada se asocie con una disminución de la probabilidad de apari-
ción de la hipoxia. Más concretamente, supongamos que se trataba de
un gran estudio de cohorte que abarcó a 1.911 mujeres, de las cuales
492 fumaron durante el embarazo mientras que 1.419 se abstuvieron
de hacerlo, y que se obtuvieron los resultados de la Tabla 3.1.
Tabla 3.1. Resultados del estudio de cohorte para valorar el efecto del hábito de
fumar de la embarazada sobre la aparición de hipoxia en el recién nacido.
Resultado
Total
Tratamiento Hipoxia No hipoxia
No fumaron 84 1.335 1.419
Fumaron 57 435 492
Total 141 1.770 1.911
La tasa de incidencia entre no fumadoras fue de 11,6% y de solo

5.9% entre las fumadoras. Esto significa que el riesgo relativo de ser
fumadora es claramente menor que la unidad (RR= 0,51 con un inter-
valo de confianza al 95% igual a 0,37 – 0,71) o, dicho de otro modo,
que es dos veces más probable padecer el problema si la madre no
fuma que si lo hace. Si los autores se inclinaron por realizar una prue-
ba de significación, obtendrían que las tasas de incidencia exhiben
una diferencia estadísticamente significativa.
Verosímilmente, el resultado será inesperado para los investiga-

dores. ¿A qué puede deberse? Aparte de posibles errores de registro,
la existencia de un sesgo o de algún otro defecto metodológico que
supondremos inexistente, las explicaciones pueden ser varias, aun-
que ahora no interesan mucho (desde que se ha registrado un efecto
de la casualidad operando sobre la cohorte elegida, hasta que real-
mente el hábito de fumar previene la hipoxia). Lo cierto es que el
resultado pudiera verificarse, incluso a despecho de que se haya se-
guido una metodología correcta. ¿Procederá ese hospital, acaso, a
orientar a sus embarazadas que comiencen a fumar en lo sucesivo?
Obviamente, no. En ese hospital, como en cualquier otro, habrán de
regirse por el conocimiento ya consolidado a nivel mundial en rela-
ción con ese tema.
Esto no quiere decir que sea necesariamente improcedente realizar
la investigación, ni mucho menos. Lo que se procura enfatizar es que,
razonablemente, con ella se hará en el mejor de los casos una modesta
aportación al conocimiento general del problema. Lateralmente, sin
embargo, es probable que el estudio deje otros dividendos: más versa-
ción sobre el tema de investigación entre los participantes, más cultura
ginecobstétrica y, consecuentemente, una gestión asistencial más efi-
ciente y una docencia más eficaz.
Por otra parte, cuando el propio investigador no tiene claro, com-
pletamente claro, lo que se propone, es muy frecuente que incurra en
una formulación ambigua o confusa. Se acude entonces a palabras o
giros que evocan una tarea o un propósito, pero que no lo determinan
fuera de toda duda.
De hecho, debe tenerse en cuenta que las preguntas que se formula
el investigador siempre han de ser sustantivas, concernientes al área
de investigación (salud pública, enfermería, pediatría, etc.), nunca son
estadísticas. Cuando se sacan conclusiones tales como que «se encon-
tró asociación entre X y Y», suele no repararse en que la asociación en
abstracto nunca tiene interés per se. Para profundizar sobre la afirma-
ción que se acaba de hacer, se sugiere al lector acudir al trabajo de
Silva y Benavides (1999), enteramente dedicado al tema y susceptible

de ser obtenido en la dirección http://lcsilva.sbhac.net.
El error más frecuente
Un error muy frecuente en el planteamiento de un problema de

investigación consiste en permitir que el enunciado del problema in-
cluya parte del método para resolverlo. Esta extendida deficiencia es
la que quizás con más claridad revela la falta de elaboración del pro-
blema. A la vez resulta curioso que virtualmente nadie alerte
explícitamente sobre ella.
Quienes incurren en tal error, parecen no reparar en que el método
es posterior al problema. Planteado un problema científico, las vías
para resolverlo pueden ser diversas. Diferentes enfoques y recursos
pueden usarse, y unos serán más fecundos o ingeniosos que otros;
puede ocurrir incluso que algunos sean totalmente inaceptables (por
razones prácticas, financieras, éticas, o aun científicas), pero el pro-
blema que ha de encararse sigue siendo exactamente el mismo. Esto
subraya la veracidad de que la formulación de un problema bien plan-
teado debe prescindir de toda alusión al método que habrá de usarse
para enfrentarlo.
Consideramos los siguientes ejemplos tomados de la literatura re-

ciente:
1) «Valorar la prevalencia de tabaquismo en una muestra repre-

sentativa de trabajadores del hospital» (Arévalo y Baquedano,
1997).
Es improcedente consignar en el propio enunciado a través de qué

procedimiento se hará la valoración deseada: el muestreo es una téc-
nica de trabajo, una forma que se implementa en función del objetivo
trazado y, en esa medida, no es parte de él. Por otra parte, la muestra

como tal nunca interesa en sí misma; sólo actúa como intermediario
metodológico para conocer una realidad más general. En este caso lo
que se quiere es estimar es la prevalencia en la población conformada
por todos los trabajadores del hospital.
2) «Comparar la eficacia de dos esquemas de tratamiento —de

cuatro meses y de seis meses de duración—, comparar las
tasas de abandono, fracaso y defunción y comparar las recaí-
das a los 6, 12 y 18 meses después del tratamiento» (Olvera
et al., 2002).
Comparar es una acción claramente metodológica. Nunca el acto

de comparar puede constituir una finalidad en sí misma. Quizás lo
que se quiere en este caso sea valorar si un esquema de tratamiento es
mejor que otro, y no realizar el acto de comparación como tal. En el
enunciado se está mezclando esa verdadera finalidad con las vías por
conducto de las cuales habrá de consumarse la evaluación. La distin-
ción entre comparar y evaluar puede parecer quisquillosa, pues
raramente se podrá hacer lo segundo sin lo primero; pero conceptual-
mente son acciones diferentes: una se orienta a satisfacer una
necesidad, la otra señala cómo se actuará para satisfacerla. Ocasio-
nalmente las evaluaciones, por otra parte, se realizan sin transitar por
comparación alguna, como ocurre cuando se consiguen a través de
consultas a expertos o cuando se apela a otros procedimientos de la
llamada «metodología cualitativa».
3) «Correlacionar la concentración de glucosa en la sangre de

niños recién nacidos antes y una hora después de ingerir ca-
lostro» (Bustos R et al., 2005).
En primer lugar, los investigadores no pueden ser quienes «corre-

lacionen» una cosa con otra; en el mejor de los casos pondrán en
evidencia una correlación que existe o, más simplemente, evaluarán

el grado en que realmente se produce. Por otra parte, el acto en sí de
hallar una correlación es en general algo sin trascendencia científi-
ca; ésta se supedita a que el hallazgo o la corroboración se inserte
coherentemente en un marco teórico previo y, sobre todo, a que
todo apunte, bien a demostrar una hipótesis de causalidad, bien a
generarla. Tal demostración o intención de conformar una conjetura
causal quizás configura en este caso el verdadero propósito, y el
acto de usar técnicas de correlación, sería sólo uno de los elementos
necesarios para alcanzarlo.
4) «Realizar una encuesta de opinión sobre osteoporosis en in-

ternistas españoles» (Sosa et al., 2005).
Este es un caso extremo: el acto metodológico (realizar la encues-

ta) se ha convertido completamente en una finalidad. Si tal encuesta
quiere realizarse, seguramente es con el fin de acopiar información
que consienta dar respuesta a alguna pregunta sustancial sobre osteo-
porosis o sobre los criterios que se tienen al respecto. Naturalmente,
el problema consiste precisamente en obtener ese conocimiento.
Cuando se confunden resultados y conclusiones
Muchas veces la concepción del problema carece de un enfoque

crítico. Este carácter crítico ha de estar presente desde la concepción
misma de la investigación científica en lugar de aparecer a la altura de la
discusión de los resultados, como a juzgar por el estilo de algunos artí-
culos científicos muchos parecen creer. En rigor, la propia investigación
científica debe nacer precisamente de una apreciación crítica de lo que
existe, de lo que se cree, de lo que se usa o de lo que se da por cierto.
El planteamiento «neutro» de un problema tal como, por ejemplo,
«Caracterizar clínica y anatomopatológicamente al paciente oncológi-
co ingresado Hospital Provincial», tiene por lo general un carácter

meramente contemplativo, por lo cual está virtualmente condenado a
no trascender. Ni siquiera en la fase de discusión de los resultados
habrá margen para una verdadera discusión. El recurso de consignar
que estos resultados coinciden con los de tal autor pero se distinguen
de los de tal otro y, en el mejor de los casos, balbucear una posible
explicación para que no sean iguales, no pasará de ser un remedo de
discusión, al que el investigador estará virtualmente condenado debi-
do a la ausencia de incisividad crítica en la formulación de su problema.
Nótese que esto no tiene nada que ver con el tipo de investigación
que se realiza. Es falsa la idea de que una investigación descriptiva
equivale a una indagación contemplativa de la realidad. Una genuina
investigación descriptiva no consiste en «mirar» la realidad, sino que
ha de pretender siempre enjuiciarla. Para ello hay que «mirar», pero no
basta. Por otra parte, la elaboración de juicios exige de algún paradig-
ma o marco referencial.
Por ejemplo, si el investigador se plantea «Caracterizar clínica y
anatomopatológicamente al paciente oncológico» ingresado en deter-
minado hospital, probablemente terminará construyendo un aburrido
amasijo de tablas donde se consignarán datos tales como que el 73%
de los pacientes eran mayores de 60 años o que al 32% de ellos se les
aplicó quimioterapia, algo que hará difícil distinguir el estudio de un
informe administrativo. De hecho, en un estudio así no se puede si-
quiera obtener conclusiones, ya que los resultados mencionados son
eso, resultados, y no dan ni pueden dar el salto cualitativo que exigi-
rían unas verdaderas conclusiones.
En cambio, si el estudio se planteara, por ejemplo, valorar el grado en
que el hospital sigue las pautas clínicas establecidas por cierta autoridad
reconocida (la American Society of Clinical Oncology, pongamos por
caso), estaríamos en un escenario muy diferente. Un resultado pudiera
ser que el 21% de las mujeres con cáncer de mama no son tratadas
adecuadamente. Obsérvese que para usar este adverbio se necesita
un referente tal como las pautas mencionadas. Este resultado, ahora
sí, puede traducirse en algún juicio, quizás que la situación es muy

alarmante, o que es aceptable, normal, o estimulante, según sea el
caso de acuerdo a los antecedentes en el propio servicio, o al desem-
peño conseguido en otro sitio, o al punto de vista teórico o ético de
los investigadores, o a todos esos elementos a la vez. El resultado
siempre lo podrá obtener un estadístico —por lo general auxiliado de
un ordenador— pero la conclusión es materia de un especialista, nun-
ca la podrá generar un programa informático, incapacitado por
definición de hacer un examen culto e integral del problema.
En general, la inferencia se produce, precisamente, cuando los
autores sacan una conclusión que trasciende al hecho empírico ha-
llado. A mi juicio, uno de los problemas más recurrentes que se
presenta en la comunicación científica contemporánea es justa-
mente esta confusión de dar como conclusión una declaración de
lo que se halló. Los usuarios de la literatura científica suelen no
comprender la diferencia entre un resultado y una conclusión; en-
tre consignar un hecho encontrado y una inferencia conformada a
partir de ese hecho.
Es harto frecuente hallar «conclusiones» como las siguientes:
• El 87% de los encuestados expresó adhesión a la medida adop-

tada por el gobierno.
• Nuestros datos arrojaron una diferencia significativa (p=0,0477)

entre la tasa de aparición de una malformación congénita para
las consumidoras de heroína durante el embarazo y la de las no
consumidoras.
• Sólo una de cada cuatro mujeres presentó reacciones adversas

en el grupo tratado con placebo, mientras que tales reacciones
se presentaron en la mitad de las mujeres que recibieron el fár-
maco.
• El tiempo medio de recuperación entre quienes tomaron el an-

tibiótico ascendió a 14,7 días, 5,4 menos que entre los que no lo
tomaron.
En todos estos casos, los investigadores, lejos de sacar conclusio-

nes, se reducen a comunicar resultados.
VALORACIÓN DE TECNOLOGÍAS MÉDICAS

EMERGENTES
Como se discutió detalladamente en el primer capítulo, la produc-

ción de nuevos conocimientos y la de productos tecnológicos son
actividades diferentes, pero guardan íntima relación: resulta suma-
mente difícil obtener tecnologías eficientes al margen de la ciencia; es
ella la que, salvo excepciones, nutre a los tecnólogos de los conoci-
mientos que permiten una producción exitosa.
Pero también es tarea de los investigadores, una de las más fre-
cuentes por cierto, la evaluación de esos productos, lo cual cierra el
ciclo simbiótico que vincula a ambas actividades. Cotidianamente, se
producen cientos de trabajos en el campo biosanitario destinados pre-
cisamente a la evaluación de las más diversas expresiones tecnológicas:
fármacos, esquemas terapéuticos, programas, servicios de atención,
equipos médicos, regulaciones de la salud pública, procedimientos
preventivos o medios diagnósticos.
¿Toda propuesta tecnológica merece ser evaluada?
En principio la respuesta a la pregunta que da título a esta sección

es afirmativa. Cabe, sin embargo, encarar un viejo dilema: si cierto
tratamiento no supone iatrogenias ni efectos secundarios negativos, y
además hay testimonios y resultados concretos favorables a su efecti-

vidad, ¿qué razones hay para cuestionarlos? ¿Por qué no aprovechar
dicho recurso terapéutico sin desgastarse en ensayos clínicos y otras
pruebas formales? En última instancia, nunca harían daño y produci-
rían, tal vez, beneficio a una parte de los usufructuarios potenciales.
Esta posición es científicamente inválida. Varias razones de naturale-
za diferente conducen a objetar la traslación de tan burdo pragmatismo
a la ciencia médica (Silva, 1997b).
En primer lugar tal estrategia puede implicar a la larga grandes
despilfarros en inversiones y subvenciones. Por ejemplo, British Medi-
cal Journal anunció (Wise, 1997) que las autoridades de salud de
Lambeth, Southwark y Lewisham en Gran Bretaña han decidido eli-
minar toda subvención para tratamientos homeopáticos. La medida
se produjo tras una revisión de las publicaciones de la literatura cien-
tífica en homeopatía y como parte del actual movimiento mundial
orientado a apoyar solamente la llamada medicina basada en la evidencia:
tal revisión no arrojó indicios convincentes del beneficio clínico de la
homeopatía. Esta conducta se adoptó hace muy poco, luego de dece-
nios de vigencia de un sistema de remisión y subvención (más de 500
pacientes al año) al Royal Homoeopathic Hospital de Londres.
En segundo lugar, una praxis médica de tal índole entraña un ries-
go indiscutible (Tellería, Sanz y Sabadell, 2005): no sería insólito que
un paciente, ante una enfermedad grave, preocupado o irritado al ver
que no mejora con el tratamiento indicado, lo abandone y acuda a un
terapeuta alternativo. Cuando más tarde, en ausencia de mejoría o
tras una recaída, vuelve a su médico habitual, el abandono del trata-
miento puede haber supuesto una pérdida de tiempo de trágicas
consecuencias.
Si, por el contrario, las cosas salen bien, el resultado no será inde-
seable para el paciente, pero sí quizás para la ciencia, en tanto sistema
orientado a entender los fenómenos. Para comprenderlo vale la pena
detenerse en el siguiente texto tomado del excelente libro El hombre
anumérico (Paulos, 1990).
"La medicina es un terreno fértil para las pretensiones pseudocientíficas

por una razón muy sencilla. La mayoría de las enfermedades, o bien mejoran
por sí solas, o bien remiten espontáneamente o, aun siendo mortales, rara vez
progresan estrictamente según una espiral ascendente. En todo caso, cual-
quier tipo de intervención, por inútil que sea, puede parecer sumamente eficaz.
Esto resulta más claro si uno se pone en el lugar de alguien que practica a
sabiendas una forma de falsa medicina. Para aprovechar los altibajos naturales
de cualquier enfermedad (o el efecto placebo), lo mejor es empezar el trata-
miento inútil cuando el paciente esté empeorando. Así, cualquier cosa que
ocurra será conveniente. Si el paciente mejora, se atribuye todo el mérito al
tratamiento; si se estaciona, la intervención ha detenido el proceso de dete-
rioro; si el paciente empeora, es porque la dosis o intensidad del tratamiento
no fueron suficientemente fuertes; y si el paciente muere, es porque tardaron
demasiado en recurrir a él."
El efecto placebo
El efecto placebo a que alude Paulos es la modificación, muchas

veces fisiológicamente constatable, que se produce en el organismo
como resultado del estímulo psicológico inducido por la administra-
ción de un material inerte, de un fármaco o, más generalmente, de un
tratamiento. Hasta 1940 el grueso de la atención médica que se dis-
pensaba estaba basada en el efecto placebo, muy especialmente como
analgésico. Se trata de un tema bastante estudiado. Ante una inflama-
ción, por ejemplo, el cerebro da la orden de liberar prostaglandinas en
el sitio de la lesión por parte de los leucocitos, lo cual origina el dolor.
Los analgésicos lo mitigan precisamente porque bloquean esa pro-
ducción. El placebo, en cambio, consigue «engañar» al cerebro: si bien
las prostaglandinas siguen produciéndose, sus efectos se neutralizan
gracias a las endorfinas que el propio cerebro libera (Park, 2001).
Cualquier médico habilidoso ha utilizado este recurso (con o sin
participación de fármacos), cuyo papel los textos académicos rara-
mente exaltan. El efecto placebo puede ser el único a que da lugar el

tratamiento, o bien puede actuar además del que éste produzca por
conducto bioquímico o físico. Al evaluar tecnologías terapéuticas, se
ha prestado insuficiente atención a la separación de una y otra parte
del efecto. El tema, sin embargo, es de máxima importancia, no sólo
por motivaciones cognoscitivas sino por razones prácticas.
Imaginemos que se valora la efectividad de un fármaco conformado
a partir de cierto principio activo de tipo esteroideo para el tratamiento
del asma. Como cualquier otra droga, ésta comporta ciertos riesgos; si
se pudiera probar que el efecto del fármaco es esencialmente de tipo
placebo, no haría falta someter al organismo a la agresión del esteroide
y se obtendrían los mismos dividendos aplicando un tratamiento simi-
lar pero sin participación de ese principio activo.
Los desarrollos pseudocientíficos que sólo desembocan en un po-
sible efecto placebo, no lo son por tenerlo, sino porque no lo reconocen
o lo ocultan, o por no estar dispuestos a evaluarlo, con lo cual obstru-
yen la comprensión de los fenómenos, además de complicar o encarecer
su aplicación. Si, por ejemplo, las «flores de Bach» —variante de la
homeopatía que exige la maceración de ciertas flores— sólo funcio-
naran, cuando lo hacen, gracias a la sugestión que ejercen; entonces
no haría falta cultivar esas flores específicas sino usar cualquier otra,
o incluso no emplear flor alguna, conservando en todo caso la panto-
mima de que sí se han empleado.
Consideremos finalmente la posición, de quienes, si bien tampoco
exigen conocer los mecanismos de acción, admiten que es preciso deli-
mitar si el método funciona o no; reconocen por lo menos la necesidad
de evaluarlo con rigor y sugieren aceptarlo sólo si pasa la prueba de la
práctica. Amparados en la posibilidad de que estemos ante una de las
excepciones en que una propuesta terapéutica, aun careciendo de toda
explicación racional, o estando en franca oposición a leyes comproba-
das de la ciencia, sea sumamente útil, estas personas sostienen que siem-
pre que se pueda probar la utilidad del procedimiento, cualquier otro
reclamo es innecesario.
Este enfoque es contrario al espíritu del pensamiento científico,

pues tal convocatoria supone restringir nuestras herramientas valora-
tivas al plano del pragmatismo, como si la teoría y el conocimiento
general pudieran ser superfluos.
Aceptar una terapia exclusivamente a partir de que pasó con éxito un
ensayo clínico constituye un error metodológico. En primer lugar porque
abre las puertas a la extendida práctica de admitir o recomendar un proce-
dimiento sólo por el hecho de que se obtuvo «significación» en un estudio
aislado (véase apartado Carácter descontextualizado del análisis, p 389). Pero
sobre todo porque tal posición entraña una hipoteca al desarrollo en la
medida que convalida la renuncia a determinar su fundamento. Conse-
cuentemente, hasta la optimización de la propia terapia en discusión se
vería potencialmente cancelada o seriamente restringida. Por otra parte,
este punto de vista padece de la ingenuidad típica de quienes no com-
prenden que, si bien los edificios se construyen con piedras, un
conjunto de piedras no equivale a un edificio. El edificio de la ciencia
se conforma por medio de un esfuerzo plural, cimentado en la corro-
boración y armado a través de teorías unificadoras.
Para comprender con más claridad lo que se quiere expresar, bas-
ta imaginar la siguiente situación. Supongamos que un médico afirma
poseer un tratamiento eficiente para curar determinadas bronconeu-
monías. El tratamiento consiste en suministrar cierta pócima por
vía oral cada ocho horas y dos horas de psicoterapia bajo estado de
hipnosis luego de ingerir el medicamento. Comparado con placebo,
el tratamiento resulta ser consistentemente efectivo y, consecuente-
mente, se aplica sin tratar de entender la explicación. Pero
imaginemos que años después se descubre que «la pócima» no era
otra cosa que un preparado de penicilina y los mensajes hipnóticos
un truco del terapeuta para hacerse imprescindible. La utilidad de
no haber cejado en el empeño de comprender el mecanismo real de la
curación sería inversamente proporcional al tiempo que nos demo-
ramos en detectar el fraude. En síntesis, nunca ha de perderse de
vista una realidad admitida en todos los entornos mundiales en que
rige un sentido estratégico de la ciencia, sintetizada con precisión

por John Bernal: «La práctica sin teoría es ciega y la teoría sin prác-
tica es estéril» (Bernal, 1979).
Compro hipótesis, pero junto con los métodos

para evaluarlas
La condición más importante que tiene que cumplir una tecnología

terapéutica para verse dignificada por el escrutinio científico no es que
se asiente en un cuerpo teórico adecuado. Aunque ello, desde luego, es
altamente recomendable para, como se ha dicho, no despilfarrar recur-
sos y para diseñar mejores experimentos, no siempre es una demanda
absolutamente indispensable a los efectos evaluativos.
Constituye, en cambio, un requisito crítico que la propuesta tec-
nológica esté definida claramente y no maneje términos tan borrosos
que resulten experimentalmente inasibles; y lo que sí es simple y
directamente imprescindible es que se formulen con nitidez sus pre-
suntas virtudes. Sólo entonces podrá intentarse la evaluación rigurosa
que demanda su convalidación inicial. El químico alemán August
William von Hoffmann escribió «Oiré cualquier hipótesis, pero con
una condición: que Ud. me muestre un método mediante el cual yo
pueda enjuiciarla».
Y procede aclarar que el hecho de que se pueda formular una
hipótesis estadística, no garantiza automáticamente que estamos
ante una hipótesis verdaderamente científica. Por ejemplo, si al
organizar una experiencia para valorar si un individuo tiene dones
telepáticos, éste supedita de antemano su posible éxito a que no se
produzcan ciertas «interferencias» no especificadas, entonces la hi-
pótesis de que hay individuos que tienen la capacidad mencionada
pierde automáticamente su carácter científico, aunque la hipótesis
nula (que afirma que la tasa de éxitos es igual a 50%) sigue siendo
susceptible de valoración estadística. Si el sujeto sólo acierta, di-
gamos, 156 de los 300 desenlaces y se legitima la posibilidad de

que justifique tan pobres resultados arguyendo que actuaron fuer-
zas o energías desconocidas por la física, entonces, simplemente,
el estudio pierde toda validez, ya que en tal caso la experiencia
estará condenada a una circularidad estéril.
La hipótesis tendría que haber sido, en todo caso: «Este señor tiene
dotes telepáticas siempre que no estén obstaculizadas por el efecto de
la energía X». Pero la clave del asunto radica en que, si no se define,
mide y controla la energía en cuestión, la hipótesis sería equivalente a
esta otra: «Este señor tiene dotes telepáticas salvo cuando no las tie-
ne». Lo que suele ocurrir es que, sin reparar en el carácter tautológico
de esta pseudohipótesis, ella es traducida al lenguaje estadístico; su-
perado ese punto, sólo resta aplicar las fórmulas y ya nadie reparará
en su origen epistemológicamente espurio. Si por añadidura, los resul-
tados arrojan «significación», entonces la comedia de enredos se habrá
consumado (véase Capítulo 6).
DIALÉCTICA DE LO OBJETIVO Y LO SUBJETIVO

En esta sección se examina el papel de la subjetividad en la inves-
tigación científica, tema de capital interés en el marco de la ciencia en
general y de la estadística en particular. Aunque está íntimamente co-
nectado con el asunto abordado en el Capítulo 2 (dedicado a la
necesidad de racionalidad epistemológica), en realidad es un compo-
nente del proceso investigativo que reclama una discusión mucho más
general. El debate no se reduce, como allí, a la distinción entre una
pantomima de reflexión científica y un esfuerzo serio por desarrollar-
la, ni a un simple proceso de desenmascaramiento de imposturas; se
trata de algo mucho más delicado: esclarecer perfiles distintivos entre
conceptos y acciones que tienden a ser mal manejados o pobremente
comprendidos.
La objetividad como aspiración
La evaluación racional y desapasionada de la realidad, que pro-

cura no acudir a otros elementos fuera de los que están objetivamente
disponibles, y que se centra en datos susceptibles de ser expresados
cuantitativamente, está sin duda en la base del progreso científico.
Sería absurdo discrepar con la idea de que un atributo básico de la
ciencia y su método radica en su naturaleza no arbitraria, carente de
todo dogmatismo y libre de caprichosas especulaciones. Es bien co-
nocido que los prejuicios, las opiniones que se sustentan en la
autoridad o en el rango de quien las emite, la sumisión a las tradicio-
nes y los juicios determinados por intereses ajenos a la búsqueda de
la verdad, son fuentes nutricias del dogma y la superchería. Por ello,
según la tradición racionalista, son los hechos objetivos quienes mejor
pueden arbitrar entre palabrería fraudulenta y verdad. El filósofo de
la ciencia Imre Lakatos sintetizó nítidamente esta idea central (Laka-
tos, 1978):
"El valor científico de una teoría es independiente de la mente humana

que la creó o la intenta comprender. Su valor científico depende sólo
del fundamento objetivo que otorguen los hechos a las conjeturas."
No es sorprendente entonces que casi cualquier disidencia teórica

respecto de regla tan bien establecida dé lugar a irritadas reacciones.
Las fábulas, la realidad
Sin embargo, la práctica dista de ser tan idílica: lo cierto es que,

aunque la objetividad sea un deseo natural y legítimo, resulta simple-
mente inalcanzable en estado puro. Las fronteras entre lo objetivo y
lo subjetivo son a veces intrínsecamente difusas y, por añadidura, no
faltan pasiones que las difuminen, ni confusiones terminológicas que
dificulten el intercambio sereno sobre sus límites.
La subjetividad está presente inexorablemente en toda actividad

humana y la producción científica no es una excepción. La exigencia
de objetividad extrema como requisito para poder dignificar a una
hipótesis como científica, o para conceder tal condición a una conclu-
sión, es directa y sencillamente quimérica, ya que como mínimo
resultaría paralizante.
El tema es muy delicado, pues un posicionamiento muy laxo abre
las puertas a las manipulaciones deliberadas y a las trampas que tien-
de al investigador su deseo subconsciente; pero una exigencia de
objetividad extrema constituiría un mecanismo descalificador a priori
de toda idea interesante y promisoria, y mediatizador de virtualmente
cualquier conclusión a la espera de avales definitivos. En resumidas
cuentas, lo cierto es que, en términos prácticos y cotidianos, a nadie
se le ocurre poner en acción tal demanda.
Para demostrar la ubicuidad del ingrediente subjetivo en la obra de
los científicos, cualquiera sea la época, cualquiera sea la esfera de
trabajo, Press y Tanur (2001) siguieron una interesente metodología:
examinaron profundamente la obra de 12 científicos encumbrados a
lo largo de la historia con la finalidad de identificar la posible apari-
ción de tal ingrediente (véase portada en la Figura 3.1).
Con el propósito de preservar la integridad del análisis, no seleccio-
naron ellos mismos a los investigadores objeto del escrutinio sino que
se ciñeron a las personalidades de la ciencia que habían sido elegidas
por Jack Meadows en su libro The Great Scientists (Meadows, 1987). Los
autores examinan penetrante y detalladamente la vida y la obra de las
siguientes figuras: Aristóteles, Galileo Galilei, William Harvey, Isaac
Newton, Antoine Lavoisier, Alexander von Humboldt, Michael Fara-
day, Charles Darwin, Louis Pasteur, Sigmund Freud, Marie Curie y Albert
Einstein. El resultado es contundente: en todos los casos, en una u otra
medida, la subjetividad aparece en las interpretaciones de los resulta-
dos o en la metodología empleada para conseguirlos. En ocasiones, el
componente subjetivo comparece de manera intermitente y coyuntu-
ral; en otros, de forma sistemática y prominente. Ello no reduce los
méritos, desde luego, a la extraordinaria aportación de estos geniales
investigadores; simplemente la coloca en una perspectiva mucho más

justa y realista.
Figura 3.1. Portada del libro de Press y Tanur sobre la subjetividad.
¿Es acaso conciliable toda esta inocultable realidad con el desidera-

tum de objetividad que legítimamente reclama la ciencia? ¿Cómo se
ha expresado históricamente y cómo se manifiesta hoy lo subjetivo en
la producción científica? ¿Se trata de un fenómeno simultáneamente
pernicioso y evitable? Y especialmente, ¿en qué medida la estadística
es una disciplina eficaz para conferir objetividad al análisis? Tales son
las preguntas fundamentales a las que se procurará responder de in-
mediato.
Subjetividad no equivale a arbitrariedad
Como se ha dicho, al admitir la subjetividad como un componente

de la ciencia, en casos extremos se corre obviamente el riesgo, por
ejemplo, de caer en el regazo de las teorías «posmodernas» combati-

das por Sokal (detalladamente examinadas en el Capítulo 2), o incluso
en desvaríos más estructurados, como el llamado «anarquismo gno-
seológico» de Feyerabend (1982).
En casos menos pintorescos, el riesgo es más sutil, como ocurre
con algunas manipulaciones, que pueden producirse en el contexto de
los esfuerzos de quien adultera o suprime resultados para convalidar
sus genuinas y sinceras convicciones. Sin embargo, un examen más
detenido de este problema nos conducirá a la identificación de la úni-
ca regla valorativa verdaderamente útil para conjurar o al menos mitigar
sensiblemente estos peligros: asumir la subjetividad como un hecho y
reconocer su presencia cuando proceda sin perder jamás la integridad.
Una de las fuentes más recurrentes de malentendidos en esta mate-
ria proviene de la errónea homologación entre subjetividad y arbitrariedad. Del
mismo modo que la convicción racional de que algo es cierto no pue-
de confundirse con la fe, es necesario distinguir entre una opinión
subjetivamente configurada y un punto de vista adoptado caprichosa-
mente. En el primer caso, suelen conjugarse impresiones informales
con datos reales; en el segundo, los juicios son más bien decisiones en
las que la realidad desempeña, a lo sumo, un papel subsidiario y en el
peor de los casos, constituye un estorbo.
Para profundizar en esta idea, supongamos que dos personas han
de pronunciarse acerca de la edad de un profesor universitario a quien
acaban de conocer y que no tienen acceso a un documento fiable
donde figure su fecha de nacimiento. Una demanda mecánica (y ridí-
cula) de objetividad les obligaría a declarar que no pueden decir nada
acerca de la edad del profesor. Pero lo cierto es que, aunque no tengan
pruebas documentales, seguramente dispondrán de motivos funda-
dos para opinar; por ejemplo, pueden creer ambos que este profesor
tiene más de 20 años y menos de 90.
Si uno de ellos estuviera forzado por las circunstancias a dar una
estimación, basándose en la apariencia del profesor y en ciertos datos
curriculares o biográficos que conoce, pudiera opinar que tiene 55
años; tal opinión contendrá un componente subjetivo, pero verosímil-

mente no habrá en ella influencia alguna del capricho (no obtuvo la
cifra, por ejemplo, auxiliándose de una tabla de números aleatorios).
Análogamente, jamás hubiera declarado que el profesor tiene aproxi-
madamente 15 o 120 años, ya que su experiencia, la información que
posee y su sentido común no lo hubieran consentido. Si la otra perso-
na es sometida a la misma experiencia «adivinatoria», usando su propia
percepción y desde su propia experiencia, probablemente no comuni-
caría exactamente la misma cifra que el primero; pero quizás pudiera
arriesgar que el profesor en cuestión tiene 52 o 59 años. Sin embargo,
si está en su sano juicio, no arribará a la conclusión de que tiene 14.
En síntesis, aunque ambos hagan uso de la subjetividad y puesto que
ninguno de los dos se conducirá arbitrariamente, sus estimaciones serán
bastante próximas entre sí. Y, mucho más importante, probablemente
serán útiles a casi cualquier efecto.
Vale la pena detenernos en unos pocos ejemplos que muestren los
innegables peligros que se corren cuando la subjetividad se ejerce de
manera oculta o subrepticia. No es nada insólito que, en tal caso, lo
que se esté manifestando sea una expresión de deshonestidad. De
hecho no es fácil encontrar ejemplos en que el verdadero villano sea
la subjetividad; casi siempre que se desmonta algún mito hasta enton-
ces arraigado, termina por aparecer algún elemento de arbitrariedad o
falta de honradez, bien por omisión deliberada de información, bien
por adulteración directa de la que se ofrece.
Un ejemplo especialmente notable en que el uso discrecional de la
subjetividad desemboca en realidad en una conducta fraudulenta, lo
ofrece el caso del físico norteamericano Robert Millikan, quien du-
rante decenios fuera conocido como uno de los fundadores de la ciencia
moderna en Estados Unidos. Millikan no era una aficionado: ganó 16
premios y 20 grados honorarios a lo largo de su exitosa vida; llegó a
ser nada menos que presidente de la ilustre Asociación Americana
para el Avance de la Ciencia, y fue acreedor del premio Nobel de
Física en 1923 (Silva, 1997a).
Figura 3.2. Robert Andrews Millikan (1868-1953).
Alrededor de 1910 sostuvo una sonada polémica con Félix Ehren-

haft, profesor de la Universidad de Viena, en torno a la existencia o
no de partículas subelectrónicas. Mientras él afirmaba haber corrobo-
rado experimentalmente la inexistencia de tales subelementos, el grupo
vienés testimoniaba no haber podido convalidar experimentalmente
dicho resultado. El debate abarcó a físicos tan afamados como Albert
Einstein, Max Planck y Niels Börn.
En el contexto de la polémica y para refutar a Ehrenhaft, Millikan
publicó una nueva serie de 58 resultados en 1913 y los acompañó
explícitamente del siguiente texto: «éste no es un grupo seleccionado
sino que representa la totalidad de las mediciones durante 60 días
consecutivos». Gerald Holton, dos décadas después de la muerte de
Millikan, hurgando en sus notas experimentales originales, descubrió
que las seis decenas de observaciones presentadas en 1913 habían

sido en realidad elegidas de entre las 140 realizadas; Millikan eliminó
de la serie aquellas que contradecían su teoría; según sus cuadernos,
las observaciones suprimidas tenían rótulos tales como «no acepta-
ble», «demasiado baja», «debe haber algo mal aquí» (Holton, 1978).
Los criterios empleados por Millikan eran directamente subjetivos.
Discutir si este investigador tenía o no razones para desechar parte de
las observaciones carece de mayor sentido. Los estudios posteriores
han demostrado que no las tenía, pero en última instancia esto es más
bien secundario. Que recelara de ciertas mediciones puede compren-
derse, aun cuando sólo le animaran motivos subjetivos; lo que no
tiene absolución es que no haya informado honradamente al respecto.
Lejos de hacerlo, maquilló y desnaturalizó los datos. El famoso físico
Richard Feynman, también ganador del Premio Nobel, consideraba
este episodio como un buen ejemplo de vergonzosas conductas no
merecedores de la menor benevolencia (Feynman, 1985). Millikan
obtuvo el Nobel en buena medida gracias al estudio mencionado, y
los valores medios informados por él se mantuvieron como válidos
durante muchos años. De haberse conducido con honradez, muy pro-
bablemente no hubiera conseguido el galardón, aunque es imposible
saberlo; pero con toda seguridad, no se hubiera prolongado la vigen-
cia de un error que demoró décadas en desarraigarse.
Muchos otros estragos atribuidos a la subjetividad, realmente se
han debido a prejuicios establecidos. Estos han operado desde anta-
ño, por ejemplo, como agentes responsables de la dilación, perfectamente
evitable, en la aceptación de resultados científicamente fundamenta-
dos.
Quizás el caso más famoso es del médico húngaro Ignatz Sem-
melweiss, quien sostuvo una larga e inexitosa batalla a mediados del
siglo XIX en procura de la modificación de ciertas prácticas hospitalarias.
Semmelweiss demostró que adoptando un conjunto de elementales me-
didas antisépticas en los hospitales, se conseguían impresionantes
resultados en el manejo de la childbed fever (fiebre puerperal). Con los
datos que se aportaban, cualquiera podía constatar objetiva e incon-

trovertiblemente sus espectaculares efectos (reducción de la mortalidad
nada menos que de 12,2% a 2,4% y la virtual desaparición de la fie-
bre puerperal); las explicaciones que Semmelweiss y su colega
Ferdinand von Hebra trataban de ofrecer eran asombrosamente lú-
cidas y no contradecían ningún conocimiento bien establecido, si
bien es cierto que resultaban incompletas.
No obstante la ostensible disminución de la morbimortalidad hospi-
talaria generada por el uso de antisépticos, la recomendación de
incorporarlos fue desdeñada por razones que no se hallaban en la órbita
de la subjetividad racional, sino en la de la espuria arbitrariedad ejercida
por el poder corporativo de entonces. En lugar de aquilatar y valorar los
argumentos que respaldaban la recomendación, y a pesar de que dichas
argumentaciones no pudieron ser objetivamente cuestionadas, ésta fue
dogmáticamente desdeñada por las autoridades sanitarias. La clase mé-
dica austriaca no estaba dispuesta a aceptar lecciones de un húngaro.
Como trágica consecuencia, murieron innecesariamente miles y miles
de mujeres. Nuevamente, no estábamos ante una víctima de la subjeti-
vidad; en este caso se trataba simplemente de mero chovinismo, típico
de la enervante autocomplacencia de aquella época tan magistralmente
dibujada por Stefan Zweig en su libro El mundo de ayer (Zweig, 1999).
Falsa objetividad
Muchos investigadores están persuadidos de que la estadística in-

ferencial, y en particular las pruebas de significación estadística (PSE),
aportan el componente de objetividad que apuntala científicamente a
sus conclusiones. No es, sin embargo, mediante la invocación a la
«objetividad» encarnada en las reglas inferenciales mecánicas y los
«valores p» que se conseguirá sellar las grietas que suelen padecer las
investigaciones en materia de diseño o en el plano teórico. Tal con-
cepción terminará por ser un boomerang.
Actuando como si la objetividad aportada por las PSE (e incluso

por los intervalos de confianza, usados no como fuente de reflexión
sino como sucedáneos de las PSE) fuera definitiva, nos podríamos
convertir en víctimas de nuestros propios mitos. En efecto, 2 o 3 estu-
dios donde no se halle significación en contra del consumo pasivo de
nicotina, o un par de trabajos donde los valores p avalen la curación
de un paciente por medios telepáticos ya darían el aval necesario para
que la empresa Philip Morris gane legítimo espacio en los periódicos
(como efectivamente ya ha ocurrido) o para que cualquier charlatán
suficientemente histriónico se gane la vida curando enfermos mediante
sus «dones» parapsicológicos sin que tengamos derecho a desconfiar
de su honradez.
No estoy «acusando» a la estadística convencional de ser inútil
para conjurar las interpretaciones anecdóticas o veleidosas de los da-
tos; pero no es difícil comprender —o al menos intuir— que el uso de
reglas dicotómicas no lleva en realidad a ninguna parte, aunque no
pocos las emplean con la ilusión de que no hace falta reflexión com-
plementaria alguna, convencidos de que las pruebas de significación
estadística son autosuficientes.
El espejismo de la falsa objetividad puede ser nefasto. El griego
John Ioannidis, profesor de la Universidad de Ioannina (Grecia) saltó
a la fama luego de haber publicado dos explosivos artículos en 2005.
En el primero (Ioannidis, 2005a) da cuenta de un seguimiento a 45
estudios publicados en las tres más importantes revistas médicas (The
New England Journal of Medicine, Journal of the American Medical Associa-
tion y The Lancet) entre 1990 y 2003, todos los cuales recibieron gran
publicidad al comunicar presuntos efectos positivos para el trata-
miento de alguna dolencia. Siete de ellos fueron posteriormente
refutados, y para otros siete se encontró en estudios ulteriores que los
verdaderos beneficios eran sustancialmente menores a los proclama-
dos inicialmente. A partir de ello diversas agencias de prensa reflejaban
que «un tercio de los estudios médicos eran equivocados» (véase por
ejemplo Tanner, 2005).
En el segundo (Ioannidis, 2005b) se da un extenso fundamento ma-

temático de las razones por las cuales tal fenómeno tiene que producirse
a partir de las prácticas habituales de valoración de los resultados basa-
das en las PSE.
Un artículo puede ser contradictorio con otro u otros que le prece-
den; y eso no es un verdadero conflicto para la ciencia. Lo inexcusable
es que un trabajo contenga generalizaciones infundamentadas, o exa-
geraciones y errores fácilmente subsanables.
En rigor, presenciamos una paradoja: los recursos falsamente obje-
tivos pueden terminar legitimando un error que pudiera haberse
evitado con el concurso de procedimientos que contemplen la incor-
poración de elementos subjetivos.
Sin embargo, más allá de reflexiones teóricas, que pueden resultar
variablemente convincentes según el caso, hay realidades de cada día
que rompen los ojos. El hechizo se hace añicos cuando los usuarios
acríticos de recursos como las PSE chocan con hechos que conducen
a admitir en la práctica (¡aunque no siempre en el discurso!) que la
inferencia clásica no basta.
No es nada difícil hallar ejemplos donde diferencias estadísticamente sig-
nificativas son, con toda justicia, desdeñadas por la comunidad científica.
Para ver una ilustración, acúdase al estudio de Harris et al. (1999) que se
discute en el apartado El misticismo ataca los ensayos clínicos, p. 301, donde se
«demuestran» los beneficios terapéuticos de la intercesión mediante plegarias
en pacientes de una unidad de cuidados intensivos, quienes ni siquiera sabían
que se rezaba por ellos. A pesar de haber obtenido significación estadística (es
decir, de que se puede descartar el azar como explicación, según la retórica
«oficial» de la inferencia clásica), lo cierto es que no hay noticias de que se
hayan creado servicios terapéuticos basados en rezos anónimos en hospital
alguno del planeta. Ello se debe a que todos sabemos íntimamente que sería
absurdo no matizar el resultado estadístico usando nuestra cultura, la infor-
mación previa que poseemos y nuestro sentido común.
Al aquilatar las conclusiones que cotidianamente se derivan de la
supuesta objetividad proveída por los procederes inferenciales clási-
cos, tropezamos con la prueba más notable y convincente de que és-

tos no pueden disipar la aparición de lo subjetivo.
Ocurre que toda mente racional se niega en el fondo a conducirse
esquemáticamente, y en este caso la racionalidad impone la reticen-
cia, ya que a menudo no sólo se carece de una teoría explicativa sino
que se invocan ideas disparatadas para suplirla, tales como que los
rezos detonan esotéricos mecanismos desconocidos, o que el agua
tiene memoria, o que en cierto proceso actúan energías inmedibles.
Por mucho que algunos defiendan a ultranza la objetividad de cier-
tos métodos estadísticos, muy a su pesar reniegan en el fondo de ellos
tan pronto la rigidez que los caracteriza sumerge a esos defensores en
la ciénaga de la irracionalidad.
Los límites de la estadística como garantía de

objetividad
¿Cuál es el papel de la estadística en esta madeja? Contribuir a des-

lindar lo anecdótico de las regularidades es justamente la encomienda
fundamental de esta disciplina. Sin embargo, ella no puede satisfacer
por sí sola las necesidades de objetividad. Todo proceso inferencial ten-
drá siempre componentes subjetivos.
Al enseñarse las técnicas estadísticas, suele generarse en los edu-
candos una ilusión a la postre perniciosa. A muchos se les inculca un
perdurable mecanicismo que conspira contra la obligación de exami-
nar la realidad a través de un pensamiento integral.
Al aplicar cierto procedimiento estadístico a un conjunto de datos
lo que se procura es que el análisis gane en objetividad; es decir, que
los puntos de vista del investigador no puedan modificar sustancial-
mente las conclusiones. Especialmente útil a esos efectos es el empleo
de la asignación aleatoria en los ensayos clínicos, del mismo modo
que lo es el enmascaramiento (recurso ajeno a la estadística). Pero los
métodos estadísticos están lejos de garantizar la completa objetividad
del análisis, pues los propios instrumentos estadísticos están sujetos a

la subjetividad; consecuentemente, mal podrán garantizar automáti-
camente la expectativa que muchos investigadores de manera un poco
pueril depositan en su capacidad objetivadora. Robert Matthews, físi-
co de la Universidad de Oxford, miembro de la Royal Statistical Society
y destacado analista de The Sunday Telegraph de Londres lo explica en
un artículo destinado a convencernos de que: «los esfuerzos previos
para «barrer la subjetividad debajo de la alfombra», han conducido a
adoptar procedimientos valorativos que no son ni objetivos ni confia-
bles» (Matthews, 2000).
No trataré ahora en detalle la endeblez de la idea según la cual los
procedimientos estadísticos convencionales han venido a conferir los
estándares de objetividad a que aspiran las ciencias experimentales y
la investigación socioepidemiológica. Pero no está de más hacer una
sucinta enumeración de recursos estadísticos cuyo empleo está inevi-
tablemente matizado por el punto de vista y las decisiones que adopte
cada investigador concreto.
El ejemplo más obvio es el nivel de significación empleado en las
pruebas de hipótesis. La elección de trabajar con el popular α = 0,05
es intrínsicamente subjetiva (aunque, por cierto, tampoco sea una
decisión arbitraria). En cualquier caso, nada hace que α = 0,05 sea
preferible a α = 0,01 o a α = 0,06.
Pero es larga la lista de ejemplos adicionales. Las propias pruebas
de significación utilizadas pueden ser paramétricas o no paramétricas,
de una cola o de dos colas, y no existe regla alguna que determine sin
discusión qué es lo mejor. En determinados contextos hay que elegir
«puntos de corte» para categorizar variables continuas como ocurre,
por poner un ejemplo familiar a todos, con el peso al nacer: un niño
con menos de 2.500 gramos se considera «de bajo peso»; igualmente
pudiera haberse elegido otro umbral (2.450 o 2.600 gramos).
Más generalmente, la forma de operacionalizar las variables de-
pende inevitablemente de decisiones personales; por ejemplo, ¿qué
significa ser un fumador?, ¿alguien que tenga el hábito, aunque lo ejer-
za muy esporádicamente?, ¿una persona que fume más de cinco ciga-

rrillos diarios?, ¿o quien consume semanalmente cierta cantidad
mínima de mg de nicotina? Al medir la presión sanguínea, se puede
operar con la tensión arterial en mm de Hg, y puede emplearse la
presión diastólica, la sistólica, o el promedio de ambas; o bien trabajar
con una versión dicotómica del concepto, para lo cual, a su vez, se
fijan umbrales que varían entre unos y otros investigadores, tales como
si la tensión del sujeto supera los 90 mmHg de diastólica o los 140
mmHg de sistólica.
El tamaño de muestra seleccionado acaso ofrezca el más notable de
los ejemplos; una detallada demostración del carácter hondamente sub-
jetivo de tal determinación puede hallarse en Silva (2000) y una
ilustración contundente en Shultz y Grimes, (2005). Igualmente subje-
tiva es la decisión de lo que habrá de entenderse por una diferencia
clínicamente relevante, o la de cuáles han de ser las variables iniciales
de un modelo de regresión múltiple antes de aplicar una selección paso
a paso, o la de aplicar dicha selección hacia delante o hacia atrás. Otro
tanto ocurre con la valoración de si cierto valor se debe o no considerar
«aberrante» (un outlier), o con la decisión de los trabajos que han de
incluirse en un metaanálisis y cuáles no.
Lo inquietante de los procedimientos convencionales no estriba en
que la subjetividad desempeñe un papel en el proceso inferencial, sino
en que, al ocultar su participación, se consolide la quimera de que
constituyen un árbitro final y se radique y extienda con ella una in-
aceptable pereza intelectual. En efecto, cuando un programa
informático de estadística concluye su tarea, muchos investigadores
creen que en ese momento ha terminado también la suya. Se trata de
un error esencial: es en ese punto donde comienza la tarea más impor-
tante del investigador.
Es un grave error conceptuar los resultados como si fueran conclu-
siones. Actuar como meros aplicadores de programas informáticos
especializados ha sido, lamentablemente, la encomienda que muchos
estadísticos creen tener.
En un revelador artículo titulado «El análisis estadístico y la ilusión

de objetividad», publicado en una prominente revista especializada,
Berger y Berry (1988) escriben: «el uso común de la estadística parece
haberse fosilizado, principalmente debido a la visión de que la estadís-
tica clásica es la forma objetiva de analizar datos».
La aplicación de criterios subjetivos no sólo es inevitable debido a la
naturaleza humana de quienes han de enjuiciar los resultados, proceso
que en rigor no es ni puede ser algorítmico, sino en virtud de que hay
imperativos prácticos que lo imponen. Constantemente hay que tomar
decisiones: con frecuencia no se puede postergar el lanzamiento de un
mensaje sanitario, la promulgación de una ley o la adopción de una
decisión terapéutica hasta que se cuente con toda la información posi-
ble. Es necio ignorar que, además de los datos acumulados, en ausencia
de unanimidad, para configurar nuestras opiniones sobre lo que leemos,
todos acudimos a una serie de pautas valorativas externas a la informa-
ción disponible y al método que la produjo. Son pautas subjetivas que
de un modo u otro intervienen en el proceso, tales como la experiencia
personal, la reputación de los científicos o personalidades involucradas
en el debate, la filiación académica de los contendientes y el tipo de
publicación en que se dan a conocer los resultados.
Todos los días surgen criterios encontrados, ideas novedosas, nuevos
informes contradictorios en una u otra medida con puntos de vista preva-
lecientes. Llegar a un criterio universalmente aceptado toma años, a veces
decenios, siglos incluso. Aunque no es teóricamente óptimo, lo cierto es
que así han funcionado las cosas sin grandes fiascos. Desde luego, hay
entornos, disciplinas, problemas concretos, en que la aparición de ciertas
propuestas no deja mucho margen, ni para la duda ni para que graviten
criterios subjetivos. Por ejemplo, una propuesta terapéutica que se opon-
ga a la segunda ley de la termodinámica, no ofrece dudas de su invalidez.
Pero no siempre las cosas son así de claras.
¿Qué hacer ante tal realidad? La única opción razonable es la de
tomar ese toro por las astas: asumir la inevitabilidad de lo subjetivo y
procurar que su manifestación aparezca explícitamente.
Lo verdaderamente inaceptable (por ser evitable) es que se engañe

a la comunidad científica, y ocasionalmente se autoengañen los pro-
pios investigadores, dando gato por liebre, pasando la subjetividad de
contrabando, disfrazada de objetividad estadística. Lo único que real-
mente garantiza tal conducta es dañar la reputación de la ciencia en
general y de la estadística en particular.
La metodología cualitativa
Numerosos problemas de índole social se abordaron durante mu-

chos años sin hacer uso de las técnicas formales de encuesta y, con
frecuencia, tomando información de manera tal que no existía la posi-
bilidad de manejar los datos en un entorno cuantitativo. Los
procedimientos de análisis eran de orden básicamente cualitativo, es-
pecialmente entre antropólogos y etnógrafos, pero también entre
sociólogos, psicólogos e, incluso, clínicos (Silva, 1997a).
Posteriormente fueron expandiéndose diversos desarrollos teóricos
y recursos prácticos —en especial las pruebas de hipótesis y las técni-
cas de muestreo— que, al propiciar la cuantificación de los resultados y
permitir expresarlos, por tanto, de manera más formal, fueron despla-
zando de la práctica, y devaluando metodológicamente a las técnicas
cualitativas de análisis. Si bien las prácticas cualitativas nunca desapa-
recieron y en cierta medida tuvieron incluso expresiones importantes
de renovación y vitalidad; lo que sí se consolidó como realidad fue su
separación casi absoluta de los procedimientos cuantitativos.
El epidemiólogo típico de la que fuera nueva hornada positivista,
cuya gestión, quiéralo o no, tenía profunda connotación sociológica,
miraría con desdén al antropólogo que se pierde en lo que, a su juicio,
no pasaba de ser diletantismo subjetivo y visión novelada de la reali-
dad. El científico social clásico, por su parte, recelaba de las tecnologías
supuestamente encartonadas que le proponían los estadísticos y que
lo obligarían a reducir la riqueza de sus observaciones a tablas y por-
centajes. Sin embargo, hoy resulta insólita una afirmación como la de

Gurvitch (1950), cuando, refiriéndose a las técnicas formales de en-
cuestas, encarnadas en la legendaria empresa que las popularizara en
Estados Unidos, escribía que «los procedimientos de Gallup son irri-
sorias búsquedas de promedios arbitrarios que no existen y operan en
el vacío».
El divorcio entre técnicas cuantitativas y cualitativas se ha atribui-
do al profundo compromiso de la epidemiología «moderna» con las
primeras, lo cual obstaculizó una integración más estrecha entre las
estrategias de investigación de las ciencias sociales en general. Pero
hace mucho que casi nadie cuestiona la conveniencia de un sensato
«pluralismo metodológico» como reclamaba Almeida (1992).
Entre las más connotadas técnicas cualitativas, bosquejadas y refe-
renciadas (véase Jones, 2004), se hallan la asamblea o forum comunitario,
el famoso brainstorming, las entrevistas en profundidad, las técnicas gru-
pales (grupos de reflexión o discusión, grupo nominal y Delfos), la historia
de vida, el uso de informantes claves, la observación estructurada y la
observación participante.
Todas ellas suponen la existencia de lo subjetivo, presente tanto en
la técnica propiamente dicha como en quien la estudia, hecho que
admiten sin avergonzarse. De hecho no hay motivos para el rubor si
se repara en que para cierto tipo de problemas resultan tanto o más
recomendables que determinadas aplicaciones estadísticas cuya obje-
tividad —como se ha dicho— dista mucho de ser absoluta.
Las encuestas estructuradas, por ejemplo, suelen restringir marca-
damente el espacio de expresión de los interrogados. Ello viabiliza y
simplifica notablemente el procesamiento estadístico, pero la subjeti-
vidad del investigador contamina el proceso tan pronto éste fija, tanto
sintáctica como conceptualmente, las respuestas posibles. La diferen-
cia básica entre los procedimientos cuantitativos y los cualitativos no
estriba en que aquellos sean objetivos y éstos no, sino en el punto y el
modo en que se introduce la subjetividad: los últimos ponen el énfasis
en permitir que los actores sociales participen con su propia subjetivi-
dad en el proceso; en los primeros, la subjetividad -poca o mucha- es

monopolizada por los investigadores.
Recientemente, las experiencias prácticas se han multiplicado, la
teoría se ha enriquecido y la literatura destinada a este tema ha creci-
do sustantivamente. Es posible hallar, incluso textos completos
(Mucchielli, 2001; Shaw, 2003;Taylor y Bogdan, 2005; Ulin, Robin-
son y Tolley, 2006) y números monográficos de revistas de Salud
Pública y Epidemiología dedicados al tema. En el editorial de uno de
ellos (Pérez, 2002) podemos leer:
"Achacar a la subjetividad del investigador y a la de los sujetos que

forman la muestra (cuando a ella no puede renunciar nadie) la falta de
validez de los resultados de la metodología cualitativa es, entre otras
cosas, negar que esta subjetividad también existe en los métodos cuan-
titativos, tanto por parte del investigador (cuando elige el tema de
investigación, cuando elabora el cuestionario y cuando realiza el in-
forme de resultados) como de los sujetos investigados (cuando deciden
participar o no y cuando responden a las preguntas). De manera que
descalificar la metodología cualitativa por basarse en la subjetividad
que nos constituye es descalificar a su vez la cuantitativa, ya que por
más que lo pretendiera nunca nadie podrá prescindir de la subjetivi-
dad."
Las técnicas cualitativas tienen, sin embargo, un alcance limitado.

Si bien pueden ser un magnífico instrumento alternativo o comple-
mentario de las técnicas inferenciales para resolver tareas tales como
sopesar un estado de opinión u ordenar jerárquicamente un paquete
de necesidades según prioridades, resultan con frecuencia inoperan-
tes por sí solas para resolver muchos problemas de investigación
epidemiológica, para casi todos los de la clínica y, me atrevería a de-
cir, que para la totalidad de los que se plantean las ciencias básicas.
Cierro estas ideas con un comentario de Ted Porter, historiador de
la Universidad de California (Porter, 1986):
"Las matemáticas son criticadas como inhumanas y admiradas como

imparciales. Los métodos cualitativos aspiran a una sensatez y flexibi-
lidad mayores pero se espera también que den evidencia de su
imparcialidad."
Probabilidades subjetivas: cuando un erudito se equivoca
En el marco del lenguaje cotidiano, incluso en el ámbito académi-

co, la probabilidad no se entiende exclusivamente como la frecuencia
relativa con que se produce un suceso a largo plazo, sino también (y
en ocasiones, solamente) como el grado de convicción personal acer-
ca de que el suceso ocurra o pueda ocurrir.
Afirmaciones del tipo «es muy probable que el Partido Liberal gane
las próximas elecciones», «es improbable que Juan haya sido quien
llamó por teléfono» o «la probabilidad de que se encuentre un trata-
miento eficaz para el SIDA en los próximos cinco años es muy baja»,
comunes y corrientes en el lenguaje cotidiano, aluden a probabilida-
des que no suelen cuantificarse formalmente. Resultan ajenas por tanto
a una metodología que se desenvuelva en un marco frecuentista. Sin
embargo, suelen ser sumamente útiles para viabilizar el intercambio
racional de las ideas. Es evidente que si le preguntamos a cierto nú-
mero de personas razonablemente informadas cuán probable es que
el campeón mundial de ajedrez resulte vencedor al jugar contra cierto
aficionado, la inmensa mayoría dará alguna respuesta (es decir, no
exigirá que se enfrenten varios cientos de veces para poder calcular la
frecuencia de victorias del campeón). Usarán adjetivos y adverbios
que por lo general no serán muy diferentes entre sí: «muy probable»,
«casi seguro», «altamente verosímil», etc.
De hecho, las decisiones clínicas que cotidianamente se adoptan
están implícitamente basadas en juicios probabilísticos subjetivos. Si
se pregunta, pongamos por caso, a un intensivista la probabilidad de
sobrevivencia que atribuye a un paciente que acaba de ingresar en su
unidad, éste responderá de alguna manera, y esa respuesta —basada

en su experiencia y sus conocimientos— constituye una síntesis su-
mamente valiosa para hacernos una composición de lugar. Si lo
«presionamos», podríamos obtener incluso una respuesta numérica del
tipo «la probabilidad de que sobreviva es aproximadamente 90%». En
tal caso, el médico estaría aplicando una especie de regresión logística
informal (subjetiva).
Otro ejemplo familiar lo aporta en el hecho de que todo veredicto
al que se llega en un juicio, salvo que esté amañado o determinado
por circunstancias ajenas al proceso judicial en sí, se realiza sobre la
base de probabilidades subjetivamente configuradas. Yo considero in-
cluso que, salvo rarísimas excepciones, es imposible demostrar la
culpabilidad de ningún acusado. Expliquémonos con un ejemplo.
Supongamos que una víctima de violación declara que su agresor
era un hombre muy alto y delgado, con muchos anillos en su mano
derecha, quien huyó del lugar del hecho en un automóvil Chevrolet
del año 1975 de color rojo. Supongamos que la policía detiene un
coche con esos rasgos y que el conductor responde a las característi-
cas descritas por la mujer. Admitamos además que el sujeto es
reconocido por la víctima. ¿Ha quedado demostrada la culpabilidad del
acusado? Obviamente, no. La probabilidad de que así sea es tan alta
que nadie dudaría en condenarlo; pero no es imposible que se trate de
una trágica casualidad o de un montaje rocambolesco en el que por
alguna razón todos los «actores» se han puesto de acuerdo. Tal posibi-
lidad es tan inverosímil que a la hora de tomar una decisión, se descarta.
Se aplicará el viejo principio jurídico anglosajón de declarar culpabili-
dad cuando ésta se haya constatado «más allá de toda duda razonable».
Pero, ¿qué es una «duda razonable»? Nadie debe pretender una defini-
ción formal: eso es materia de sentido común y, al final, algo
inexorablemente subjetivo.
Lamentablemente, el cúmulo de pruebas no es por lo general tan
avasallante: éstas son más débiles o confusas, e incluso contradictorias,
de modo que a lo largo del juicio la probabilidad de que el acusado sea
culpable se mueve o pendula para cada miembro del jurado, con más o
con menos irregularidad, entre 0 y 1. Pero siempre se trata de determi-
nar si finalmente está suficientemente cerca de 1 como para dar un
veredicto de culpabilidad: así se conducen jueces y miembros del jura-
do, aunque no operen con una cuantificación formal de la probabilidad.
La tendencia contemporánea se inclina sin embargo a incorporar
cómputos formales (véase Fenton y Neil, 2000) los cuales se realizan
típicamente a través del enfoque bayesiano (al que me referiré en el
apartado Los intervalos de confianza como sucedáneos, p. 418), aunque se
trata de ideas que aún padecen de un alto grado de incomprensión.
En un libro que recoge artículos de prensa escritos por el filósofo de
la ciencia Mario Bunge pueden hallarse ejemplos persuasivos de tal
dificultad (Bunge, 2003). Allí puede leerse:
"Una nueva escuela jurídica norteamericana, nacida hace tres décadas, dice
emplear el concepto de probabilidad para medir la credibilidad de litigan-
tes y testigos, así como la posibilidad de que un jurado tome una decisión
acertada. Pero la probabilidad propiamente dicha, o sea, la matemática, es
totalmente ajena a los pleitos, porque la probabilidad mide el azar, y los
pleitos, por accidentados que sean, no son aleatorios sino que, por el
contrario, están dirigidos (bien o mal). En el mejor de los casos, la juris-
prudencia probabilista da una apariencia científica a un argumento jurídico
ordinario. En el peor de los casos conduce al error judicial, porque las
probabilidades en cuestión son subjetivas y por lo tanto arbitrarias."
Disparatado silogismo: como hemos visto, carece de todo sentido

decir que, dado que una probabilidad es subjetiva, entonces es nece-
sariamente arbitraria. Pero no es todo. Bunge remata diciendo «¡Ojo a
la probabilidad jurídica, porque pone en peligro la familia, la propie-
dad, o aun la vida!». Como si la desaparición del pensamiento
probabilístico fuera posible. Y peor aun, ¡como si tal abolición garan-
tizara que no se fueran a cometer errores judiciales y con ello quedaran
a salvo la familia, la propiedad y la vida!
Figura 3.3. El epistemólogo argentino Mario Bunge.
Aunque en ese texto de Bunge figuren no pocas oraciones crípticas

e ininteligibles tales como «…algunos aspectos del mundo son causa-
les, otros aleatorios y otros más caóticos», el pasaje donde se aprecian
más claramente los prejuicios y la incompetencia de Bunge en esta
materia, es el siguiente:
"También es falsa la opinión de que tenemos derecho a atribuirle una

probabilidad a todo acontecimiento. En efecto, sólo podemos adjudi-
car probabilidades a acontecimientos aleatorios. Este es el caso del
resultado de «revolear» una moneda honesta. En cambio, si la mone-
da ha sido fabricada por un tahúr, no corresponde hablar de
probabilidades."
Me resulta curioso que el gran epistemólogo argentino no capte

que la situación es exactamente la opuesta: decir de antemano que
una moneda es «honesta» equivale a atribuirle (subjetivamente) una
probabilidad de 0,5 a cada lado. Por otra parte, si se parte de calificar-
la como «honesta», entonces ponerse a «revolearla» ya carece de
sentido. Finalmente, si hubiera sido «fabricada por un tahúr», esa sería
exactamente la situación en que más claramente procedería «hablar
de probabilidad», ya sea con vistas a estimar la que corresponda a

cada posible desenlace bajo la definición frecuentista, ya sea subjeti-
vamente —usando nuestro conocimiento, si lo tuviéramos, sobre las
«mañas» habituales del tahúr— o incluso combinando ambos enfo-
ques mediante el teorema de Bayes.
BIBLIOGRAFÍA
Almeida N. Epidemiología sin números. Serie Paltex Nº28, Washing-

ton: OPS/OMS. 1992.
Arévalo JM, Baquedano FJ. Prevalencia del tabaquismo en los traba-
jadores de un hospital. Revista Española de Salud Pública 1997; 71:
451-462.
Berger JO, Berry DA. Statistical analysis and the illusion of objectivi-
ty. The American Scientist 1998; 76:159-165.
Bernal J. La ciencia en nuestro tiempo. México DF: Nueva Imagen. 1979.
Bunge M. Cápsulas. Barcelona: Gedisa. 2003.
Bustos R et al. Volumen de ingesta de calostro y glucemia en recién
nacidos a término. Revista Mexicana de Pediatría 2005; 72:278-282.
Fenton NE, Neil M. The jury observation fallacy and the use of Ba-
yesian networks to present probabilistic legal arguments. Mathematics Today
2000; 36:180-187.
Feyerabend P. Contra el método. México DF: Tecnos. 1982.
Feynman RP. Surely you’re joking Mr Feynman. London: Unwin. 1985.
Gurvitch G. La voaction actualle de la sociologie. Paris: Presses Universi-
taires de France. 1950.
Harris WS et al. A randomized, controlled trial of effects of remote,
intercessory prayer on outcomes in patients admitted to the coro-
nary care unit. Archives of Internal Medicine 1999; 159:2273-2278.
Holton G. Subelectrons, presuppositions, and the Millikan-Ehrenhaft
dispute. Historical Studies in the Physical Sciences 1978; 9:166-224.
Ioannidis JPA. Contradicted and initially stronger effects in highly ci-
ted clinical research. Journal of the American Medical Association 2005a;
294:218–228.
Ioannidis JPA. Why most published research findings are false? PLoS
Medicine 2005b; 2:e124
Jones K. Mission drift in qualitative research, or moving toward a
systematic review of qualitative studies, moving back to a more
systematic narrative review. The Qualitative Report 2004; 9:95-112.
Kitiagorodski A. Lo inverosímil no es un hecho. Moscú: Mir. 1970.

Lakatos I Philosophical Papers (Worrall & Currie, eds.) Vol 1. Cambrid-
ge: Cambridge University Press. 1978.
Matthews RA. Facts versus Factions: the use and abuse of subjectivi-
ty in scientific research. En: European Science and Environment Forum
Working Paper; reprinted in Rethinking Risk and the Precautionary
Principle. Ed: Morris, J. Oxford: Butterworth. 2000.
Meadows J. The Great Scientists. New York: Oxford University Press.
1987.
Mucchielli A. Diccionario de métodos cualitativos en Ciencias Humanas y
Sociales. Madrid: Síntesis Editorial. 2001.
Olvera R et al. Tratamiento antituberculoso ultracorto (2HRZ/2H3R3)
versus tratamiento estándar (2HRZ/4H3R3) en combinación fija
bajo la estrategia TAES. Revista del Instituto Nacional de Enfermeda-
des Respiratorias de México 2002; 15:214-219.
Paulos JA. El hombre anumérico. Madrid: Alfaguara. 1990.
Pérez C. Sobre la metodología cualitativa. Revista Española de Salud
Pública 2002; 76:373-380.
Porter P. The Rise of Statistical Thinking, 1820-1900. Princeton: Prince-
ton UP. 1986.
Press SJ, Tanur JM. The subjectivity of scientists and the Bayesian approach.
New York: Wiley and Sons. 2001.
Schulz KF, Grimes DA. Sample size calculations in randomised trials:
mandatory and mystical. The Lancet 2005; 365:1348–1353.
Shaw IF. La evaluación cualitativa. Introducción a los métodos cualitativos.
Madrid: Paidós Editorial. 2003.
Silva LC. La formulación de problemas de investigación en salud.
Revista Cubana de Cardiología y Cirugía Cardiovascular 1991; 5:64-
71.
Una mirada crítica. Madrid: Díaz de Santos. 1997a.
Silva LC. Ciencia y pseudociencia: una distinción crucial. Revista Cu-

bana de Investigaciones Biomédicas 1997b; 16:78-82.
ción sanitaria. Madrid: Díaz de Santos. 2000.
Silva LC. Deficiencias en la formulación de problemas de investiga-
ción en ciencias de la salud. Metas de Enfermería 2004; 7:51-55
Silva LC, Benavides A. Causalidad e inobservancia de la premisa de
precedencia temporal en la investigación biomédica. Revista Metho-
dológica (Bélgica) 1999; 7:1-11.
Sosa M et al. ¿Qué opinan los internistas españoles de la osteoporosis?
Revista Clínica Española 2005; 205:379-382.
Tanner L. A third of medical studies are wrong. Accesible en: http://
www.livescience.com/othernews/ap_050714_medical_studies.html)
en agosto de 2007. 2005.
Taylor SJ, Bogdan R. Introducción a los métodos cualitativos de investigación.
Madrid: Paidós Ibérica. 2005.
Tellería C, Sanz VJ, Sabadell MA. ¿Es efectiva la homeopatía? Acce-
sible en: http://www.arp-sapc.org/articulos/homeopatia/ en agosto
de 2007. 2005.
Ulin PR, Robinson ET, Tolley EE. Investigación aplicada en salud
pública: métodos cualitativos. Publicación Científica y Técnica Nº614,
Washington: OPS. 2006.
Wilson EO. Consilience: The Unity of Knowledge. Londres: Random
House. 1998.
Wise J. Health authority stops buying homeopathy. British Medical Jour-
nal 1997; 314:1574.
Zweig S. El mundo de ayer. Memorias de un europeo. Barcelona: El Acan-
tilado. 1999.
209
4
Los enemigos
de la ciencia
La pseudociencia tiende a interpretar todos los datos
de modo que sus tesis queden confirmadas ocurra lo
que ocurra. El pseudo científico, igual que el
pescador, exagera sus presas y oculta o disculpa todos
sus fracasos.
MARIO BUNGE
Lo que más desearía es que Ud. tenga la buena suerte

de estar en un lugar donde, por la necesidad de
mantener una posición o el apoyo financiero, nunca
se sienta forzado a perder su integridad.
RICHARD FEYNMAN
a ciencia soporta numerosos embates, como se ha visto a lo

L largo de los capítulos precedentes. Pero muchos de ellos no son
estructurales, sino meras desviaciones coyunturales padecidas por sis-
temas sociales o institucionales.
La prensa, por poner un solo ejemplo, puede constituir un peligro
para el feliz desarrollo de la actividad científica, ya que la manera en
que a veces tergiversa o manipula la información salida de la investi-
gación y la tecnología produce daños notables. Park (2001) escribía
«La diferencia entre especulación no comprobada (e incluso no com-
probable) y genuino progreso científico suele desvanecerse en el
tratamiento que dan los medios de comunicación a las cuestiones re-
lacionadas con la ciencia». Sin embargo, esto no es lo que ocurre
siempre, ni mucho menos. Ha de reconocerse el creciente y valiosísi-
mo papel que han venido desempeñando los medios masivos de
comunicación en materia de divulgación, difusión, esclarecimiento e
incluso acrisolamiento de los resultados científicos y tecnológicos. Este
209
propio libro se ha beneficiado de mucha información procedente de

estas fuentes.
Sin embargo, hay enemigos esenciales, que lo son por su propia
naturaleza, que lo serán siempre y sin excepciones. Los dos más nota-
bles son la pseudociencia, cuyos dividendos siempre son negativos, y
el fraude científico, que por definición hace exactamente lo contrario
que lo que se propone conseguir su objeto de depredación (en lugar
de buscar la verdad, lo que procura es construir falsedades, tergiver-
saciones y adulteraciones).
En este capítulo me extenderé especialmente sobre el primero de
estos dos enemigos. El lector hallará un análisis bastante pormenori-
zado de un par de expresiones de naturaleza muy diferente entre sí,
que ilustran con claridad el modus operandi de la pseudociencia. Si se
quiere consultar un texto abarcador y de alto vuelo histórico y teórico,
sugiero el libro Señor Pata de Cabra. Crítica a la sinrazón pura (Quintana,
2008). Las conductas fraudulentas en el marco de la ciencia serán
abordadas algo más someramente.
PSEUDOCIENCIA
Es imposible valorar una propuesta científica si no se cuenta con
un marco teórico potente que permita distinguir entre ciencia y pseu-
dociencia. Con frecuencia se escuchan debates en que intervienen
declaraciones del tipo «la práctica X sí es científica pero la Y no lo es,
en tanto que la teoría Z aún está en discusión». Muchas veces, lamen-
tablemente, se trata de palabras vacías de contenido, pues no dimanan
de un examen sistemático y correcto de X, Y y Z, sino de conviccio-
nes nacidas de la intuición, de la asimilación inercial e ingenua de lo
que dicen o hacen otros, o de una concepción errónea de los objetivos
y procedimientos de la ciencia.
Por lo tanto, lo primero que debe tenerse presente es que el propó-
sito central de la ciencia es el establecimiento de las leyes que rigen
LOS ENEMIGOS DE LA CIENCIA 211
los fenómenos que examina, así como conformar teorías (sistema de

leyes) que expliquen los acontecimientos, tanto actuales como poten-
ciales. Dicho esfuerzo se orienta a conseguir, a la postre, la traslación
de los nuevos conocimientos al plano tecnológico.
Es bien conocido que el proceso de conformación de dichas le-
yes y teorías exige la aplicación de un método riguroso, muchas veces
arduo y árido, complejo y lento. La especulación acientífica, en cam-
bio, resulta más fácil y en principio más interesante que la paciente
colección de datos objetivos en un marco conceptual previo y que
el proceso subsiguiente de desentrañarlos y organizarlos dentro de
estructuras teóricas interna y externamente coherentes.
La ciencia no pretende ser final e incorregible, definitivamente cierta
(Bunge, 1972). Lo que la ciencia proclama es:
• ser una fuente explicativa más eficiente que cualquier modelo

no-científico del mundo;
• su capacidad de probar esa cualidad mediante contrastación
empírica;
• que se vale de un método capaz de descubrir sus propias defi-
ciencias;
• que tiene la capacidad de corregir dichas deficiencias.
Lo que se propone sobre estas bases es construir representaciones

de la realidad que la modelen de manera cada vez más adecuada. La
ciencia identifica constantemente lagunas en tales representaciones;
esa es, precisamente, una de las funciones de la investigación científi-
ca. Nunca parte de postulados mesiánicos; en todo caso, conforma
hipótesis siempre abiertas a ser mejoradas, o incluso desechadas cuando
proceda. Ninguna especulación extracientífica es tan modesta ni tan
productiva.
La pseudociencia es, en cambio, típicamente arrogante, pues se au-
toproclama dueña de la verdad. Las disciplinas pseudocientíficas suelen
exhibir uno o más de los rasgos que enumeramos a continuación:
• no formular genuinas interrogantes, sino más bien problemas

para los que ya se tienen respuestas anticipadas;
• no proponer hipótesis ni procedimientos fundamentados para
evaluarlas, parten de lo que deberían probar;
• no procuran hacer contrastaciones objetivas de sus tesis ni para
demostrarlas ni, mucho menos, para que afloren sus fisuras; ca-
recen por tanto de mecanismos autocorrectores;
• suplen los argumentos estructurales con ilustraciones de sus
concepciones y las evidencias estadísticas con anécdotas;
• las leyes que esbozan o enuncian son básicamente especulati-
vas y se definen a través de categorías difusas y elusivas;
• permiten la coexistencia de contradicciones internas en su pro-
pia formulación; no consienten las enmiendas que se podrían
derivar de dichas contradicciones;
• desprecian total o parcialmente la herencia científica de la hu-
manidad, de modo que desdeñan los mecanismos de validación
externa y con frecuencia huyen de ellos.
Resulta difícil sintetizar mejor el estilo y propósito de la pseudo-

ciencia que como lo hace el epistemólogo argentino Mario Bunge,
uno de los más profundos estudiosos del fenómeno, cuando en el tex-
to arriba citado escribe:
"La pseudociencia no puede progresar porque se las arregla para

interpretar cada fracaso como una confirmación, y cada crítica como
si fuera un ataque. El objetivo primario de la pseudociencia no es
establecer, contrastar y corregir sistemas de hipótesis (teorías) que
reproduzcan la realidad, sino influir en las cosas y en los seres huma-
nos: como la magia y como la tecnología, la pseudociencia tiene un
objetivo primariamente práctico, no cognitivo, pero, a diferencia de
la magia, se presenta ella misma como ciencia y, a diferencia de la
tecnología, no goza del fundamento que da a ésta la ciencia."
Declaro de antemano que respaldo y respeto enteramente el espíri-

tu presente en muchas corrientes intelectuales dentro de lo que ha
dado en llamarse «movimiento escéptico», aunque confieso que no
me siento especialmente cómodo dentro de tal adjetivo. Soy refracta-
rio a declararme un «escéptico» profesional. Creo que la elección de
tal calificativo para designar a quien nunca baja la guardia de la racio-
nalidad no es del todo feliz, aunque me doy cuenta de que el término
procura desentenderse claramente de lo que pudiera ser su antítesis:
la ingenua credulidad tantas veces explotada por mercachifles del in-
telecto.
A mi juicio toda propuesta o idea merece atención y reflexión. El
asunto está en identificar el momento en que ya no vale la pena desti-
nar ni un segundo más al tema. Este lapso puede durar minutos en
algunos casos. En otros, ha durado años o decenios. Las listas de ras-
gos caracterizadores de la pseudociencia y de la ciencia verdadera
arriba expuestas pueden servir, sin embargo, para olfatear de qué lado
está aquello que valoramos.
DISOCIACIÓN ENTRE CREENCIA Y EVIDENCIA

Mi primer contacto (más bien, colisión) con la pseudociencia acae-
ció hacia 1985. Por entonces empezaba a alcanzar cierta notoriedad
mundial la llamada «teoría de los biorritmos» (TBR). Se trata de un
sistema relacionado con los ritmos biológicos, pero que nada tiene
que ver con la disciplina conocida como Cronobiología. Esta se ocu-
pa de estudiar el comportamiento rítmico de las variables biológicas
que, en el caso del ser humano, abarca, por ejemplo, la temperatura
corporal, la actividad metabólica y hormonal, la fatiga intelectual y la
tensión arterial, entre otros procesos fisiológicos cuyo comportamiento
periódico ha sido demostrado.
Inspirada en ideas que se remontan a finales del siglo XIX, la «teoría
de los biorritmos» afirma la existencia de una estrecha relación entre
la fecha de nacimiento de cada individuo y los acontecimientos físi-

cos y psicobiológicos que se producirán a lo largo de toda su vida. Su
surgimiento se debe al cirujano y otorrinolaringólogo alemán Wilhelm
Fliess, quien formuló un conjunto de ideas típicas de la pseudocien-
cia numerológica que por entonces seducía a Europa.
Supuestamente, a partir de observaciones empíricas, se descubrió
que la vida de los humanos está regida por tres ciclos que comienzan
para cada individuo el día de su nacimiento y mantienen su vigencia
de manera vitalicia. Se trata del «ciclo físico», el «ciclo emocional» y el
«ciclo intelectual» que duran 23, 28 y 33 días respectivamente para
todos los humanos, con independencia del género, la edad o cualquier
otra circunstancia social o fisiológica del sujeto. Cada ciclo se divide
en dos fases exactamente iguales: durante la primera, las potenciali-
dades del individuo estarían desarrolladas, mientras que a lo largo de
la segunda, se hallarían atrofiadas. Y aquellos días en que se transita
de una fase positiva a una negativa o viceversa, son calificados como
críticos. Se plantea que durante los días críticos el individuo está en
situación especialmente vulnerable: accidentes, bajo rendimiento y
percances de índole diversa se presentarían con probabilidad mucho
más alta que en los restantes.
Resurgida a partir aproximadamente de 1975, la susodicha teoría
se fue consolidando por aquellos años en el imaginario colectivo y no
pasó mucho tiempo antes de que aparecieran artículos de prensa, co-
mentarios en revistas ligeras, biocalculadoras, programas informáticos,
y hasta equipos que permitían identificar los «días críticos» ubicados
en áreas comerciales y aeropuertos al lado de las máquinas que permi-
tían adquirir refrescos o emparedados.
En ese contexto vino a verme un entusiasmado anestesista con el
ruego de que le ayudara en el diseño de una investigación relacionada
con la TBR. Su propósito era valorar la eficacia de un programa que,
al fijar el momento de las operaciones, eludiera los días críticos de los
pacientes. De inmediato se me ocurrió un esquema elemental: configu-
rar aleatoriamente dos grupos de pacientes llamados a ser intervenidos
quirúrgicamente en un futuro inmediato; fijar la fecha de la operación

en un día crítico para los integrantes de uno de los grupos y eludir
tales días para los del otro. La expectativa del anestesiólogo sería con-
seguir una sensible disminución en la frecuencia de desenlaces
indeseados para los sujetos incluidos en el segundo respecto de la que
tuvieran aquellos del primero.
Sin embargo, acuciado por una fuerte intuición de que la susodi-
cha TBR podría ser descabellada, antes de enrolarme en tal esfuerzo,
decidí indagar acerca de sus bases teóricas potenciales, así como de
los supuestos avales empíricos que estarían respaldándola. La res-
puesta que al respecto me diera el propio anestesista ya fue bastante
decepcionante o reveladora: él había leído un artículo sobre la TBR
en una revista soviética. Se trataba de una publicación informal que
por entonces aparecía mensualmente en varios idiomas llamada Sput-
nik. Pero en aquella época era común en Cuba que el hecho de que
un tema cualquiera fuera objeto de estudio en la Unión Soviética
bastara para que muchos le confiriesen automáticamente un hálito
de seriedad.
Me di a la tarea de buscar referencias serias sobre la TBR. Mi sen-
tido común me hacía valorar como insólita la exacta regularidad de
los ciclos y su idéntica influencia en todos los seres humanos; en prin-
cipio la teoría parecía matizada por un determinismo ingenuo y rígido,
que adquiría por esa vía un carácter místico. La sospecha de super-
chería se torna mayor cuando se repara en que «las condiciones
iniciales» se reducen a un solo dato: la fecha de nacimiento del sujeto.
En realidad todo el planteamiento parecía de una notable puerilidad.
Pero la revisión bibliográfica disipó toda duda: la teoría en cuestión
carecía de respaldo teórico alguno —ni anterior ni posterior a su for-
mulación— y su origen entroncaba con pensamientos delirantes; su
defensa se basaba en anécdotas y excepciones, y el aluvión de críticas
de todo tipo sobre sus notables y numerosas endebleces resultaba
aplastante. Todo aquello, en fin, no era más que una patraña, capaz de
seducir por partes iguales a incautos o farsantes. Publiqué entonces
un artículo con un resumen de tales pesquisas y reflexiones (Silva,

1984) e hice más tarde un análisis detallado del tema debido al interés
que ofrecía como ejemplo integral (Silva, 1997) del modus operandi de
la pseudociencia.
Ahora me interesa, sin embargo, adicionar una anécdota de algo
acaecido en el contexto de aquel empeño. Es un breve relato que
ilustra vívidamente la afirmación del notable investigador Murray Gell-
Mann, ganador del Premio Nobel cuando incisivamente resumía la
esencia del asunto: «La pseudociencia es la disociación entre la creen-
cia y la evidencia» (Collazo, 1995).
Entre los materiales que cayeron en mis manos como parte de la
búsqueda bibliográfica, apareció un pequeño libro escrito por un fisió-
logo soviético, académico universitario dedicado a la Cronobiología.
Puesto que a todas luces se trataba de un trabajo realizado por un cien-
tífico racional y serio, ofrecía para mí particular interés ya que —en
caso de que allí se hiciera una valoración crítica de la TBR— el mito de
que dicha teoría contaba con «el aval de los soviéticos» se desmorona-
ría. Aunque para mí era evidente que «los soviéticos» no eran un bloque
monolítico con criterios unánimes (y sospechaba que allí habría canta-
mañanas y cultores de la banalidad como en cualquier sitio), el peso
psicológico capaz de ejercer el ya mencionado artículo de la revista
Sputnik conspiraba contra mi argumentación.
Pero surgió un problema serio: mis conocimientos de lengua rusa
eran muy poco más que nulos… y el ejemplar del libro que poseía
estaba escrito en ese idioma. Sólo contaba con una traducción del
título. Siendo así, apelé a un recurso que, afortunadamente, estaba a
mi alcance inmediato; en la oficina contigua a la mía trabajaba una
doctora en medicina española pero que había nacido en Moscú y vivi-
do allí sus primeros 10 años. Le expliqué la situación y, para mi
sorpresa, se apresuró a decirme que conocía del tema y que estaba tan
atraída por la TBR como el anestesista. Intercambiamos algunas ideas,
pero ella no parecía muy inclinada a apearse de sus entusiastas con-
vicciones.
En ese punto le rogué que me leyera en castellano el índice del

libro. ¡Y, felizmente, apareció lo que yo esperaba! Uno de los epígrafes
finales se titulaba «Lejos de la ciencia». Cuando me lo leyó íntegra-
mente, pude comprobar que allí se desenmascaraba sucinta pero
radicalmente la famosa TBR.
Al terminar la lectura le pregunté qué pensaba ahora. Sus puntos
de vista anteriores no se habían modificado un ápice; esto me sor-
prendió, pero no tanto. En definitiva, no tenía por qué compartir todas
las opiniones del académico. Lo que me llenó de estupor fue que reac-
cionaba como si lo que acababa de traducirme expresara lo contrario
de lo que realmente yo había oído de su propia voz. Ni siquiera cuan-
do le llamé la atención acerca del título elegido para el epígrafe, mi
traductora ocasional llegó a admitir que este académico pusiera real-
mente en duda el poder de la teoría de los biorritmos.
Ese día comprendí cuán difícil es que la racionalidad penetre en
una mente de antemano anestesiada por ideas fijas o necesitada de
ellas. Con los años, he comprobado una y otra vez lo mismo. Park
(2001) relata que asistió a una conferencia de prensa en la cual dife-
rentes terapeutas alternativos iban exponiendo sus respectivas teorías
a título individual. No tenían nada que ver unas con otras: ora era un
homeópata, ora un especialista en «toque terapéutico» o un practican-
te de la cromoterapia. El sentido común indica que un científico
convencido del poder de las pirámides, pongamos por caso, no tiene
por qué contemporizar con una teoría absolutamente ajena a dicho
procedimiento como pudiera ser la «terapia floral». Pero esto jamás
ocurre. Park testimonia que percibió que allí no había ninguna sensa-
ción de conflicto:
"Mientras uno hablaba, los demás asentían con la cabeza… Entreví

entonces por primera vez qué es lo que mantiene unidas a todas las
terapias alternativas: no hay ninguna disensión interna en una comu-
nidad que se siente sitiada desde el exterior."
Volviendo a la TBR, me quedé sin aliento cuando comprobé en

pleno 2008 que el socorrido buscador Google arrojaba más de 100
mil entradas donde se aborda el tema de la obtusa teoría de los biorrit-
mos en idioma ingles (para corroborarlo, basta poner «biorhythms»
"23", "28", "33"). En algunos de estos sitios se hallarán valoraciones
críticas o demitificadoras, pero la abrumadora mayoría se ocupa de
exaltar las virtudes predictivas de la TBR. No siempre es fácil deslin-
dar cuáles de estos elogios responden a la ignorancia, falta de rigor o
incultura científica de los valedores o voceros de la TBR, y cuáles a
mero oportunismo descarado de quienes mercan con la candidez y la
credulidad de la gente. En cualquier caso, alguien que pertenece al
primer grupo o se encuentra entre quienes están dispuestos a ponerse
en manos de los segundos, tiene oportunidades sobradas de ejercer su
inocencia comprando programas informáticos que anticipan sus «días
críticos» (Figura 4.1), tales como Biorhythms for Windows Pro puesto
a la venta en 2005 por la módica suma de 60 dólares (http://
www.acutech.com/daniunas/ ).
Figura 4.1. Pantalla de Biorhythms for Windows Pro (2005).

UN DISLATE BÍBLICO
El relato que se expone a continuación es algo extenso. Cons-
tituye un curioso ejemplo en el que se integran el sensacionalismo,
la manipulación mediática, el ingenio, el mercantilismo y la esta-
dística para dar lugar a un producto intelectual aberrado que
encarna a la perfección el modus operandi de la pseudociencia.
Debido a esa «integralidad» y a pesar de ser una digresión, ya que
no está vinculado al ámbito sanitario, me ha parecido atractivo
insertar de manera pormenorizada algo que comenzó por ser un
mero acertijo matemático.
Acerca de un acertijo
En agosto de 1994, Statistical Science, una prestigiosa revista cientí-

fica dedicada a la estadística, publicó el artículo titulado «Equidistant
Letter Sequences in the Book of Genesis» (Secuencias equidistantes
de letras en el libro del Génesis) bajo la firma de tres autores israelíes:
el físico teórico Doron Witztum, el matemático Eliyahu Rips y el in-
formático Yoav Rosenberg.
Witztun, Rips y Rosenberg (1994) (véase foto del autor princi-
pal en la Figura 4.2) dicen demostrar que en el Libro del Génesis se
hallan ocultos diversos mensajes susceptibles de ser ahora revela-
dos mediante las computadoras. En el artículo explican un
procedimiento de conformación de palabras (que describo más
adelante), con el cual buscaron en el Génesis emparejamientos en-
tre los nombres de una lista de rabinos célebres y sus respectivas
fechas de nacimiento y muerte. Según informaban, la concordan-
cia encontrada entre nombres y fechas era de tal magnitud que
resultaba de todo punto imposible atribuirlas al azar si se examina-
ban bajo el prisma de las probabilidades.
Figura 4.2. Doron Witztum descifrando mensajes secretos en la Biblia.
Para que se entienda mejor la naturaleza del hallazgo comunicado

a Statistical Science, pongo un ejemplo que en su esencia es similar a lo
que hicieron los tres autores mencionados. Imagine que Ud. confor-
ma una lista con los nombres de los 7 músicos más destacados de la
historia de América Latina y pone a la derecha sus respectivas fechas
de nacimiento. Luego toma el libro Don Quijote, escrito siglos antes de
la existencia de estos músicos, y sugiere que, en lugar de leerlo de
manera normal, Ud. ha de seguir cierto algoritmo general para formar
palabras usando las letras contenidas en esa novela. Al aplicarlo, se
halla que los nombres de aquellos músicos y las fechas de nacimiento
respectivas van emergiendo del texto. Finalmente, examina el hallaz-
go desde la perspectiva formal de la estadística y, teniendo en cuenta
lo que se buscaba, así como el algoritmo empleado, halla que la pro-
babilidad de que tal suceso hubiera ocurrido solo por azar es inferior a
1 en 10 millones. Tomando rabinos israelíes en lugar de músicos lati-
noamericanos, el libro del Génesis en lugar de Don Quijote y usando un
algoritmo que se explica más adelante, eso fue lo que a grandes rasgos
presentaron Witztun, Rips y Rosenberg a la revista.

El artículo fue sometido al criterio de tres árbitros, quienes no
pudieron hallar fisuras en el cálculo de las probabilidades, de modo
que finalmente se decidió publicarlo en calidad de acertijo (puzzle)
para los lectores, según comunicara explícitamente en la presenta-
ción el editor de Statistical Science, Robert Kass, quien textualmente
escribió:
"Nuestros árbitros quedaron desconcertados: sus convicciones pre-

vias les hacían pensar que no era posible que el Libro del Génesis
contuviera referencias a individuos actuales; pero al realizar análisis y
comprobaciones adicionales, el efecto se mantenía. Este artículo se
ofrece en Statistical Science como un acertijo concebido como desa-
fío intelectual para nuestros lectores."
Nace un bestseller
Ni corto ni perezoso, un ex periodista del Washington Post nom-

brado Michael Drosnin escribió en 1997 un libro titulado The Bible
Code (Drosnin, 1997) donde afirma haber realizado su propia indaga-
ción siguiendo el método usado en este artículo y haber hallado una
sorprendente serie de revelaciones
Particularmente impactante resultaba el vaticinio (realizado 3000
años antes) del entonces reciente asesinato de Itzhak Rabin. Según
sus declaraciones:
"La Biblia tiene la forma de un gigantesco crucigrama. Está codificada

de principio a fin con palabras que, al conectar entre sí, revelan una
historia oculta [...] Hay una Biblia debajo de la Biblia."
En la contratapa de la primera edición del libro, la editorial escribe:

«El código ha sido descubierto por un matemático israelí, quien presen-
tó la demostración en un Journal científico de primer nivel, y ha sido

convalidado por famosos matemáticos de todo el mundo.» En poco
tiempo, las ediciones se multiplican en varios idiomas (Figura 4.3).
Figura 4.3 Ediciones del bestseller El código de la Biblia.
El método de las secuencias equidistantes
Antes de avanzar en el análisis de estas revelaciones y de otros

asuntos conexos, bosquejaré el modo en que, según la teoría del trío
israelí, recreada por Drosnin, pueden hallarse los códigos secretamen-
te incrustados en un texto dado (bíblico o no).
Se convierte el texto de que se trate en una secuencia continua de
letras, eliminando espacios y signos de puntuación (en el caso del
Génesis se tendría así una retahíla de 78.064 letras hebreas).
Se considera un segmento de dicha secuencia y se organiza en for-
ma de matriz rectangular de letras.
Después se indica a un programa de computadora que busque
nombres, palabras o frases que el usuario proporciona. El ordena-
dor empieza la búsqueda por la primera letra y va probando todas

las posibilidades, formando palabras con las letras que aparecen
cuando se dan saltos de 1, 2, 3… caracteres. La búsqueda se repite
empezando por la segunda letra, y así sucesivamente hasta la últi-
ma.
Al encontrar una de tales palabras formada por la unión de letras
con la mínima separación fija posible, el ordenador reorganiza el texto
de forma que esa palabra se pueda leer íntegramente y forma una
«matriz» de caracteres, cuyas filas tienen como longitud el número de
letras que forman la palabra clave.
Consideramos como ejemplo los dos párrafos que Ud. acaba de
leer, pero ahora en forma de retahíla, tal y como se recoge en el recua-
dro.
despuesseindicaaunprogramadecomputadoraquebusquenombrespalab
rasofrasesqueelusuarioproporcionaelordenadorempiezalabusquedapo
rlaprimeraletrayvaprobandotodaslasposibilidadesformandopalabrasconlaslet
rasqueaparecencuandosedansaltosdecaractereslabusquedaserepiteempez
andoporlasegundaletrayasisucesivamentehastalaultimaalencontrarunadetalespala
brasformadaporlauniondeletrasconlamnimaseparacionfijaposibleelordenadorreorg
anizaeltextodeformqueesapalabrasepuedaleerintegramenteyformaunamatrizdel
etracuyasfilastienencomolongitudelnumerodeletrasqueformanlapalabraclave
El texto del recuadro es el mismo de los dos párrafos escritos por

mí, pero despojado de las tildes, espacios, números, comas, puntos,
etc. Esa es la materia prima de la matriz que habrá de conformarse si
se quisieran hallar mensajes secretos.
La matriz en cuestión tendría la siguiente forma1:
1
Para que la matriz sea rectangular, como exige el algoritmo, para formarla se han
quitado las últimas 27 letras de las que figuran en el recuadro. La matriz resultante es en
este caso cuadrada; tiene 529 letras (23 filas y 23 columnas).
Figura 4.4. Texto de dos párrafos ordenados en forma matricial.
A continuación se buscan en esa matriz otras palabras relaciona-

das con la originalmente buscada en cualquier orientación posible
(vertical, horizontal o diagonal) y en cualquier dirección (ascendente,
descendente, de izquierda a derecha o viceversa). Nótense la «apari-
ción» de las palabras REAL, SACA, ORDEN, CASA y PESAR luego
de examinar la matriz según la regla descrita.
Finalmente, se «descubre» el mensaje que dichas palabras evocan.
Debe apuntarse un hecho singular que facilita las cosas: en he-
breo, las vocales se escriben como signos de puntuación, los que
han de ser removidos en el proceso. Esto facilita los hallazgos, ya
que, por ejemplo, diremos haber hallado la palabra «farsa» si encon-
tramos la secuencia «frs». Pero si buscamos la palabra «fresa» o «fieras»
también podremos afirmar haberla hallado una vez que tropezamos
con «frs».
El hecho es que, siguiendo ese método (que luego ilustraré con

más detalle) el autor del libro consigue que «emerjan» varias profecías
presuntamente contenidas en el texto bíblico.
Netanyahu no es asesinado
Lo primero que presenta el libro es un caso simple pero muy espec-

tacular: una matriz donde las palabras «Itzhak Rabin» están en una
vertical atravesada horizontalmente por la frase «asesino que asesina-
rá». Poco más adelante, el «código de la Biblia» se emplea en varias
matrices que contienen el anuncio de diversos acontecimientos inter-
nacionales recientes.
Drosnin, quien se declara escéptico en materia religiosa, procura,
en apariencia, encarar con «objetividad científica» el asunto. Entre
otras cosas, especula con la posibilidad de que seres extraterrestres
poseedores de un enorme avance tecnológico pudieran haber interve-
nido en la redacción de la Biblia y desarrolla una confusa reflexión
sobre ovnis y encuentros cercanos que desemboca en la afirmación
de que: «Tras los "milagros" del Antiguo Testamento, se esconde una
tecnología avanzada».
Y así se llega al punto crucial: una matriz donde presuntamente se
anuncia para 1996 un viaje a la capital de Jordania del recientemente
elegido nuevo presidente de Israel, Netanyahu, durante el cual éste
sería asesinado.
El hecho desconcierta un poco al lector. El libro se escribió en
1997 y todo el mundo sabe que Netanyahu no fue asesinado el año
anterior a la publicación del libro.
Como dijimos, en la misma matriz donde se predecía la elección
de Netanyahu como nuevo primer ministro de Israel, se anunciaba
su asesinato. La tensión va aumentando a lo largo del relato de los
hechos históricamente acaecidos en aquellos años de la década del
90. El clímax se alcanza cuando Netanyahu anuncia un viaje a Am-
man, para entrevistarse con el rey Hussein de Jordania, ocasión en

que, según el mensaje secreto, se produciría el crimen. Revisando la
matriz donde se hablaba de Netanyahu, Drosnin encuentra especta-
cularmente la expresión «julio a Amman», de modo que hasta ahí,
hechos y profecías ocultas concuerdan a la perfección.
Pero Drosnin nos recuerda que el viaje de Netanyahu a Jordania
había tenido que ser aplazado debido a una súbita e inesperada enfer-
medad del rey Hussein, y lo cierto es que Netanyahu no pudo ir a
Amman hasta el 5 de agosto.
¿Se había equivocado el código de la Biblia? El «primer minis-
tro Netanyahu» fue «a Amman», tal como estaba anunciado desde
hacía tres mil años, pero no en «julio» como aseguraba el código,
sino en agosto. Drosnin cuenta al lector que en medio de un gran
desconcierto, fue a ver a Eliyahu Rips, quien le hizo notar que
justo encima de «julio a Amman» aparecía la palabra «postergado».
Drosnin hechiza al lector como un encantador de serpientes: avanza
despaciosamente cautivándolo primero con sus fabulosos descubrimien-
tos, aunque sembrando casi imperceptiblemente algunas dudas. Pero,
ya casi al final, cuando se ha conseguido un clímax de gran expectación,
nos viene a decir que todo podría ser un monumental error. Es enton-
ces, como en las mejores (o peores) películas de matinée, cuando todo
parece perdido, entra en acción la sagacidad de Eliyahu Rips (uno de
los autores del artículo original) y con ella, ¡aparece la clave salvado-
ra!: la providencial palabra «postergado», con la cual no sólo se recupera
toda la coherencia sino que se reconfirma la prodigiosa capacidad
predictiva del método y la no menos asombrosa verdad de que hay
una «Biblia debajo de la Biblia».
Figura 4.5. El matemático Eliyahu Rips salva la situación.
Cualquier mente sensata puede comprender que si se hubiera pro-

ducido realmente el asesinato de Netanyahu, Drosnin no hubiera
buscado en la matriz una palabra salvadora («postergado»), o simple-
mente no hubiera llamado la atención sobre ella. ¿Una prueba de tal
afirmación? Hela aquí: sobre la matriz que figura en la mismísima
portada del libro, que es aquella donde se profetizaba la muerte de
Rabin (esta sí ocurrida), los expertos que han trabajado en el desmon-
taje de toda esta absurda fábula hallaron la palabra «postergado» varias
veces (¡tres de ellas atravesando el nombre del asesino, Amir!). O
bien Drosnin no la buscó en este caso (no le hacía falta), o bien la
encontró y se ocupó muy bien de no comunicarla (no le convenía).
Es curioso cómo pueden funcionar, incluso en la era digital, los
viejos trucos que ya habían patentado los brujos de tribu de cualquier
civilización conocida, y adoptados a lo largo de los siglos por todo
tipo de farsantes, buscavidas, impostores y prestidigitadores de feria.
Hágase el negocio, y el negocio se hizo
Pero lo cierto es que el libro tuvo un gran éxito editorial, y Drosnin

se hizo rico con él. Se trataba de un pingüe negocio; de modo que no
tardaron en aparecer advenedizos aspirantes a los huevos de oro de

esa gallina. Al calor del cabalismo milenarista por entonces en boga
(concluía el segundo milenio) se produjeron vídeos, libros paralelos,
paquetes de software y productos similares, todos basados en el Códi-
go de la Biblia, los cuales se han seguido comercializando hasta el día
de hoy.
Los más vendidos paquetes informáticos que permiten aplicar el
código son CodeFinder: Millennium Edition, Bible Codes 2000, ABC
Decoder, Unlocking the Bible Codes, Bible Decoder Torah Codes 2000
y Bible Code Oracle.
Figura 4.6. Pantalla de trabajo del software Bible Code Oracle.
En ese punto se destapó la caja de Pandora: una serie interminable

de profecías, vaticinios y corroboraciones de la capacidad predictiva
de la Biblia fue cobrando vida. Entre ellos, como no, se halló el anun-
cio de los atentados del 11 de septiembre a las torres en Manhattan
(véase Figura 4.7).
Figura 4.7. Vaticinio del atentado en Nueva York hecho

por la Biblia 3000 años antes.
Desde luego, ante tal amasijo de dislates, y teniendo en cuenta que

se invocaban argumentos aparentemente científicos para arroparlo,
no tardaron en aparecer numerosas objeciones y llamados al sentido
común por parte no sólo de científicos serios, sino también por no
menos serios teólogos especialistas en sagradas escrituras, unos y otros
irritados por la farsa.
Moby Dick entra en acción
Acosado por las críticas, Drosnin tuvo la malísima idea de comuni-

car que, si similares vaticinios a los que él había encontrado en la
Biblia fuesen hallados en la novela Moby Dick, entonces dejaría de
sostener su doctrina. Textualmente, declaró a Newsweek (Junio 9, 1997):
«When my critics find a message about the assassination of a prime
minister encrypted in Moby Dick, I'll believe them».
Cavó su tumba: en menos de una semana, empleando la técnica de
las Secuencias Equidistantes de Letras los objetores hallaron diversos
vaticinios de ese tipo en la famosa novela de Melville (véase http://
cs.anu.edu.au/~bdm/dilugim/moby.html), en particular, los asesina-
tos de Leon Trotsky, Martin Luther King, Abraham Lincoln, Indira

Gandhi y John F. Kennedy y, para rematar, ¡también el de Yitzhak
Rabin!
He aquí un ejemplo. Configurando una matriz según los métodos
descritos por Drosnin, pero usando la novela Moby Dick, se obtuvo lo
que muestra la Figura 4.8.
Figura 4.8. Moby Dick profetiza el magnicidio.
Como puede apreciarse, allí aparecen las palabras y frases siguien-

tes:
Kennedy - had been so killed - shoot - head - remained invisi-

bly enshrined within - he stood very quietly - coffins
La exégesis es bastante simple:
Kennedy ha sido asesinado, baleado en la cabeza por un asesino

que esperaba silenciosamente en un lugar oculto.
Con el tiempo, los desenmascaradores de esta patraña han hallado

en los textos más diversos todo tipo de vaticinios (incluyendo la muerte
del propio Drosnin, pero también hechos como el inexistente asesina-
to de Winston Churchill o el escándalo Clinton-Lewinsky).
Por mera diversión y sin contar con programa informático alguno

(lo cual hubiera potenciado el proceso) no pude sustraerme a la tenta-
ción de inspeccionar con la técnica de Drosnin la segunda parte del
texto escrito por mí, expuesto en forma de retahíla, y luego de matriz,
en el apartado El método de las secuencias equidistantes, p.222, de este
libro. Tras aplicarlo obtuve lo que sigue:
Figura 4.9. Palabras "incrustadas" dentro de la configuración matricial.
Las aparición de las palabras ONCE - CONTRA - REO - NAO -

RUTA - MAR - BALA (dos veces), III (dos veces) - SOS - NADO
(Figura 4.7) podrían llevarme a pensar que en mi propio texto se halla-
ba, secretamente incrustado, el anuncio de un acontecimiento acaecido
en Cuba en marzo de 2003. Se trató del intento de desviar una nave
«nao» por parte de «once reos» de su «ruta» en el «mar», disparando
«balas contra» los tripulantes, hecho que ocurriría el mes «3» del año
«3» de este siglo, secuestro que no se consumó debido a que, tras una
solicitud de ayuda «SOS», los rehenes se escaparon a «nado».
¿Traído por los pelos? Pues no, ese es exactamente el estilo de la
interpretación que Drosnin y sus seguidores aplican a las matrices.
Quedaba así empíricamente demostrada la falsedad de todo este
andamiaje. Sólo restaba esclarecer el enigma estadístico que había
planteado Statistical Science en 1994.
La refutación estadística
Cinco años después de la publicación original de Witztun, Rips y

Rosenberg, cuatro conocidos investigadores publican en la propia re-
vista en que se inició toda esta historia un detallado estudio matemático
que explica por qué los «mensajes» pueden aparecer en cualquier texto.
El nuevo artículo, firmado por un afamado matemático australiano y
tres científicos de la universidad de Jerusalén (Brendan Mc Kay, Bar
Natan, Bar Hillel y Gil Kalai respectivamente) demuestra, además,
que el truco de los emparejamientos de los nombres de los rabinos
con sus fechas de nacimiento se basó en la manera elegida para nom-
brarlos y en el modo de identificar las fechas de nacimiento. Lo que
hicieron estos cuatro investigadores, en esencia, fue lo siguiente (Mc
Kay et al., 1999):
1. Pedir a diferentes especialistas que enumeraran a los «rabinos más

célebres». Las listas obtenidas, naturalmente, distaban de ser idénticas
(si preguntamos a diferentes musicólogos quiénes han sido los 7 músi-
cos más importantes en América Latina, algunos pondrán a Silvio
Rodríguez y otros no, algunos mencionarán a Yupanqui y otros no,
etc.). Los autores del artículo, es evidente, eligieron una que se ajusta-
ra a sus propósitos. Nada más fácil que suplir dos o tres rabinos por
otros si los primeros no permiten llegar a los resultados deseados.
2. Reparar en que cada uno de esos rabinos podrían haberse llama-

do de diversas maneras. ¿Cómo identificar, por ejemplo, que el
primer músico arriba mencionado aparece en una sopa de letras?
Puede ser Silvio, Silvio Rodríguez, Rodríguez, Rodríguez Domín-
guez, SRD, etc. Lo mismo pasa con la fecha de nacimiento (29 de
noviembre de 1946; 29-11-46; 29 XI 1946, vigésimo noveno día
del mes once del año cuarenta y seis, etc.).
3. Descubrir que, si se modificaban las formas de aludir a las fechas y
a los rabinos (así como que si los nominados fueran otros), ya no
era posible reproducir el fenómeno con igual precisión.
4. Hacer un examen similar al del primer artículo pero con la novela
Guerra y Paz de Leon Tolstoi traducida al hebreo (que era de igual
longitud aproximada que el Libro del Génesis) y conseguir resultados
muy similares una vez configurada cierta lista de rabinos para los
que se elegían apelativos y formas convenientes de aludir a sus
fechas de nacimiento.
5. Rehacer los cálculos probabilísticos teniendo en cuenta este modus
operandi.
El desenlace fue contundente: consiguieron un resultado perfecta-

mente coherente con lo que, bajo esas condiciones, cabría esperar por
azar.
El trabajo fue sometido a peer review a cargo de científicos de máximo
nivel (estadísticos líderes en su campo), y se aceptó como demostrada,
más allá de toda duda, la naturaleza nada sobrenatural de los hallazgos
proclamados en el artículo original.
Cabe destacar la Declaración de Statistical Science en ocasión de esta
publicación, hecha el 8 de septiembre de 1999. Como se recordará,
cuando dicha revista publicó el trabajo original en 1994, (y esta es
una de las muchas cosas que Drosnin ocultó en su libro, como tam-
bién escamoteó que los tres autores están íntimamente relacionados
con la organización religiosa judía Aish HaTorah, que utiliza el «códi-
go de la Torah» como parte de su práctica regular), su editor introdujo
dicho artículo advirtiendo explícitamente que la publicación no en-

trañaba ningún tipo de aprobación científica sino que se hacía público
en calidad de acertijo para los lectores.
En la presentación que la revista hace ahora del artículo que con-
tiene la refutación, el editor comenta que, en su momento, ninguno de
los revisores de aquel trabajo había quedado convencido de que los
autores hubieran hallado algo genuinamente asombroso. Recuerda que
lo que permaneció fue la intriga acerca de dónde radicaba con toda
precisión la causa de aquellos hallazgos. Más adelante, escribe tex-
tualmente:
"Desgraciadamente, aunque quizás no tan sorprendentemente, mu-

chas personas fuera de nuestra propia profesión interpretaron la
publicación del artículo como un aval que confería aprobación cien-
tífica al estudio. Sin embargo, aunque los árbitros iniciales habían
pensado detenidamente acerca de fuentes posibles del error, nin-
guno de nosotros estaba dispuesto a gastar el tiempo y el esfuerzo
requeridos para reanalizar los datos detenida e independientemen-
te. De hecho, publicamos el artículo con la esperanza de que alguien
se motivaría para dedicar la energía necesaria a esclarecer lo que
pasaba y con la esperanza de que la disciplina estadística se enriquece-
ría con la identificación de los problemas sutiles que pueden surgir en
esta clase de asuntos. Finalmente, podemos anunciar que Brendan
Mc Kay y sus colaboradores han resuelto convincentemente el
problema y demuestran la invalidez estadística del análisis del artí-
culo original de Witztun, Rips y Rosenberg. El enigma ha quedado
resuelto y la solución puede hallarse en el artículo que ahora pu-
blicamos."
La afirmación divulgada por Drosnin de que los matemáticos del

mundo entero están de acuerdo con sus ideas (así lo dice en su libro)
es esperpéntica.
Drosnin y el premio Nobel
En relación con esta historia, cabe insertar una simpática pincela-

da.
Cada año, a principios de octubre y desde 1991 (más o menos en
las mismas fechas en que se entregan los premios Nobel reales), un
comité internacional, coordinado por la dirección de la revista de hu-
mor científico Annals of Improbable Research, elige a los investigadores
que se han destacado por sus contribuciones «ignobles» al avance de
la Ciencia. Ig-noble, en inglés, significa: «innoble», «ignominioso», «de
mal gusto» o «de baja categoría».
Los premios Ig-Nobel se conceden en una serie de categorías que
parodian a los Nobel reales, y sus contenidos son variados, típicamente
investigaciones que representan las formas más inútiles y absurdas de
perder el tiempo y despilfarrar el dinero de los contribuyentes. El pro-
pósito oficial consiste en «premiar a aquellos individuos cuyas
investigaciones no pueden o no deben ser reproducidas». Se otorgan
diez premios cada año, no necesariamente en las mismas categorías.
En la versión de 1997 el premio de literatura fue concedido, como
resultaba fácilmente imaginable, a Doron Witztum, Eliyahu Rips y
Yoav Rosenberg, de Israel, y a Michael Drosnin, de los Estados Uni-
dos, «por su espeluznante descubrimiento estadístico de que la Biblia
contiene un código secreto oculto». Véase http://www.improb.com/
ig/ig-97.html.
Epílogo del dislate
El trabajo original de Doron Witztum, Eliyahu Rips y Yoav Rosen-

berg es en esencia un ingenioso fraude, ya que los autores se ocuparon
de no comunicar con transparencia la tramposa metodología seguida.
El libro de Drosnin, por su parte, está signado en su totalidad por el
estilo típico de la pseudociencia: ocultar cualquier fisura que se vis-
lumbre y adicionar todo lo que haga falta para que a la postre se con-
firme aquello que de antemano se quiere hacer creer.
Cabe comentar que, aunque ya con resonancias mediáticas mucho
más menguadas y dividendos monetarios mucho menos grandiosos,
Drosnin ha publicado imperturbable un segundo libro: Codes of the
Bible II, The Countdown, del cual se ha dicho que supera ampliamente
en estupidez al primero. Este libro está repleto de ideas delirantes
acerca del Armagedón que nos esperaba en el 2006 (de ahí lo del
countdown, la cuenta atrás). En él se destina una buena parte a la tras-
nochada búsqueda de ciertos «obeliscos» supuestamente dejados en
la Tierra en un pasado muy distante por unos sujetos poseedores de
una inteligencia superior, y otros despropósitos de idéntico tenor.
Pienso que es natural que mucha gente carezca de recursos para
demostrar la falsedad de las afirmaciones que cada tanto hacen los
iluminados, telepredicadores y mercaderes que pululan por doquier,
pero resulta conveniente entrenar nuestro instinto para la detección
de supercherías que, a grandes rasgos, casi siempre exhiben síntomas
bastante claros de serlo.
ALTERNATIVA MÉDICA Y MEDICINA ALTERNATIVA

La medicina no convencional más primaria se da en el contexto de
sociedades que han desarrollado experiencias y formas especiales de
«conocer y saber» acerca de la salud y la enfermedad, configuradas a
través de nociones y conocimientos procedentes de la práctica coti-
diana y espontánea de la gente común, que se sistematiza mediante la
experiencia de la colectividad en largo tiempo (Breihl et al., 1990).
Este saber informal, de indudable valor cultural, es considerado por
algunos salubristas como una conquista secular que es necesario con-
servar o recuperar.
Pero en el marco de sociedades «desarrolladas», cada vez más gen-
te elude la «medicina oficial» y acude a procedimientos marginales o
alternativos, fenómeno que se produce con especial énfasis en países

desarrollados. Por lo general se trata de un justificado acercamiento a
toda una serie de prácticas menos invasivas o más «blandas» para el
cuidado de la salud, a su vez enmarcado dentro de una tendencia
generalizada de regreso a la naturaleza. Se ha ido consolidando así
una marcada recuperación de expresiones médicas tradicionales y, más
generalmente, de lo que ha dado en llamarse la «medicina alternati-
va», «medicina natural» o «medicina no convencional». En un reciente
libro (Shapiro, 2008) donde se expresan duras críticas a la mayoría de
las prácticas médicas «alternativas», se informa que el 42% de los
médicos generales británicos, casi la mitad de los médicos de familia
holandeses y el 85% de los belgas prescriben remedios homeopáticos
a sus pacientes.
La magnitud de este fenómeno puede apreciarse claramente, por ejem-
plo, a través de un estudio nacional realizado en Estados Unidos para
estimar la prevalencia y los costos correspondientes al uso de las prácti-
cas médicas alternativas cuyos resultados son ciertamente impresionantes:
uno de cada tres estadounidenses había consultado a alguno de estos
proveedores de salud en el último año y se estima que en total se produ-
jeron 425 millones de visitas de este tipo en 1990; como elemento de
referencia cabe reparar en que la atención primaria norteamericana ha-
bía producido sólo 388 millones de consultas; por otra parte, estos
pacientes habían pagado por los servicios de medicina alternativa un
total de 10.300 millones de dólares, monto similar a los 12.800 millo-
nes desembolsados ese mismo año por ciudadanos norteamericanos por
concepto de hospitalizaciones (Eisenberg et al., 1993).
En el contexto de todo este desarrollo, han surgido o se han recu-
perado diversas variantes de actuación terapéutica. Las terapias
alternativas producen en términos generales un marco polémico don-
de coexisten dos posiciones extremas, ambas perniciosas: una,
caracterizada por la defensa sectaria y vehemente de estas prácticas;
la otra, consistente en su negación categórica desde posiciones auto-
ritarias. Naturalmente, entre esos dos extremos queda abarcada una
amplia gama de posiciones, en muchos casos matizadas por la confu-

sión y el desconcierto.
A nivel informal, parecería que buena parte de la confusión, suspi-
cacia o recelos mutuos hoy vigentes reposa más en prejuicios de uno
u otro signo que en una reflexión pausada y, a la vez, científicamente
estructurada.
El sabio cubano Fernando Ortiz expresaba casi 60 años atrás (Or-
tiz, 1951):
"Creemos indispensable que sea fomentado el estudio científico de la

terapéutica popular, así tocante a lo charlatanesco y nocivo como a
lo ingenuo y provechoso, ya que la práctica de una medicina empírica,
está muy extendida y, aun siendo absolutamente ilegítima, es fatal-
mente inevitable. Cerrar los ojos ante el mal es necio, cuando no
culpable; porque en definitiva, ninguna sociedad puede condenar inexo-
rablemente a sus individuos a que no acudan al curandero, al santero,
al brujo y hasta al mismísimo demonio, si cuando sufren, no se les
proporciona la asistencia médica que todo pueblo civilizado debe a
sus hijos infelices y sin amparo; lo cierto es que todo pueblo sin mé-
dicos suficientes, capaces y bien equipados a su alcance inmediato,
tendrá los curanderos y los brujos necesarios para el remedio efec-
tivo o iluso de sus males."
Se refería a la realidad cubana de entonces, afortunadamente supe-

rada hoy, gracias al notable y exitoso esfuerzo de la salud pública en
los últimos decenios. Sin embargo, su invocación al estudio científico
de expresiones terapéuticas no convencionales sigue siendo legítima,
por al menos dos razones: porque sería erróneo aceptarlas o rechazar-
las sin un examen serio y, porque el autoritarismo es incompatible con
el talante abierto y reflexivo de la ciencia.
Desde luego, ese examen ha de atenerse a las reglas valorativas que
rigen en la ciencia contemporánea. Son imperfectas y mejorables, desde
luego, pero hasta ahora no hay ningún sistema más eficaz y producti-
vo para realizar verdaderos progresos. La acotación viene al caso por-

que, lamentablemente, no faltan ejemplos de cultores de terapias
«alternativas» que consideran que también para evaluar sus afirma-
ciones hay caminos alternativos. Por ejemplo, la británica UK Society
of Homeopaths ha declarado que «Está bien establecido más allá de
toda duda que los ensayos clínicos controlados no constituyen una
herramienta de investigación adecuada para evaluar la homeopatía».
Esto quiere decir que si se realiza tal ECC y sus efectos resultan ser
iguales a los de un placebo, el motivo del fracaso es que la homeopa-
tía no debe ser evaluada.
Steven Bratman, un decidido cultor de las terapias no convencio-
nales, ofrece un testimonio especialmente interesante. Literalmente
escribe (Bratman, 2008):
"En una época practiqué la medicina alternativa con toda confianza.

Por décadas, la apliqué a mis pacientes y a mí mismo y mi familia, y
asumía que mucho de ella funcionaba. Entonces tuve conocimiento de
los estudios a doble ciega, lo cual fue como un tornado que derriba un
castillo de naipes. Descubrí que yo, como la mayoría de las personas
que adoran la medicina alternativa, cometían un inmenso (aunque
entendible) error. Había pensado que era posible saber si un trata-
miento funcionaba simplemente aplicándolo. Pensaba que podría fiarme
de la tradición, de la anécdota, y de la autoridad. Pero ahora veo las
cosas de otro modo… Muéstreme los estudios a doble ciega, y le
prestaré atención. De otro modo, en lo que a mí concierne, lo con-
sideraré poco más que palabrería."
Por cierto, Bratman advierte con desazón que «mientras ciertos

productos de la medicina verde pueden ser objeto de pruebas sóli-
das, la mayoría de los métodos alternativos no. En casos como la
quiropraxia o la acupuntura no es posible hacer estudios a doble
ciega: quien la aplica inexorablemente conocerá si se ha empleado
el tratamiento real o el falso». Estimo que Bratman se equivoca en
parte. Si se compara la «cirugía psíquica» con cirugía real, realizada

con un bisturí, tiene razón sin lugar a dudas; pero en los casos que
menciona (quiropraxia y acupuntura) y en muchos otros (homeopatía,
terapia floral, piramidoterapia, etc.) sí es posible aplicar cabalmente
las técnicas de enmascaramiento. Para conseguirlo, se trataría de com-
parar dichas técnicas con ellas mismas, solo que aplicándolas en el
grupo de control de manera falsa. Por ejemplo, un grupo podría reci-
bir acupuntura, tal y como establece la ortodoxia oriental (basándose
en los puntos que ella establece, en los «meridianos», etc.), mientras
que en el otro se aplican las agujas en puntos seleccionados al azar.
Quienes creemos que muchas de estas prácticas, de las cuales la
homeopatía es un ejemplo bien claro (véase la Sección siguiente), no
solo carecen de todo respaldo científico sino que contradicen verdades
científicas bien establecidas tenemos una responsabilidad ineludible.
Estamos en el deber de esclarecer qué responsabilidad tiene la prácti-
ca médica convencional y la sociedad toda en el hecho de que un gran
número de personas bien educadas, que se conducen racionalmente
en otras esferas de la vida, se encomienden a procedimientos de los
que tendrían en principio que recelar, habida cuenta de la evidente
presencia de charlatanes y farsantes de toda laya entre sus cultores,
que se amparan en ellas simplemente para ganarse la vida.
Algunas de las modalidades terapéuticas más primarias, como ya
se expuso, pueden dejar beneficios tangibles. Tal es el caso, por men-
cionar algunos ejemplos, de las técnicas de relajación, los masajes, la
hipnosis y muchas expresiones de la llamada «medicina verde». Otras
solo aportan un efecto psicológico en el mejor de los casos, pero crean-
do falsas expectativas de curación, y muchas veces generan, por eso
mismo, daños irreparables. El éxito de tales propuestas es un fenóme-
no escasamente estudiado; pero no es demasiado arriesgado conjeturar
que, ante las reiteradas evidencias de manipulación y comercialismo
extremo de la medicina «oficial», numerosas personas recurran de
manera natural a casi cualquier recurso que exhiba una cara más hu-
mana, especialmente cuando ha tenido experiencias frustrantes con
los sistemas convencionales de salud y no se trate de procesos patoló-

gicos de mucha gravedad.
La relación de los profesionales de la salud con el conocimiento
científico es muy variable pero cabe destacar tres grupos básicos. Hay
algunos que simplemente tragan conocimientos (especialmente infor-
mación que otros han elegido por ellos). Otros profesionales son
capaces de digerir los conocimientos; esto quiere decir, que desean y
pueden procesarlos críticamente. Un tercer grupo está integrado por
quienes adicionan a éstas dos capacidades la de producir conocimien-
tos; esto es: los que pueden hacer investigación científica exitosa. No
todos están en condiciones materiales e intelectuales de integrar el
tercer grupo, pero no es una aspiración descabellada la de reducir al
máximo el primero en favor del segundo. Si las presentes reflexiones
contribuyen a despertar la inclinación por la investigación, estaría muy
satisfecho; pero si sólo ayudan a crear el hábito de digerir la produc-
ción intelectual que se ha consumido, ya será suficiente para sentirme
complacido.
Mi propósito es repasar el pensamiento preponderante en el mun-
do científicamente culto en torno a estas prácticas. Interesa hacerlo
desde una perspectiva capaz de aportar herramientas teórico-meto-
dológicas para su adecuada valoración.
Se trata de construir un discurso teórico-conceptual que, a modo
de ilustración, valore una de las prácticas terapéuticas no convencio-
nales más difundidas en el mundo y que posee un marco teórico
suficientemente desarrollado como para consentir un análisis detalla-
do: la homeopatía.
HOMEOPATÍA: UN PARADIGMA DE ACIENTIFICIDAD

A lo largo de los siglos se ha mantenido una ardua batalla de la racio-
nalidad contra la credulidad. Siendo así, a los que están atrapados en la
trampa de la credulidad les resulta muy difícil tomar un distanciamiento
crítico, pues ello exige ser capaz de escapar de su propio ensimisma-

miento. No obstante, aspiramos a que las secciones que siguen hagan
una modesta contribución para superar la disociación entre evidencia y
creencia que señalara Gell Mann. Por constituir un ejemplo integral-
mente representativo de la irracionalidad pseudocientífica, nos
detendremos en el examen de la homeopatía, aprovechando que en esta
disciplina comparecen, como veremos, virtualmente todos los rasgos
de las pseudociencias y las pseudotecnologías (Silva, 2002).
Orígenes y principios generales de la homeopatía
La terapéutica homeopática es un sistema concebido a finales del

siglo XVIII por Samuel Hahnemann, nacido en Meissen, Alemania, en
1755. Su obra cumbre, publicada en 1810, es conocida como el Or-
gannon (Organnon der Rationellen Heilkunde). Para Hahnemann y sus
seguidores, existe algo a lo que llaman la «fuerza vital», que otorga
«armonía vital» a todos los componentes del organismo, y también
una entidad maligna, conocida como «miasma», que puede desplazar
a la fuerza vital; cuando esta última falta, en palabras del Organnon, el
sujeto «ya no puede sentir, ni obrar, ni hacer cosa alguna para su pro-
pia conservación». La tarea del homeópata, por tanto, se concentra en
restituir la fuerza vital al organismo desposeído de ella.
Figura 4.10.
Samuel Hahnemann (1755-1843).
Debe subrayarse que la homeopatía surge como respuesta o reac-

ción a una práctica terapéutica que se mostraba incapaz de resolver
los problemas de salud más frecuentes, por entonces marcadamente
cruenta debido al empleo de procedimientos tales como amputacio-
nes, potentes eméticos y sangrías. Esa vocación humanizadora
constituye, a no dudarlo, un mérito histórico de Hahnemann, que ha-
bla de su sensibilidad y de su sincero esfuerzo por modificar una
realidad médica inaceptable.
Pero desde el comienzo la homeopatía produjo suspicacias debido
a su honda raigambre idealista y sobre todo a la connotada carencia
de fundamento teórico, fenómeno típico y casi universal en la pseu-
dociencia. Esto era de esperar, pues aunque no se dominaran aún los
resultados de la física y la química de que hoy disponemos, algunas de
las afirmaciones de Hahnemann eran tan descabelladas que no po-
dían sino causar perplejidad en las mentes ordenadas.
La teoría fue creada por un solo hombre hace dos siglos en una épo-
ca en que absolutamente nada se sabía de la existencia de bacterias o
virus, ni endorfinas o neurotransmisores. La capacidad de adaptación a
los nuevos conocimientos sobre la fisiología humana es un rasgo medu-
lar en el desarrollo, cada día, de la medicina moderna y de las técnicas
para diagnosticar y tratar sus desviaciones. La homeopatía, en cambio,
permanece cristalizada en el tiempo en lo que concierne a sus insólitos
principios y su manera de aplicarlos.
En su peculiar monografía Introducción a la homeopatía, Bernard Poi-
tevin, homeópata francés considerado una autoridad mundial en la
materia, expone la teoría de Hahnemann y un amplio abanico de ideas
afines (Poitevin, 1992). El controvertido «investigador» no hace una
sola valoración crítica a la ortodoxia homeopática; se esfuerza en cam-
bio por traducirla a un lenguaje más moderno. El resultado es un texto
cuyo hilo lógico se torna extremadamente difícil de seguir, con pasa-
jes confusos y cuadros incomprensibles. Según esta fuente, la ausencia
de metodología en la medicina de su época fue la que condujo a Samuel
Hahnemann a separarse de su práctica y dedicarse al trabajo de tra-
ductor, hasta que comprendiera que los síntomas descritos para la

intoxicación con quinina eran parecidos a los que presentaban las en-
fermedades tratadas habitualmente con esta planta. Notó que las
substancias que pueden curar ciertas fiebres son capaces también de
provocarlas y, a partir de allí, erige el conjunto de leyes en que reposa
su sistema. Posteriormente aparecen varias escuelas y subtendencias,
pero la forma dominante en los círculos homeopáticos es la llamada
«homeopatía unicista», en alusión al presupuesto hahnemanniano de
que el paciente debe ser tratado con un remedio único y nunca con
una combinación de medicamentos, sean estos homeopáticos o no.
El presupuesto teórico fundamental de la homeopatía (del griego:
la raíz homois significa similar y pathos equivale a enfermedad) es la ley de
similitud, que establece que toda sustancia farmacológicamente activa
provoca en el individuo sano síntomas característicos de dicha sus-
tancia; cualquier alteración de la fisiología normal se singulariza por
un conjunto de síntomas y la enmienda a tal anomalía se consigue
administrando pequeñas dosis de aquella sustancia capaz de producir
los síntomas que exhibe el enfermo. Dicho de otro modo: un agente o
principio activo, cuando se aplica sin diluir a una persona sana, pro-
duce en ella ciertos síntomas, entonces el producto que se obtiene al
diluir dicho agente adecuadamente, sería capaz de curar a un paciente
portador de aquellos síntomas. Puesto que la homeopatía, de ahí su
nombre, para curar emplea el mismo producto que produce los sínto-
mas, sus cultores llaman «medicina alopática» (cura con contrarios) a la
práctica médica regular. Esto constituye, dicho sea de paso, un absurdo
conceptual, pues la medicina convencional no hace compromisos aprio-
rísticos en ese terreno (y, de hecho, en ninguno) ni enuncia reglas
estrechas dentro de las que quede entrampada. Es bien conocido, por
poner un ejemplo, que algunas alergias se tratan con pequeñas dosis de
los propios alergenos. De modo que los términos «médico alópata» y
«medicina alopática» constituyen un engendro dicotomizador de los
homeópatas que carece de toda base lógica o histórica.
Como se deduce de lo anterior, la ley de similitud es independiente

de cuál sea el mal responsable de los síntomas. De hecho, la medicina
homeopática no repara en la etiología: los síntomas y la enfermedad
son para los homeópatas una y la misma cosa. De tal suerte, dos pa-
cientes que exhiban los mismos síntomas tienen el mismo problema
de salud al margen del trastorno fisiológico concreto que los hayan
producido. En rigor, la doctrina homeopática formal va más lejos, ya
que afirma que las enfermedades deben llevar por nombre el del re-
medio que las cura
En torno a esta noción se conforma su segundo principio, la ley de
individualización: la homeopatía se autoproclama como recurso alta-
mente individualizado en el sentido de que a cada paciente le
corresponde un tratamiento único, exclusivo. Tal principio es parcial-
mente correcto pero desconoce que existen relaciones causa-efecto
de valor general, aunque puedan asumir manifestaciones singulares.
Los fármacos homeopáticos
El proceso de preparación de las medicinas homeopáticas consta

de dos pasos: la potenciación del agente (conseguir la superdilu-
ción) y su dinamización, consistente en agitar cada dilución, pues
no basta con remover la mezcla sino que es crucial que se agite soste-
nida y vigorosamente, acto al que llaman «sucusión» del preparado
homeopático, que es el que conferiría el verdadero valor terapéutico
a la droga.
Para captar mejor estas ideas es útil comprender el modo en que se
conforma la dilución final. Una planta, pongamos por caso, se macera
y se disuelve en alcohol. Esta es la «tintura madre» que, si se diluye en
agua en proporción de 1 a 9, produce lo que se denomina una poten-
cia D1. Si este proceso se repite, se obtiene una potencia D2. Si en
lugar de esto, por cada parte de tintura madre se adicionan 99 partes
de agua, se trataría de la potencia C1.
Este proceso se repite varias veces para dar lugar a altísimas dilu-
ciones del componente activo. Así, una potencia D2 equivale a una
C1, una potencia C2 sería el resultado de diluir 100 veces una C1; una
potencia C6 significa que por cada molécula de la tintura madre hay
1.012 moléculas de agua. La afirmación homeopática es que las dilu-
ciones más altas actúan con más fuerza que las menores; de ahí que al
proceso de diluir el principio activo le llamen «potenciación».
Consideremos un ejemplo hipotético que coloca en perspectiva y
simplifica la explicación de lo que todo esto puede significar en térmi-
nos prácticos.
Es bien conocido que la cafeína estimula el sistema nervioso cen-
tral: aumenta el nivel de atención y favorece el estado de vigilia, aunque
también acelera el ritmo cardíaco. El consumo de altas dosis de este
alcaloide produce nerviosismo y ansiedad por ser un estimulante an-
tagonista de la adenosina, que sirve para modular el estado de vigilia
y sueño. Siendo así, según la teoría que hemos repasado, dosis alta-
mente diluidas de esta sustancia tendrían un efecto sedante.
Supongamos que elaboramos una tintura de café extremadamente
concentrada, que vertemos un mililitro de dicha tintura en un litro de
agua y que procedemos a agitar vigorosamente el líquido resultante:
ya tendríamos un sedante sumamente poderoso, puesto que habría-
mos elaborado una dilución extraordinariamente alta de un agente
que en dosis altas produce el efecto contrario. Si luego vertemos este
litro en un camión cisterna que contenga 30.000 litros de agua y con-
seguimos que el camión circule durante algunas horas por vías más o
menos accidentadas, los 30.001 litros habrán sido objeto de una enér-
gica sucusión y habremos producido, partiendo de un solo centímetro
cúbico de café, una cantidad 30 millones de veces mayor de remedio
homeopático contra la alteración nerviosa. Si tomamos un litro de los
30.001 que tiene el camión, lo dividimos en 50 partes y vertemos
cada una de ellas en respectivos camiones cisterna, entonces estaría-
mos consiguiendo un millón y medio de litros de un producto con
capacidad sedante mucho mayor que el de la primera experiencia, ya
que a menor dosis, afirman los homeópatas, mayor efecto. A esta al-
tura habríamos producido 1.500 millones de centímetros cúbicos del
poderoso fármaco a partir del mililitro original de tintura. Es decir,
tendríamos sedante para todos los ciudadanos de la tierra y habría que
ser muy cuidadoso, pues como el efecto sedativo crece en la medida
que aumenta la dilución, éste podría haber alcanzado cotas hipnóti-
cas o somníferas tan altas que pudieran dejar al consumidor del agua
en estado de profundo letargo.
Cuando repiten los insólitos puntos de vista de Hahnemann que nos
conducen a un despropósito de estas proporciones, a los homeópatas
no les importa que contradiga todas las leyes de la farmacocinética.
Puesto que una dilución muy alta, como por ejemplo una C6, ase-
gura que en el producto final ya no quede ni una molécula de la tintura
madre, la homeopatía afirma que el papel activo corre a cargo de «la
memoria del agua»: sus moléculas conservarían el recuerdo del pro-
ducto activo que una vez estuvo en su seno, y éste sería suficiente
para producir el efecto terapéutico.
El descubrimiento en el siglo XIX del físico italiano Amadeo Avogadro
que establece que la cantidad de masa presente en una molécula-gramo
de cualquier sustancia asciende a (6,02) x 1023 moléculas, permitió conocer
que cualquier principio activo, disuelto en agua a la usanza homeopática,
produce un resultado del cual ha desaparecido por completo ese principio
activo. Esto constituyó un duro golpe para quienes creían que este sistema
de ideas pudiera tener fundamento científico. La mencionada ley vino a
dar una estocada mortal a las bases de esta disciplina, ya que, si bien hasta
entonces ellas eran netamente especulativas y voluntaristas, aún no habían
sido teóricamente refutadas. Por eso la medicina y la farmacología basadas
en la ciencia constituida sostienen que los fármacos homeopáticos, al no
contener nada, no ejercen acción terapéutica alguna a excepción de un
ocasional efecto placebo.
Es interesante detenerse en el comentario que hace un teórico de
la homeopatía sobre este problema. En su libro Epistemología y Medici-
na escribe sin ruborizarse (Lasprilla, 1992):
"El estar acostumbrado a la quimioterapia, al concepto organicista y

mecanicista de la medicina alopática, ha llevado a mucha gente a no
reconocer en las dinamizaciones altas de la homeopatía, substancias
medicinales reales. Como en ellas ya no es detectable el soluto por
procedimientos químicos, deducen fácilmente que no hay droga y,
por lo tanto, si se opera una curación es por pura sugestión. Si estu-
diaran la filosofía, la terapéutica y la farmacodinamia homeopáticas
no llegarían a esa triste conclusión."
Sugiero a cualquier lector de este libro que no pierda tiempo bus-

cando información alguna (o cita donde hallarla) sobre aspectos ni de
la filosofía, ni de la terapéutica, ni de la farmacodinamia que expli-
quen este misterio: no los hallará. Resulta desconcertante a la vez que
revelador que, luego de tan promisoria como pomposa invocación al
estudio, el autor no vuelva a abordar el tema en su voluminoso trata-
do. Sólo atina a agregar lo siguiente:
"Supongamos que un paciente que no cree en la homeopatía, aun

contra su voluntad se mueve a la consulta. El homeópata le prescribe
la droga que concuerda con su cuadro clínico. Aunque no le tenga fe
a lo que va a tomar, se cura. Porque no es un problema de fe, es un
problema de leyes naturales. Por otro lado, ya existen aplicaciones
de la homeopatía en animales y plantas. ¿Cómo podría operar la su-
gestión aquí?"
El autor nos comunica sin más trámite que tal paciente «se cura».
¿Será que tenemos el deber de aceptar, a la manera en que debían
creerse los dogmas tolomeicos en el medioevo, que eso ocurre siem-
pre? Personalmente preferiría que citara experiencias replicables,
con enmascaramiento y asignación aleatoria, que permitieran com-
parar las tasas de recuperación en el grupo homeopáticamente
tratado con las de un grupo tratado con un placebo (simplemente
agua, por ejemplo).
Pero el segundo «argumento» es mucho más espectacular: ¿Qué

valor tiene el dato de que «ya se esté» aplicando la homeopatía a las
plantas y a los animales? El mismo que si se nos informara que «ya se
está» aplicando el psicoanálisis a edificios deteriorados con el fin de
repararlos. ¿Cuáles y cómo son los estudios concretos? ¿Cuáles sus
resultados? y, sobre todo, ¿cómo puede aplicarse a plantas y animales
una medicina que, según se proclama una y otra vez en el propio libro,
tiene profunda raíz antropológica? Allí se insiste machaconamente en
la unidad psico-fisiológica del paciente y la necesidad de escrutarla
para poder conocer los procesos espirituales que angustian al pacien-
te, cuyo conocimiento es imprescindible unir a los síntomas orgánicos
para poder elegir el remedio homeopático debido. Es una lástima que
el autor haya dejado pendiente para otra ocasión comunicarnos cómo
se las arreglan los homeópatas para averiguar los trastornos psico-
afectivos de una planta específica que esté enferma por carencia de
clorofila, o las angustias existenciales de un perro que presente sínto-
mas de anorexia.
En este contexto cabe esclarecer una vieja confusión y el sofisma
asociado. Uno de los elementos que han influido en que se conceda
cierta credibilidad a la homeopatía es que las vacunas, procedimiento
admitido y practicado por la medicina oficial, está inequívocamente
basado en los principios homeopáticos.
En primer lugar, debe enfatizarse que la medicina no está atrapada
en dogmas: si una sustancia que a altas dosis es nociva, resulta ser
beneficiosa en dosis pequeñas, la emplea sin complejos de culpa. En
segundo lugar, la vacunación es un recurso preventivo, no curativo2. En
tercer lugar, su aplicación se basa en el conocimiento preciso del me-
canismo de acción inmunitaria sobre el que la vacuna consigue actuar;
al inocularse una vacuna, se suministra una dosis perfectamente cuan-
tificada y, desde luego, no diluida hasta desaparecer sino en magnitud
2
No olvidar que la prevención es una noción ignorada tanto por la teoría como por la
praxis homeopática; esto se debe a que su esencia anquilosada no permite adaptarse a
cánones inexistentes en la época en que se inventó.
suficiente como para que genere una respuesta inmunológica protec-

tora, a la vez que insuficiente para producir daños irreversibles.
Un último apunte cabe realizar sobre los fármacos homeopáticos:
debido a las altísimas diluciones que supuestamente los hacen más
potentes, la realidad es que no existen procedimientos químicos de
índole alguna que permitan distinguirlos del agua común y corriente.
Es decir, si Ud. tiene un preparado homeopático, la única manera de
saber si ha pasado por el proceso que lo convierte en tal es el testimo-
nio de quien se lo haya entregado. El agua homeopáticamente agitada
comparte una propiedad esencial con el agua piramidalizada y el agua
bendita: es imposible distinguir cualquiera de ellas tres del agua co-
mún. Es bien conocido que desde 2002 hay un millón de dólares
esperando por alguien que sea capaz de hacer la distinción bajo con-
diciones controladas en laboratorio (véase http://www.randi.org/).
Figura 4.11. Las aguas indistinguibles.

Una tautología salvadora para salir del laberinto
A partir del descubrimiento de Avogadro, la homeopatía perdió

gran cantidad de adeptos, y la mayoría de los que se han mantenido
adheridos a ella se han atrincherado durante más de un siglo y medio
en una argumentación sumamente endeble: «no sabemos por qué; el
asunto es que produce resultados», como proclama en su número in-
augural un journal dedicado a las terapias alternativas el cual, no por
casualidad, incluye en su primer número una especie de editorial (Carls-
ton, 1995) titulado El mecanismo de la homeopatía: lo único que importa es
que funciona.
Otros aluden a ciertas leyes alternativas, como si las leyes químicas
pudieran derogarse según convenga o no, cual meras regulaciones ad-
ministrativas, y como si no fuera menester exponer con transparencia
cuáles son esas presuntas leyes de la ciencia que liberan a la homeopatía
de sus incoherencias. Por ejemplo, un homeópata cubano borra orondo
de su universo intelectual a toda la física cuando comunica a la prensa:
«La función del medicamento homeopático es energética, y su potencia
se explica por las leyes físicas, no químicas» (de la Osa, 1999).
Sin embargo, la base en que predominantemente se apoyan estos de-
fensores de la homeopatía es la confusa secuencia de anécdotas
confirmatorias que enarbolan. Los artículos que suelen aparecer en revis-
tas especializadas de homeopatía (por ejemplo, Homeophatic British Journal) llaman
la atención, precisamente, por la copiosa y florida reseña de casos parti-
culares de pacientes que, virtualmente siempre, se curan tras algún
tratamiento homeopático. Sus autores no pestañean siquiera cuando se
les llama la atención sobre la consabida falacia de razonar mediante el
ingenuo silogismo post hoc, ergo propter hoc3, ni cuando se les reclama que en
lugar de esgrimir anécdotas espectaculares, se manejen en términos de
tasas de recuperación de los pacientes tratados y dentro de marcos expe-
rimentales protocolizados.
3
Posterior a esto; luego debido a esto.
En este punto cabe examinar las singulares reflexiones contenidas

en el ya citado libro del colombiano Lasprilla:
"Cuando se nos pregunta con tanta insistencia, dónde están los datos
estadísticos que avalen las tuberculosis, los cánceres o las artritis cu-
rados por la homeopatía, ¿qué podemos responder? A no ser que
aclaremos solamente: esa pregunta y todas las que a ella se parezcan,
no tienen respuesta en homeopatía. Porque para ella no hay enfer-
medades sino enfermos y el nombre de ellos en cuanto tales o, si se
quiere, en un intento de contemporizar, el nombre de las enferme-
dades que padecen es el mismo del remedio que las cura. Así pues, se
dirá estadísticamente que de 100 pacientes Bryonia, 60 se curaron
con Bryonia y el resto no se curó porque recibió medicamentos dife-
rentes a Bryonia. El problema se le arma a los alópatas cuando se
enteran de que los susodichos enfermos Bryonia tenían, algunos artri-
tis; otros, neumonía; otro grupo, tifoidea; aquél otro, encefalitis, etc.
Por esta razón la estadística no nos sirve de nada a nosotros para
avalar nuestra práctica clínica."
De él se deriva que si un enfermo no se cura, no es porque el

procedimiento homeopático haya fracasado, sino porque no se ha
empleado el medicamento debido. Dicho de otro modo: pueden equi-
vocarse los homeópatas pero la homeopatía, por definición, no puede
fracasar; siendo su tasa de errores igual a cero, la estadística no tiene
lugar. Curioso silogismo; sobre estas bases se podría fundar un siste-
ma terapéutico (llamémosle numeroterapia) consistente en musitar al
oído del paciente un número: si el individuo no se cura, ello es debi-
do a que no se le trató con el número correcto. La numeroterapia será
igualmente infalible. La enunciación de un sistema que carece de
referentes valorativos externos, y que es por tanto tautológicamente
eficaz, sólo puede caber en un pensamiento obsesivo hasta el punto
de sacrificar el más elemental sentido de la lógica en el altar de sus
convicciones.
Figura 4.12. El poder de las terapias tautológicas.
No menos caóticas son las reglas homeopáticas que se siguen para

el tratamiento. Según los teóricos de esta disciplina, ello se debe a que
cada paciente es singular. En un estudio publicado (Cornu et al., 1995)
en la revista Therapie queda claramente evidenciado el laberinto tera-
péutico que supone la homeopatía. Se realizó una encuesta por correo
a 257 médicos homeópatas. Se les presentaron diez casos reales de
niños aquejados de infecciones respiratorias recurrentes y otros dos
casos simulados de la misma dolencia, y se les pidió opinión acerca
del tratamiento homeopático que aplicarían en cada caso. Respondie-
ron sólo 48 médicos (20%), pero entre todos sugirieron ¡476 drogas
diferentes y 509 tratamientos distintos! Teóricamente, para cada pa-
ciente hay que descubrir el único remedio que lo cura; si un homeópata
no da con ese remedio, no podrá curar al sujeto. Esta experiencia de-
muestra que la probabilidad de identificar esa supuesta panacea es
remotísima.
Por otra parte, a cualquier disciplina científica se le reclama cohe-
rencia teórico-práctica; ¿cómo compatibilizar la ley según la cual no
hay medicamentos generales con la existencia de una farmacopea
homeopática? ¿Cómo pueden realizarse experimentos clínicos si, en

virtud de la ley de la individualización, es imposible obtener grupos
homogéneos de enfermos? Ante estas preguntas, los homeópatas, o
bien rechazan los ensayos clínicos colocándose definitiva y explícita-
mente al margen de los cánones científicos universales (como hace el
autor del libro citado en la sección anterior) o bien los admiten, aun-
que cuando se les enfrenta a esta contradicción, muchos suelen no
pasar del marco de las divagaciones.
Estos últimos no escasean, de modo que tampoco faltan ensayos
clínicos sobre el tema realizados por homeópatas, además de los que
han llevado a cabo investigadores diversos. Típicamente, sin embar-
go, tales trabajos adolecen de serias deficiencias metodológicas.
Dichas insuficiencias se ponen de manifiesto, por ejemplo, en una
evaluación de la calidad metodológica de 107 ensayos clínicos sobre
homeopatía, procedentes de las más diversas fuentes, desde revistas
con alto factor de impacto, hasta presentaciones en congresos y revis-
tas homeopáticas casi desconocidas (Klijnen, Knipschild y ter Riet,
1991). El método empleado otorgaba un máximo de 100 puntos a
partir de siete criterios metodológicos:
• descripción adecuada de los pacientes (10 puntos),

• número adecuado de pacientes (30 puntos),
• asignación aleatoria a los tratamientos (20 puntos),
• intervención bien descrita (5 puntos),
• uso de enmascaramiento (20 puntos),
• medición correcta de los efectos (10 puntos),
• presentación de los resultados de manera que el análisis pueda
ser comprobado por el lector (5 puntos).
La mayoría de los ensayos fueron de paupérrima calidad metodoló-

gica. Los siguientes resultados hablan por sí solos: ninguno de los 107
ensayos superó los 90 puntos y sólo dos alcanzaron esa cifra, apenas
12 de los 107 llegaron a los 70 puntos y solamente 23 superaron los
50 puntos; esto es: 4 de cada 5 trabajos no llegaron a la mitad del

puntaje posible.
La conclusión de estos autores es que tal vez no haga falta realizar
una enorme cantidad de experiencias sino sólo unas pocas con mues-
tras grandes y exigencias metodológicas extremas. A conclusión muy
similar arribaron cuatro años más tarde Resch y Ernst (1995). No
obstante, los homeópatas que aceptan los ensayos clínicos, se aferran
a reunir pequeños estudios (la mayoría de dudosa transparencia meto-
dológica, como ya vimos), como, por ejemplo, ocurre con un reciente
metaanálisis publicado en Lancet (Linde et al., 1997) que arroja un
odds ratio de 1,66 a favor de la homeopatía frente a los placebos.
Cabe reparar por lo demás, en que los mismos resultados, examinados
desde la perspectiva de la estadística bayesiana (véase Sección 6.10),
enfoque emergente que a nuestro juicio es mucho más razonable que
el frecuentismo clásico, reducirían a nada los efectos del preparado
homeopático debido a la ínfima plausibilidad biológica de que el agua
pura tenga algún efecto, aunque —como ironiza el editor del afamado
Annals of Internal Medicine— «dicha agua haya sido agitada de una
manera muy especial» (Dadidoff, 1999).
Un aspecto más ha de agregarse en este contexto: el efecto placebo
de la homeopatía puede ser mucho mayor que el de un tratamiento
convencional. Es evidente que si se comparan los resultados de un
tratamiento homeopático para el dolor de espalda, pongamos por caso,
con los que produce un antiinflamatorio, pero el homeópata invierte
una hora indagando sobre la problemática personal del paciente para
determinar el producto con el cual hará la dilución, el efecto placebo
en este caso será mucho mayor que el que produzca el fármaco tan
pronto se hace el diagnóstico convencional. Para conjurar ese sesgo
sería mucho más atractivo tratar con el remedio homeopático en cues-
tión a un grupo y con agua común y corriente al otro, pero desarrollando
en ambos casos la susodicha entrevista. Lo ideal sería que el homeó-
pata la llevara adelante con todos los pacientes y luego se aplicara
uno u otro tratamiento a la ciega para el paciente y también para el
terapeuta. Tal rigor metodológico, sin embargo, supera abismalmente

los estándares habituales de la investigación en este campo.
Para concluir el tema de los estudios realizados, cabe señalar que a
lo largo de los últimos años se han venido produciendo sucesivas y
cada vez más rigurosas indagaciones. Numerosos trabajos pudieran
citarse, (veánse, por citar sólo dos, Linde y Melchart, 1998; Cucherat
et al., 2000), pero a modo de resumen, nada mejor que el metaanálisis
que se publicó en Lancet (Shang et al., 2005) debido a su naturaleza
exhaustiva y a la contundencia de sus resultados. Los investigadores
compararon la homeopatía con la medicina regular examinando 220
ensayos clínicos relacionados con diversos trastornos (problemas gás-
tricos, asma, mialgias, etc.). En 110 de ellos en que se valoraba el
efecto de la homeopatía (por lo general, en comparación con un pla-
cebo) y los otros 110 eran ensayos clínicos clásicos para evaluar los
efectos de la recursos procedentes de la medicina convencional.
El resultado de la comparación fue aplastante: en los ensayos rea-
lizados con muestras aceptablemente grandes y que observaban una
metodología rigurosa, no se registró que la homeopatía tuviera mejo-
res efectos médicos que los placebos. En los estudios de la medicina
convencional, sin embargo, ocurría lo contrario. Los autores conclu-
yen, simplemente, que la homeopatía no cura y que sus eventuales
efectos benéficos sólo se deben a la autosugestión del paciente.
El episodio de los basófilos
A continuación se relata con cierto detalle un crucial episodio in-

deleblemente ubicado en la historia de la homeopatía. El 30 de junio
de 1988 apareció en Nature, probablemente la revista científica más
prestigiosa del mundo, un artículo firmado por una docena de auto-
res, cuyo título parecía intrascendente: «Degranulación de basófilos
humanos activada por un antisuero contra IgE muy diluido» (Dave-
nas et al., 1988). Los autores más relevantes entre los investigadores
eran el profesor Jacques Benveniste de la Universidad de París-Sur y

jefe de la Unidad 200 del INSERM francés, la técnico Elisabeth Da-
venas y el homeópata Bernard Poitevin, responsable éste último de
múltiples materiales como el críptico opúsculo al que nos referimos
en una sección precedente.
Su contenido era tan sorprendente e importante que la noticia dio la
vuelta al mundo (Di Trochio, 1995). Si los resultados que se presenta-
ban en ese artículo se hubieran confirmado realmente, la ciencia habría
dado, por primera vez, una prueba tangible del principio fundamental
de la medicina homeopática: el que afirma que sustancias suministra-
das en dosis infinitesimales pueden tener acción terapéutica.
Debe consignarse que la mera publicación del artículo había des-
encadenado desde el principio una agria polémica. Se le recriminó a
John Maddox, el director de Nature, que una revista tan encumbrada
se hiciera eco de resultados que se hallaban en franca colisión con la
ciencia constituida. Maddox había rechazado inicialmente el manus-
crito, pero terminó cediendo ante Benveniste, quien había insistido
repetidas veces anteponiendo toda su autoridad científica y aducien-
do el deber de la ciencia de atender sin dogmatismos todas las
expresiones de la realidad objetiva. Junto al artículo en cuestión se
publicó, sin embargo, un editorial en que se alertaba a los lectores que
debían aplazar su juicio acerca del tema hasta conocer el dictamen de
una comisión que asistiría in situ a la repetición de los experimentos y
controlaría los resultados.
Entre los descargos de Nature para acceder a la publicación figura-
ba la convicción de que la publicación permitiría a la comunidad
científica identificar errores en el planteamiento, o proponer otros
experimentos que permitieran valorar las conclusiones. Los detalles
del «descubrimiento» pueden consultarse en diversos sitios (por ejem-
plo, en Silva, 2002). Aquí me circunscribiré a señalar que los
experimentos presentados en el artículo de Nature demostraban que
dosis infinitesimales de un anticuerpo preparadas a partir del princi-
pio de dilución típico de la homeopatía tenían un efecto. Se decía que
el agua destilada en la que el antisuero había sido diluido hasta des-

aparecer provocaba, aunque no siempre, una reacción corroborable
sobre basófilos humanos.
La dosis homeopática de antisuero estaría provocando su efecto en
forma inexplicable, o al menos inexplicada, a despecho de la mismísima
ley de Avogadro. Los propios autores del artículo no sabían explicar por
qué y escribían: «La naturaleza de este fenómeno permanece sin expli-
cación». No obstante, tratando de atenerse a las reglas universalmente
aceptadas, Benveniste bosquejaba una hipótesis: sostenía que si bien
las moléculas de antisuero ya no se encontraban en el agua tras las altí-
simas diluciones, dejaban sin embargo una huella, una especie de marca
imperceptible, modificando el campo electromagnético de algunas mo-
léculas de agua. Es decir, que el agua conservaría en su memoria la
presencia de las moléculas de antisuero, y ese recuerdo sería suficiente
para producir la degranulación de los basófilos.
La idea fue considerada descabellada por la comunidad científica,
especialmente cuando Benveniste, para divulgarla declaró, por ejem-
plo, «que se podría lanzar la llave de su automóvil al Sena en París y
recoger en el propio río, pero muchos kilómetros más adelante, las
moléculas de agua que conservan en su memoria el molde de la llave,
lo cual permitiría reconstruirla y encender el motor». Cuando escu-
chaban ilustraciones de este tenor, los colegas de Benveniste, físicos
y químicos, que habían prestado atención al tema debido a Nature, no
salían de su estupor.
Consecuentemente con lo acordado antes de la publicación, durante
toda una semana John Maddox en persona, acompañado por el conoci-
do prestidigitador profesional James Randi, y por Walter Stewart, afamado
especialista en la detección de fraudes, se personaron en el laboratorio
de Benveniste e hicieron todo tipo de indagaciones y revisiones sobre
documentos y anotaciones. Los experimentos fueron repetidos por los
autores del artículo ante los examinadores y dieron resultados positivos.
No fue hallada ninguna anomalía grave aunque, según los auditores, no
se podía descartar la existencia de alguna persona que hubiese cometi-
do un engaño. Por otra parte, se habían detectado algunos detalles in-

quietantes, en especial el hecho de que la única que había obtenido
regularmente buenos resultados era Elisabeth Davenas, la encargada
de registrar los desenlaces de los experimentos.
Antes de darse por vencidos frente a los milagrosos resultados
observados, los tres auditores llevaron adelante una última y definito-
ria experiencia, regida por una metodología de enmascaramiento y
asignación aleatoria extremadamente rigurosa.
Los resultados fueron todos negativos: el antígeno en dosis ho-
meopáticas no tenía efecto alguno.
En un artículo que se publicó de inmediato en Nature (Maddox,
Randi, Stewart, 1998) titulado: «Los experimentos de alta dilución:
una desilusión», los auditores se ciñeron a relatar cómo se habían de-
sarrollado los hechos sin arriesgar una hipótesis acerca de quién podría
haber sido el responsable del fraude.
Era el principio del fin de una vulgar patraña. Las cosas empezaron a
tomar su lugar cuando se supo que Boiron, la empresa farmacéutica que
monopoliza el mercado homeopático en Francia, (y hoy se expande
agresivamente en otros países europeos) era la que se hacía cargo del
salario de Poitevin y quien financiaba las investigaciones, hecho que
había sido cuidadosamente omitido en el artículo original de Nature. En
total, la empresa farmacéutica homeopática había desembolsado entre
1987 y 1988 alrededor de 150 mil dólares sólo en función de este estu-
dio.
Luego se supo que la relación entre Benveniste y la industria far-
macéutica homeopática había comenzado a desarrollarse precisamente
a través de Bernard Poitevin, quien por otra parte había sido el que
persuadiera a Benveniste de comenzar la investigación. Además, Poi-
tevin actuaba como supervisor de los experimentos con la asistencia
de un técnico de laboratorio pagado por Boiron: Elizabeth Davenas.
Esta estrecha relación con la empresa farmacéutica, ahora revelada,
cuestionaba toda la investigación que se realizaba en la unidad 200
del INSERM.
La situación era vergonzosa para la ciencia francesa y se esperaba

una reacción del INSERM. De modo que se produjo una segunda
evaluación de la unidad 200 encomendada a un equipo de cuatro in-
vestigadores, todos miembros del consejo científico del INSERM,
acompañados por dos investigadores, un norteamericano y un británi-
co. El informe resultante aconseja la no renovación del doctor
Benveniste en su cargo.
Philippe Lazar, director general del INSERM, le concedió a Ben-
veniste la posibilidad de continuar su mandato al frente de la Unidad,
con la condición de que expulsara a Davenas, que desistiera de este
tipo de experimentos y que volviera a ocuparse estrictamente de In-
munología.
Arremetiendo contra la objetividad
La comunidad científica internacional quedó convencida de que

la historia de la memoria del agua era una verdadera estafa. Poite-
vin, sin embargo, siguió citando sin sonrojo alguno el artículo de
Nature sin hacer la menor alusión a los sucesos y artículos poste-
riores (véase, por ejemplo, su libro, ya citado, de 1992). Esta quizás
sea la expresión más clara e indiscutible del espíritu pseudocientí-
fico de estos cultores de la homeopatía: ¿por qué sobredimensionar
los presuntos éxitos? ¿por qué actuar como vulgares charlatanes
de feria y escamotear los fracasos si hubiera un afán de objetividad
y búsqueda honesta y consecuente de la verdad? Acceder a una
revista prestigiosa mediante un fraude y luego exhibir esa publica-
ción como un estandarte es una felonía que en otro ámbito sería
objeto de persecución legal.
Bernard Poitevin afirmaba con desparpajo, dos años después de la
bochornosa aventura con Nature, textualmente lo siguiente (Poitevin,
1992):
"La homeopatía es algo más que una hipótesis: comprende una far-
macología, pero una farmacología nueva. Se debe tener confianza en
las altas dinamizaciones. La información de naturaleza electromagné-
tica puede ser transmitida por el agua y estas señales pueden ser
recibidas por las estructuras biológicas."
Vale decir: «tengo certeza teórica; si la realidad no es compatible

con esta teoría, peor para la realidad». Mucho más comedido, aunque
igualmente esquivo en relación con el aparatoso fraude de que fue
protagonista, este incansable asalariado de la industria farmacéutica
homeopática, se quejaba (Poitevin, 1999) desde una tribuna sorpren-
dente (la Organización Mundial de la Salud) de la falta de fondos para
la investigación que se produjo tras otro sonado fracaso de la homeo-
patía4 cuando ésta fue puesta a prueba en un marco riguroso.
Cabe señalar, finalmente, que Benveniste no quedó a la zaga de su
colega homeópata; su alineamiento posterior con diversos círculos de
estudio de lo paranormal (véase Tellería, Sanz y Sabadell, 2005) y el
mantenimiento obsesivo de la afirmación de que el agua tiene memo-
ria, obligó al INSERM a cerrar la unidad 200 a finales de 1993.
EL FRAUDE CIENTÍFICO: UNA LARGA LUCHA CONTRA

LA VILEZA
Como es bien conocido, los delitos en este marco pueden ser de

muy diversa naturaleza. Incluyen el plagio y las supercherías experi-
mentales; pero también la supresión de información, la adulteración
de datos reales y la manufactura directa de resultados. El plagio y la
invención de datos son en mi opinión las más graves de todas las
formas de conducta impropia en este ámbito, ya que son fechorías
conscientes y deliberadas, propias de un delincuente.
4
De ello dio cuenta Lancet en marzo de 1988.
Ocasionalmente, un autor reproduce subconscientemente un segmento

o idea que alguna vez ha leído. Para distinguir este accidente de un plagio,
se usa el término criptomnesia (véanse Gruber, 2007 y Barcat, 2008). El
plagio, en cambio, es un robo premeditado de las ideas o esfuerzos de
otros. Constituye, sin embargo, un delito que ofrece variable confianza
en el éxito para el estafador por ser susceptible de demostración si se da
con el texto plagiado. Su presencia, por tanto, en la ciencia de alto nivel
es reducida. Así lo sugiere el hecho de que en el año 2005, solo uno de
los casos calificados como de inconducta científica por la norteameri-
cana Oficina para la Integridad en la Investigación correspondió a plagio
(los restantes, a fabricación o falsificación de datos), patrón que se
repitió en 2006 (Office of Research Integrity, 2007).
Algo muy diferente acaece en el mundo educativo. Se ha dicho al
respecto que estamos en la era del «copia y pega» (Ercegovac y Ri-
chardson, 2004). Las oportunidades que brinda Internet son ciertamente
inquietantes y han promovido una atención de primer orden en dicho
ambiente (Szabo y Underwood, 2004; McCabe, 2005; Breen y Maas-
sen, 2005; Hayes y Introna, 2005; Devlin, 2006).
Pero la invención de información es lo más infamante. Al decir de
Bunge (2000): «…los fraudulentos merecen sanciones mucho más
severas que los plagiarios. Éstos son meros rateros que difunden artí-
culos casi tan buenos como los originales. Roban, pero apenas
adulteran, de modo que su delito no se propaga ni perjudica más que
a los autores originales.»
En la base de todo el edificio de la ciencia se halla la convicción
generalizada de que los que se dedican a esta actividad poseen una
moral diferente, más elevada, una ética mucho más acrisolada que la
del resto de los profesionales. Se supone que el hecho de que la mi-
sión del científico sea, precisamente, la búsqueda de la verdad, da
lugar a que jamás traicione el propósito fundamental de su quehacer.
Lamentablemente, esto es en buena medida falso. Muchos ejemplos
de tales fechorías pueden citarse, tanto del pasado remoto como de la
historia más reciente. El análisis de las complejas raíces de este fenó-
meno exigiría examinar problemas que van desde asuntos organiza-

cionales y financieros, hasta móviles sociales o políticos, pasando
incluso por la esfera psicopatológica.
Algo de historia pasada y reciente
Tanto en Internet como en artículos de prensa (véanse por ejemplo

Schulz y Katime, 2003; Salomone, 2006) y varios libros (e.g. Di Tro-
chio, 1995; Lock, Wells y Farthing, 2001; Park, 2001; Judson, 2004)
puede hallarse abundante información sobre los episodios más famo-
sos de fraude a lo largo de los años. Se trata de casos históricos bastante
conocidos, tales como el del padre de la Genética, Gregor Mendel, el
del tan llevado y traído Trofim Lysenko, quien entre 1929 y 1965
fuera la única voz de la ciencia agrícola soviética, o el del presidente
de la Sociedad Psicológica Británica Cyril Burt; pero también de algu-
nos escándalos más recientes, como el del físico Jan Hendrik Schön,
un joven de 32 años de los prestigiosos laboratorios Bell, quien en
sólo dos años había publicado 25 artículos fabricados en las mejores
revistas, o el del hematólogo alemán Friedhelm Herrmann, con 96
publicaciones que contenían datos confirmada o verosímilmente fal-
sos.
Figura 4.13. Los pinochos de la ciencia.

No repetiremos aquí en detalle todas esas bochornosas historias.

Vale la pena, sin embargo, detenerse en algunas perlas que ofrezcan
por una u otra razón algún interés especial.
Por ejemplo, una estafa científica singular fue realizada hace unos
años por la investigadora Thereza Imanishi-Kari del Instituto Tecnoló-
gico de Massachussets; lo notable fue que involucró a un notorio biólogo
molecular que hubiera sido laureado con el premio Nobel en 1975 (Da-
vid Baltimore, presidente de la Universidad de Rockefeller). La académica
fue declarada culpable en 1994 por el Departamento de Investigación
de la Integridad de EE UU de 19 cargos de falsificación de datos y
pruebas, incluidas en un artículo científico publicado en 1986 por la
prestigiosa revista Cell (Weaver et al., 1986). La singularidad del asunto
se la concede el hecho de que Baltimore, quien había participado como
coautor del artículo en cuestión, se negó a apoyar la investigación sobre
el posible fraude y desarrolló una intensa y vidriosa campaña de defen-
sa de su colaboradora, sancionada a la postre a 10 años de exclusión de
investigaciones financiadas por agencias federales.
Un caso que me parece interesante por sus fuertes implicaciones
públicas y la publicidad de que fue objeto, fue el que protagonizó el
investigador de mercados neoyorquino James Vicary en el año 1957,
cuando afirmó haber realizado exitosos experimentos que demostra-
ban que la inclusión intermitente (no registrable conscientemente por
el receptor) en una película de frases tales como "tengo sed", inducía
a los individuos al consumo de refrescos más allá de su voluntad como
consecuencia de la huella dejada por el mensaje subliminal (del latín
sub limen, por debajo del límite). En particular, dijo haber llevado ade-
lante el estudio en un cine de New Jersey, durante las seis semanas
durante las que se exhibió la película Picnic. En días alternos, se habría
insertado una imagen parasitaria entre las 24 que pasan cada segundo
que contenía los mensajes: «¿Tienes hambre?, come palomitas» y «Bebe
Coca-Cola». Se testimonió un incremento en la venta de palomitas
del 57,7% en los días en los que se incluían los mensajes subliminales
y un aumento de un 18% en el consumo de Coca-Cola.
Tal posibilidad conmovió a muchas personas que pidieron la inter-

vención de la Comisión Federal de Comunicaciones de Estados Unidos
para conjurar tal manipulación. Pero los hallazgos de Vicary no pu-
dieron nunca convalidarse. Una cadena de televisión canadiense
realizó un experimento similar: pasó mensajes subliminales solicitan-
do al público de determinado programa que llamara a la emisora
durante su transmisión pero el número de llamadas se comportó en
los márgenes habituales. Pero más importante, viéndose presionado a
repetir su experimento —ahora con controles rigurosos y bajo la pupi-
la atenta de los psicólogos experimentales— Vicary tuvo que admitir
que las ventas no se modificaban, y finalmente, en 1962, confesó que
sus afirmaciones habían sido inventadas, y que toda la historia no
constituía más que una broma.
En los primeros años del presente siglo se produjeron algunos frau-
des que conmovieron a la opinión pública. El más conocido por las
esperanzas que despertó, fue cometido por el veterinario surcoreano
Woo Suk Hwang, quien en 2004 anunció estridentemente haber pro-
ducido por primera vez en la historia células madre de embriones
humanos clonados. Un año más tarde saltó a la fama desde su opaca
posición académica por haber, supuestamente, extraído tales células
de la piel de pacientes enfermos, de modo que se habría hallado la
fuente para regenerar diversos tejidos, susceptibles de ser empleados
en trasplantes y en la curación de enfermedades degenerativas hasta
entonces incurables. Los hallazgos fueron publicados nada menos que
en Science; pero en sólo dos años se supo que Woo Suk Hwang no
había clonado absolutamente nada, aparte de las fotografías presen-
tes en sus trabajos, acto que fue la clave de su desenmascaramiento.
Menos de un año después, cuando la comunidad científica aún
masticaba sin haber digerido del todo el chasco del coreano, se reveló
el caso del médico noruego Jon Sudboe. Este investigador había
«descubierto» que el uso de antiinflamatorios (tales como ibuprofeno,
naproxeno o paracetamol) reducía el riesgo de cáncer de boca en fumadores;
pero en realidad había inventado la información correspondiente a 908
pacientes inexistentes (inventó los nombres, los documentos de

identidad y los historiales de los pacientes). The Lancet, revista que había
acogido el trabajo, se había tragado la mentira. Poco después Sudboe
reconoció haber engañado a The New England Journal of Medicine y The
Journal of Clinical Oncology, que también habían publicado en su momento
estudios igualmente imaginarios.
Figura 4.14. El coreano Suk y el noruego Sudboe, iniciadores del fraude

del siglo XXI.
Tentaciones del hombre común
Robert Hauptman escribía que los científicos están tan expuestos

a las tentaciones materiales como cualquiera. Se disputan subvencio-
nes, premios, puestos de trabajo, invitaciones, fama, honores, derechos
procedentes de patentes, y remuneración monetaria. Y estas motiva-
ciones pueden ser iguales o mayores que las de hallar y difundir nuevos
conocimientos (Hauptman, 1999). Si tenemos en cuenta que un in-
vestigador puede obtener grants de cientos de miles de dólares, no es
difícil compartir la convicción de Hauptman. Además, la práctica lo
ha demostrado; basta reparar en el caso del especialista en obesidad
Eric Poehlman, con unos 200 artículos publicados sobre el tema, al
menos 10 de ellos con datos fabricados, quien reconoció en 2005

haber falseado datos en 17 ocasiones para obtener subvenciones pro-
cedentes del National Institutes of Health por un monto que, según
la fiscalía, superaba los 2,5 millones de dólares (véase Payne, 2005).
A juicio de Broad y Wade (1982), sin embargo, la diferencia entre
este «cocinado» y la invención de datos es sólo una cuestión de grado.
En su apasionante libro sobre el tema, consideran que la deshonestidad
en el quehacer científico es más generalizada de lo que se piensa. En su
opinión, sólo vemos la punta del iceberg; pero el despiadado marco en
el que opera la ciencia en la actualidad obliga al investigador profesio-
nal a participar en una competencia que no todos asumen honradamente.
Muchos emplearán procedimientos espurios para ganar esa competi-
ción y se esmerarán (probablemente con más éxito del que imaginamos)
para que sus delitos no sean advertidos. Es bastante lógico pensar que
si se trata de pequeñas fechorías cometidas en círculos de menor pre-
eminencia, la probabilidad de detección disminuirá. De modo que mucho
más sutiles y comunes son otras conductas, como la de introducir mo-
dificaciones aparentemente irrelevantes en los resultados, o seleccionar
aquellos más aceptables, o enviar varias veces el mismo trabajo a diferen-
tes revistas aunque a veces ligeramente maquillados –especialmente en el
título- para dar la impresión de que se trata de algo realmente diferente.
Este último «truco», creciente y preocupante, adultera los análisis (espe-
cialmente metaanálisis) que procuran establecer la evidencia disponible sobre
algún asunto. Se trata de algo que la mayoría de las revistas científicas pros-
criben expresamente en sus normas. En el fondo se trata de un fraude que
persigue incrementar artificialmente el currículum de los infractores.
Según Valerio (2008), investigadores de la Universidad de Texas
examinaron siete millones de trabajos publicados en revistas científicas
para identificar duplicaciones. Afortunadamente, ahora se cuenta con
programas informáticos capaces de detectar buena parte de tales
repeticiones; de hecho, en tal recurso se basó el estudio de estos
investigadores que han hallado 70.000 infracciones de este tipo, las
cuales pueden consultarse en una página Web creada al efecto.
Refiriéndose a la dimensión ética del plagio científico, el notable

investigador, Premio Nobel en Biología, Peter Medawar comenta el
caso de un investigador cuyo fraude quedó inequívocamente demos-
trado; Medawar (1984) escribe textualmente:
"Se produce una batalla terrible pero, por fortuna para el culpable, el
organismo que lo emplea tiene interés ante todo en evitar un escánda-
lo público. Este fue, por tanto, rehabilitado en otra institución científica,
y allí ha proseguido con éxito moderado, consumando pequeños deli-
tos de género muy similar. ¿Cómo puede vivir consigo mismo semejante
hombre?... A mí no me parece pasmoso ni inexplicable; me parece una
felonía lisa y llana de la que se supone que los científicos no son menos
capaces que ningún otro tipo de profesional."
Si no son inequívocamente descubiertos, no sólo consiguen vivir

consigo mismo —y sin demasiados sobresaltos— los autores de lo
que Medawar llama con toda justeza «semejantes felonías», sino que,
cuando surgen sospechas, el entorno que los rodea parece dispuesto
al ejercicio de una benevolencia que quizás no aplicaría ante otras
expresiones de deshonestidad. Siempre me ha desconcertado reparar
en que no pocas veces el engaño produce menos escándalo que el que
se deriva de un acto de cruda sinceridad.
En cualquier caso, más que hacer un recuento de los fraudes más
connotados de los últimos años, me interesa concentrarme en el asunto
de cómo detectar estos fenómenos, aspecto en el que me concentraré
en lo que sigue.
EL FRAUDE BAJO LA PUPILA DETECTIVESCA DE

LA ESTADÍSTICA
Ocasionalmente, como se verá, la estadística puede también ser

útil para identificar conductas delictivas, algo especialmente factible
cuando se trata de datos fabricados o procedentes de experimentos o

prácticas ilegítimas. Esto es así porque el patrón de la información
ofrecida en tales casos es con frecuencia incompatible con lo que ca-
bría esperar si los resultados fueran reales. El interés central, en síntesis,
será discutir e ilustrar cómo la estadística puede contribuir en el com-
bate a este flagelo mediante la identificación de anomalías en los datos
que pudieran tener un origen fraudulento.
El tema ha sido objeto de interés en diversos ámbitos. Tal es el
caso, por ejemplo, de los registros de contabilidad, los resultados en
escrutinios electorales o en exámenes, y los datos procedentes de los
ensayos clínicos, como veremos más adelante.
También el marco de los records deportivos ha ofrecido espacio
para este tipo de análisis. Recientemente se puso sobre el tapete la
posibilidad de que los impresionantes resultados durante la etapa
final de la muy prolongada carrera deportiva del jugador de béisbol
norteamericano Roger Clemens, apodado «el cohete», pudieran ser
debidos al consumo de esteroides, de lo cual había sido directamen-
te acusado. Un estudio realizado por cuatro profesores de la
Universidad de Pennsylvania (Eric Bradlow et al., 2008) examina su
desempeño. El artículo desmonta estadísticamente el truco empleado
en un informe realizado en defensa del jugador en el cual se incurría
en un sutil sesgo de selección para comparar la actuación de Clemens
con las de otros colegas. Estos autores incluyen el de todos los juga-
dores de similar trayectoria a la de Clemens (31 en total) desde 1968.
Los resultados arrojan que sus resultados deportivos exhibían anoma-
lías durante los 10 años posteriores a su trigésimo cumpleaños que
serían inexplicables sin la participación de factores inusuales (aun-
que, naturalmente, los estadísticos se abstienen de asegurar que tales
factores fueran drogas antirreglamentarias).
La tarea de detectar el plagio científico, especialmente el fenóme-
no del «copia y pega» entre estudiantes al que nos referimos en el
apartado El fraude científico: una larga lucha contra la vileza, p. 261, tam-
bién ha sido objeto de desarrollos estadístico-computacionales. Entre
varios otros, se destaca el programa CrossCheck, que permite a edito-

riales a cargo de revistas científicas, profesores e incluso autores
comprobar la originalidad de los trabajos a través del cotejo contra
textos ubicados en millones de sitios Web. El empleo de software con
este fin no es una panacea (Warn, 2006), entre otras razones porque
puede ser útil a los propios plagiarios para refinar las adulteraciones y
convertir el resultado en un falso negativo (en definitiva hay que ser
exageradamente mediocre para transcribir mutatis mutandis un texto
ajeno y darlo como propio).
En el campo de nuestro mayor interés, la investigación sociosani-
taria, el problema del fraude reclama cada vez más atención, y la
posibilidad de detectarlo usando técnicas estadísticas ha venido pro-
duciendo creciente interés; quizás la evidencia más clara la tenemos en
el hecho de que la revista Statistics in Medicine haya publicado a finales de
siglo un artículo en que un grupo de 13 estadísticos destacados en el
mundo de la salud (Buyse et al., 1999) discutieron específicamente acerca
del papel que puede y debe desempeñar la bioestadística en la detec-
ción y el tratamiento del fraude en los ensayos clínicos y algo más tarde
Evans (2001) examina algunos aspectos estadísticos relacionados con
la detección de fraudes. Ese interés se refleja bien en la revisión realiza-
da en Bolton y Hand (2002). Las técnicas que pueden aplicarse son
diversas, aunque por lo general bastante elementales. Por ejemplo, Akhtar
y Kooshkghazi (2003) prueban que en determinados contextos los co-
eficientes de correlación pueden servir como indicadores de posibles
fabricaciones de datos y Al-Marzouki et al. (2005) muestran cómo un
simple examen de medias, varianzas y configuración de los datos de
acuerdo a sus dígitos conducen a la conclusión de que los resultados
de un ensayo sobre dietas provienen casi con seguridad de datos fa-
bricados.
En lo que sigue, veremos algunos ejemplos elocuentes tanto de las
capacidades de la estadística en este terreno como de la ingenuidad
en que pueden incurrir algunos delincuentes intelectuales (¡y no inte-
lectuales!) que no la dominan.
Un ejercicio básico
Hace unos años fui objeto de una consulta especializada que te-
nía la singularidad de no ser una inocente solicitud de colaboración
académica como estadístico. Era bastante delicada, ya que venía
acompañada de una sospecha de fraude y, justamente se me pregun-
taba si la estadística pudiera arrojar luz sobre la validez de tal
sospecha.
La situación en esencia era la siguiente: se realizó un examen a un
conjunto de 72 pretendientes para ocupar un puesto de trabajo; uno
de los «contendientes» alcanzó una nota llamativamente superior a la
del resto. El resumen estadístico de las 72 notas era el siguiente:
nota promedio 2,787

nota mínima = 0,523
nota máxima = 6,632
desviación estándar = 1,109
La pregunta básica es ¿constituye 6,632 una nota «demasiado»

alta? Es decir, ¿puede considerarse que ese valor es un outlier? Se me
comunicó que las personas que se presentaron a este examen confi-
guraban un conjunto de individuos normales (los contendientes eran
todos trabajadores de un mismo entorno y ninguno había exhibido
hasta ese momento síntoma alguno de brillantez especial). No había
allí ni superdotados ni retrasados mentales. Desde luego, uno de los
examinados pudiera tener un paupérrimo desempeño debido a un
factor anómalo especial (por ejemplo, extrema fatiga, o malestar fí-
sico). Más difícil es imaginarse a alguien que como resultado de una
mera casualidad pudiera tener un desempeño extraordinariamente
bueno.
¿Cómo se identifica un outlier u «observación aberrante», como a
veces se le llama en castellano? Esto es, ¿cómo descubrir si un valor
dado fue conseguido por alguien que no integra al conjunto de perso-

nas normales? En Silva y Barroso (2003) se lee textualmente:
"Las observaciones extremas pueden ser identificadas desde una pers-

pectiva univariante, bivariante o multivariante. La primera examina la
distribución de observaciones, e identifica como casos aberrantes
aquellos que caigan fuera de los recorridos de la distribución. El en-
foque clásico para detectarla parte de convertir los valores de los
datos en valores estándares, que tienen una media cero y una desvia-
ción estándar igual a la unidad. Según Hair et al.(1999), para muestras
pequeñas (de 80 o menos observaciones), las pautas sugeridas identi-
fican como atípicos a aquellos casos con valores (de la variable
estandarizada) de 2,5 o más unidades."
En nuestro caso, si llamamos x a una nota dada, se trata de obte-
ner . En el Anexo 4.1 se recoge la tabla de los 72 valores

crudos y las respectivas estandarizaciones. Se aprecia allí que los
valores estandarizados se mueven entre -2,041 y 3,467. Sólo un su-
jeto resulta tener un valor aberrante; todos los demás tienen valores
estandarizados entre -2,5 y 2,5. Por otra parte, si quitáramos a este
individuo del conjunto y repetimos exactamente el mismo proceso
con los 71 restantes, el resultado es Media=2,733 y Desv Est=1,028.
Naturalmente, la media disminuye, y la desviación estándar tam-
bién. Consecuentemente, los valores estandarizados tienen un
recorrido mayor para esos 71 sujetos. Es fácil corroborar que éstos
se mueven entre 2,189 y -2,149, de modo que según el criterio apli-
cado, no hay valor aberrante alguno.
En síntesis, el valor 6,632 procede bien de una persona prodigiosa-
mente capaz, que sobresale mucho (nótese, por cierto que no es un
outlier que escasamente cae en esa condición, sino que está mucho
más alejado de lo necesario para serlo), bien de alguna otra anomalía,
típicamente un error en la medición o en su registro. Naturalmente,
no tenemos una prueba de deshonestidad. Yo, sin embargo, como esta-

dístico, no dudaría en aconsejar que se invalidara o repitiera este
examen.
En términos generales, Bolton y Hand (2002) apuntan: «…ha de
enfatizarse que raramente podemos tener certeza, basándonos sólo
en el análisis estadístico, de que se ha perpetrado un fraude. El análi-
sis ha de considerarse más bien como un alerta de que algo anómalo
acaece, o de que la probabilidad de que estemos frente a un fraude es
mayor, de modo que hay motivos para proceder a una investigación
más detallada». En este caso confluían algunos elementos inquietan-
tes tales como el sujeto en cuestión no tenía una historia personal que
permitiera percibirlo como un genio ni mucho menos, y que cultivaba
una marcada amistad con el examinador. Ignoro si tal escrutinio más
detallado se produjo en el caso que acabo de referir.
Desde luego, esa confluencia de elementos adicionales (ajenos a la
estadística como tal) puede ser crucial en el veredicto, como ocurre
en cualquier juicio (véase apartado Probabilidades subjetivas: cuando un
erudito se equivoca, p. 201). A continuación me extiendo sobre el caso
arriba mencionado de Ciryl Burt, en que ambos instrumentos se con-
jugan de manera sumamente persuasiva.
Cyril Burt traicionado por la estadística
Un ejemplo que ilustra la identificación de patrones inusuales como

indicio iluminador de anomalías detrás de las que se esconde una con-
ducta fraudulenta se relaciona con el psicólogo británico Cyril Burt.
Éste llevó adelante no pocos estudios vertebrados en torno a la
idea de su profesor Francis Galton según la cual, para valorar la
preeminencia de las características heredadas sobre las ambientales
dentro de una familia, pudieran emplearse mellizos idénticos, (ho-
mozigóticos) que se hubieran desarrollado en ambientes diferentes.
En varios artículos publicados antes y después de la Segunda Gue-
rra Mundial, Burt dejó «demostrado» que la herencia era crucial para
determinar la inteligencia, mientras que el ambiente tenía influencia
más bien marginal. Era una conclusión enteramente coherente con
las expectativas del entonces pujante movimiento eugenésico crea-
do por Francis Galton del cual era Burt activo militante. Para ello
hizo uso del coeficiente de correlación de Pearson (por cierto, otro
defensor de la eugenesia) y del coeficiente de inteligencia (IQ) crea-
do por Binet hacia 1920.
A poco de morir Burt, Leon Kamin, psicólogo de la Universidad de
Princeton, halló inquietantes irregularidades en los datos, las cuales
sugerían que algunos de ellos pudieran ser producto de un fraude.
Para ser más rigurosos, diríamos que lo que Kamin encontró fueron
inverosímiles regularidades. Concretamente, llamaba la atención la rei-
terada aparición de patrones tales como que el mismo coeficiente de
correlación se reportase en estudios realizados con sucesivas mues-
tras acumuladas de gemelos idénticos. La Tabla 4.1 muestra la
secuencia de parte de los hallazgos que Burt se atribuía.
Tabla 4.1. Coeficientes de correlación comunicados por Burt entre 1943 y 1966.
Año No. de gemelos Coeficiente

del estudio acumulados de correlación
1943 15 0,770
1955 21 0,771
1966 53 0,771
La coincidencia es casi prodigiosa; pero otro asunto empezó a des-

pertar serias sospechas. ¿Cómo pudo haber hallado tantos pares de
gemelos homocigóticos que, además, tuvieran la extraña condición
de haber sido educados en familias diferentes? Esto de por sí, ya era
«estadísticamente sospechoso». Además, de los 53 pares, 21 habrían
sido estudiados antes de su jubilación y los otros 32, posteriormente,
cuando ya era septuagenario y padecía de sordera. Obviamente, no
estaba en condiciones de hacer una indagación de tal envergadura.

Tucher (1994) descubrió que a lo largo de siete décadas (entre 1922 y
1990) ni un solo estudio había podido acumular, ni por asomo, tal
número de parejas que tuvieran los rasgos supuestamente poseídos
por los gemelos de Burt; de hecho, ni siquiera uniéndolos todos juntos
se llega a dicho número.
Estos hallazgos condujeron a un escrutinio más estrecho de la obra
de Burt, lo cual llevó a nuevos descubrimientos que hacen creer que
éste habría inventado valores de IQ. En 1976, el periodista del Sunday
Times Oliver Gillie, descubrió que dos asiduas colaboradoras de Burt,
quienes figuraban como coautoras de los trabajos (Margaret Howard
y Jane Conway) eran simplemente desconocidas en la Universidad de
Londres: no aparecían ni en los archivos, ni en las nóminas del centro.
La obra científica independiente de Conway y Howard era copiosa,
pero se concentraba en citar y elogiar a Burt; además se había publica-
do exclusivamente en una única revista: Journal of Statistical Psychology,
cuyo director era…¡Cyril Burt!
Figura 4.15. La imaginación de Cyril Burt.

Un estudio que se llevó adelante a solicitud de la familia Burt, el

psicólogo británico Leslie Hearnshaw, dio en 1971 una estocada final
al asunto: se descubrió que decenas de cartas escritas a Burt en su
calidad de director del Journal of Statistical Psychology, habían sido re-
dactadas por el propio Burt con diferentes identidades falsas.
El hecho ilustra la necesidad (y posibilidad) de dirimir entre una
actuación permeada por la subjetividad, algo inevitable, y la vileza de
adulterar los resultados, conducta inaceptable, por muy convencido
que esté el autor de «su» verdad. Burt había preferido mentir antes
que sufrir con la victoria de sus adversarios, uno de los caminos típi-
cos por los cuales se despeñan algunos hacia este tipo de fraudes.
Debe decirse que no faltan algunos defensores del británico, pero
se trata básicamente de admiradores de la obra de Herrnstein y Mu-
rray (1994), cuyo carácter acientífico fue discutido en el apartado
Los criterios de autoridad, p. 145.
Con matices diferentes al de Burt, pero en esencia en virtud del
mismo mal, adquirió notoriedad el caso de los famosos experimentos
de Gregor Mendel con los que se avalaban sus 3 leyes sobre rasgos
heredados en función de caracteres recesivos y dominantes de las se-
millas. La coherencia de los resultados obtenidos con la teoría
proclamada era tan grande que Ronald Fisher no pudo menos que dar
su famoso dictamen: «demasiado bueno para ser veraz» (Fisher, 1936).
No nos extenderemos en los detalles de éste polémico asunto (el lec-
tor puede hallarlos en Piegorsch, 1990); basta consignar que los
estudiosos del tema han demostrado que el célebre Abad no pudo
haber obtenido los resultados que comunicó.
Un fraude siniestro que pudo haber sido

estadísticamente neutralizado
A finales de enero de 2000 fue condenado a cadena perpetua el mé-

dico británico Harold Shipman, apodado como el doctor Muerte. Se le
comprobó la autoría del asesinato de 15 de sus pacientes, pero se sos-

pecha fuertemente que podría haber sido responsable directo de la muerte
de 297 personas a lo largo de sus 24 años de práctica profesional. Ship-
man certificó 311 fallecimientos más que sus colegas durante el lapso
que duró su permanencia (entre 1974 y 1998) en las localidades de
Hyde (Manchester) y Todmorden (Yorkshire), en el norte de Inglaterra.
La conducta de Shipman seguía un patrón macabro: aprovechando
las visitas en sus casas en horas de la tarde, asesinaba a sus víctimas
—por lo general ancianas de más 75 años— usando dosis mortales de
morfina. Después, él mismo extendía un certificado donde consigna-
ba que su paciente había muerto por causa natural.
En 1979, la tasa de mortalidad entre las pacientes femeninas de 75
o más años de Shipman fue de 14,05% mientras que dicha tasa se
reducía a 4,79% en la población de Hyde. En 1997, dichas tasa fue-
ron 29,8% y 2,07% respectivamente. El exceso de mortalidad no
prueba necesariamente un comportamiento criminal, ya que puede
deberse a circunstancias tales como que un médico tenga un mayor
número de pacientes oncológicos terminales. Pero podría constituir
un claro aviso para iniciar una indagación que permita determinar a
qué puede deberse tan notable anomalía en el número de muertes.
Figura 4.16. El doctor Muerte, Harold Shipman.

Figura 4.17. Porcentaje de muertes según hora del fallecimiento.
De hecho, estos acontecimientos, que colocan a Shipman como el

asesino en serie más prolífico de la historia, pusieron de manifiesto la
necesidad de establecer mecanismos de alerta. Y la estadística está lla-
mada a participar con protagonismo en ello. Un estudio realizado por
Baker, Jones y Goldblatt (2003) a raíz de este siniestro suceso, permitía
observar otras irregularidades virtualmente incriminatorias, tales como
que el porcentaje de muertes acaecidas en horas de la tarde era mucho
más alto para Shipman que para sus colegas (véase Figura 4.17).
De hecho, existen técnicas estadísticas formales para llevar ade-
lante este tipo de exámenes. En particular se destaca el llamado
«método de las sumas acumuladas» (cumulative summation methodology,
CUSUM) susceptible de ser aplicado en procesos como el que nos
ocupa para la detección de desviaciones, incluso sutiles, en el patrón
según el cual se configuran los datos (Bolsin y Colson, 2000).
En el número inaugural de la revista Significance se publicó un tra-
bajo a cargo de los profesores británicos David Spiegelhalter y Nicky
Best en el cual se muestra cómo una versión de la técnica CUSUM
pudiera haber detectado las fechorías de Shipman a fines de 1985, 13
años antes de que fuera arrestado (Spiegelhalter y Best, 2004).
Diversas técnicas de interés en el afán de detectar outliers y llevar

adelante procesos estadísticos de control pueden hallarse en Carey
(2003), Spiegelhalter (2005a), Spiegelhalter (2005b), Mohammed y
Laney (2006) y Woodall (2006).
Ley de Benford: cuando los números toman

vida propia
La última ilustración con que concluiremos el recorrido sobre el

posible empleo de la estadística y la teoría de probabilidades en la
detección de conductas fraudulentas, es ciertamente fascinante.
El asunto que nos ocupará comienza cronológicamente a finales
del siglo XIX y concierne al matemático y astrónomo norteamericano
Simon Newcomb. Nacido en Canadá en 1835, se destacó por sus es-
tudios de mecánica celeste y fue el primer presidente de la American
Astronomical Society, pero también presidió dos prestigiosas socieda-
des científicas no circunscritas a la astronomía: la influyente American
Association for the Advancement of Science y la American Mathema-
tical Society.
En su época, las tablas de logaritmos eran libro de cabecera de
cualquier manejador de cifras que se preciara. Newcomb reparó en
que su libro de tablas logarítmicas iba exhibiendo un desgaste menor
en la medida que sus páginas avanzaban (estaba muchísimo más «ma-
noseado» en las primeras páginas que en las últimas). El señalado
desgaste diferencial sólo podía tener una explicación y era que, a lo
largo de los años, habían sido consultado mucho más los logaritmos
de números que comenzaban por 1 que los de aquellos que comenza-
ban por un 2, y más estos últimos que los que comenzaban por 3, y así
sucesivamente. Esto a su vez permitía sospechar algo extraño: que
son más abundantes los números cuya primera cifra es 1, o 2 que
aquellos que empezaban por 8 o 9.
Figura 4.18. Simon Newcomb (1835-1909).
Newcomb comenzó a indagar y advirtió que las primeras páginas

del libro de tablas de logaritmos de la biblioteca de su facultad tam-
bién estaban mucho más manoseadas que las últimas, y más tarde lo
corroboró en las bibliotecas de otras facultades. Mediante un breve e
ingenioso razonamiento, que no incluía argumentos formales ni desa-
rrollos matemáticos, Newcomb enunció una relación o ley logarítmica:
«La ley de probabilidad de la ocurrencia de números es tal que las
mantisas de sus logaritmos son equiprobables» (Newcomb, 1881). Esta
es la base de lo que hoy se conoce como Ley de Benford.
La observación de Newcomb pasó casi inadvertida hasta que en
1938 y de manera aparentemente independiente, el físico norteameri-
cano Frank Benford observó el susodicho fenómeno en las tablas de
logaritmos y realizó una comprobación empírica sobre la distribución
de distintas series de números según fuera el primero de sus dígitos.
Trabajó con un total de 20.229 números agrupados en 20 muestras de
gran diversidad: áreas fluviales, constantes y magnitudes físicas y quí-
micas, funciones matemáticas, e incluso números tomados de
direcciones personales (Benford, 1938).
A partir de los resultados empíricos, Benford postuló una «ley de
los números anómalos» que para cada número del 1 al 9, indica cuál
es la probabilidad de que éste sea el primer dígito dentro de un con-

junto de números que figuren en una lista salida de alguna construcción
teórica, o de la actividad práctica, de la naturaleza o de la sociedad,
como veremos más adelante.
Concretamente, la ley que se resume en la siguiente fórmula.
donde log es el logaritmo en base 10 y P(d) es la probabilidad que le

corresponde al dígito de ser el primero cuando estamos ante una serie
de números como las mencionadas arriba.
Según dicha fórmula, las probabilidades de que en una serie de
muchos datos el primer dígito de un número sea 1, un 2, ..., un 8 y un
9 son las que figuran en la Tabla 4.2 y en la Figura 4.19.
Tabla 4.2. Probabilidades de aparición de los números del 1 al 9,
como primer dígito.
Dígito d 1 2 3 4 5 6 7 8 9
P(d) 0,301 0,176 0,125 0,097 0,079 0,067 0,058 0,051 0,046
Figura 4.19. Distribución de probabilidades de la aparición de los números del 1 al

9 según la Ley de Benford.
Ahora bien, ¿qué ha de entenderse como «una lista salida de alguna

construcción teórica, o de la actividad práctica, de la naturaleza o de
la sociedad»?
No cualquier conjunto de datos sigue la Ley de Benford. Por ejemplo,
los números de lotería que se pueden comprar un día cualquiera en
Filadelfia no la cumplen; tampoco se ajustaría la distribución de los
números de teléfonos de La Habana. Pero sí se ajustan por lo general
datos salidos de fenómenos sociales, naturales y económicos tales como
longitud de los ríos, tamaños poblacionales de comunidades, series
cronológicas de producción, o el número de bytes correspondientes a
los archivos contenidos en la PC de cualquiera de nosotros.
A continuación se relacionan varios ejemplos tomados de Ayllón y
Perera (1999) donde se ha evaluado la validez de la Ley de Benford
tanto para series de datos que emergen de formulaciones matemáti-
cas como para algunas magnitudes salidas de la vida real.
Tras tomar 10 mil números aleatorios de la distribución uniforme
[0,1], al considerar en cada caso el primer dígito (número del 1 al 9)
que figura en la parte decimal, se halló la siguiente distribución.
1 2 3 4 5 6 7 8 9
0,112 0,111 0,112 0,111 0,111 0,111 0,110 0,111 0,111
Tal distribución, como era de esperar, nada tiene que ver con lo
que muestra la Tabla 4.2. Pero al tomar 10 mil conjuntos de 5 núme-
ros aleatorios de esa misma distribución y para cada quinteto obtener
el producto de sus integrantes, los 10 mil números resultantes se dis-
tribuyeron del modo siguiente:
1 2 3 4 5 6 7 8 9
0,300 0,175 0,126 0,094 0,077 0,067 0,061 0,054 0,046
cuya similitud con la distribución de la Tabla 4.2 es simplemente asom-

brosa. Algo muy similar ocurre, por ejemplo con los primeros 10.000
términos de la sucesión de Fibonacci:
1 2 3 4 5 6 7 8 9
0,301 0,177 0,125 0,096 0,080 0,067 0,057 0,053 0,045
Cuando se trabajó con algunos conjuntos de datos naturales o sur-

gidos de procesos de la vida, los resultados no son tan "perfectos",
pero resultan no obstante impresionantes. En la Tabla 4.3 se recoge lo
que arrojó el análisis de cuatro muestras: la cantidad de mujeres en los
8.098 municipios españoles en 1998 según datos oficiales del Institu-
to Nacional de Estadística, la superficie y la población de los 192
países que recogía el Atlas Encarta 99 de Microsoft, y un conjunto de
3.336 facturas de compras correspondientes a muy diversos produc-
tos procedentes de una empresa.
Tabla 4.3. Distribución de frecuencias relativas de los números según sea

el primer dígito para cuatro muestras.
La Ley de Benford fue apreciada durante años como una simple cu-
riosidad estadística, carente de una fundamentación matemática seria,
y difícilmente aplicable para la solución de problemas prácticos. Pero
actualmente está teóricamente respaldada y despierta mucho interés
por sus posibles aplicaciones (veánse Hill, 1999; Matthews, 1999).
La que más interesa ahora concierne a su posible empleo como medio
para ayudar a la detección de datos erróneos o fraudulentos. Por ejem-
plo, la distribución según el primer dígito de los números de una
declaración fiscal verdadera sería muy parecida a la que establece la
Ley de Benford, pero si esa declaración fuera fraudulenta (hecha con
datos inventados) la distribución se alejará de la que establece la teo-
ría, y daría serios motivos a potenciales auditores para pensar en un
fraude (datos inventados o «retocados»), como se pone de manifiesto
en Nigrini (2000).
La aplicación de la ley para la detección de fraudes científicos en
experimentos clínicos ha sido igualmente considerada (Brown, 2005;
Diekmann, 2005; Durtschi, Hillison y Pacini, 2004; Taylor, Mc Ente-
gart y Stillman, 2002). Personalmente, me encantaría aplicar este
análisis a los datos de las historias clínicas inventadas por el Sr. Jon
Sudboe (véase apartado Un ejercicio básico, p. 270). Por cierto, si tuviera
acceso a esos datos, podría valorarlos en línea (http://
www.checkyourdata.com/) o mediante uno de los softwares creados
al efecto, algunos de los cuales se pueden obtener gratuitamente de la
red.
ANEXO 4.1.
NOTAS ALCANZADAS POR LOS 72 ASPIRANTES A UN PUESTO LABORAL

Y SUS RESPECTIVOS VALORES (ORDENADOS DE MENOR A MAYOR
EN LA TERCERA COLUMNA DE CADA BLOQUE).
BIBLIOGRAFÍA
Akhtar N, Kooshkghazi M. How does correlation structure differ

between real and fabricated data-sets? BMC Medical Research
Methodology 2003; 3:18.
Al-Marzouki S et al. Are these data real? Statistical methods for the
detection of data fabrication in clinical trials. British Medical Journal
2005; 331:267-270.
Ayllón JD, Perera M. El primer dígito significativo. Epsilon 1999; 45:
339-352.
Baker R, Jones DR, Goldblatt P. Monitoring mortality rates in general
practice after Shipman. British Medical Journal 2003; 326:274-276.
Barcat JA. Criptomnesia. Medicina 2008; 68:101-103
Benford F. The law of anomalous numbers. Proceedings of the American
Philosophical Society 1938; 78:551-572.
Bolsin S, Colson M. The use of the Cusum Technique in the assessment
of trainee competence in new procedures. International Journal for
Quality in Health Care 2000; 12:433-438.
Bolton RJ, Hand DJ. Statistical fraud detection: a review. Statistical
Science 2002; 17:235–255.
Bradlow E et al. Report backing clemens chooses its facts carefu-
lly. Periódico The New York Times del 10 de febrero, 2008. Nueva
York.
Bratman S. A Major Scientific Advance of the 20th Century. Accesible
en: http://www.mendosa.com/bratman.htm en junio de 2008).
2008.
Breen L, Maassen M. Reducing the incidence of plagiarism in an un-
dergraduate course: The role of education. Issues In Educational Research
2005; 15:1-16.
Breilh J et al. El deterioro de la vida. Quito: Corporación Editora Nacional.
1990.
Broad W, Wade N. Betrayers of the truth. Fraud and deceit in the halls of
science. New York: Simon and Schuster. 1982.
Brown RJC. Benford’s law and the screening of analytical data: the
case of pollutant concentrations in ambient air. The Analyst 2005;
130:1280-1285.
Bunge M. La investigación científica. La Habana: Ciencias Sociales.1972.
Bunge M. El fraude científico. Periódico La Nación del 30 de octubre,
2000. Buenos Aires.
Buyse M, et al. The role of biostatistics in the prevention, detection
and treatment of fraud in clinical trials. Statistics in Medicine 1999;
18: 3435-345.
Carey RG. Improving healthcare with control charts: basic and advanced SPC
methods and case studies. Milwaukee: American Society for Quality
Press. 2003.
Carlston M. The mechanism of homeopathy. All that matters is that
it works. Alternative Therapies in Health and Medicine 1995; 1:95-
96.
Collazo C. Perfil de Murray Gell-Mann. Muy Interesante 1995; 169:117-
118.
Cornu C et al. Essai clinique contrôlé et traitement homéopathique
des infections ORL et respiratoires récidivantes de l’enfant: en-
quête préliminaire auprès de médecins homéopathes (Ensayo clínico
controlado y tratamiento homeopático de infecciones ORL y res-
piratorias recidivantes del niño: encuesta preliminar a médicos
homeópatas).Therapie 1995; 50:41-45.
Cucherat M et al. Evidence of clinical efficacy of homeopathy: a meta-
analysis of clinical trials. European Journal of Clinical Pharmacology
2000; 56:27–33.
Dadidoff F. Standing statistics right side up. Annals of Internal Medicine
1999; 130: 1019-1021.
Davenas E et al. Human basophil degranulation triggered by very
diluted antiserum against IgE. Nature 1988; 333:816-818.
Devlin M. Policy, preparation, and prevention: Proactive minimiza-
tion of student plagiarism. Assessment and Evaluation in Higher Education
2006; 28:45-58.
De la Osa E. Homeopatía: va ganando el favor de los cubanos.

Periódico Granma del 24 de julio, 1999. La Habana.
Di Trochio F. Las mentiras de la ciencia. Madrid: Alianza. 1995.
Diekmann A. Not the first digit! Using Benford’s law to detect
fraudulent scientific data. Accesible en: http://129.3.20.41/eps/
othr/papers/0507/0507001.pdf en agosto de 2007. 2005.
Drosnin M. El código secreto de la Biblia. Madrid: Planeta. 1997.
Durtschi C, Hillison W, Pacini C. The effective use of Benford’s law
to assist in detecting fraud in accounting data. Journal of Forensic
Accounting 2004; 5:17-34.
Eisenberg DM et al. Unconventional medicine in the United States.
Prevalence, costs, and patterns of use. The New England Journal of
Medicine 1993; 328:246-252.
Ercegovac Z, Richardson JV. Academic dishonesty, plagiarism inclu-
ded, in the digital age: A literature review. College and Research Libraries
2004; 65(4):301-318.
Evans S. Statistical aspects of the detection of fraud. En: Lock S,
Wells F, Farthing M, (eds.) Fraud and misconduct in medical research.
3rd ed. London: BMJ Publishing Group. 2001.
Fisher RA. Has Mendel’s work been rediscovered? Annals of Science
1936; 1:115-137.
Gruber RP. Minds that think alike or cryptomnesia? Plastic Reconstructi-
ve Surgery 2007; 116:1945-1946.
Hair JF et al. Análisis multivariante (5a. ed) Madrid: Prentice Hall Iberia.
1999.
Hauptman R. Research misconduct: why are definitions so elusive?
Science and Engineering Ethics 1999;5: 443-444.
Hayes N, Introna L. Cultural values, plagiarism, and fairness: when plagiarism
gets in the way of learning. Ethics and Behavior 2005; 15: 213-231.
Herrnstein RJ, Murray C. The Bell Curve: Intelligence and class structure in
American life. Nueva York: The Free Press. 1994.
Hill TP. La primera cifra significativa dicta su ley. Mundo Científico
1999; 199:56-59.
Judson FH. Fraud the great betrayal: Fraud in science. New York: Harcourt.
2004.
Klijnen J, Knipschild P, ter Riet G. Clinical trials of homeopathy. British
Lasprilla E. Epistemología y medicina: un estudio de la naturaleza humana.
Barranquilla: Antillas. 1992.
Linde K et al. Are the clinical effects of homeopathy placebo effects? A
meta-analysis of placebo-controlled trials. Lancet 1997; 350:834-843.
Linde K, Melchart D. Randomized controlled trials of individualized
homeopathy: a state-of-the-art review. Journal of Alternative and Com-
plementary Medicine 1998; 4:371–388.
Lock S, Wells F, Farthing M. Fraud and misconduct in biomedical research.
London: BMJ Books. 2001.
McCabe D L. Cheating among college and university students: A North
American perspective. International Journal for Educational Integrity
2005; 1(1).
Maddox J, Randi J, Stewart WW. High-dilution’ experiments a delusion.
Nature 1988; 334:287-290.
Matthews R. The power of one. New Scientist 163 (july). Accesible en:
http://www.newscientist.com/ns/19990710/thepowerof.html en
agosto de 2007. 1999.
McKay B et al. Solving the bible code puzzle. Statistical Science 1999;
14:150-173.
Medawar P. Consejos a un joven científico. México DF: Fondo de Cultura
Económica. 1984.
Mohammed MA, Laney D. Overdispersion in health care performance data:
Laney’s approach. Quality and Safe Health Care 2006; 15:383-384.
Newcomb S. Note on the frequency of the use of digits in natural
numbers. American Journal of Mathematics 1881; 4:39-40.
Nigrini MJ. Digital analysis using benford’s law: tests statistics for auditors.
Vancouver. Global Audit Publications. 2000.
Office of Research Integrity. Annual_report. Accesible en: http:/
ori.dhhs.gov/publications/annual_reports.shtml en agosto de 2007.
Ortiz F. La medicina folklórica de Cuba. Revista Bohemia 1951; 48:

16-18.
Payne D. ‘Egregiousness’ of conduct over almost 15 years leads to
first-ever lifetime ban on US grants. Periódico Daily News del 21 de
marzo, 2005. New York.
Piegorsch WW. Fisher’s contributions to genetics and heredity, with
special emphasis on the Gregor Mendel controversy. Biometrics 1990;
46:915-924.
Poitevin B. Integrating homeopathy in health systems. Bulletin of the
World Health Organization 1999; 77:160-166.
Poitevin B. Introducción a la Homeopatía. México: B. Poitevin.1992.
Quintana CA. Señor Pata de Cabra. Crítica a la Sinrazón Pura. Buenos
Aires: Lulu. 2008.
Resch KL, Ernst E. Valoración de la efectividad de las terapias
complementarias. Análisis de la literatura ejemplificada mediante
acupuntura. (en alemán el original) Fortschr Med 1995; 113:49-53.
Salomone M. Impostores de la ciencia. Suplemento semanal del
periódico El País del 19 de febrero de 2006.
Shapiro R. Suckers: How alternative medicine makes fools of us all. Lon-
don: Harvill Secker. 2008.
Schulz PC, Katime I. Los fraudes científicos. Revista Iberoamericana de
Polímeros 2003; 4:1-90.
Silva LC. Teoría de los biorritmos: ¿resurgimiento de un mito? Revista Cuba-
na de Administración de Salud 1984; 10:333-340.
Silva LC. El pensamiento científico y la homeopatía: una crónica
bicentenaria. Revista Médica Habanera, 1, Nº2. Accesible en http://
lcsilva.sbhac.net en agosto. 2002.
Silva LC, Barroso I. Regresión logística. Madrid: La Muralla. 2003.
Shang A et al. Are the clinical effects of homoeopathy placebo effects?
Comparative study of placebo-controlled trials of homoeopathy

and allopathy. Lancet 2005; 366:726–732
Spiegelhalter DJ, Best N. Shipman’s statistical legacy. Significance 2004;
1:10-12.
Spiegelhalter DJ. Funnel plots for comparing institutional performan-
ce. Statistics in Medicine 2005a; 24:1185-1202.
Spiegelhalter DJ. Handling over-dispersion of performance indicators.
Quality and Safe Health Care 2005b; 14:347-351.
Szabo A, Underwood J. Cybercheats: Is information and communica-
tion technology fuelling academic dishonesty? Active Learning in
Higher Education 2004; 5:180-199.
Taylor RN, Mc Entegart DJ, Stillman EC. Statstical techniques to
detect fraud and other data irregularities in clinical questionnaire
data. Drug Information Journal 2002; 36:115-125.
Tellería C, Sanz VJ, Sabadell MA. ¿Es efectiva la homeopatía? Acce-
sible en: http://www.arp-sapc.org/articulos/homeopatia/ en agosto
de 2007. 2005.
Tucher WH. Facts and fiction in the discovery of Sir Burt’s flaws.
Journal of the History of the Behavioral Sciences 1994; 30:335-347.
Valerio M. La trampa de los estudios repetidos. Periódico El Mundo del 4
de febrero, 2008. Madrid.
Warn J. Plagiarism software: no magic bullet! Higher Education Research
and Development 2006; 25:195-208.
Weaver D et al. Altered repertoire of E. endogenous immunoglobulin
gen expression in transgenic mice containing a rearranged mu heavy
chain gene. Cell 1986; 45:247-257.
Witztum D, Rips E, Rosenberg Y. Equidistant letter sequences in the
book of genesis. Statistical Science 1994; 9:429-438.
Woodall WH (2006). The use of control charts in health-care and
public health surveillance. Journal of Quality Technology 2006; 38:89-
104.
293
5
Adocenamiento y ceremonias
metodológicas
Si comenzamos con certezas, terminaremos con
dudas; pero si comenzamos con dudas y somos
pacientes con ellas, terminaremos con certezas.
FRANCIS BACON
s típico que, cuando un procedimiento lleva muchos años apli-

E cándose, empiece a abaratarse, no necesariamente por el hecho
de que pierda vigencia como tal, sino más bien debido a que, al trans-
mitirse de unos a otros, los que van arribando al club de aplicadores
suelen mimetizar lo que han visto, sin acudir a las fuentes originales y
muchas veces sin entender del todo (y hasta sin entender nada) la
esencia, las limitaciones, el propósito último del método en cuestión.
Se va generando muchas veces una suerte de «tradición» a lo largo de
cuya configuración el mecanicismo suple al pensamiento critico que
lo originó.
Tal es el caso de muchos procedimientos aplicados en la investiga-
ción epidemiológica y clínica, especialmente en el área de la estadística,
que se convierten en verdaderos rituales metodológicos. El rito más
extendido, con diferencia, es el que se asocia a las pruebas de signifi-
cación estadística. Es tanto el adocenamiento presente en su
aplicación, tan notable la incomprensión sobre sus limitaciones, y son
tan grandes la influencia que tiene y la inercia con que se emplea, que
destinaremos el próximo y último capítulo casi íntegramente a exami-
nar el problema. En el presente abordaré unos cuantos ejemplos de
orden más general, en la misma línea, aunque de manera más abarca-
dora que la empleada en otro sitio (Silva, 2005).
293
RITUALES EN EPIDEMIOLOGÍA
Por lo general, la investigación epidemiológica se emprende, bien
con el fin de describir una realidad o proceso de salud a nivel pobla-
cional —es decir, para caracterizar en relativamente pocos trazos
cómo es tal realidad— bien para explicar por qué dicha realidad es
como es, lo cual equivale en esencia a descubrir o corroborar los
mecanismos causales que la gobiernan. El cumplimento de la pri-
mera de estas encomiendas ha sido notable; pero el de la segunda se
ha visto beneficiado por un puñado de éxitos y ensombrecido por
recurrentes decepciones.
Hace unos años, señalé (Silva, 1997a) que ya resultaba imposible
desconocer los inquietantes síntomas de crisis que vivía la epidemio-
logía analítica observacional tal y como se ha venido practicando en
los últimos lustros. En un incisivo e influyente trabajo publicado por
la prestigiosa revista Science, Taubes (1995) daba cuenta de ello a tra-
vés de un discurso crítico vertebrado a partir de las propias
declaraciones, tomadas de aquí y allá, procedentes de figuras tan em-
blemáticas de la Epidemiología actual como Greenland, Sackett,
Rothman, Mc Mahon, Breslow, Feinstein y Peto, donde los propios
protagonistas iban aportando indicios de la desazón que prevalecía en
sus predios metodológicos.
Expresado resumidamente, el síntoma esencial de tal crisis era cla-
ro e indiscutible: los resultados alcanzados por esta disciplina en la
explicación de mecanismos causales han sido notoriamente modestos,
máxime si se toman en consideración el tiempo y los recursos emplea-
dos. Tras varias décadas de intensos y costosos estudios orientados a
esclarecer la etiología de las más importantes dolencias que aquejan
al mundo desarrollado, los dividendos son con frecuencia ficticios o
decepcionantes. Como veremos, una parte importante de la responsa-
bilidad de tales chascos ha sido el empleo superficial y acrítico de
recursos estadísticos y computacionales.
ADOCENAMIENTO Y CEREMONIAS METODOLÓGICAS 295
La situación llegó por entonces a tal extremo que no era extraño

hallar sombrías afirmaciones como las de Charlton (1996) recogidas
en las páginas del Journal of Clinical Epidemiology:
"La epidemiología cada día se considera más a sí misma como una

disciplina autónoma con sus propios patrones intelectuales para en-
contrar demostraciones (...) a pesar de que está sistemáticamente
incapacitada para resolver debates concernientes a los mecanismos
causales".
Los artículos que se acaban de citar son relativamente antiguos, lo

cual ofrece una medida de que las preocupaciones no son nuevas.
Podría pensarse que se trata de problemas resueltos, pero lamentable-
mente, las críticas de este tipo no han cesado. Por ejemplo, el médico
y columnista británico James Le Fanu publicó hace pocos años un
polémico libro titulado Ascenso y caída de la medicina moderna, donde
textualmente declara (Le Fanu 2000):
"Un científico en cualquier disciplina científica seria, tal como la gené-

tica, se vería en serios problemas si sus colegas fueran incapaces de
confirmar o reproducir sus aseveraciones acerca del gen para la obe-
sidad. Se ganaría la reputación de no ser «fiable» y las universidades
serían refractarias de darle empleo. Tal insistencia auto impuesta en
que la metodología ha de ser rigurosa, sin embargo, está ausente en la
epidemiología contemporánea; en efecto, el rasgo más chocante es la
desaprensión con la cual los epidemiólogos anuncian sus hallazgos, como
si ellos no esperaran que nadie los tomara muy en serio".
Las observaciones críticas son muy cáusticas; la realidad, afortu-

nadamente, no es exactamente esa. A la vez que, ciertamente, se hacen
más obvias y reconocidas las limitaciones de la Epidemiología en su
cauce actual, es un desatino atribuir dicha esterilidad a la disciplina
como tal. Sus fracasos relativos no nos habilitan para descartar la po-
sibilidad de que el enfoque epidemiológico y los recursos estadísticos
asociados a él puedan hacer contribuciones, muchas veces parciales,
a la explicación de los fenómenos, del mismo modo que sus éxitos
históricos no pueden validar la sublimación de sus posibilidades. Me-
nos aún si no se supera el acomodamiento metodológico que hoy se
observa.
A partir de esta realidad, el debate relevante gira en torno a cuáles
son los límites epistemológicos de una disciplina en la cual, como en
la Meteorología o la Demografía, generalmente no se puede acudir al
recurso experimental, y de la que podríamos quizás estar exigiendo
más de lo que puede aportar.
LA INSTALACIÓN DE LOS RITUALES
Entre los problemas fundamentales que ponen de manifiesto una

cultura epidemiológica deformada y que reclaman enmienda se halla
la sobre valoración del análisis que se verifica a nivel individual y el
consecuente desprecio hacia el enfoque socioambiental, así como el
empleo inercial de la estadística como sucedáneo y no como comple-
mento de la reflexión crítica.
Vivimos en una época en que el sacrificio de «remilgos» humanis-
tas en el altar de la eficiencia es frecuente moneda de cambio, y el
«sálvese quien pueda» parecería ser la nueva filosofía de vida que se
nos propone, y en no pocas ocasiones, se nos impone. En este marco
general se consolida el enfoque reduccionista que deriva en una mar-
cada sumisión a la idea de que las causas han de buscarse al mismo
nivel en que se produce el problema. Las condiciones ambientales o
contextuales se desdeñan casi por entero y se procede a la cacería
afanosa de factores individuales de riesgo (Silva, 2002). Los artículos
que se orientan en esa dirección pueblan las revistas médicas como
hongos después de la lluvia. Parece no repararse, por poner un ejem-
plo, en que alimentarse adecuadamente o no, si bien es una acción indi-

vidual, está tan fuertemente condicionada por circunstancias
económicas, publicitarias y sociales que no siempre constituye una
elección individual.
Debe señalarse que la búsqueda de factores de riesgo para una
entidad o desenlace dado no es en sí misma un esfuerzo censurable ni
mucho menos. Cuando tal esfuerzo se verifica en un marco racional,
teóricamente coherente y mediante métodos correctos, puede dar lu-
gar a conocimientos útiles, aunque sólo fuera para configurar hipótesis,
o sugerir líneas de experimentación, o nuevos y más refinados estu-
dios observacionales. Lo impugnable radica en que con extrema
frecuencia esta búsqueda se intenta desarrollar sin verdadera y genui-
na reflexión, apoyándose en la ingenua convicción de que, para que
sea exitosa, basta emplear mecánicamente determinado algoritmo me-
todológico. En ese caso, el resultado puede ser contraproducente.
Y es ahí donde comparecen rituales estadísticos que producen re-
sultados peores que los de un espejismo, ya que, a diferencia de éste,
que sólo genera una ilusión, tales rituales pueden desembocar en per-
niciosas decisiones equivocadas.
HUELLAS MENTALES EN RELACIÓN CON EL RIESGO

Y LA CAUSALIDAD
Una definición que permita pronunciarse acerca de qué debe en-

tenderse por un agente causal y por un factor de riesgo es sin duda polémica.
En mi opinión, cualquiera que sea la definición formal que se adopte
para la primera categoría, la definición funcional —es decir, útil a los
efectos prácticos de la prevención primaria— de la causa de un efecto
dado puede expresarse del modo siguiente: cualquier factor, condición o
característica, cuya supresión elimina la posibilidad de que se produzca el efecto,
es una causa de dicho efecto.
Por otra parte, están los elementos que, sin ser necesarios, son propi-
ciatorios del efecto. Se trata de los llamados factores de riesgo (FR) para
desarrollar una enfermedad1. Ellos son los que generan más confusión
porque, como es lógico, suelen venir acompañados de las causas y «se
parecen» a ellas, del mismo modo que las medidas paliativas para enca-
rar una dolencia (por ejemplo, analgésicas) se parecen a la curación. Se
trata de factores susceptibles de ser modificados que, sin ser causas propiamente,
pueden favorecer que el agente causal actúe. Ejemplos típicos de factores de
riesgo son: la práctica de no usar condón, circunstancia que favorece el
embarazo y las enfermedades de transmisión sexual, el consumo de
grasas saturadas a los efectos de padecer cardiopatías, o la obesidad
como condición que contribuye al surgimiento de dolencias vasculares.
Aunque, como se ha visto, se trata de categorías diferentes, a los
efectos de lo que sigue es irrelevante si hablamos de una causa o de un
factor de riesgo, ya que las exigencias metodológicas para la corrobora-
ción de uno u otro carácter en el marco observacional son básicamente
las mismas. Sin embargo, sí procede subrayar que cuando se trata de
estados que no pueden ser modificados mediante acciones o cambios
de conducta (tal es el caso de la edad, del grupo sanguíneo o del géne-
ro), no estamos ante un FR. Para dejar clara la distinción se les suele
llamar marcadores de riesgo.
Son bien conocidas las listas de condiciones o premisas que han de
cumplirse para tener derecho a considerar que cierta relación entre
dos variables es causal o que la presencia de un factor entraña efecti-
vamente riesgo a los efectos de enfermar. Aunque hay requisitos obvios,
tales como la plausibilidad biológica (premisa que exige que la hipótesis
de causalidad cuente con cierto respaldo teórico), aquellas verdadera-
1
Aunque por lo general el «efecto» de que hablamos es una enfermedad, no siempre es ese
caso. Pudiera tratarse de la realización de un intento suicida, de una complicación dentro de
un proceso morboso, de sufrir un accidente o de cualquier otro desenlace, adverso o no. No
obstante, en lo sucesivo aludiremos con frecuencia a «enfermedad», que es la situación más
frecuente en el marco de los factores de riesgo.
mente cruciales y que han de ser insoslayablemente atendidas desde

el punto de vista metodológico son las siguientes:
• Congruencia temporal: la presunta causa ha de haber actua-

do antes que el efecto y el diseño del estudio tiene que garantizar
que las mediciones se hayan realizado con acuerdo a ello.
• Ausencia de sesgos: han de evitarse circunstancias que con-
duzcan a que veamos distorsionadamente en un sentido u otro
la realidad.
• Asociación: debe corroborarse que la presunta causa o FR debe
estar asociada con la variable que registra el desenlace (enfer-
medad).
• Carácter intrínseco de la asociación observada: hay que corro-
borar que la asociación no puede ser enteramente atribuible a la
acción de otros factores; es decir, hay que constatar que la asocia-
ción subsiste una vez «controlados» los llamados factores de
confusión, que en esencia son variables que influyen sobre las dos
que se examinan de manera que pueden crear la ilusión de que
estas últimas guardan una relación esencial (véase una definición
formal del concepto de confusión con su correspondiente discu-
sión y varias ilustraciones en de Irala, Martínez y Guillén (2001).
Para garantizar el cumplimento de los dos primeros requisitos, el

esfuerzo ha de concentrarse en el empleo de diseños adecuados. La
corroboración de los dos últimos, sin embargo, se puede conseguir bási-
camente mediante procedimientos estadísticos. Coherentemente con el
propósito de la Sección, me concentraré en dichos procedimientos.
Asociación
La asociación es condición sine qua non de la causalidad y puede medir-

se a través de diversos estadígrafos tales como, por ejemplo, un riesgo
relativo, un odds ratio, un coeficiente de correlación o una diferencia de

medias aritméticas. Cuanto más intensa sea, más verosimilitud adquiere
la hipótesis de que hay una relación de causalidad directa o indirecta. Ello
se debe a que, tras identificar una asociación en los estudios observacio-
nales, una de las más importantes incertidumbres estriba en que la
correlación observada pudiera ser sólo un reflejo del efecto que ejercen
otros condicionantes; si la correlación es intensa, la posibilidad de que la
asociación pueda explicarse enteramente por el efecto de tales condicio-
nantes, los llamados factores confusores, es mucho menor.
Control de factores confusores
Los diseños concebidos para corroborar conjeturas etiológicas o, más

generalmente, hipótesis causales, recorren un amplio abanico de va-
riantes y subvariantes. No obstante, consignados de manera concisa y
esencial, dichos procedimientos son básicamente tres: los estudios de
casos y controles, los longitudinales o de cohorte y los experimentales.
Estos últimos, de los cuales el ensayo clínico controlado es su ex-
presión más emblemática en el mundo biomédico, constituyen la forma
óptima para encarar el problema de la causalidad. El carácter pros-
pectivo inherente a todo experimento resuelve el escollo posible de la
temporalidad y, si el ensayo clínico se conduce adecuadamente (en
particular cuando se usan técnicas de enmascaramiento y asignación
aleatoria) muchos de los posibles sesgos son conflictos potenciales
que quedan conjurados por el propio diseño. Sin embargo, su virtud
fundamental consiste en que, a través de la asignación aleatoria, espe-
cialmente si las muestras son grandes, los grupos que van a compararse
se equiparan o balancean respecto de todos los factores que pudieran
ser confusores, conocidos o no.
Lamentablemente, diversos imperativos éticos y prácticos suelen
imposibilitar la experimentación en el marco de la epidemiología. Los
estudios observacionales de cohorte son los sucedáneos naturales del
ensayo clínico, ya que comparten con él su naturaleza prospectiva: los

hechos se registran en orden temporalmente ascendente. La observa-
ción comienza tanto para quienes ostentan una presunta condición de
riesgo como para quienes no la tienen, cuando aún no se han expresa-
do los desenlaces que se estudian y, en esencia, se trata de comparar
las tasas de incidencia de la enfermedad entre dichos grupos. De ese
modo, el registro adecuado de la temporalidad queda garantizado de
antemano. Pero este enfoque alarga los lapsos para llegar a resultados
analizables (a veces durante años) y suele ser prohibitivamente caro.
Por eso suelen preferirse los estudios de casos y controles, a pesar de que
ellos pueden ofrecer dificultades para asegurar el cumplimiento de la
premisa de precedencia temporal (véase Silva, 2004).
Ahora bien, el gran problema que afecta a todos los estudios no
experimentales lo ofrece el control de factores confusores. ¿Cómo ase-
gurarse de que la asociación observada es intrínsecamente causal y
que no se debe preponderante o exclusivamente a la influencia de al
menos un factor (quizás varios factores) sobre los dos que se exami-
nan? Como se ha expuesto en cientos de artículos y decenas de libros,
el recurso clásico para ello era la llamada postestratificación y posterior
aplicación de las técnicas propuestas por Mantel y Haenszel a finales
de la década de los 50 del siglo pasado (véase Silva y Barroso, 2003).
Sin embargo, tal recurso está en la actualidad virtualmente ausente de
las aplicaciones reales debido a su naturaleza restringida y artesanal, y
ha quedado casi por entero relegado a su nostálgica aparición en los
cursos ortodoxos de epidemiología. Su lugar ha sido ocupado por los
modelos multivariados, muy especialmente por la regresión logística.
EL MISTICISMO ATACA A LOS ENSAYOS CLÍNICOS

Más adelante pondré algunos ejemplos de los rituales aplicados en el
marco de la investigación biomédica observacional, pero ahora quiero
detenerme en un ejemplo que ilustra el fenómeno en el campo de los
ensayos clínicos. Discutiré un desconcertante caso en que se siguen

virtualmente todos los pasos establecidos para realizar un ensayo clíni-
co fructuoso, pero en el cual dicho esfuerzo está condenado a la
esterilidad, precisamente por desplegarse inercialmente en el contexto
de un vacío teórico y conceptual que le dé sentido. Los ensayos clínicos
constituyen, como se ha dicho, el instrumento más eficiente para acri-
solar el conocimiento. Como tal, puede ser útil para despojarlo de todo
misticismo. El ejemplo que se expone a continuación da cuenta de cómo,
cuando sus resultados se interpretan mecánicamente, puede produ-
cirse exactamente el efecto opuesto: el misticismo despoja al ensayo
clínico de su capacidad esclarecedora.
Plegarias terapéuticas
La afamada revista Annals of Internal Medicine publicó al inicio del

siglo XXI un artículo de revisión (Astin, Harkness y Ernest, 2000) que
examina las investigaciones realizadas en torno a la eficacia de los
métodos de sanar a distancia, entre los que se incluyen recursos como
la oración, la curación psíquica, el toque terapéutico y la sanación espiritual. La
revisión sólo abarcó ensayos clínicos controlados, como garantía de
una calidad metodológica mínima. Sorprende que se hayan encontra-
do en la literatura médica veintitrés experimentos que cumplen dichas
condiciones, cinco de ellos referidos concretamente al uso de las ple-
garias como método curativo.
El artículo que bosquejaremos a continuación (Harris et al., 1999),
publicado en la prestigiosa Archives of Internal Medicine, es un ejemplo
de este fenómeno. Allí se da cuenta del examen de los efectos a dis-
tancia de la intercesión mediante la oración como recurso terapéutico
a través de un ensayo clínico controlado en pacientes ingresados en
una unidad de cuidados coronarios.
En la Introducción los autores consignan que «la intercesión median-
te la oración como recurso terapéutico complementario rara vez ha
sido sometida al escrutinio científico», lo cual justificaría la realiza-

ción de este trabajo.
En el Método se explica que se seleccionaron todos los pacientes
que ingresaron en la Unidad de Cuidados Coronarios (UCC) del Insti-
tuto Americano de Cardiología, Kansas, a lo largo de un año, salvo
aquellos que fueran a ser objetos de transplante de corazón, para quie-
nes se anticipaba una estancia prolongada en el servicio. Se eliminaron
del estudio los pacientes cuya estancia hospitalaria hubiese sido infe-
rior a 24 horas, puesto que este era el tiempo requerido para contactar
con los intercesores2 e iniciar los rezos.
Se comunica que los pacientes, registrados diariamente, fueron
«asignados aleatoriamente» a los grupos de tratamiento: el grupo con-
trol recibió el tratamiento médico convencional que se dispensa en la
UCC, y el experimental, además, fue destinatario de ruegos incluidos
en oraciones emitidas por un conjunto de practicantes religiosos re-
clutados al efecto. En rigor, para la distribución de los pacientes se
utilizó el último dígito del número del registro médico con que fue
recepcionado: los pares eran asignados al grupo experimental (466
pacientes) y los impares al grupo control (524 pacientes). De esta
forma, según estiman los autores, «era nula la posibilidad de sesgos,
dado que el número de registro respondía al orden secuencial de los
ingresos, independientemente de cuán enfermos estuviesen». Se pro-
curaba valorar así el efecto de las oraciones como recurso para disminuir
tanto las complicaciones que sobrevienen a los pacientes de enferme-
dades coronarias como la duración de su permanencia en la UCC y en
el hospital.
Una vez que el paciente era asignado al grupo experimental, se
informaba su nombre (sin apellidos) por vía telefónica al responsable
de uno de los grupos de intercesores para que se comenzara a orar por
espacio de 28 días exactos. Para formar parte del grupo de interceso-
2
El término «intercesor», empleado por los autores, se aplica a quién «intercede», en este
caso ovbiamente, ante un ser supranatural (Dios).
res era necesario suscribir la siguiente declaración: «Yo creo en Dios.

Creo que Él es personal y se preocupa por el destino de las personas.
Creo, además, que es sensible a las oraciones que ruegan por el bene-
ficio de los enfermos». Los intercesores eran asignados aleatoriamente
a los pacientes y las plegarias debían tener carácter individual: cada
religioso, afiliado a alguna denominación cristiana (grupos protestan-
tes, episcopales, católicos romanos, etc.) rezaría por los enfermos
específicos que le fueran asignados acerca de los cuales sólo se les
informaba el nombre (ni siquiera el apellido). En sus oraciones, los
intercesores pedían una rápida recuperación de los pacientes, exenta
de complicaciones.
Para cuantificar los resultados, se creó al efecto un índice de compli-
caciones (IDC). A cada una de las posibles complicaciones (o acciones
derivadas de ellas) se le atribuyó un número (ponderación) según la
gravedad que entrañaban. Este índice es una variable cuantitativa que
contempla la gravedad de 35 posibles eventos clínicos, tales como:
fiebre (1), angina inestable (1), hipotensión o anemia (2), taquicardia
supraventricular (2), extensión del infarto (3), paro cardíaco congesti-
vo (4), muerte (6). Por ejemplo, si después del primer día de ingreso
en la UCC el paciente solo presenta fiebre y no tiene más complica-
ciones hasta el alta, el IDC en su caso será igual a 1; sin embargo, si
luego sufre, además, ataque cardíaco (5 puntos) y finalmente muere
(6 puntos), el valor de su IDC será igual 123.
Para valorar estadísticamente la hipótesis de nulidad se compara-
ron los porcentajes de aparición de complicaciones, mediante la prueba
de Ji-Cuadrado, así como las medias del IDC y de los tiempos de es-
tancia mediante la prueba t de Student de dos colas. No se obtuvieron
diferencias estadísticamente significativas entre los grupos en lo que
3
Incidentalmente, cabe señalar que este indicador exhibe rasgos ciertamente chocantes.
Obsérvese que un sujeto que muere sin más a poco de ingresar alcanzaría seis puntos, en tanto,
otro que sobrevive tras una taquicardia acompañada de anemia, pero seguida de un paro
cardíaco, llegaría a ocho puntos, de modo que pudieran tener complicaciones peores que el
fallecimiento.
concierne a ninguno de los 35 componentes individuales del IDC, ni

tampoco para tiempo de estadía en la UCC y tiempo de estancia
hospitalaria. Sólo la comparación de las medias del IDC produjo un
resultado cuya p fuera inferior a 0,05. Los resultados finales obteni-
dos por Harris y sus colaboradores se sintetizan en la Tabla 5.1.
Tabla 5.1. Efectos de la intercesión mediante la oración sobre el IDC, la permanencia

de los pacientes en la Unidad de Cuidados Coronarios y el tiempo de estancia
hospitalaria.4
Grupo control Grupo exper.

Indicadores p
(n = 524) (n = 466)
Índice de Complicaciones
(IDC) 7,13 6,35 0,04
Tiempo de estancia en
UCC 1,23 1,12 0,28
Tiempo de estancia en el
hospital 5,97 6,48 0,41
En la Discusión, los autores se anticipan a aclarar que no se propo-

nen explicar el mecanismo de acción de los rezos, y dejan abierta la
posibilidad de que los beneficios que producen sean consecuencia de
la acción de «fuerzas físicas desconocidas» generadas por los interce-
sores. Nos dicen que se limitan a dar a conocer lo que los datos
demuestran y que no prueban con ello que Dios responde a los inter-
cesores, ni tampoco su existencia. Para concluir, afirman que los
resultados estadísticos demuestran que la intercesión remota y a cie-
gas, por medio de la oración, produce una tangible mejoría en los
pacientes con afección coronaria. Estas consideraciones, junto con
un resultado favorable en un estudio previo (Byrd, 1988), les llevan a
recomendar la realización de investigaciones del mismo perfil, que
utilicen instrumentos ya validados para la recolección de la informa-
4
Respetamos el título elegido por los autores para la tabla que recoge los resultados.
ción. De este modo, opinan, se contribuirá a fundamentar aún más el

papel de los rezos como coadyuvante del tratamiento médico.
Es muy probable que los editores de Archives of Internal Medicine se
hayan visto en una difícil encrucijada. El estudio es bastante bufo-
nesco, pero básicamente cumple con los estándares metodológicos
habituales; negarse a publicarlo podría ser considerado como un acto
prejuiciado contra quienes creen en el poder de Dios. Sólo podemos
especular, pero verosímilmente, al optar por su publicación, acaso
estaban conscientes de que cada cual es rehén de lo que publica y de
que un artículo "heterodoxo" como este, obviamente desataría una
reacción inmediata de muchos lectores que pondrían las cosas "en su
lugar". Y así fue.
Figura 5.1. Plegarias curativas.
Las pruebas de significación en auxilio del absurdo
Los autores señalan que la intención básica del estudio es probar la

efectividad de la intercesión a través de la oración y no la existencia
de Dios. Pero esto es contradictorio en sí mismo, ya que la efectividad

de los rezos de los intercesores estaría expresándose en la realidad a
partir de invocaciones inmateriales. Los limones administrados por
George Lind a los marineros para el tratamiento del escorbuto, analo-
gía que esgrimen Harris y sus colaboradores en defensa anticipada de
una investigación que demuestra el efecto de una acción aunque se
ignoren los mecanismos causales, eran algo claramente material. En
definitiva, es a ese inescrutable mecanismo supuestamente detonado
por las plegarias a lo que podría llamarse «Dios».
Las personas que tienen fe en la actuación divina han orado desde
los albores de la civilización. Para aquellos que creen en la existencia
de Dios, las razones por las cuales las personas enferman y cómo es
que sanan, tienen un significado muy diferente al que le confieren los
investigadores del estudio (Pande 2000). En las oraciones regulares,
los creyentes no exigen a Dios que cure, no le dan una agenda para
hacer la tarea. En otras palabras, ellos no ponen a prueba a Dios (en
concordancia, por cierto, con el dictum bíblico —Mateo 5:7— de no
someter a pruebas a Dios), sino que aceptan resignadamente lo que
Él haga y entienden que la respuesta a su petición podría ser negativa
como parte de la providencia mayor de Dios. Tanto materialistas como
idealistas coinciden en que la existencia de Dios es una cuestión de
fe; por tanto, la creencia acerca de su intervención es anterior a cual-
quier experimento. Podría considerarse incluso descabellado y hasta
blasfemo el escrutinio científico de temas religiosos de esta naturale-
za. ¿Cómo la ciencia puede demostrar o refutar la existencia divina, si
ésta es simplemente materia de fe? La religión no necesita de las cien-
cias médicas para validar sus rituales (Sloan y Bagiella, 2000).
En realidad no tiene mucho sentido extenderse en el análisis de la
legitimidad de esta investigación. El centro del interés radica en po-
ner de manifiesto cómo el uso mecánico de la metodología es capaz
de validar el absurdo.
Cuando se descubrió que la tierra era redonda y no plana, se dio
un paso que iba de una concepción muy alejada de la realidad a otra
muy ajustada a ésta; pero cuando se supo que realmente no era esfé-
rica sino achatada en los polos, lo que se hizo fue perfeccionar un
conocimiento que, si bien era esencialmente correcto, pudo ser re-
presentado por un modelo más refinado y fidedigno. Así es como
avanza la ciencia, y los métodos fecundos son los que operan en esa
dirección. Si luego del descubrimiento de la redondez terráquea, cierto
método de análisis hubiera conducido a la conclusión de que la tie-
rra era cúbica, hoy pensaríamos que dicho procedimiento era peor
que imperfecto y lo tildaríamos no sólo de inservible sino también
de contraproducente (Silva, 1997b). Esto es en esencia extrapola-
ble a la situación que se presenta con las pruebas de significación estadística
(PSE) en este artículo, ya que en este caso lo único que avala sus
insólitas conclusiones es el resultado surgido de la aplicación de tal
recurso estadístico.
En este punto no puede menos que rememorarse la ya vieja adver-
tencia de Bakan (1966): «Cuando se llega al extremo en que los
procedimientos estadísticos pasan a suplir nuestros pensamientos en
lugar de estar en función de ellos, y somos conducidos así al reino del
absurdo, entonces es el momento de regresar al sentido común».
Algunos defensores de prácticas que carecen de toda explicación
racional o que están en franca oposición a leyes comprobadas de la
ciencia arguyen que «lo único importante es establecer si el método
funciona o no» (véase, por ejemplo, Carlston, 1995). Sobran razones
para impugnar un punto de vista tan miope (véase Sección 3.2.1), que
ofrece un magnífico salvoconducto, por lo demás, para la aplicación
acrítica de las PSE.
La aceptación de las terapias a partir, exclusivamente, de sus apa-
rentes éxitos clínicos vacía de contenido y respaldo al propio concepto
de lo que significa «funcionar». El experimento que nos ocupa ofrece
una excelente ilustración.
La estadística es un recurso metodológico más. Para que sea fruc-
tuoso debe operar en un marco conceptual sólido y a partir de un
diseño correcto. Del mismo modo que el procesador de un sistema
nunca podrá enmendar las deficiencias de los datos de entrada (re-

cuérdese la regla del análisis de sistemas, GIGO5), ningún análisis
estadístico, ni simple ni complejo, podrá enderezar el árbol que nació
metodológicamente torcido. La aplicación de una PSE a tal situación
es, por tanto, contextualmente improcedente, al margen de los defec-
tos intrínsecos de este recurso y del grado de servilismo con que se
emplee. Pero lo cierto es que, en este ejemplo, ambos fenómenos se
ponen de manifiesto. Al examinar el análisis estadístico del artículo se
puede apreciar, en efecto, la flagrante invalidez de las PSE como re-
curso valorativo.
En la medida que los investigadores se niegan a conjeturar siquiera
sobre los posibles mecanismos causales del presunto efecto que pro-
claman como real, su esfuerzo se diluye en un limbo improductivo. Si
el resultado fuera negativo, ¿a qué atribuirlo?: ¿a que Dios no existe?,
¿a que no atendió a los ruegos?, ¿a que éstos no fueron suficientemen-
te vehementes?, ¿a que se produjeron ruegos paralelos de signo
opuesto?
Los autores han convertido una falsa hipótesis sustantiva en hipó-
tesis estadística (algo que casi siempre puede conseguirse) y a partir
de ese punto se conducen como si, al tener una formulación estadísti-
ca, dicha hipótesis hubiera adquirido estatuto científico.
Para poner de manifiesto la falacia que tal maniobra entraña, basta
reparar en una observación del holandés Van der Does (2000), quien
en una carta al editor señala que los autores manejan sólo dos posi-
bles explicaciones para sus resultados: las diferencias son debidas a
las plegarias o pueden atribuirse al azar. Esta última posibilidad que-
da descartada por los datos, puesto que obtienen una diferencia
significativa entre los valores medios de IDC de los grupos (p= 0,04),
aunque ese haya sido el caso para sólo una de las 40 comparaciones
que realizan. No contemplan otras explicaciones alternativas para sus
hallazgos. Es la lógica tramposa de las PSE. Para subrayar el carácter
5
Garbage in, garbage out.
acientífico de la hipótesis cabe solicitar a Harris y sus colaboradores

que consideren esta otra explicación:
"Yo soy telépata y clarividente. Usando estos dones, estaba completa-

mente al tanto (a diferencia de los pacientes involucrados) acerca de
que este estudio se estaba llevando adelante. Usando mis poderes de
«sanador a distancia», que también poseo, decidí intervenir en el cur-
so de los acontecimientos a favor de los integrantes del grupo
experimental. Admito que los resultados obtenidos fueron algo me-
nos espectaculares de lo que esperaba, pero ello puede atribuirse al
hecho de que siempre había practicado mis poderes dentro de mi
país; esta fue mi primera experiencia de intervención terapéutica en
el extranjero. No obstante, estoy satisfecho, pues al menos conseguí
una diferencia que resultó ser estadísticamente significativa."
Las explicaciones son entonces tres:
• Poder de las oraciones desplegadas por el equipo de rezadores

de Kansas.
• Telepatía y clarividencia más capacidad terapéutica a distancia
ejercida por mí.
• Empleo de técnicas estadísticas cuestionables.
Me pregunto si Harris y sus nueve colaboradores tendrán algún

argumento convincente que otorgue más credibilidad a la primera ex-
plicación que a la segunda. Puesto que ambas son igualmente ridículas,
sólo nos queda la tercera.
Una diferencia significativa pero insignificante
La prueba t de Student para comparar las medias del IDC en am-

bos grupos (µexp = 6,35; µcon = 7,13) permite, aunque sea «por los
pelos», declarar a la diferencia observada (7,13- 6,35=0,78) como

estadísticamente significativa (p= 0,04). Ahora bien, ¿qué significa
cualitativamente dicha diferencia? El artículo ni siquiera lo valora.
Para el análisis de sus datos, Harris y sus colaboradores se basan ex-
clusivamente en las PSE; prescinden de los intervalos de confianza,
incluso como recurso complementario. Afortunadamente, se comuni-
ca la desviación estándar de los datos en cada grupo (5,61 para el
experimental, y 6,18 para el grupo control), lo cual nos permite hacer
el análisis usando este recurso.
Si tenemos en cuenta que la puntuación asignada a los componen-
tes del IDC fuerza a que el indicador tome valores enteros (se basa en
la suma de números enteros entre 1 y 6), esta diferencia de 0,78 a
todas luces dista de tener trascendencia sustantiva, pues, colocado en
una perspectiva clínica, representa mucho menos que algo tan simple
como un pasajero episodio de fiebre. Es fácil ver que el IC al 99% es
(0,76 – 0,80), de modo que «podemos estar sumamente confiados» en
que, a lo sumo, pudiera alcanzar el valor 0,80. Dicho de otro modo, se
puede confiar en que la diferencia es, en el mejor de los casos, muy
inferior a un solo punto de la escala con que se mide el IDC, lo que en
términos cualitativos indicaría que el poder de las plegarias es simple-
mente insignificante. Sorprende que los autores no reparen, por cierto,
en que un efecto tan esmirriado parece algo indigno de quién no en
balde es denominado el Todopoderoso.
Procede recordar a Mc Closkey (1995) cuando escribía: «Los cien-
tíficos suelen preocuparse acerca de si el resultado es estadísticamente
significativo; pero deberían estar mucho más preocupados en valorar
qué es lo que esto significa».
Una vuelta de tuerca adicional
El israelí Leonard Leibovici es uno de los editores de la prestigiosa

revista British Medical Journal. Hace pocos años señalaba que las lla-
madas «medicinas alternativas» se comportaban como los pájaros cuco:

disfrazándose e introduciéndose advenedizamente en el nido del em-
pirismo para ganar credibilidad científica y médica (Leibovici, 1999).
El autor aboga por operar con lo que llamó modelos profundos, precau-
ción esencial a la hora de elegir qué hipótesis merecen ser dignificadas
por un examen cuidadoso. Tal valoración es crucial para desestimar
de entrada aquellas que, ni con la mejor voluntad, casan con la sensa-
tez y el sentido común.
Leibovici (2001) utilizó recientemente esta misma tribuna para
mostrar lo que puede ocurrir en caso de que se desdeñe la idea de los
modelos profundos. El último número del año 2001 de la revista British
Medical Journal incluyó un artículo con su firma bajo el título: Ensayo
Clínico Controlado sobre el efecto, retroactivo y a distancia, de la intercesión
mediante la oración en pacientes con infección sanguínea. El propósito del
ensayo clínico realizado por este autor fue valorar los posibles efectos
de los rezos sobre la mortalidad, el tiempo de estancia hospitalaria y
la duración de la fiebre, como continuación natural del trabajo de las
plegarias que se acaba de discutir. Sin embargo, se trata de un Ensayo
Clínico Controlado con la peculiaridad de que el autor no asume, a
priori, que el tiempo sea lineal, o que Dios esté limitado por esta li-
nealidad que nosotros percibimos y que obligaría a una secuencia
temporal de los eventos (primero la causa y luego el efecto). Para
sostener tan insólita posibilidad, Leibovici se ampara en un especula-
tivo artículo debido a los físicos Landsberg y Vickers (2000), que fuera
publicado en la afamada revista Nature6.
De hecho, la «intervención» en el grupo experimental fue realizada
¡varios años después del desenlace de la afección en los pacientes!
Fueron incluidos en el estudio 3.393 adultos que habían ingresado
entre 1990 y 1996 con infección sanguínea en el Rabin Medical Cen-
6
De paso, Leivobici también pone con ello en entredicho cierta tendencia de revistas no
médicas a ceder ante esnobismos infundamentados (o, más bien, infundamentables, debido a
su propia esencia absurda).
ter de Israel. En el año 2000 los pacientes fueron aleatoriamente dis-

tribuidos en dos grupos: uno que fue objeto de las plegarias y otro en
el que no se intervino. Se entregó a los intercesores el listado con los
nombres de los pacientes que finalmente integraron el primero para
que rezaran por ellos y luego se buscó el desenlace que había ocurrido
en las historias clínicas que se habían conservado en el hospital. El
diseño del estudio fue a doble ciega.
Usando PSE convencionales se halló asociación estadísticamente
significativa entre el tratamiento propuesto y dos de las variables: tiem-
po de estancia hospitalaria y duración de la fiebre (p = 0,01 y p = 0,04,
respectivamente). La mortalidad fue 28.1% (475/1691) en el grupo de
intervención y 32,0% (514/1.702) en el grupo control, pero la diferen-
cia no llegó a ser significativa (p = 0,40). A partir de estos resultados
estadísticos, el autor sugiere la inclusión del nuevo tratamiento en la
práctica médica. Aunque advierte que no existen mecanismos conoci-
dos que puedan explicar los efectos benéficos, a distancia, de la
intercesión retroactiva en pacientes con infección sanguínea, afirma que
los resultados de las PSE y el perfecto diseño de la investigación prue-
ban que este efecto puede conseguirse.
Afortunadamente, la publicación de este estudio tuvo el impacto
seguramente deseado: movilizar el sentido común. Dos semanas des-
pués de su publicación habían sido enviadas decenas de cartas a la
revista, la inmensa mayoría de las cuales reaccionaban (por lo general
jocosamente, aunque algunas con irritación) contra el carácter desca-
bellado de esta posibilidad, convicción obviamente anterior a cualquier
supuesta valoración estadística.
Debe señalarse que, si bien en ningún momento Leibovici se apea de
la apariencia de máxima seriedad (o precisamente por ello), ha tratado
con refinada ironía el artículo de Harris et al. (1999) examinado en los
epígrafes precedentes y, sobre todo, ha conseguido lo que se proponía:
ridiculizar las propuestas carentes de toda racionalidad (la suya es di-
rectamente demencial) y, en no menor medida, a mi juicio, los recursos
estadísticos mecanicistas que tienen la posibilidad de avalarlas.
Los escollos para hacer de la ciencia una actividad más racional,

pueden de hecho acentuarse como consecuencia de la aceptación acrí-
tica del veredicto que aportan las PSE. Valga la siguiente constatación.
El asunto de la «intercesión por medio de oraciones» ha concitado la
atención de la Colaboración Cochrane, que en su reciente revisión del
tema (Roberts, Ahmed y Hall, 2003) concluye asombrosamente que
«la evidencia presentada hasta ahora es lo bastante interesante como
para justificar nuevos estudios». Llena de estupor que esta organiza-
ción, máximo exponente y promotora de la llamada medicina basada en
la evidencia, que ha defendido por más de veinte años la necesidad de
tomar decisiones en materia de asistencia sanitaria sustentadas en
evidencias científicas sólidas, convoque a realizar más investigacio-
nes sobre un procedimiento terapéutico cuyo único respaldo procede
de la aplicación de un recurso altamente cuestionado: las PSE. Hasta
ese punto puede conducir el entramado de equívocos vertebrado en
torno a esta técnica, capaz de dar avales absolutamente inmerecidos.
Epílogo sorprendente
Desde luego, la intercesión realizada sin conocimiento de los pa-

cientes involucrados es algo muy diferente al posible efecto de los
rezos sobre un paciente a quien se le informa que éstos se están pro-
duciendo. Tal conocimiento pudiera tener un impacto real, y en
principio quizás favorable. Pero he aquí que una investigación desa-
rrollada a lo largo de 10 años (Bensen et al., 2006), pone de manifiesto
exactamente lo contrario. El estudio, calificado en el New York Times
como «la más rigurosa investigación científica realizada hasta la fecha
acerca de los efectos de los rezos sobre la recuperación de los pacien-
tes» (Carey, 2006), tuvo un resultado curioso: dicho efecto existe, pero
es adverso para la salud del paciente.
Aproximadamente a 1.201 de los 1.802 pacientes involucrados en el
estudio, todos los cuales serían objeto de la implantación de un bypass,
se les dijo que podrían ser objeto o no de rezos, pero no se les informó
en cuál de los dos casos estaría. De ellos, 604 elegidos al azar recibieron
ese beneficio y 597 no. Un tercer grupo, integrado por los restantes 601,
fue destinatario de plegarias pero sin que se les comunicara que así
sería. Los rezos, a cargo de intercesores procedentes de congregaciones
cristianas de Massachusetts, Minnesota, y Missouri, quienes pedían que
la intervención fuera exitosa y sin complicaciones, comenzaron la no-
che previa a una operación y continuaron por dos semanas. La variable
de respuesta más importante fue el desarrollo o no de complicaciones
en los 30 primeros días del periodo postoperatorio. Aproximadamente
el 54% de todos los pacientes presentó este percance: 52% en el primer
grupo, 51% en el segundo, y 59% en el último. La diferencia entre el
grupo de los que fueron objeto de rezos sin saberlo y el de los que sí se
enteraron, como se ve, es notable (y la prueba estadística arrojó un
valor p=0,025). Un dato interesante es que, según New York Times, el
estudio costó dos millones y medio de dólares a la fundación religiosa
John Templeton Foundation, la cual financió el estudio con la expecta-
tiva de demostrar lo contrario de lo que se halló.
LOS MODELOS MULTIVARIADOS

Los modelos multivariados (o multivariables) y, destacadamente,
la regresión logística, constituyen una alternativa sumamente atracti-
va y útil a los efectos de controlar simultáneamente de manera ágil y
elegante varios posibles factores de confusión. A su popularidad con-
tribuye decisivamente el hecho de que las enormes dificultades
computacionales que ofrece, debido a la complejidad de los algorit-
mos en que se basa, han dejado de ser un obstáculo con el advenimiento
de los rapidísimos ordenadores personales y los numerosos programas
informáticos a los que hoy todos tenemos acceso (véase Silva, 1995).
En esencia, si consideramos la respuesta binaria «enfermar-no en-
fermar» y ajustamos una regresión logística introduciendo una posible
causa o factor de riesgo como variable independiente y un conjunto

de covariables con vistas a ser controladas, se obtiene un coeficiente
para la primera que permite aquilatar el grado de asociación entre
dicha posible causa y la respuesta «ajustado por el posible efecto con-
fusor de todas las covariables incorporadas al modelo». Bien usada,
esta propiedad constituye un excelente paliativo a la limitación que
supone el hecho de no poder asignar aleatoriamente los sujetos a los
tratamientos.
EXPLICACIÓN Y PREDICCIÓN
En este marco debe advertirse algo recurrentemente olvidado: «factor
de riesgo» y «factor predictivo» no son sinónimos: el hecho de que esté
actuando o no un factor de riesgo (y conocer el grado en que éste gravita)
puede ocasionalmente ser útil para la predicción, pero una variable puede
hacer importante aportación a los efectos de predecir, aunque en sí mis-
ma no sea un factor de riesgo ni tenga papel causal alguno.
Por ejemplo, la pérdida sostenida de peso puede tener valor predic-
tivo a los efectos de que un adolescente realice un intento suicida,
aunque la pérdida de peso no tenga —como es obvio— ninguna «res-
ponsabilidad» en el hecho. Y en esa calidad, puede tener interés a los
efectos de la prevención. Toda variable explicativa tiene valor predic-
tivo, pero lo que el ejemplo ilustra es que el recíproco es falso: un
factor puede servir para la predicción sin que eso lo convierta ni por
asomo en un agente causal.
UNA CEREMONIA ENCUMBRADA
Aunque los rituales —unos generales, otros más puntuales— adop-

tan muchas formas y se multiplican, hay uno que parecería florecer
especialmente. Su aparición es tan recurrente en artículos científicos,
tesis y estudios epidemiológicos, que resulta a mi juicio evidente que

el día que la vieron usar por primera vez muchos investigadores que-
daron convencidos de haber tropezado con una llave maravillosa con
la cual podrían empezar a abrir puertas; bastaría sólo reproducirlo. Es
a mi juicio crucial examinar el asunto con bastante detalle y señalar
cuán estéril termina siendo su machacona aplicación cuando se reali-
za como una panacea con forma de receta.
El esquema de la ceremonia
Las consideraciones recordadas de manera sintética en la Sección

precedente nos colocan en el escenario donde se despliega una de las
ceremonias estadísticas más empleadas y perniciosas.
Su empleo se ha extendido hasta el punto de haberse convertido en
un verdadero ritual, que se aplica intensamente en estudios observa-
cionales orientados a identificar factores de riesgo para desarrollar o
padecer cierta enfermedad (estudios de casos y controles y estudios
prospectivos) discurre básicamente del modo siguiente:
1) Identificar un conjunto de variables que verosímilmente pudie-

ran considerarse factores de riesgo; para ello se acude a criterios
de expertos, estudios previos, consideraciones teóricas o bús-
quedas en manuales o en Internet.
2) Hacer un estudio «univariado» donde se valora la posible aso-
ciación entre cada una de las variables arriba mencionadas y la
variable de respuesta (típicamente una enfermedad o una com-
plicación) mediante una prueba de significación (por lo general
Ji-Cuadrado o t de Student en dependencia de que la variable
sea dicotómica o continua).
3) Ajustar un modelo multivariado usando las variables originalmen-
te identificadas. Lo más frecuente es que se aplique la regresión
logística y que el ajuste se realice con aquellas variables indepen-
dientes para las que se obtuvo «significación» en el paso ante-

rior.
4) Identificar las variables independientes que «se asocian» con la
variable de respuesta. En este punto la receta puede continuar,
bien identificando cuáles de las variables mantienen su carácter
significativo tras haber hecho el ajuste mencionado en el punto
3, bien aplicando un procedimiento algorítmico de selección de
variables; es decir, aplicar una selección «paso a paso» (stepwise
regresion) para determinar cuáles variables han de «quedarse» en
calidad de factores detectados como verdaderamente influyen-
tes y cuáles habrán de despreciarse.
5) Calificar como factores de riesgo a las variables que «sobrevi-
ven» (por lo general, las que se mantengan como significativas)
luego del paso precedente.
Debe puntualizarse que el ritual descrito no se emplea siempre de

manera exactamente igual. En ocasiones, por ejemplo, se omite el paso
2 y se procede del primer paso directamente al 3. A veces, al cumplir el
paso 5 no se habla de «factores de riesgo» como tal, sino que se emplea
una expresión neutra: que alude a las «variables que se asocian» con la
dolencia. Tal declaración es especialmente inútil e intrascendente, pues
la asociación per se nunca interesa; sólo tiene interés en tanto ingredien-
te de un proceso. Para hallar una discusión detallada donde se fundamenta
esta afirmación, véase Silva y Benavides (1999).
Hallar ejemplos en que se aplique este esquema es sin duda más
fácil que encontrar estudios que se planteen resolver la tarea de la
causalidad contemplando todas las exigencias del caso. Una rapi-
dísima búsqueda en Internet, sólo en idioma castellano, me permitió
hallar numerosos ejemplos en diversas revistas latinoamericanas y
españolas.
Sólo a modo de ejemplo, se invita al lector a revisar una reducida
muestra de ejemplos recientes en Venezuela, Chile, Perú, Colombia,
España, México, Costa Rica, Argentina y Cuba, todos susceptibles de
ser hallados en Internet: Díaz OL (2000), López et al. (2000), Lleó et

al. (2000), Fuertes et al. (2001), Alegría et al. (2002), Meza et al. (2002),
Recabarren y Cárdenas (2003), Gimenoa, Marko y Martínez (2003),
Baena et al. (2003), Roselló (2003), Romero et al. (2003), Verdonck et
al. (2004), Rosas et al. (2004), Llop et al. (2004), Rosales et al. (2005),
Lizarralde et al. (2005), Rodríguez et al. (2005), Ríos et al. (2005). La
situación en el mundo anglosajón no es muy diferente.
Cuándo y por qué su aplicación es infructuosa
A continuación desarrollo un sucinto análisis orientado a demos-

trar que la aplicación canónica del procedimiento es inconducente.
Veamos cada uno de los pasos.
• Primer paso: Identificar un conjunto de posibles factores de riesgo.

En primer lugar, hay que señalar que una tendencia bastante gene-
ralizada es tratar de identificar «todos» los factores de riesgo para
una dolencia. Curiosamente, este ampuloso propósito (aunque no
tiene nada objetable en principio) es mucho más típico de ambien-
tes de menor desarrollo que de espacios académicos consagrados.
Dicho de otro modo: cuanto más desarrollo, las preguntas son más
incisivas, puntuales y creativas; cuanto menos desarrollo, más abar-
cadoras e inespecíficas.
El otro asunto es que, al trazarse este propósito global, los investi-
gadores suelen poner a prueba ciertos factores cuyo carácter de
riesgo o cuyo papel causal es bien conocido. Si ellos se hubieran
planteado algunas preguntas específicas, obviamente no destina-
rían energía a examinar condiciones o variables para las que ya se
tiene una respuesta hace mucho tiempo.
• Segundo paso: Valorar significación a través de un estudio «uni-

variado» con cada variable.
Suele considerarse que un riesgo relativo o un odds ratio mayor que

2 es ya suficientemente grande como para considerarlo promisorio
y digno de estudio más profundo (Beaglehole, Bonita y Kjellström,
1994). Como se consigna en el sonado artículo de Taubes (1995),
algunas de las importantes figuras de la epidemiología contempo-
ránea demandan valores mayores para dignarse a prestarle atención;
Marcia Angell, por ejemplo, ex editora de The New England Journal
of Medicine, reclamaba que éste ascendiera a por lo menos 3. Lo
que sí no menciona ningún verdadero experto como criterio de-
marcatorio es que la asociación hallada difiera de manera estadísticamente
significativa de la nulidad.
Una razón para la crítica reside en que lo que realmente importa es la
magnitud del efecto (el grado de la asociación). El carácter significa-
tivo es irrelevante, habida cuenta de que la famosa «significación»
puede conseguirse tomando muestras suficientemente grandes (véa-
se apartado Valores p y tamaños de muestra, p. 371).
Si bien las pruebas de significación son merecedoras de una valo-
ración crítica por sí mismas, su papel puede ser especialmente
contraproducente cuando se comete la ingenuidad de emplearlas
como un cribado inicial para la identificación posterior de causas o
de FR.
• Tercer paso: Identificar cuáles de las variables mantienen su ca-

rácter significativo tras ajustar un modelo multivariado.
El ajuste de un modelo multivariado para controlar variables confu-
soras es en principio adecuado. Sin embargo, la manera en que suele
emplearse es desastrosa. Lo correcto sería lo siguiente:
a) identificar con claridad la variable cuya condición de FR (o po-

sible causa) se quiere evaluar e incluirla como una de las
variables independientes del modelo;
b) valorar teóricamente, uno por uno, aquellos factores que pudie-
ran ser confusores de la relación entre el presunto FR y la variable
de respuesta (para ello hay que corroborar que cumple las con-
diciones) e incluir como covariables del modelo sólo a los que
estén en ese caso;
c) valorar la magnitud de la asociación que se obtiene luego de
haber controlado simultáneamente todos los factores del punto
anterior;
d) valorar esta magnitud a la luz de lo que se obtuvo cuando se
hizo la estimación cruda (sin ajustar por los factores confuso-
res); si la asociación inicial no se modifica, el carácter de FR
intrínseco se consolida.
Nótese que según lo anterior, el control de variables en el contexto

observacional no debe practicarse si no es para evaluar hipótesis clara-
mente expuestas y fundamentadas con anticipación, donde el potencial
papel confusor de las variables que se controlan también tenga respaldo
teórico independiente y fundamento lógico anterior.
En cambio, lo que suele hacerse, simplemente, es:
– Incluir en el modelo todas las variables que se consideran posi-

bles factores de riesgo (háyase o no realizado el cribado univariado).
– Identificar todas aquellas cuyos coeficientes de regresión sean
significativamente diferentes de cero.
• Cuarto paso: Concluir que las variables influyentes son las que se
retienen tras aplicar una selección paso a paso.
Al depositar en este algoritmo la responsabilidad de decidir cuáles
son los FR, se pasan por alto al menos los siguientes conflictos:
1. las ya mencionadas limitaciones de las PSE;

2. que probablemente se estén controlando factores que no son
confusores (un FR no necesariamente es un confusor para la
asociación de la enfermedad con otro FR);
3. la frecuente inclusión de marcadores de riesgo como si fueran

necesariamente confusores.
Stepwise suele ser unwise
Consideremos ahora los métodos de selección algorítmica del modelo, que

constituyen el caso extremo de la ingenuidad cuando se aplican en el
contexto del ceremonial descrito. Estos métodos se han concebido para
identificar aquellas variables que habrán de integrar la función que a la
postre será empleada como modelo resumen del proceso bajo estudio. No
explicaré aquí en detalle cómo operan estos métodos; basta compren-
der que la lógica subyacente de tal recurso consiste en conservar las
variables independientes que contienen información relevante y a la
vez prescindir de aquellas que resulten redundantes respecto de las que
quedaron en el modelo. En cualquier caso, lo más importante es reparar
en que se trata de procedimientos de índole exclusivamente estadística,
que discurren según algoritmos programables en los que, una vez elegi-
do el conjunto inicial de variables, no intervienen los juicios teóricos de
los investigadores (Silva y Barroso, 2001).
Figura 5.2. Oficiando la ceremonia de la regresión paso a paso.

Se han ideado varias alternativas para seleccionar un «modelo re-

sumen». La más conocida es la llamada regresión paso a paso —RPP—
(stepwise method), susceptible de ser aplicada según diversas variantes.
Las más empleadas son: ir incorporando variables al modelo (forward
selection), e ir eliminando variables de él (backward elimination). Virtual-
mente todos los grandes paquetes informáticos para el tratamiento
estadístico de datos (tales como SPSS, SAS, BMDP o MINITAB) brin-
dan la posibilidad de aplicar estas dos posibilidades.
Supongamos que un investigador quiere construir una función que
permita estimar cuán probable es que una embarazada dé a luz un
niño con bajo peso atendiendo a un conjunto de rasgos de la madre
tales como escolaridad, si fumaba durante el embarazo, edad, número
de hijos anteriores, cifras tensionales, salario, etc. En tal caso, el mo-
delo de regresión (incluyendo el colofón de una RPP) puede ser útil.
Es posible que en el modelo final no figure el hábito de fumar (que
tiene responsabilidad causal) pero sí figure el salario (que no la tiene).
Sin embargo, a los efectos de lo que se procura resolver, esto no ha de
preocupar, ya que la información inherente al hábito nicotínico vero-
símilmente ya esté subsumida en otras tales como el propio salario y
la escolaridad (ya que fuman más las madres menos instruidas o de
menor nivel socioeconómico).
Es decir, si este procedimiento se emplea para construir un mode-
lo predictivo a través de un proceso acorde con el llamado «Principio
de Parsimonia» (tratar de que figure la menor cantidad posible de va-
riables), no veo objeción de peso al empleo de la RPP, ya que la
predicción es un proceso para cuya valoración el único mecanismo de
interés es estrictamente pragmático. Un modelo predice o no predice
aceptablemente; poco importa si involucra o no a variables causal-
mente influyentes. Ocurre lo mismo que con el hecho de que alguien
lleve fósforos en su bolsillo: se puede vaticinar (con cierto grado de
error, claro está) que fumará en las próximas horas sin importar que
ello no sea una causa del hábito de fumar ni un factor que incremente
la probabilidad de su existencia.
Sin embargo, por lo general (aunque ocasionalmente se use la ter-

minología de la predicción) la RPP se usa para identificar los factores
verdaderamente influyentes y no para construir modelos de predicción.
De hecho, autores de gran prestigio sugieren que cuando se ajuste un
modelo de regresión múltiple se aplique de inmediato un procedimiento
algorítmico de selección de variables (véase Kleinbaum, Kupper,
Muller, y Nizam, 1997).
Tras la aplicación de la RPP, los resultados suelen ser interpretados
como sigue: las variables que se «quedan» dentro del modelo final son
parcialmente responsables (quizá las principales y hasta las únicas res-
ponsables) de las modificaciones que experimenta la variable
dependiente; las que no permanecen, no influyen causalmente en el
proceso, o su influencia no es apreciable. Es decir, muchos investiga-
dores utilizan la selección algorítmica de modelos con la aspiración
de obtener de manera automática conclusiones explicativas sobre el
proceso causal que estudian.
La esperanza de que el uso de estos procedimientos contribuya a
«entender» o «explicar» la realidad es, en el mejor de los casos, estéril
o quimérica; y, no con baja probabilidad, contraproducente y desca-
bellada. La improcedencia de emplear la RPP con este fin se examina
con más profundidad a continuación.
Los números no saben de dónde vienen
Para interpretar más claramente esta realidad, consideremos un

ejemplo tomado de Silva y Barroso (2001). Supongamos que un in-
vestigador estuviera interesado en conocer cuáles son los factores que
verdaderamente influyen en el padecimiento de enfisema pulmonar
antes de los 60 años de edad. Podría comenzarse con la elección de un
conjunto de variables presuntamente explicativas del proceso que se
estudia, tales como edad, antecedentes patológicos familiares, hábito
de fumar cigarrillos, pigmentación de los dedos (pulgar, índice y me-
dio) de la mano, polución ambiental en su medio laboral, etc. En ese

punto, realizar un estudio prospectivo mediante el cual se identifica a
quienes desarrollan o no enfisema, para entonces, aplicar la regresión
logística y, finalmente, realizar una selección mediante RPP con la
idea de establecer cuáles de estas variables tienen mayor peso causal
sobre la aparición de la dolencia (o cuáles son los factores que entra-
ñan mayor riesgo de desarrollarla).
No sería para nada inverosímil que tal acción tuviera como posible
resultado que el grado de pigmentación en los dedos quedara incluido
en el modelo y a la vez resultara excluida la condición de fumador. Es
una posibilidad natural debido a la madeja de correlaciones que tienen
estas dos variables con las restantes del modelo y a la asociación que
tienen entre sí, y especialmente en virtud de algo que no por ser eviden-
te, deja de ser frecuentemente olvidado: «los números no saben de dónde
vienen», como advirtiera Lord (1953) hace más de 50 años.
Si no fuera por la certeza que existe hoy de que el hábito de fumar es
una práctica que favorece el enfisema pulmonar y de que la pigmentación
de los dedos (inducida por el hábito) no guarda relación causal7 con la
dolencia, el investigador sería conducido por sus propias reglas de análisis
a aseverar que la pigmentación de los dedos, en caso de mantenerse en el
modelo final, es una causa o un factor de riesgo para esta entidad. Como
es obvio, tal conclusión, lejos de iluminar el camino hacia el conocimien-
to de las verdaderas relaciones causales, lo ensombrecería.
Como señalé antes, si el modelo de regresión se aplicara para esti-
mar la probabilidad de que un sujeto con cierto perfil desarrolle en el
futuro un enfisema pulmonar (por ejemplo, para emprender una espe-
cial acción preventiva sobre quienes tengan tal perfil), entonces la
pigmentación de los dedos podría figurar con todo derecho en el mo-
delo. En este contexto resulta irrelevante si una variable dada ha
quedado incluida en virtud de que desempeña un papel causal, o por
7
Es obvio que si se inventara un jabón que borrara todo pigmento, ello no mejoraría las
perspectivas que pudiera tener un fumador de evitar el enfisema.
ser un mero reflejo de otras variables que no figuran pero que sí pu-
dieran tener influencia. Todo lo que importa en tal caso es construir
un instrumento eficiente para la predicción.
Pero si se quiere entender el mecanismo de producción del enfisema
(identificar factores causales o de riesgo), la maniobra descrita es como
mínimo inconducente, y el recurso de no comprometerse mediante el
expediente de calificar de «predictivas» a ciertas variables independientes
es meramente retórico, pues no se está avanzando absolutamente nada
en el conocimiento causal sino respondiendo a la pregunta equivocada.
Lo curioso es que, a la vez que muchos autores están advertidos
acerca de que no deben confundir asociación con causalidad en el
marco univariado, parecen olvidarlo cuando quedan encandilados por
los métodos multivariados, así como que no comprendan que, al apli-
car estos algoritmos mecánicamente, están incurriendo solapadamente
en el viejo sofisma. Variables que pudieran tener responsabilidad «di-
rectamente causal» pueden resultar eliminadas al ser suplidas por una
o más variables que no tengan influencia real alguna pero que se vin-
culen con ella. Y en la medida que el asunto se dirime en la caja negra
de la RPP, nada podemos hacer para conjurar esa contingencia.
Hace casi tres decenios, Guttman (1977) había advertido que «el
uso de la regresión paso a paso es en la actualidad una confesión de
ignorancia teórica sobre la estructura de la matriz de correlaciones».
Cuando la regresión múltiple se usa para describir los patrones de
causalidad según los cuales ciertas variables actúan sobre otra, la re-
gresión paso a paso equivale a cubrir esa ignorancia con un algoritmo
que piense por el investigador. No en balde el stepwise regression fue
rebautizado irónicamente por Leamer (1985) como unwise regression8.
Ocasionalmente, el ceremonial descrito ni siquiera se completa: se
construye un modelo «final» y todo se reduce a comunicarlo. En tales
8
Juego de palabras intraducible que aprovecha que el vocablo wise denota en inglés la
manera o el modo de hacer algo, pero también significa «sabio», de modo que unwise regression
vendría a ser algo así como regresión tonta, desatinada o irracional.
casos daría la impresión de que se ha hecho de la aplicación de este

recurso una finalidad en sí misma.
Veámoslo en un estudio real de casos y controles concebido para
—según se deriva del propio título del estudio— identificar factores
de riesgo para que un sujeto se torne consumidor de antidepresivos.
Allí Rispau et al. (1998) llevan a cabo la maniobra típica pero sin rea-
lizar siquiera un cierre conceptual. Con las variables que exhibían
relación significativa a nivel bivariante con el hecho de ser caso o
control, se ajustó una regresión logística a la que se aplicó luego el
método stepwise. Según palabras de los investigadores: tras aplicar este
procedimiento «entraron a formar parte de la ecuación el hecho de
haber vivido algún acontecimiento personal relevante y el presentar
valores de la escala de Zung9 superiores a 50». Se ha construido un
modelo «final»; ahora procede preguntarse ¿y qué? En este trabajo
concreto no se intenta sacar conclusiones (el hecho queda suelto y
desconectado en el discurso), ya que cualquier respuesta sobre causa-
lidad carecería de sentido. En efecto, sería imposible descartar que, al
«quedar» la escala de Zung en el modelo, exista cierta variable asocia-
da con dicha escala que resultó estadísticamente redundante (en virtud
de lo cual haya quedado fuera de la función obtenida mediante el
stepwise) pero que pudiera tener importante vínculo causal con el con-
sumo de psicofármacos, máxime en este caso, en que lo que se
«demuestra» a través de la regresión es nada menos que ¡el consumo
de antidepresivos está asociado con estar deprimido!
En síntesis, el problema fundamental está en la pretenciosa y a la
vez ingenua interpretación que suele hacerse del resultado que arroja
la RPP. Su empleo con fines explicativos es absurdo, pues la selección
algorítmica de modelos no puede evitar que los resultados dimanen
de meras concomitancias estadísticas (de hecho, en eso se basan), ni
distinguir entre las asociaciones de índole causal y las debidas a terce-
ros factores involucrados en el proceso.
9
La escala de Zung es un indicador propuesto en 1990 para la medición de la depresión, el
cual se obtiene tras un cuestionario que el sujeto se autoaplica.
Espacio para el sentido común
El sentido común nos dice que si el empleo mecánico de recursos

estadísticos, sean univariados o multivariados, pudiera ayudar a es-
clarecer las complejas relaciones causales que expliquen por qué unos
individuos enferman y otros no, entonces con las enormes bases de
datos hoy disponibles, las poderosísimas y veloces computadoras ac-
tuales y los potentes programas informáticos a los que todos tenemos
acceso, la etiología del cáncer de mama, por poner un ejemplo, no
sería el misterio que es hoy para la ciencia y que obliga a la generación
apremiante de nuevos enfoques que se han venido reclamando (véase
Evans, Morris y Marmor, 1994), muy alejados de la acomodaticia es-
peranza de que el software puede suplir nuestras perspicacia y
creatividad.
Se ha argüido que las enfermedades, en especial las coronarias y
los tumores malignos, son entidades muy complicadas y dependien-
tes de demasiadas variables mutuamente correlacionadas para que
el análisis pueda prosperar con recursos estadísticos elementales.
Tal afirmación es un poco ridícula, no porque sea falsa, sino porque
es verdadera para casi cualquier dolencia imaginable (desde el cata-
rro común hasta la esclerosis múltiple) y, sobre todo, porque contiene
el mensaje implícito de que con procedimientos multivariados sí po-
dríamos alcanzar respuestas automáticas. Lo cierto es que, a partir
de esta convicción, en los últimos años se ha multiplicado el empleo
de complejos modelos estadísticos multivariados que supuestamen-
te podrían esclarecer las cosas. Pero el problema no radica en la
escasa frondosidad del método estadístico sino en la manera erró-
nea de emplearlo y en la falta de teorización. De hecho, hace ya
mucho se dispone de avanzados recursos tanto estadísticos como
computacionales; esto no parece haber producido, sin embargo, un
giro visible en la situación.
No casualmente Kolmogorov (citado por Breilh, 1997), uno de los
más eminentes especialistas en teoría de probabilidades, advertía:
"...en el estudio de fenómenos tan complicados como los que apare-

cen en biología y sociología, los métodos matemáticos no pueden
desempeñar el mismo papel que, por ejemplo, en la física. En todos
los casos, pero especialmente allí donde los fenómenos son más com-
plicados... si no queremos perder el tiempo manejando fórmulas
desprovistas de significado, el empleo de la matemática es útil sólo si
se aplica a fenómenos concretos que ya han sido objeto de una pro-
funda teorización."
La aplicación de la RPP es la situación en la que el ritual se lleva a

su máxima expresión.
Se ha enfatizado la necesidad de incluir sólo variables cuyo sentido
epidemiológico o clínico esté claro, pero eso no resuelve el problema
cardinal: si aspiramos a que la RPP conduzca a conseguir conocimien-
tos que no teníamos sobre la preeminencia causal de unas variables
sobre otras, necesariamente tendremos que incluir variables iniciales
cuyo papel ignoramos; y viceversa: si conocemos cabalmente ese pa-
pel, entonces la RPP no puede decirnos nada novedoso, y la selección
algorítmica del modelo se convierte en una finalidad y no en un me-
dio. No es posible escapar de este laberinto.
Los esfuerzos por resolver el problema a través de poderosos pro-
gramas informáticos recuerdan a los constructores de máquinas de
movimiento perpetuo: ignorantes de la ley de conservación de la ener-
gía, creyendo que sus fracasos se debían a que el diseño del aparato
no era suficientemente ingenioso, procedían a desgastarse en la con-
fección de nuevos y más sofisticados dispositivos10 (Silva, 1997b).
Nótese finalmente que, bajo ningún concepto, se está desdeñando
el poder esclarecedor de la estadística; lo que se rechaza es la extendi-
da ilusión de que ella pueda aportar explicaciones por sí sola. Resulta
10
Incidentalmente, no deja de ser asombroso que tales inventores no se den por vencido ni
siquiera en pleno siglo XXI, y no sin éxito financiero y mediático, como denuncia Park (2001).
más eficiente no perder el tiempo buscando o aplicando códigos algo-

rítmicos de procedimiento y recetas estadísticas para hacer una
epidemiología fructuosa. El pensamiento científico nunca ha sido al-
goritmizable en ningún dominio. ¿Por qué habría de serlo en éste? La
estadística puede ocupar un espacio como invalorable recurso instru-
mental, pero sólo un régimen de amplia simbiosis transdisciplinaria y
metodológica desplegada en un marco teórico profundo será capaz de
cerrar ciclos cognoscitivos que dejen dividendos reales.
TAMAÑO DE MUESTRA
El problema
El sensible y crucial asunto de determinar el tamaño muestral ade-

cuado para un estudio constituye un ejemplo difícilmente superable
de procedimientos atravesados por no pocos tics y presupuestos mís-
ticos.
He tratado este tema con todo detalle en Silva (2000a), pero me
parece oportuno comentarlo brevemente también en este texto, ya
que su abordaje configura uno de los rituales más extendidos. Se trata
de una tarea muy singular y contradictoria porque en ella confluyen
dos circunstancias especiales:
• es un asunto al que hay que atender insoslayablemente: por una

u otra vía, no hay más remedio que decidir un tamaño muestral;
• no existe una solución formal que sea medianamente satisfac-
toria.
Todo estudio empírico demanda el manejo de muestras, y es natu-

ral que, cualquiera sea su naturaleza, se desee operar con la menor
cantidad posible de unidades de análisis con el fin de economizar re-
cursos. El problema consiste en hallar ese número mínimo.
Falsas soluciones
Curiosamente, a pesar de ser uno de los temas más borrosamente

solucionados por la estadística, la uniformidad del tratamiento que le
dan los textos es casi total; ello hace pensar a muchos que la interfase
entre la teoría y la práctica correspondiente está completamente con-
solidada y carece de fisuras. Pero esto es falso.
No es que no existan fórmulas que supuestamente aportan la solu-
ción, sino que ellas plantean muchos más problemas de los que resuelven
por la simple razón de que, salvo situaciones excepcionales, para apli-
carlas hay que fijar de antemano valores desconocidos y sólo susceptibles
de ser determinados mediante una generosa dosis de fabulación. Las
inconsistencias en esta materia son tan notables que resulta asombrosa
la hipnosis colectiva a la que asistimos. Salvo alguna pincelada aquí o
allá, el conflicto es predominantemente pasado por alto. Ante tal con-
tingencia, aparecen de inmediato las «soluciones» rituales.
Como se ilustra en Silva (2000a) y en Grimer y Schultz (2005) la
realidad es tal que dos investigadores independientes, siguiendo la
misma estrategia general (usando las mismas fórmulas), pueden obte-
ner tamaños abismalmente diferentes, sólo por el hecho de que han
fijado —legítimamente ambos— de manera diferente, incluso ligera-
mente distinta, los valores que tienen que incluir dentro de las fórmulas
para llegar al tamaño muestral.
Algunas de las fuentes de subjetividad que plagan a este proceso
son ocasionalmente reconocidas en tal calidad por la literatura, pero
lo típico es que no se haga mención alguna a ellas, o se den «explica-
ciones» doctrinarias como la siguiente en la que Mejía et al. (1995)
aluden a los valores que hay que fijar de antemano para poder aplicar
las fórmulas:
"...podría parecer que la suposición de estos valores es extremada-

mente arbitraria; sin embargo, es mejor intentar esta aproximación a
llevar a cabo el estudio sin intentarlo..."
Curiosa afirmación; lamentablemente, lo que no nos dicen Mejía y

sus ocho colaboradores es por qué es mejor hacer suposiciones «ex-
tremadamente arbitrarias» sobre los datos de que depende el tamaño
muestral antes que elegir ese tamaño directamente desde nuestra sub-
jetividad.
Ante las dificultades mencionadas, no faltan recetas mágicas. Por
ejemplo, en un libro concebido para ayudar a resolver el problema del
tamaño muestral, (Lemeshow et al. 1990) se hace textualmente la ta-
jante afirmación siguiente relacionada con el tamaño de muestra
necesario para estimar un porcentaje P:
"Cuando el investigador no tenga la menor idea acerca de cuál puede

ser el valor de P, sustituya 50 en su lugar y siempre obtendrá suficien-
tes observaciones, cualquiera que sea el verdadero valor de P."
Es una sugerencia sin sentido alguno. Aquellos interesados en los

detalles técnicos que fundamentan tal convicción pueden leer la dis-
cusión desarrollada al respecto en la revista española Gaceta Sanitaria
(véanse Marrugat et al., 1999; Suárez y Alonso, 1999; Marrugat, Vila
y Pavesi, 1999 y Silva, 2000b).
La mayoría de los textos y de los profesores pasan por alto estas
realidades. Afortunadamente, hay algunas excepciones; una de ellas es,
en mi opinión, notable, pues se encuentra en el famoso libro de Roth-
man (1986). Aunque sin desarrollar las ideas in extenso, Rothman reconoce
con crudeza la inviabilidad de una solución teórica cuando escribe:
"En resumidas cuentas, el problema de determinar el tamaño de mues-

tra más adecuado no es de naturaleza técnica; no es susceptible de ser
resuelto por vía de los cómputos, sino que ha de encararse mediante
el juicio, la experiencia y la intuición."
Es una excelente noticia que en trabajos más recientes, se ha co-

menzado a reaccionar desde importantes tribunas científicas contra
los rituales arraigados en esta materia (Bacchetti, 2002; Bacchetti et

al., 2005; Schulz y Grimes, 2005). La Figura 5.3, incluida en este
último trabajo, ironiza acerca del tema del tamaño muestral.
Figura 5.3. La liturgia del tamaño muestral.
Cuando se tropieza con la verdad
Los investigadores se sienten a menudo desconcertados e insegu-

ros para resolver el problema del tamaño muestral por la simple razón
de que se les impone una teoría desconcertante e insegura, plagada de
inalcanzables exigencias. Los teóricos sugieren sus recetas y, si surgen
cuestionamientos a los absurdos en que se basan o a las endebleces
que padecen, miran hacia otro lado. Uno no puede menos que recor-
dar la frase de Churchill: «En ocasiones, el hombre tropieza con la
verdad; pero, casi siempre, evita caerse y sigue adelante».
Los investigadores reales, en cambio, no pueden usar el cómodo

recurso de hacerse los entretenidos, pues verdaderamente necesitan
de un tamaño muestral concreto, no para hacer manuales basados en
recetas mágicas, sino para llevar adelante estudios tangibles. ¿Cuál es
la recomendación que han de seguir estos últimos ante tan acuciante
exigencia práctica?
No me sonrojo al decir que, a partir de los recursos disponibles,
resulta preferible usar el sentido común y tener en cuenta los tamaños
usados en trabajos similares (es decir, incorporar el sentido común de
los demás). Cabe aclarar, por lo demás, que no tengo ninguna enemis-
tad principista hacia las fórmulas; no necesariamente me parece mal
que se empleen en ciertos casos siempre que se haga de modo flexi-
ble, se reconozcan sus enormes limitaciones y se complementen con
una reflexión crítica y racional.
FICHAS TÉCNICAS DE LAS ENCUESTAS DE PRENSA

Un ejemplo sorprendente que ilustra cómo las huellas mentales
pueden consolidarse hasta extremos alarmantes lo ofrece el de las
llamadas «fichas técnicas» que de manera regular acompañan los artí-
culos de prensa que ofrecen resultados de las encuestas.
Las fichas de marras consisten en un par de párrafos que, supuesta-
mente, ofrecen la información técnica necesaria para que los
especialistas entiendan lo que se ha hecho y, quizás, para que los ciu-
dadanos corrientes, que casi nada saben de muestreo, se fíen de que la
encuesta en cuestión está asentada sobre bases científicas y de que
los errores asociados a las estimaciones que ofrecen son suficiente-
mente pequeños como para confiar en ellas.
Pero en la práctica se han arraigado determinados estereotipos que
hacen que las susodichas fichas no cumplan ninguna de las dos fun-
ciones.
Mi primer encontronazo
La primera vez que «choqué» contra las fichas técnicas fue en mayo
de 1993. El día 23 se produjo en Madrid un debate televisado entre
dos candidatos presidenciales: José María Aznar y Felipe González.
Tres días más tarde, el periódico español El País (1993) comunicó el
resultado de una encuesta realizada por la empresa DEMOSCOPIA
en la que se sondeaba la opinión popular prevaleciente al día siguien-
te de producido el mencionado debate.
La llamada «ficha técnica», contenida en el artículo de prensa, in-
cluía el texto que se reproduce textualmente a continuación:
Tamaño y distribución de la muestra: 800 entrevistas fija-

das mediante muestreo estratificado por región y tamaño de
hábitat proporcional a la distribución de la población y con am-
pliación de cuotas de sexo y edad.
Error de muestreo: asumiendo los criterios de muestreo alea-

torio simple, para un nivel de confianza de 95,5 % (dos sigmas)
y para la hipótesis más desfavorable (p=q=50), el error para el
total de la muestra sería de ±3,5%.
Tan pronto leí el primer párrafo comprendí que me hallaba ante un

texto absolutamente críptico: no conseguí entender cabalmente casi
nada a partir de la palabra «entrevistas». Y sospeché que a los lectores
regulares del rotativo español les habrá pasado otro tanto, aunque
seguramente muchos hayan conservado la impresión dejada por la
aureola de «cientificidad» que envuelve a tal enunciado. Se trata de un
amasijo inescrutable de palabras. ¿Qué debe entenderse por «fijar»
entrevistas? ¿A qué le llaman «región»? ¿Qué es «hábitat» en este con-
texto? ¿Qué significa «ampliación de cuotas de sexo y edad»?
Demasiadas dudas para un párrafo de 30 palabras. Es evidente que
carece de sentido brindar una información «técnica» que resulta inin-

teligible, incluso para especialistas.
Por otra parte nos han informado de que el tamaño muestral as-
ciende a 800. La primera pregunta que se formuló a los encuestados
fue: ¿Vio entero o en parte el debate?
Nos comunican que sólo 431 entrevistados lo vieron durante un
lapso suficiente largo como para opinar, de modo que el resto del
análisis se remite a ese número de espectadores. Por ejemplo, a conti-
nuación se preguntó: Con independencia de sus simpatías políticas,
¿quién le ha resultado más creíble?
En el artículo se comunican los resultados según las tres mayores agru-
paciones políticas españolas (Partido Socialista Obrero Español, Partido
Popular e Izquierda Unida) tal y como se recoge en la Tabla 5.2:11
Tabla 5.2. Distribución de las respuestas sobre la credibilidad de los contendientes

según simpatía por cada una de las tres grandes agrupaciones políticas españolas.
PSOE (%) PP (%) IU (%)

Felipe González 55 0 25
José María Aznar 28 94 34
Los dos por igual 7 3 29
Ninguno de los dos 13 1 12
No sabe/no contesta 3 1 0
Lamentablemente, los autores no comunican cuántos entrevista-

dos correspondieron a cada una de estas tres agrupaciones; pero,
teniendo en cuenta datos conocidos, cabe esperar que, por ejemplo,
los simpatizantes de Izquierda Unida hayan sido alrededor de 40, ya
que esa fuerza agrupaba en aquel momento algo menos del 10% del
11
Nótese que la suma de porcentajes dentro del Partido Socialista asciende absurdamente a
106%. No es una errata de este libro: así aparece en el informe de Demoscopia. Por otra parte,
al menos a mí me resulta imposible identificar en qué se diferencian la tercera y la cuarta
alternativas.
electorado. De modo que, para estimar, por ejemplo, el porcentaje de

individuos de Izquierda Unida a quienes resultó «más creíble» el Sr.
González, se trabajó verosímilmente con una muestra de 40, un número
20 veces menor que el tamaño de muestra original. Esta situación es entera-
mente típica: aunque la ficha técnica informe de que la muestra se
conformó con cierto número de entrevistados, el tamaño efectivo para
la mayoría de las estimaciones es marcadamente inferior. Consecuen-
temente, tales estimaciones están sujetas a errores mucho mayores
que lo que se comunica. Esta es parte de la explicación que tienen los
aparatosos fracasos de los vaticinios electorales en España (véase
apartado Alfabetización informática e incultura de la sociedad, p. 70).
Figura 5.4. La veleta de las encuestas.
La ficha dice que «para la hipótesis más desfavorable el error para

el total de la muestra sería de ±3,5%». En Silva (2000a) puede hallar-
se una demostración técnica que muestra que, verdaderamente, el error
cometido al informar que el 25% de los partidarios de IU vieron a
González como vencedor, podría razonablemente ascender como
mínimo 20%. Se trata de un error enorme: casi igual a la magnitud de
lo que se estima (concretamente, las cuatro quintas partes). Es tan

poco informativo como si, cuando me preguntaran mi edad, yo dijera
que ésta se halla entre 9 y 80 años. Algo similar ocurre con la mayoría
de las estimaciones de la encuesta.
Clonando la estafa
Con el paso del tiempo, pude comprobar que un texto tan alejado de
la transparencia deseable para una comunicación que, aun siendo de
prensa, supuestamente tiene carácter científico, parece constituir una
cómoda horma general. Por ejemplo, cinco años después, y a raíz de las
elecciones primarias del PSOE, El País (1998) publicaba la siguiente
«ficha técnica» en el contexto de una de sus encuestas habituales:
Tamaño y distribución de la muestra: 1.200 encuestas fija-

das mediante muestreo estratificado por región y tamaño de
hábitat proporcional a la distribución de la población y con am-
pliación de cuotas de sexo y edad.
Error de muestreo: asumiendo los criterios de muestreo alea-

torio simple, para un nivel de confianza de 95,5 % (dos sigmas)
y para la hipótesis más desfavorable (p=q=50), el error para el
total de la muestra sería de ±2,9 %.
Un cotejo detallado entre el contenido de este recuadro con el de

la Sección precedente permite apreciar lo que no pasa de ser un acto
de clonación; ¿será que estos dos diseños carecen de especificidades
propias dignas de ser comunicadas? Sería sorprendente que así fuera,
máxime cuando la encuesta de 1993 fue telefónica y la de 1998 se
verificó cara a cara.
Los problemas descritos son casi universales. No se debe pensar
que concierne solo a El País. El periódico El Mundo, por poner un
ejemplo, publicó una encuesta en octubre de 2002, en cuya ficha téc-

nica se ponía:
Universo mayores de 18 años. Ámbito nacional. Muestra 1.000

entrevistas con un error posible de ± 3,16%, para un nivel de
confianza del 95,5% y un p=q=50. Selección polietápica, es-
tratificada, aleatoria. Entrevista: telefónica. Fecha del Trabajo
de Campo del 8 al 11 de octubre 2002.
Y un año después, en septiembre de 2003, en otra encuesta, para

un tema totalmente diferente, la ficha técnica incluía exactamente lo
mismo:
Universo mayores de 18 años. Ámbito nacional. Muestra 3.400

entrevistas con un error posible de ± 2,2%, para un nivel de
confianza del 95,5% y un p=q=50/50. Selección polietápica,
estratificada, aleatoria. Entrevista: telefónica. Fecha del Traba-
jo de Campo del 23 y 24 de septiembre de 2003.
Tampoco debe pensarse que estos problemas ocurren esporádica-

mente: se trata de un patrón de cuyas expresiones tenemos ejemplos
semanalmente desde hace varios lustros y hasta la actualidad.
Por ejemplo, exactamente la misma ficha se publicó en El Mundo
para estudios realizados el 28 y 29 de octubre de 2004, y 7 y 8 de
noviembre de 2007.
En ocasión de un intercambio de opiniones con el defensor de El
País (véase Gor, 1998), se informaba que la dificultad radicaba en el
escaso espacio que podía otorgarse a estos aspectos metodológicos.
El espacio reducido, desde luego, no puede excusar ni los disparates
ni las manipulaciones, pero no deja de ser un contratiempo. Por eso,
tuve a bien sugerir una solución que me parecía —y me sigue pare-
ciendo— óptima para resolver con toda transparencia el conflicto:
publicar la encuesta con una ficha informativa muy general, que solo
abarque aquello realmente comprensible por cualquiera —por tanto,

exenta de todo tecnicismo—, y comunicar que todo aquel lector inte-
resado en los detalles técnicos se dirija al sitio WEB de la empresa
responsable del estudio. Naturalmente, si se colocara dicho informe
técnico detallado en un sitio WEB de Internet, no habría que preocu-
parse por las lógicas restricciones de espacio que rigen en la prensa.
En definitiva, es una propuesta que se inscribe en la misma línea del
modelo ELPS (Electronic Long, Paper Short) adoptado por British Medi-
cal Journal (Müllner y Groves, 2002) con el propósito de optimizar el
proceso editorial y similar en su motivación a la propuesta de Smith y
Roberts (2006) para reformar el sistema de publicación de ensayos
clínicos y eliminar así sus muchas manipulaciones actuales (desvia-
ción respecto de los protocolos, resultados selectivamente elegidos,
no inclusión de efectos adversos, métodos de análisis oscuros y reali-
zados post hoc, etc.).
Todos, al menos teóricamente, ganaríamos: la empresa podría ex-
playarse, los especialistas podrían satisfacer cualquier duda, y los
lectores tendrían la tranquilidad de que la encuesta puede ser evalua-
da, llegado el caso, por especialistas cualificados. Lamentablemente,
las empresas que se ocupan de estos temas parecen preferir que una
solución tan simple y eficiente como esta no se adopte. Ignoro con
qué argumentos, pues hasta ahora no se han dado, a la vez que se
mantiene la práctica habitual sin mayor (ni menor) rubor.
BIBLIOGRAFÍA
Alegría A et al. Evolución neurosensorial en recién nacidos de muy

bajo peso de nacimiento a los 2 años de edad corregida. Revista
Chilena de Pediatría 2002; 73:348-356.
Astin JA, Harkness E, Ernest E. The efficacy of distant healing: a
systematic review of randomized trials. Annals of Internal Medicine
2000; 132:903-910.
Bacchetti P. Author’s thoughts on power calculations (letter). British
Bacchetti P et al. Ethics and sample size. American Journal of Epidemio-
logy 2005; 161:105–110.
Baena JM et al. Factores de riesgo modificables para el accidente is-
quémico transitorio no cardioembólico. Estudio de casos y controles
en población general. Revista de Neurología 2003; 37:2-6.
Bakan D. The test of significance in psychological research. Psychologi-
cal Bulletin 1966; 66:423-437.
Beaglehole R, Bonita R, Kjellström T. Epidemiología básica. Organiza-
ción Panamericana de la Salud, Publicación Científica Nº 551,
Washington. 1994.
Bensen H et al. Study of the therpeutic effects of intercessory prayer
(step) in cardiac bypass patients. A multicenter randomized trial
of uncerntainty and certainty of receiving intercessory prayer.
American Heart Journal 2006; 151:934-942.
Breilh J. Nuevos conceptos y técnicas de investigación. Serie «Epidemiología
crítica», Número 3, Quito: Centro de Estudios y Asesoría en Sa-
lud. 1997.
Bunge M. La investigación científica. La Habana: Ciencias Sociales. 1972.
Byrd RC. Positive therapeutic effects of intercessory prayer in a
coronary care unit population. Southern Medical Journal 1988;
8:826-829.
Carey B. Long-awaited study questions the power of prayer.
Periódico The New York Times, del 31 de marzo. 2006.
Carlston M. The mechanism of homeopathy. All that matters is that it

works. Alternative Therapies in Health and Medicine 1995; 1:95-96.
Charlton BG. The scope and nature of epidemiology. Journal of Clini-
cal Epidemiology 1996; 49:623-626.
De Irala J, Martínez MA, Guillén F. ¿Qué es una variable de confu-
sión? Medicina Clínica 2001; 117:377-385.
Díaz OL. Factores de riesgo en la infección protésica vascular. Revista
Cubana de Higiene y Epidemiología 2000; 38:29-36.
El País. Triunfo claro de Aznar en el primer debate. Periódico El País
del 26 de mayo, 1993. Madrid.
El País. Los votantes del PSOE creen que ganará Almunia. Periódico
El País del 27 de marzo, 1998. Madrid.
Evans RG, Morris LB, Marmor TR. Why are some people healthy and
others not? The determinants of health of populations. New York: Aldine
Gruyter. 1994.
Fuertes J et al. Factores de riesgo de asma, alergia e hiperreactividad
bronquial en niños de 6 a 8 años Anales Españoles de Pediatría 2001;
55:205 – 212.
Gimenoa D, Marko D, Martínez JM. Relación entre los factores de
riesgo psicosociales laborales y la ausencia por razones de salud:
motivos laborales y no laborales en España. Archivos de Prevención
de Riesgos Laborales 2003; 6:139-145.
Gor F. La verdad de las encuestas. Periódico El País del 4 de enero,
1998. Madrid.
Guttman L. What is not what in statistics. The statistician 1977; 26:81-
107.
intercessory prayer on outcomes in patients admitted to the coro-
nary care unit. Archives of Internal Medicine 1999; 159:2273-2278.
Kleinbaum DG, Kupper LL, Muller KE, Nizam A. Applied regression
analysis and multivariable methods. USA: Duxbury Press. 1997.
Landsberg PT, Vickers J. Thermodynamics: conflicting arrows of time.
Nature 2000; 103:609 (Citado por Leibovici, 2001).
Le Fanu J. The rise and fall of modern medicine. New York: Carroll &
Graf. 2000.
Leamer EE. Sensitivity analysis would help. American Economic Review
1985; 75:308- 313.
Leibovici L. Alternative (complementary) medicine: a cuckoo on the
nest of empiricist reed warblers. British Medical Journal 1999; 319:
1629-1632.
Leibovici L. Effects of remote, retroactive intercessory prayer on
outcomes in patients with bloodstream infection: randomised con-
trolled trial. British Medical Journal 2001; 323:1450-1461.
Lemeshow S et al. Adequacy of sample size in health studies. New York:
Wiley. 1990.
Lizarralde E et al. Pronóstico de las bacteriemias adquiridas en la co-
munidad ingresadas en un servicio de medicina interna. Anales
de Medicina Interna 2005; 22:105-107.
López S et al. Factores de riesgo para la mortalidad de los pacientes
quirúrgicos graves. Revista Española de Anestesiología y Reanimación
2000; 47:281-286.
Lord FM. On the statistical treatment of football numbers. American
Psychologist 1953; 8:750-751.
Lleó A et al. Factores clínicos de riesgo de la vitreorretinopatía proli-
ferativa después de la cirugía del desprendimiento de retina. Archivos de la
Sociedad Española de Oftalmología 2000; 11:741-750.
Llop JM et al. Hipofosfatemia en nutrición parenteral: prevención y
factores de riesgo asociados. Nutrición Hospitalaria 2004; 19:362-
366.
Marrugat J, Vila J, Pavesi M. Supuesto de máxima indeterminación:
¿error absoluto o error relativo en el cálculo del tamaño de la mues-
tra? Gaceta Sanitaria 1999; 13:491-493.
Marrugat J et al. Réplica. Medicina Clínica 1999; 112:798.
McCloskey DN. The insignificance of statistical significance. Scientific
American 1995; 272:104-105.
Mejía JM et al. El tamaño de muestra: un enfoque práctico en la inves-

tigación clínica pediátrica. Boletín Médico del Hospital Infantil de México
1995; 52:381-391.
Meza AM et al. Factores de riesgo para el fracaso del tratamiento an-
tituberculoso totalmente supervisado. Revista de la Sociedad Peruana
de Medicina Interna 2002; 15:30-38.
Müllner M, Groves T. Making research papers in the BMJ more acce-
ssible. British Medical Journal 2002; 325:456.
Pande PN. Does prayer need testing? Archives of Internal Medicine 2000;
160:1873-1874.
Recabarren A, Cárdenas S. Factores de riesgo de asma infantil en niños
que asisten al programa de control de asma del Hospital III Yanahuara
ESSALUD – Arequipa. Enfermedades del Tórax 2003; 46:118-125.
Ríos A et al. Estudio multivariable de los factores de riesgo para desa-
rrollar complicaciones en la cirugía del bocio multinodular. Cirugía
Española 2005; 77:79–85.
Rispau A et al. Factores de riesgo asociados al consumo de antidepre-
sivos. Atención Primaria 1998; 22:78-83.
Roberts L, Ahmed I, Hall S. Intercessory prayer for the alleviation of
ill health (Cochrane Review) The Database of Systematic Reviews
Volume (Issue 1).The Cochrane Library, Oxford: Update Software.
2003.
Rodríguez A et al. Relación entre el nivel socioeconómico y hábitos
de vida, con el fibrinógeno y el factor von Willebrand en venezola-
nos sanos y con cardiopatía isquémica. Investigación Clínica (Venezuela)
2005; 46(2):157-168.
Romero G et al. Análisis multivariado de factores de riesgo asociados
a la muerte fetal anteparto. Calimed 2003; 9:24.
Rosas M et al. Nueva visión de los factores de riesgo asociados a la
hipertensiónarterial en México. Arch Cardiol Mex 2004; 74
Supl(2):164-178.
Rosales M et al. Incidencia y factores de riesgo de las infecciones qui-
rúrgicas de by-pass vasculares en el hospital Juan Canalejo de A
Coruña en el período 2000-2002. Revista Española de Salud Pública

2005; 79:59-67.
Roselló M. Factores de riesgo asociados a glicemia elevada en ayunas
en pacientes de la clínica de salud, de El Guarco de Cartago. Revis-
ta Costarricense de Ciencias Médicas 2003; 24:25-32.
Rothman KJ. Epidemiología moderna. Madrid: Díaz de Santos. 1987.
Schulz KF, Grimes DA. Sample size calculations in randomised trials:
mandatory and mystical. The Lancet 2005; 365:1348-1353.
Silva LC. Excursión a la regresión logística en ciencias de la salud. Madrid:
Díaz de Santos. 1995.
Silva LC. Hacia una cultura epidemiológica revitalizada. Revista Hu-
mana 1997a; 1:23-33.
Una mirada crítica. Madrid: Díaz de Santos. 1997b.
ción sanitaria. Madrid: Díaz de Santos. 2000a.
Silva LC. Nueva visita al supuesto de máxima indeterminación y al
empleo de errores absolutos y relativos. Gaceta Sanitaria 2000b; 14:
255-257.
Silva LC. Lo individual y lo contextual en la búsqueda de factores
etiológico. Revista Humana 2002; 6:117.
Silva LC. Estudios de casos y controles en psiquiatría: Causalidad,
diseño y advertencias. Actas Españolas de Psiquiatría 2004; 32:236-
248.
Silva LC. Una ceremonia estadística para identificar factores de ries-
go. Revista Salud Colectiva 2005; 1:329-322.
Silva LC, Barroso I. Selección algorítmica de modelos en las aplica-
ciones biomédicas de la regresión múltiple. Medicina Clínica 2001;
116:741-745.
Silva LC, Barroso I. Regresión logística. Madrid: La Muralla. 2003.
Silva LC, Benavides A. Causalidad e inobservancia de la premisa de
precedencia temporal en la investigación biomédica. Revista Metho-
dologica (Bélgica) 1999; 7:1-11.
Sloan RP, Bagiella E. Data without a prayer. Archives of Internal Medi-

cine 2000; 160:1870.
Smith R, Roberts I. Patient safety requires a new way to publish clini-
cal trials. PLoS Clin Trials 2006; 1(1):e6.
Suárez P, Alonso JC. Sobre el supuesto de máxima indeterminación,
el tamaño muestral y otras consideraciones sobre muestreo. Gaceta
Sanitaria 1999; 13:243-246.
Taubes G. Epidemiology faces its limits. Science 1995; 269: 164-169.
Van der Does W. A randomized, controlled trial of prayer? Archives of
Internal Medicine 2000; 160:1871-1872.
Verdonck K et al. Asociación entre infección por el virus linfotrópico
humano de células T tipo I (HTLV-I) y mortalidad en pacientes
hospitalizados con tuberculosis. Revista Médica Herediana 2004; 15:
197-202.
347
6
Valores p y pruebas de significación
estadística: fin de una era
La vida no es un block cuadriculado sino una
golondrina en movimiento.
JOAQUÍN SABINA
no de los recursos metodológicos más extendidos y arraigados

U en la investigación empírica contemporánea son las pruebas de
significación estadísticas (PSE)1 que datan de la tercera década del siglo
precedente y constituyen sin duda alguna el recurso estadístico infe-
rencial más empleado en los últimos 80 años.
En pocas áreas de la estadística más que en ésta han conseguido
carta de ciudadanía las recetas y los recursos adocenados, presentes
tanto en los centenares de libros introductorios sobre estadística infe-
rencial que —con pocas diferencias entre sí— se fueron publicando
desde entonces, como en los cursos clásicos de estadística que ofre-
cen las universidades y otros servicios formativos. Unos y otros suelen
concentrarse en la comunicación de una secuencia mecánica de códi-
gos operativos que desembocan en el cómputo de los llamados «valores
p» y, por su conducto, en veredictos con los que no pocos investiga-
dores se consideran relevados de la obligación de pensar. Ni los libros
ni los cursos —salvo excepciones— ponen de manifiesto las notables
endebleces metodológicas que padecen las PSE; mucho menos, la
enconada controversia a que han dado lugar.
1
El término puede ser conflictivo. Como se verá, debido sobre todo a razones históricas,
no hay unanimidad en cuanto a cómo denominar a esta técnica. Más adelante se harán
algunas precisiones terminológicas.
347
Por otra parte, puesto que las rutinas asociadas a su aplicación son
fácilmente algoritmizables, miles de programas informáticos se han
ocupado de facilitar el mecánico empleo de las PSE, hoy enraizado en
casi cualquier esfera de la investigación sanitaria.
A pesar de ello, la inferencia estadística basada en tales pruebas no
entró al nuevo siglo de manera especialmente luminosa. Muy por el
contrario, las PSE han sido tan castigadas en el plano conceptual que
hoy son contados los especialistas que se empeñan en defenderlas
explícitamente. Senn (2001) dice textualmente «…es muy difícil ha-
llar a un estadístico que defienda a los valores p. Los bayesianos en
particular las hallan ridículas, pero incluso los frecuentistas modernos
no las tienen en muy alta estima».
Aunque dichas pruebas conserven una tenaz presencia inercial en
la literatura, la acumulación de observaciones críticas aparecidas des-
de su creación conforma hoy un voluminoso prontuario y cada día se
torna más difícil soslayar la necesidad de suplirlas por recursos más
racionales.
A lo largo de los últimos años se han venido verificando declara-
ciones tan tajantes como que «es difícil imaginar una manera menos
apropiada para traducir los datos en conclusiones» (Loftus, 1991), tan
cáusticas como «la utilidad de los valores p es completamente limita-
da y nosotros nos mantenemos reclamando eutanasia para tales
procedimientos» (Anderson y Burnham, 2002) o «Las PSE constitu-
yen con toda seguridad el más idiota proceder jamás institucionalizado
en el entrenamiento maquinal de los estudiantes de ciencia» (Rozebo-
om, 1997) y tan estridentes como la que elige Jeff Gill para iniciar un
muy reciente trabajo sobre el tema (Gill, 2004):
"Las PSE no deberían siquiera existir, mucho menos deberían prospe-

rar como el método dominante para presentar evidencias estadísticas
en las ciencias sociales. Ellas entrañan una bancarrota intelectual y son
profundamente inconsistentes tanto desde una perspectiva lógica como
práctica."
VALORES p Y PRUEBAS DE SIGNIFICACIÓN ESTADÍSTICAS: FIN DE UNA ERA 349
¿Cómo explicarse aseveraciones de ese calibre tratándose de un

procedimiento tan universalmente empleado?
El propósito de este capítulo es dar una circunstanciada respuesta
a esta pregunta. Para cumplir con tal encomienda me basaré en no
pocos ejemplos y en un amplio abanico de citas procedentes de la
bibliografía disponible, sobre todo desde 1990 en adelante. En primer
lugar se hace un breve repaso histórico. Posteriormente, expongo y
fundamento las limitaciones inherentes a los valores p —al margen de
su papel en el contexto de las pruebas de hipótesis— y, a continua-
ción, las que conciernen a las PSE propiamente dichas. Finalmente,
haré una breve reflexión sobre las razones que explican por qué la
agonía de este recurso es tan larga y mencionaré varias alternativas
metodológicas para suplirlo o complementarlo.
Mi aspiración es exponer estas ideas del modo más sencillo posi-
ble. El modelo probabilístico asociado al lanzamiento de una moneda
quizás sea el más simple y el más conocido por cualquier investiga-
dor; su elocuencia puede ser, sin embargo, notable. Por esas razones,
el lector lo hallará más de una vez, casi como un leit motiv, a lo largo
del presente capítulo.
UNA HISTORIA TURBULENTA

Mirar el pasado desde el presente es siempre un ejercicio interesan-
te y a menudo útil; pero mucho más fecunda es la oportunidad que
nos da la Historia como disciplina para apreciar el presente mirándolo
desde el pasado. Según el destacado historiador Peter Stearns, hay
dos razones básicas para el estudio de la Historia: que nos ayuda a
comprender a las personas y a la sociedad, y que contribuye a enten-
der los cambios y cómo la realidad en que vivimos llegó a ser la que es
(Stearns, 2003).
Bellhouse (2003) cita algunos ejemplos reveladores acerca de este
carácter iluminador de la Historia para explicarnos los patrones de
difusión que tuvieron las teorías inferenciales en sus diferentes ámbi-

tos de gravitación. El prolongado debate a que han dado lugar las
PSE proporciona un claro ejemplo de que cualquier empresa intelec-
tual trascendente despierta pasiones que en una u otra medida influyen
en sus derroteros. Para comprender mejor la situación actual de las
PSE, resulta aconsejable que nos detengamos a examinar el entrama-
do de intereses y posicionamientos en cuyo contexto emergieron.
Antecedentes
La idea subyacente en las PSE se remonta a más de dos siglos

atrás. El mérito de haberlas introducido corresponde al médico esco-
cés John Arbuthnot (1667-1735), famoso por haber traducido en 1692
el tratado de Huygens sobre probabilidades –primera obra sobre el
tema publicada en inglés. Arbuthnot resultó electo miembro de la Royal
Society en 1704 y las PSE comparecen en un trabajo suyo considera-
do como la primera aplicación de la teoría de probabilidades a la
solución de interrogantes de naturaleza social, publicado seis años
más tarde (Arbuthnot, 1710). Allí se examinaba la pequeña pero con-
sistente supremacía de nacimientos masculinos sobre los femeninos.
Tal había sido el caso en los 82 años consecutivos considerados en su
estudio. Su razonamiento era muy similar al de hoy en día: la probabi-
lidad condicional de tal resultado bajo el supuesto de que en cada año
fuese tan probable un desenlace favorable a los hombres como a las
mujeres, resultaba extremadamente pequeña. Consecuentemente, el
alto índice empírico de masculinidad al nacimiento, se concluía, sería
obra de la divina providencia y no del azar.
Pero tal manera de razonar demoraría dos siglos en asentarse como
un procedimiento formal. En la segunda mitad del siglo XIX y los pri-
meros 20 años del XX se produjo un enorme crecimiento de la literatura
científica, especialmente en el campo de la medicina. La estadística,
disciplina que ya había irrumpido con claridad en el ámbito de las
aplicaciones sociales y epidemiológicas, desempeñaba un papel en esta

eclosión: la comparación entre repeticiones de ciertas experiencias, el
análisis de diseños factoriales y el empleo de tablas y gráficos estadís-
ticos figuraban con profusión en tales publicaciones (véase Smith et
al., 2000).
Sin embargo, para cierta desesperación de los editores, los testimo-
nios sobre acaecimientos clínicos más o menos aislados abarrotaban
las revistas médicas. Resultaba muy difusa la distinción entre las anéc-
dotas y las confirmaciones sustantivas de las leyes que éstas parecían
sugerir. En ese marco surgen los primeros reclamos formales de con-
tar con indicadores y reglas que permitieran aquilatar la trascendencia
de los resultados.
A partir de los años 20 aparecen dos posibles soluciones para com-
plementar los razonamientos verbales con indicadores objetivos;
posteriormente, estos enfoques se fusionan. Los hitos fundamentales
de este proceso, en definitiva, son tres. A saber:
a) las pruebas de significación;

b) las pruebas de hipótesis;
c) método combinado.
Antes de adentrarnos en los detalles técnicos y para comprender

mejor el núcleo del conflicto metodológico que nos ocupa, repasemos
sucintamente el convulso marco académico en que surgen y se conso-
lidan.
Los padres de la estadística se divorcian
Quienes sentaron las bases de la inferencia en la bioestadística

moderna fueron Karl Pearson, Francis Galton y Walter Weldon, co-
fundadores en 1901 de Biometrika, revista dedicada al estudio de los
problemas teóricos y prácticos planteados a la estadística por la biolo-
gía y que a la postre sería la publicación más influyente en esta mate-

ria a lo largo del siglo XX. El más encumbrado y carismático de ellos,
sin duda alguna, fue Pearson, director de la revista desde su funda-
ción hasta que muriera en 1936. El número inaugural rindió homenaje
a Charles Darwin y resaltaba sus palabras «Ignoramus, in hoc signo labore-
mus» («somos ignorantes, de modo que pongámonos a trabajar»), una
divisa acorde con la propia vida de Karl Pearson, batallador natural a
favor de variadas causas tales como la emancipación de la mujer, la
ética de la libre expresión, la eugenesia y el socialismo (Williams et al.,
2003).
Figura 6.1. Karl Pearson (1857-1939).
En el momento de la fundación de Biometrika, Ronald Fisher, quien

llegaría a ser una de las más fascinantes y contradictorias figuras de la
biometría británica, tenía sólo 10 años. Mostró desde muy temprano
un notable talento para las matemáticas, por lo cual mereció una beca
en una prestigiosa universidad, y ganó varios premios. Considerado
uno de los «padres de la inferencia estadística moderna», entre sus

muchos aportes teórico-prácticos se destaca la distribución muestral
del coeficiente de correlación, descubierto precisamente por Karl Pear-
son. De hecho, muchas de las contribuciones de Fisher fueron
enmiendas y perfeccionamientos de la obra de aquél.
De manera autónoma propuso y desarrolló las nociones de eficien-
cia, suficiencia y consistencia de los estimadores, el método de máxima
verosimilitud y, muy especialmente, a él se debe la introducción for-
mal de la asignación aleatoria como requisito crucial de los experimentos
(sobre todo en el ámbito de la agricultura). En 1925 publicó Statistical
Methods for Research Workers, y diez años más tarde The Design of Experi-
ments. En 1938, junto a Frank Yates, publicó Statistical Tables for Biological,
Agricultural and Medical Research, usadas en la práctica durante varios
decenios. Fue un vehemente propulsor, como Pearson, de la reaccio-
naria corriente eugenésica, a cuya defensa consagró gran parte de su
vida, pero también un eximio matemático (Almenara et al., 2003), y
llegó a ser la figura dominante de la biometría británica tras el retiro
de Pearson.
Figura 6.2. Ronald Fisher (1890-1962).

A pesar de las numerosas e importantes contribuciones de Fisher a

la estadística, nunca tuvo un nombramiento académico como estadís-
tico, pues siempre rechazó trabajar en lo que sería su lugar natural, el
departamento que dirigía Karl Pearson en el University College of
London. Las desavenencias entre estas dos recias personalidades da-
taban de antaño y se habían originado a raíz de una crítica que hiciera
Fisher a uno de los trabajos de Pearson. A partir de entonces se profe-
saron una profunda antipatía mutua, que más tarde Fisher también
tuvo hacia Egon, el hijo de Karl, y más aún hacia el matemático pola-
co Jerzy Neyman, colega y estrecho colaborador de Egon.
En 1933, a la edad de 76 años, Karl Pearson se jubila y abandona
los puestos que había venido ocupando en el alto centro londinense.
Las autoridades universitarias optaron salomónicamente por crear dos
departamentos a partir del que había sido dirigido por Karl: para la
jefatura del Departamento de Eugenesia fue designado Fisher, en tanto
que la dirección del Departamento de Estadística Aplicada fue here-
dada por Egon Pearson. Tanto Fisher como Karl quedaron resentidos
e inconformes con la «solución».
La contribución de Fisher que más interesa destacar ahora se produ-
jo en este caldeado ambiente: la introducción y desarrollo entre 1925 y
1929, de los llamados valores p y, con ellos, de las pruebas de significa-
ción. Tales valores, desde su punto de vista, aportaban una medida de
la discrepancia de los datos con una hipótesis, lo que permitiría valorar
su plausibilidad: si la p resultante fuera muy pequeña, tal hipótesis sería
puesta en cuestión y demandaría análisis más profundo.
Muy poco tiempo después, fueron precisamente Egon Pearson y
Jerzy Neyman, quienes propusieron un método alternativo al que de-
nominaron prueba de hipótesis, que suponía una enmienda crítica al
enfoque fisheriano, del cual difiere radicalmente desde el punto de
vista conceptual, ya que está orientado a la toma de decisiones y no a
valorar integralmente un problema científico. Según esa propuesta, el
problema consiste en decantarse por una de dos hipótesis comple-
mentarias y el procedimiento daba una regla formal para realizar tal
decisión. Fisher se enfrentó con beligerancia a esta alternativa que

empleaba, a la vez que desvirtuaba, el papel de su propia invención.
Impugnaba su naturaleza algorítmica (mecanicista) que, además, era,
a su juicio, incoherente desde el punto de vista lógico.
Retirado el viejo Pearson del campo de batalla, y ante aquella «afren-
ta», Fisher arremete contra los creadores de la prueba de hipótesis. A
raíz de la conferencia que dictó Jerzy Neyman en ocasión de su ingre-
so a la Royal Statistical Society en Londres, Fisher se burló del polaco
con el hiriente comentario de que Neyman bien podría haber selec-
cionado un tema «acerca del cual pudiera disertar con alguna
autoridad». Hasta su muerte en Australia en 1962, sostuvo una genui-
na «guerra epistemológica» contra Pearson y Neyman. Egon hizo
infructuosos esfuerzos por contemporizar con Fisher, cuyas realiza-
ciones tenía en alta estima, pero Neyman no se quedó atrás en sus
denuestos a la obra de Fisher, y llegó a declarar que los métodos de
Fisher eran «peores que inútiles».
Lo esencial es que la diferencia entre las pruebas de significación y
las pruebas de hipótesis, a las que Fisher denominó burlonamente
«procedimientos de aceptación» y «funciones de decisión», no sólo
era matemática, sino que entrañaba concepciones enfrentadas acerca
del papel de la inferencia estadística en la ciencia.
Fisher (1955) señalaba que la especificación de funciones de pérdida
para las decisiones incorrectas era apropiada en el ámbito de la planifi-
cación o de la esfera militar, pero que el intento de aquilatar las
consecuencias de las inferencias no tiene sentido en la ciencia.
Historia después de la historia
Tras este breve repaso histórico2, cabe preguntarse ¿cuál de los dos
enfoques teóricos en pugna se aplica con más frecuencia en la prácti-
2
Incidentalmente, debe mencionarse que en este contexto histórico surge y se consolida
el influyente cuerpo teórico debido al filósofo Karl Popper. Algunos han querido ver en su
ca cotidiana? La realidad es que, virtualmente nunca, ni una ni otra

alternativa son empleadas. Alrededor de la Segunda Guerra Mundial,
los dos métodos arriba esbozados se unen de manera anónima (véase
Christensen, 2005) como un forzado intento de conciliar estas pers-
pectivas originalmente divergentes, y se desemboca en la actual prueba de
significación estadística. Ejemplo del más fácil eclecticismo, las PSE re-
nuncian por una parte al reclamo de racionalidad relativizadora por el
que abogaba Fisher, y por otra a la exigencia implícita de sopesar los
riesgos, propia del enfoque de Neyman y Pearson.
A pesar de que el valor p propuesto por Fisher y el método de
prueba de hipótesis de Neyman y Pearson eran conceptualmente in-
compatibles, se sacrificó la individualidad de cada enfoque en el altar
del pragmatismo, en lo que constituye un entramado que erróneamen-
te muchos consideran como un único y coherente enfoque de inferencia
estadística. Al resultado de esta simbiosis, y para distinguirlo de sus
dos fuentes nutricias, Royall (1997) lo denomina «pruebas de recha-
zo» (rejection trials). En inglés se ha generalizado bastante la expresión
null hypothesis significance test (NHST) y en menor medida null-hypothesis
significance-test procedure (NHSTP) (véase Chow, 1996), que no he visto
traducidas al castellano.
EL VALOR P: DEFINICIÓN Y FALACIAS
Veamos ahora algunos entresijos técnicos subyacentes a los he-

chos relatados. Para garantizar que el resto de la discusión descanse
sobre una comprensión cabal del significado que tiene el concepto
clave del que dependen las PSE, los famosos «valores p», no es ocioso
obra una suerte de inspiración para la lógica de las PSE en virtud de que Popper abogaba por
el «enfoque falsacionista» que considera el rechazo de las hipótesis como el único camino
válido para el avance de la ciencia empírica (véase Silva, 1997). Pero esto no es más que una
falacia sin fundamento; en realidad la influencia mutua entre Popper y los estadísticos fue
casi nula, como demuestra inequívocamente García (2003).
comenzar puntualizando su definición y recordando su esencia. Con

el fin de «repasar» la filosofía y la mecánica computacional de estos
valores, algunas precisiones y unos pocos ejemplos deberían bastar.
De ello se ocupa el apartado Definición de p, p. 357. Sin embargo, pues-
to que a lo largo de décadas se han ido popularizando diversas
interpretaciones fantasiosas de los valores p, se impone un análisis
adicional, que se desarrolla en el apartado Transposición de condicionan-
tes y otras interpretaciones fantasiosas, p. 360.
Definición de p
Básicamente, Fisher propuso valorar una hipótesis (Ho) a través de

una observación concreta (do) y calcular una probabilidad condicional
p, definida como:
donde D es un estadístico cuya distribución pudiera deducirse de las

condiciones del estudio. Expresado en palabras: asumiendo que la
hipótesis nula es válida, si el mismo experimento se repitiera infinitas
veces, la frecuencia con la cual teóricamente obtendríamos un valor
al menos tan alejado de lo que ella anuncia como el que objetivamen-
te se obtuvo, es igual al valor p.
Para tener una primera ilustración, detengámonos en un caso muy
simple. Supongamos que Ho afirma que una novedosa técnica quirúr-
gica para el tratamiento de la otosclerosis tiene una eficacia
exactamente igual a la de otro procedimiento ya existente. Imagine-
mos que se cuenta con 10 pacientes que padecen la enfermedad en
ambos oídos, todos con el mismo nivel de deterioro audiométrico. Se
realiza una experiencia consistente en aplicar la técnica novedosa en
uno de los dos oídos y la técnica convencional en el otro, decidiendo
al azar para cada paciente cuál se aplica en el derecho y cuál en el
izquierdo. El valor p se calculará para evaluar cuán incompatibles son

los resultados de tal experiencia con lo que afirma Ho. Para computar-
lo se tendrán en cuenta dichos resultados y la estructura probabilística
de la experiencia.
Hechas las 20 intervenciones, se practican las mediciones corres-
pondientes y se cuenta el número, llamémosle m, de pacientes (número
entero que estará entre 0 y 10) para los que el nuevo tratamiento
consigue más recuperación auditiva que el otro. Se calcula entonces
la probabilidad de tal resultado «bajo Ho».
Por ejemplo, si la técnica novedosa resulta mejor para los 10 pa-
cientes, la pregunta que ha de responderse es: ¿Cuál es la probabilidad
de que la técnica novedosa produzca mejores resultados para todos
los pacientes, supuesto que es válida la hipótesis que afirma que am-
bas técnicas sean igualmente eficientes?3
De la teoría elemental de probabilidades sabemos que, si llamamos
π a la probabilidad de que el tratamiento novedoso sea el que «gane»,
el valor de dicha probabilidad es igual a p=πm. En nuestro caso, m=10
y la hipótesis Ho equivale al supuesto de que π=0,5, de modo que
p=(0,5)10=0,00098.
Ha aparecido la famosa p. Lo que se ha calculado es la frecuencia
con que se obtendrían 10 «éxitos» si la experiencia de aplicar ambas
variantes terapéuticas a 10 pacientes se repitiera un gran número de
veces. Así, si tal estudio con 10 pacientes se realizara, por ejemplo,
100.000 veces y Ho fuera verdadera, entonces teóricamente en solo
98 ocasiones, obtendríamos 10 éxitos consecutivos
Según el razonamiento de Fisher, puesto que p es muy pequeño,
tendríamos un indicio muy fuerte de incompatibilidad entre los datos
y Ho.
Más generalmente, p se define como la probabilidad, bajo el su-
puesto de «no efecto» o «no diferencia» (hipótesis nula) de obtener un
3
Se trata de la misma probabilidad de que, tras lanzar 10 veces una moneda «no trucada»,
se obtengan 10 caras y ningún escudo.
resultado igual a, o más extremo que, lo efectivamente observado.

Consecuentemente, si la superioridad de la técnica se hubiera regis-
trado en sólo 9 de los 10 casos (m=9), la hipótesis de nulidad estaría
soportando un fuerte embate experimental, aunque sin duda algo
menos acusado que en el caso anterior. ¿Cuál sería en este caso el
grado de incompatibilidad entre el valor de m y la veracidad de Ho? Se
trata de calcular la probabilidad de que se produzcan m o más «victo-
rias» para el nuevo tratamiento pese a ser éste equivalente a su
competidor.
No es difícil demostrar que, en general, se tiene:
La probabilidad de obtener 9 o más resultados favorables a la nue-

va técnica, supuesto que Ho es cierta, es igual a p=0,011. Es fácil
corroborar que la probabilidad de que la experiencia dé lugar a por lo
menos m=8 «éxitos» para la nueva técnica asciende a p=0,055, y que
si m=7, entonces p sería igual a 0,172. Cabe enfatizar una vez más
que p es una probabilidad concerniente a los datos, una probabilidad
condicional de lo que podría obtenerse si Ho fuera correcta; en este
último caso, ella nos informa que si se repitiera un gran número de
veces el proceso de realizar 10 lanzamientos de una moneda legal, en
el 17,2% de las ocasiones el número de caras sería superior a 6.
El ejemplo ilustra la esencia del cómputo de p; en la práctica casi
todas las situaciones exigen, desde luego, cómputos probabilísticos
más complejos, pero el razonamiento básico es el mismo.
¿Qué uso se ha propuesto dar al valor p? La respuesta a esta pre-
gunta tiene cierta complejidad y se abordará más adelante (Apartado
Valores p y tamaños de muestra, p. 372). Continuemos ahora con el exa-
men de este controvertido elemento probabilístico.
Transposición de condicionantes y otras

interpretaciones fantasiosas
La más extendida entre las interpretaciones erróneas del valor p

consiste en creer que mide la probabilidad de que Ho sea verdadera.
Así lo asumen numerosos lectores e incluso no pocos profesores e
investigadores (Haller y Krauss, 2002), quienes están convencidos de
que, por ejemplo, un valor p=0,03 significa que es muy poco probable
que la hipótesis nula sea cierta; más concretamente, que dicha hipóte-
sis tiene una probabilidad de sólo un 3% de ser cierta.
Es una interpretación «comprensible», ya que el investigador eva-
lúa hipótesis; de modo que nada es más natural que el deseo de
cuantificar el grado de validez que ellas merezcan. Lamentablemente,
sin embargo, es una interpretación equivocada. La falacia se aprecia
con toda claridad si se advierte que los valores p son calculados bajo
el supuesto de que la hipótesis nula es verdadera; es imposible, por lo
tanto, que sea una medida directa de la probabilidad de que ella sea,
en efecto, verdadera. Esta ilusión refuerza la noción equivocada de
que los datos por sí solos pueden decirnos la probabilidad de que una
hipótesis sea verdadera, falacia que ha sido reiteradamente resaltada,
incluso en trabajos recientes aparecidos en revistas de primer nivel
(Goodman, 1999).
Si, por ejemplo, se estuviera valorando un nuevo tratamiento, como
se ha dicho, el valor p no es otra cosa que la probabilidad de observar
una diferencia tan grande como (o más grande que) la realmente obser-
vada entre éste y uno convencional, supuesto que ambos tratamientos
tuvieran el mismo efecto. Es por tanto una cuantificación probabilísti-
ca condicional sobre los datos, no sobre las hipótesis.
Carver (1978) ilustra sarcástica pero muy elocuentemente la dife-
rencia existente entre una y otra probabilidad condicional:
"¿Cuál es la probabilidad de que una persona esté muerta (M) dado

que fue ahorcada (A)?; simbólicamente, ¿cuál es la magnitud de P(M|A)?
Obviamente, debe ser muy alta, quizás de 0.97 o más. Ahora, hagamos
la pregunta inversa ¿Cuál es la probabilidad de que una persona haya
sido ahorcada (A) dado que está muerta (M)?; esto es, ¿a cuánto as-
ciende P(A|M)? En este caso la probabilidad es sin lugar a dudas muy
baja, quizás de 0.01 o menos. Nadie probablemente cometería el error
de sustituir la primera estimación (0.97) por la segunda (0.01); es
decir, aceptar a 0.97 como la probabilidad de que una persona haya
sido ahorcada dado que esa persona está muerta. Aunque no parece
verosímil que se incurra en tal inversión, se trata exactamente del
tipo de error que se comete al interpretar el valor p en el contexto
de la PSE: estimaciones de P(A|M) se interpretan como si lo fueran de
P(M|A)."
Se trata de la falacia conocida como «transposición de los condi-

cionantes», en la que incurren no sólo los usuarios coyunturales de las
PSE sino incluso libros de texto (véase, por ejemplo, Heyes, Hardy,
Humphreys y Rookes, 1993).
Figura 6.3. Falacia de transposición de condicionantes.

Desde luego, se trata de un error de interpretación y no de un de-

fecto intrínseco de los valores p; pero el hecho de que, a pesar de
haber sido señalado en decenas de artículos especializados, esté tan
extendido y sea tan difícil erradicarlo, es muy expresivo de que el
empleo último que regularmente se da al valor p responde a la convic-
ción íntima de que p ofrece una medida directa de la evidencia y al
deseo de que así sea. Pero pone de manifiesto, sobre todo, que su
verdadera naturaleza es con extrema frecuencia incomprendida.
¿A qué atribuir la persistencia de este error? La razón es simple: lo
que realmente interesa al investigador es tener una medición del gra-
do de verosimilitud que alcanza cierta hipótesis a partir de ciertos
datos objetivamente registrados y no viceversa.
Imaginemos que un sujeto es acusado de ser responsable directo
de un asesinato y que varios elementos circunstanciales (falta de coar-
tada, existencia de un móvil, etc.) le incriminan. Durante el juicio
surge el dato comprobado por la prueba de ADN de que en la escena
del crimen hay rastros de sangre compatible con la de dicho sujeto.
Este dato resulta concluyente, pues es evidente que la probabilidad
de que este sospechoso sea el asesino, dado que hay coincidencia ge-
nética de sangre, llamémosle P(A|S), es altísima. El abogado defensor
arguye que ese dato no tiene tanta relevancia debido a que el porcen-
taje de casos en que el asesino deja rastros de su propia sangre P(S|A)
es extremadamente bajo. La falacia en este caso es obvia y sólo los
deseos del defensor de que se interprete P(S|A) como si fuera igual a
P(A|S) puede explicar que se intente tal argucia.
Comentando esta realidad, en uno de los artículos más intensa-
mente citados sobre esta temática, Cohen (1994) afirmaba:
"Después de cuatro décadas de duras críticas, el ritual de probar la

significación de hipótesis nulas —mecánicas decisiones dicotómicas al-
rededor del sacralizado criterio de 0,05— aún persiste. [...] ¿Cuál es
el problema con las pruebas de significación? Bueno, entre otras co-
sas, que no nos dicen lo que queremos saber; sin embargo, es tan
intenso el deseo de saber lo que queremos saber que, por desespera-

ción, ¡creemos que lo hace!"
Han pasado muchos años desde que se publicara este muy conoci-
do y citado texto de Cohen, y muchos más desde que el error se hubiese
empezado a señalar; pero éste no sólo sobrevive en los trabajos apli-
cados y habita en las cabezas de profesores y alumnos, sino que sigue
apareciendo nada menos que en trabajos especializados destinados a
esclarecer las cosas y hasta en artículos de importantes revistas médi-
cas concebidos con la única finalidad de, precisamente, ¡enseñar
inferencia estadística! Dos o tres ejemplos oportunos pueden ser sufi-
cientes para ilustrar en qué medida es así. Veamos.
En el contexto de un debate promovido por la revista Research in the
Schools, para pronunciarse precisamente acerca de la legitimidad de
los valores p, uno de los expertos invitados (Daniel, 1998) escribe
textualmente: «La significación estadística simplemente indica la pro-
babilidad de que la hipótesis nula sea verdadera en la población».
En la primera parte de una serie de artículos publicados en 2003
por la prestigiosa revista Radiology con el propósito declarado de «pro-
veer de una comprensión básica de los enfoques cuantitativos para el
análisis de datos radiológicos», Zou et al. (2003) circunscriben su pri-
mer trabajo a explicar las pruebas de significación. Desde luego, no
hacen la menor mención a la existencia de la controversia; pero lo que
interesa destacar ahora es que allí se recurre no sólo a las consabidas
recetas convencionales sino que se incurre en el error que nos ocupa,
por ejemplo, cuando escriben:
"Cuando concluimos que hay significación estadística, el valor p nos

dice cuál es la probabilidad de que nuestra conclusión sea incorrecta
cuando en realidad H0 es correcta."
Como en caso de que haya significación lo que se concluye es que

H0 es falsa, si tal conclusión fuera errónea, la correcta sería que H0 es
verdadera, de modo que estamos exactamente en la situación descrita

por Cohen: en ese artículo lo de que de hecho se nos explica es que si,
por ejemplo, p=0,02, entonces la probabilidad de que H0 sea verdade-
ra es 2%.
Una última perla que habla por sí misma es la siguiente. En las
«Normas para la presentación de comunicaciones libres a premio al
mejor trabajo» del XIII CONGRESO NACIONAL DE MEDICINA
en Argentina del año 2003, se puede leer textualmente:
"Las abreviaturas y siglas en tablas y figuras, deben aclararse en las

leyendas respectivas, pero NS (no significativo), ES (error estándar),
DS (desvío estándar), IC95 (intervalo de confianza del 95 %) y p (pro-
babilidad de que la hipótesis nula sea cierta) no requieren aclararse."
Gigerenzer, Krauss y Vitouch (2004) relatan una interesante expe-

riencia que ilustra con nitidez la colosal dificultad que ofrecen los
valores p para ser debidamente interpretados. Se trabajó con un nutri-
do grupo de alumnos y profesores procedentes de seis universidades
alemanas. La muestra incluía a 44 estudiantes de Psicología, todos los
cuales habían superado cursos en los que se habían explicado las PSE,
39 profesores de esta misma disciplina y 30 profesores de Estadística.
Se les informó que:
"Al comparar mediante una prueba t de Student las medias corres-

pondientes a sendos tratamientos, se obtuvo: t=2,7; gl = 18; p= 0,01."
Y se les pedía que valoraran la veracidad de cada una de 6 afirma-

ciones que figuraban a continuación. Todas las afirmaciones
entrañaban una interpretación errónea de los valores p (por ejemplo,
una de ellas rezaba: Ud. ha hallado la probabilidad de que la hipótesis nula
sea verdadera).
Ninguno de los estudiantes señaló que las seis afirmaciones eran
falsas y la inmensa mayoría de los profesores declaró al menos una
como correcta. Otros resultados interesantes se resumen en la Ta-

bla 6.1.
Tabla 6.1. Resumen de las respuestas de alumnos y profesores sobre la veracidad de

seis interpretaciones erróneas sobre el significado del valor p.
Número % de interrogados
% de interrogados
medio de que creen que p es la
con al menos un
respuestas probabilidad de que
error
erróneas H0 sea correcta
Instructores
en Metodología 80,0% 1,9 17,0%
(44)
Profesores de
Psicología (39) 89,7% 2,0 26,1%
Alumnos (30) 100,0% 2,5 32,0%
VALORACIÓN ESTADÍSTICA DE HIPÓTESIS
Hasta aquí se ha discutido la interpretación de los valores p, pero

sin considerar más que tangencialmente el modo en que habrían de
ser empleados en el contexto de una investigación concreta. En el
apartado Una historia turbulenta, p. 349, se habían mencionado tres
enfoques alternativos. Detengámonos ahora a repasar en qué consis-
ten y en qué se diferencian exactamente.
Propuesta de Fisher: las pruebas de significación
Ronald Fisher se ocupó de enfatizar que el valor p no debía inter-

pretarse como la frecuencia hipotética de «error» en que se incurriría
si se repitiera el experimento; este valor fue concebido como una

medida para ser calculada luego de un sólo experimento, y según su
propuesta debía emplearse para reflexionar acerca de la credibilidad
de la hipótesis nula, una vez examinados los datos. Fisher considera-
ba que, como medida del carácter probatorio, el valor p debía
combinarse con otras fuentes de información sobre el fenómeno ob-
jeto de estudio.
Es decir, el valor p no fue articulado como parte de un método
inferencial formal, sino como un componente del proceso de obten-
ción de conclusiones. En ese proceso habrían de combinarse los valores
p con el resto de la información en alguna forma no especificada de
manera consistente por él (ni por nadie luego); su papel era congénita-
mente orientativo, sin que se estableciera algorítmicamente qué hacer
con esos números (Silva, Benavides y Almenara, 2002).
Es un hecho, sin embargo, que Fisher propuso el empleo del um-
bral 0,05 para declarar o no «significación». En un famoso artículo
(Fisher, 1929) escribió textualmente el siguiente párrafo, que pone de
manifiesto claramente ambos elementos de la propuesta fisheriana:
"En la investigación de seres vivos por métodos biológicos, las pruebas de

significación son esenciales. Su función es prevenirnos de errar en virtud
de ocurrencias accidentales, no debidas a las causas que deseamos estu-
diar, o que intentamos descubrir, sino a una combinación de muchas
otras circunstancias que no podemos controlar. Una observación se juz-
ga significativa, si sólo excepcionalmente pudiera producirse en ausencia
de una causa real. Es práctica común la de juzgar un resultado como
significativo si es de magnitud tal que no se habría producido por mero
azar con frecuencia mayor que una vez en cada veinte ensayos. Esto es un
umbral de significación arbitrario, pero resulta a la vez conveniente para
el investigador práctico, aunque no quiere decir que él esté dispuesto a
errar una de cada veinte veces que haga un experimento. La prueba de
significación sólo le dice qué ignorar: a saber, todos los experimentos en
los que no se obtienen resultados significativos."
Y en su libro The Design of Experiments, Fisher (1935) precisaba:
"Es corriente y útil que el experimentador fije el 5% como un nivel

estándar de significación, en el sentido de que ha de estar preparado
para desdeñar aquellos resultados que no alcancen este umbral, y por
esta vía evitarnos la discusión posterior de la mayor parte de las fluc-
tuaciones introducidas en los datos sólo por azar."
El 0,05 se convirtió rápidamente en dogma; se consolidó como un

límite rígido para separar la «significación» de la «no significación».
Sin embargo, una lectura detenida de las citas de Fisher permite apre-
ciar, por una parte, que él valoraba este umbral con mucha mayor
flexibilidad, y por otra, que nunca habló de «rechazar hipótesis» sino
de «desdeñar resultados», de modo que para él, la significación era
sólo un «salvoconducto» para realizar un escrutinio más profundo del
problema.
La perversión de establecer reglas mecánicas había sido enfática-
mente denunciada y no sin cierta desesperación por el propio Fisher.
Repárese en la siguiente cita (Fisher, 1929):
"Al desviar la atención del deber que tiene el trabajador científico de

llegar a conclusiones científicas correctas, resumiéndolas y comuni-
cándolas a sus colegas y al hacer hincapié en su supuesta obligación de
llevar a cabo mecánicamente una sucesión de «decisiones» automáti-
cas, se fomenta la idea según la cual el científico puede considerarse
una pieza inerte dentro de una vasta institución cooperativa que tra-
baja según reglas aceptadas..."
De poco valió que luego Fisher intentara matizar esa propuesta

con afirmaciones tales como: «ningún trabajador científico tiene un
nivel fijo de significación, al cual todos los años, bajo todas las cir-
cunstancias, rechace hipótesis; más bien reflexiona para cada caso
particular a la luz de sus evidencias y sus ideas» (Fisher, 1956).
No es infrecuente que los textos originales de algunos autores cai-

gan en el olvido y queden sumidos en la bruma, ocultados o
tergiversados por una práctica o una interpretación que se transmite
de unos a otros hasta parecer que el propio introductor del concepto o
autor del método es quien ha sugerido lo que se hace, cuando en rea-
lidad esto que se hace sólo tiene cierto parecido con lo que
originalmente se sugirió.
Debe señalarse, sin embargo, que el propio Fisher incurrió en no
pocas inconsecuencias a lo largo de su carrera académica, como que-
da claro en el examen que realiza Marks (2003) de su extensa obra.
La caracterización esquemática de la propuesta esencial de Fisher
puede hallarse en el Anexo 6.1.
Enfoque de Neyman-Pearson: las pruebas de

hipótesis
La teoría de Neyman y Pearson involucra dos hipótesis: al igual

que Fisher, consideran una hipótesis nula Ho (usualmente una afirma-
ción de que el efecto es nulo), pero agregan una hipótesis alternativa
HA, según la cual el efecto asciende a cierta magnitud no nula. El
problema consiste, según ese enfoque, en elegir una de las dos.
El resultado de aplicar una prueba de hipótesis pasaba así a ser un
instrumento para adoptar una conducta, en lugar de un acto inferen-
cial: rechazar una hipótesis y aceptar la otra, solamente sobre la base
de los datos. Esto coloca a los investigadores frente al riesgo de co-
meter dos tipos de error en el acto de decidir: declarar, por ejemplo,
que los efectos de dos terapias difieren en cierta magnitud cuando
realmente son iguales, es decir, cuando se cumple Ho (error tipo I) o
concluir que las dos son iguales cuando en realidad se cumple HA
(error tipo II). Colocadas las cosas en esos términos, inexorablemente
comparecen de manera natural las funciones de pérdida, definidas como
la probabilidad α de cometer el primero de los errores y la probabili-
dad β de aceptar Ho siendo ésta falsa. Cuando se fijan estas tasas de

error de antemano, queda definida una llamada «región crítica». Si el
valor del estadístico de la prueba se sitúa en dicha región, se acepta la
hipótesis alternativa y se rechaza la hipótesis nula; en su defecto, se
decide lo contrario: aceptar Ho y descartar HA. Véase este plantea-
miento esquematizado en el Anexo 6.1. La afirmación «la hipótesis
nula nunca se acepta, sólo es posible no descartarla» a lo que aludire-
mos más abajo, nada tiene que ver con las pruebas de hipótesis, tal y
como fueron formuladas por Neyman y Pearson.
La idea central de Neyman y Pearson parte de que lo verdadera-
mente útil para la ciencia no es razonar inductivamente a partir de
un único experimento sino la de usar métodos que limiten el número
de errores que se cometen cuando se realizan muchos experimentos
con el mismo fin. Así lo dejan explícitamente dicho (Neyman y Pear-
son, 1933):
"Ninguna prueba basada en la teoría de las probabilidades puede por

sí misma proporcionar evidencia valiosa alguna sobre la veracidad o
falsedad de una hipótesis. Sin aspirar a conocer si cada hipótesis por
separado es verdadera o falsa, podemos buscar las reglas que gobier-
nan nuestro comportamiento con respecto a ellas, siguiendo las cuales
podemos asegurar que, ante un número grande de repeticiones ex-
perimentales, no estaremos frecuentemente equivocados."
Enfoque híbrido: método combinado
Como ya se anticipó, una década más tarde comienza a fraguarse

un método que se conforma con ingredientes de Fisher (su valor p
como índice que mide la fuerza de la evidencia), y de Neyman y Pear-
son (el establecimiento de una decisión). Tal engendro no tendría por
qué ser necesariamente criticable si no fuera por el hecho de que com-
bina acciones conceptualmente incompatibles.
La lógica del método combinado, tal y como se emplea actualmen-

te, descansa en el cumplimiento de varias etapas que se describen en
el Anexo 6.1.
El método combinado se divorcia de Fisher cuando se traza la
tarea de «decidir» sobre Ho. Para ello se reduce a comparar el valor p
con un umbral cuantitativo que permite declarar significativa o no a la
medida de efecto, y prescinde enteramente de factores tales como la
plausibilidad biológica, la solidez de la teoría que está siendo valo-
rada, y la información aportada por investigaciones precedentes,
elementos que se convierten en aspectos laterales del problema. Toma
de Neyman y Pearson la idea de que la finalidad es adoptar una deci-
sión sobre la hipótesis nula, pero se desentiende de este enfoque
cuando elude establecer una hipótesis alternativa concreta, a partir de
lo cual insiste en que no rechazo no es lo mismo que aceptación y «prohí-
be» la aceptación de la hipótesis nula. Se extirpa así el error de segundo
tipo y establece una regla que sólo repara en el primero de ellos.
Aunque el método combinado no se basa en un cuerpo coherente
de ideas, es tan cómodo que ha sido asimilado por las más diversas
disciplinas aplicadas.
Los creadores de estos enfoques —Fisher por una parte, Neyman y
Pearson por otro— defendieron sus respectivos puntos de vista en un
debate vehemente que incluyó duros ataques personales, pero ningu-
no contemporizó con este método combinado que cercena ingredientes
cruciales de una y de otra aproximaciones. No obstante, es presenta-
do en textos y revistas médicas como una teoría consagrada y
coherente.
Para apreciar un análisis que demuestra que el método combi-
nado amalgama dos concepciones conceptualmente irreconciliables,
invito al lector a leer el artículo de Goodman (1999), a mi juicio el
más lúcido y penetrante de cuantos hayan examinado el problema.
Sin embargo, ello se pone de manifiesto nítida, y yo diría que es-
pectacularmente, en ejemplos como el que se desarrolla en la Sección
siguiente.
Naturaleza irreconciliable de los enfoques originales
El lector habrá observado en el ejemplo de la audiometría en el

apartado El valor p: definición y falacias, p. 356., que al computar p
se ha supuesto que el valor m obtenido representa una gama más
amplia de posibilidades: la de que el número de éxitos sea «mayor
o igual» que m. Es decir, lo que se calcula es la probabilidad de
obtener m o más éxitos. Se trata de una «perversa» singularidad de
esta teoría, pues es razonable que una hipótesis esté bajo sospecha
por ser incompatible con ciertos hechos observados, pero, tal y
como están definidos los valores p, esta práctica entraña la posibi-
lidad de que una hipótesis pudiera conceptuarse como incompatible
con ciertos resultados ¡que no han ocurrido! Sin embargo, el im-
pacto que tiene este hecho es a la vez más interesante y más
dramático que la mera retórica implícita en él.
Por el modo en que se definen, los valores p sólo pueden ser enten-
didos en un sentido frecuentista. Expresan la frecuencia teórica con
que se produciría un resultado como el observado o más extremo, si
rigiera Ho y repitiéramos muchas veces la experiencia realizada. El
gravísimo escollo que ello supone para la interpretación regular que
se hace de p estriba nada menos que en lo siguiente: a una misma
observación concreta pueden corresponder diferentes valores de p en
dependencia de cuál sea el experimento que el investigador tenga o
haya tenido proyectado en su mente.
Este planteamiento, de gran trascendencia epistemológica, es cier-
tamente sutil y por ende, en cierta medida, difícil de captar. Un ejemplo
adecuado puede ayudar notablemente. El lector puede encontrar una
simple e impresionante ilustración (basada en la distribución bino-
mial negativa) en el excelente libro de Royall (1997) o en el más reciente
debido a Howson y Urbach (2006); pero en el Anexo 6.2 se expone
una ilustración particularmente sencilla, pues apela a una simple mo-
neda, a la vez que transparenta con toda elocuencia el «paradójico»
fenómeno.
VALORES p Y TAMAÑOS DE MUESTRA

Las bases lógicas y la utilidad práctica de los valores p de Fisher no
tardaron mucho en ser criticadas (véase, por ejemplo, el famoso tra-
bajo de Berkson, 1942). El rasgo más claramente cuestionable de los
valores p como medida de la evidencia, ya señalada desde entonces,
radica en que el tamaño del efecto observado (por ejemplo, la diferen-
cia entre las tasas de recuperación que correspondan a sendos
tratamientos) se «mezcla» indiscerniblemente con el tamaño mues-
tral. Siendo así, a un pequeño efecto en un estudio con un tamaño de
muestra grande puede corresponder el mismo valor p que a un gran
efecto encontrado en una muestra pequeña. Más específicamente: el
valor p se puede hacer tan pequeño como se desee en virtualmente
cualquier situación práctica; basta con tomar una muestra suficiente-
mente grande en una situación en que Ho sea falsa.
Beach (2001) escribe: «Un valor P > 0,05 puede ocurrir cuando no
hay efecto del tratamiento o cuando no hay suficientes datos recogi-
dos. Consecuentemente, P > 0,05 sugiere ausencia de evidencia de
un efecto antes que ausencia de un efecto».
Uno de los más graves problemas que dimana de esta indiscutible
verdad estriba en que casi siempre se tiene certeza anticipadamente
de que el efecto no está ausente, es decir, de que la hipótesis nula es
falsa. Así lo señalaba Bakan (1966) explícita y persuasivamente desde
hace más de cuatro décadas:
"Es un hecho objetivo que casi nunca hay buenas razones para esperar
que la hipótesis nula sea verdadera. ¿Por qué razón la media de los
resultados de cierta prueba habría de ser exactamente igual al este
que al oeste del río Mississipi? ¿Por qué deberíamos esperar que un
coeficiente de correlación poblacional sea igual a 0,00? ¿Por qué espe-
rar que la razón mujeres/hombres sea exactamente 50:50 en una
comunidad dada? o ¿por qué dos drogas habrán de producir exacta-
mente el mismo efecto? Una mirada a cualquier conjunto de estadísticas
que incluyan totales poblacionales confirmará de inmediato que la

nulidad se presenta muy raramente en la naturaleza."
Incluso diez años antes el afamado matemático Leonard Savage

había advertido (Savage, 1957):
"Con mucha frecuencia se sabe incluso antes de recoger los datos que
las hipótesis de nulidad no rigen; en ese caso el rechazo o la acepta-
ción, simplemente es un reflejo del tamaño de la muestra y no hace,
por tanto, contribución alguna a la ciencia."
Para comprender mejor esta realidad acudamos nuevamente al mo-

delo asociado al lanzamiento de una moneda. Llamemos ∆ a la
probabilidad que corresponde a uno de los dos desenlaces posibles (por
ejemplo, al de que salga cara). Lo que afirma la hipótesis de nulidad Ho
es que ∆=0,5. Como ninguna moneda de curso legal en el planeta es
perfectamente simétrica, es obvio que en rigor la hipótesis ha de ser
necesariamente falsa. Pero de momento supongamos que admitimos la
posibilidad de que sea verdadera y que dejaremos en manos de una PSE
la decisión al respecto. Supongamos que se examinará la validez de Ho a
través de una experiencia y que, aunque no lo sabemos, ∆ es un número
muy cercano aunque no igual a 0,5. Lo que estoy afirmando es que, por
nimia que sea la discrepancia con la nulidad, siempre habrá un número
suficientemente grande de lanzamientos como para que los datos pa-
rezcan altamente incompatibles con la hipótesis (y, por cierto, siempre
habrá uno suficientemente pequeño como para que no parezca así). O
sea, el resultado —si éste se enjuicia a través de la p— a la postre va a
depender simplemente del tamaño de muestra que se elija.
Si, por ejemplo, ∆=0,53 tomando n=5.000, se obtendría un núme-
ro de caras muy cercano a n·∆=2.650; bajo el supuesto de que la
probabilidad de cara es un medio (Ho: ∆ =0,5) y, de ser ese el desenla-
ce, el valor p sería inferior a 0,003: solo en 3 de cada mil oportunidades
que se realice la experiencia de lanzar la moneda 5.000 veces se ob-
tendrá un número que esté tanto o más alejado de 2.500 caras como
lo está 2.650. Supongamos un caso extremo, tal como que la moneda
fuera casi perfecta y se tuviera ∆=0,5001; entonces, es fácil demos-
trar que para alcanzar, por ejemplo, una p tan pequeña como 0,0016,
bastaría lanzarla 250 millones de veces (n=250.000.000).
En el Anexo 6.3 se ofrece una ilustración práctica asociada a una
sencilla demostración matemática formal de que el valor de Ji-Cua-
drado se puede agrandar tanto como se desee (y por ende, hacer que
el valor p sea tan pequeño como se quiera) aumentando el tamaño
muestral. Aunque allí se ha elegido un ejemplo extremadamente sim-
ple y familiar para cualquier investigador, lo mismo ocurrirá, por
ejemplo, con el valor observado de una t de Student cuando se com-
paren dos medias. Los tamaños muestrales del estadístico se hallan en
este caso en el denominador del denominador, de modo que su valor
crece en la medida que lo hagan los tamaños de las muestras. De he-
cho, ese patrón será el de todo estadístico con que se trabaje.
Thompson (1993) ironizaba sobre esta situación escribiendo:
"Luego de haber coleccionado datos de cientos de sujetos, agotados

por el esfuerzo, los investigadores realizan una PSE para evaluar si los
sujetos eran una gran cantidad, aunque esto es algo que los investiga-
dores ya sabían, ya que están agotados debido precisamente a la gran
cantidad de datos recogidos."
LA LUPA CRÍTICA SOBRE LAS PSE
Hecho este recorrido, procede que nos detengamos en las más im-
portantes impugnaciones de que son objeto las PSE4. Algunas dimanan
4
Resulta importante aclarar que en lo sucesivo, el término PSE alude específicamente
a las pruebas tal y como se emplean en la actualidad (pruebas de rechazo o método
casi automáticamente de las limitaciones intrínsecas que padecen los

valores p, instrumento en torno al cual se vertebran (expuestas en los
apartados Transposición de condicionantes y otras interpretaciones fantasiosas,
p. 360; y Naturaleza irreconocible de los enfoques originales, p. 371). Otras
conciernen al modo en que dichos valores son empleados como parte
del ritual cotidiano de las PSE. En Silva (2008) puede hallarse un
apretado resumen elaborado en términos fáciles de comprender para
cualquier profesional interesado en la investigación médica. A conti-
nuación se examinan con detalle los cinco elementos más importantes
allí esbozados.
La nulidad siempre puede ser rechazada
La tarea que se quiere resolver con una PSE es pronunciarse dico-

tómicamente acerca de si Ho puede considerarse falsa o si no se tiene
suficiente evidencia muestral como para hacerlo.
Supongamos que se valora si dos hormigas son o no iguales entre
sí. Si se llegara a la conclusión de que no podemos pronunciarnos al
respecto, sólo hay una explicación: las hormigas no se han examinado
con suficiente detalle. Salvo contadísimas excepciones, usar una PSE
para evaluar si dos tratamientos son o no iguales, es exactamente lo
mismo que emplear determinado instrumento con el único propósito
de determinar si son o no iguales dos hormigas.
El hecho de que virtualmente siempre se sabe que Ho es falsa antes de
realizar prueba alguna y el de que el valor p que se usa para tal valoración
puede reducirse tanto como se quiera tomando una muestra suficiente-
mente grande, son dos circunstancias que se complementan para cancelar
la presunta capacidad demarcatoria de una PSE entre lo cierto y lo falso.
Basta que haya una minúscula diferencia, por intrascendente que
sea (incluso el más mínimo sesgo), para que la diferencia cuya nulidad
combinado), aunque algunas de las observaciones críticas alcanzan por igual a sus fuentes
originales.
es proclamada por Ho pueda ser declarada «significativa»; sólo se trata

de que se cuente con suficientes recursos como para tomar una mues-
tra adecuadamente grande. Como escribía recientemente un periodista
en Wall Street Journal: «Ud. puede probar cualquier hipótesis, por estú-
pida que sea, llevando adelante una prueba estadística con toneladas
de datos» (Albert, 2007).
Esta es una muy grave imputación, pues nos dice que la decisión
queda en manos de un elemento externo a la realidad que se examina,
de modo que la respuesta a la pregunta formulada queda determinada
a la postre de los recursos disponibles. Dicho de otro modo: si la mues-
tra es muy grande, las pruebas de significación son inútiles, pues ya se
sabe el resultado que arrojarán.
• Una recomendación irracional
Para aportar una «solución» a tan desolador panorama, además de ad-

vertir que debemos procurar que el tamaño muestral sea suficientemente
grande como para poder detectar cierta diferencia mínima, también se ha
señalado que debe evitarse que dicho tamaño sea tan grande que permita
declarar como significativa a una diferencia que sea cualitativamente irre-
levante. Abramson (1990), por ejemplo, suscribe esta opinión apoyándose
en la siguiente frase de Sackett (1979): «Las muestras demasiado peque-
ñas pueden servir para no probar nada; las muestras demasiado grandes
pueden servir para no probar nada». Es decir, algunos autores, compren-
diendo este grave problema, pero sin entender que no tiene solución,
hacen una sugerencia desconcertante: evitar que la potencia de una prue-
ba sea demasiado grande, de modo que se cancele la posibilidad de que
un efecto cualitativamente insustancial pueda ser estadísticamente signi-
ficativo. Rossi (1997), por ejemplo, escribe textualmente:
"Es importante que los investigadores sean precavidos con la potencia

de sus experimentos; no sólo han de poder detectarse los efectos
buscados, sino que también debe evitarse la detección de pequeños

efectos triviales."
Tales advertencias son un reconocimiento claro del problema, pero

a la vez entrañan una propuesta que —como ya se señaló— es sim-
plemente absurda, equivalente a sugerir que no nos acerquemos
demasiado a las dos hormigas para no vernos obligados a admitir que
no son idénticas.
Hay algunos especialistas que defienden las PSE, pero no conozco
un solo artículo, un sólo libro, un sólo profesor que consiga refutar o
siquiera matizar esta gravísima limitación. No se me ocurre respaldo
mayor para esa objeción que el clamoroso silencio que produce.
• El trauma de la no significación
Consideremos un ensayo clínico realizado para valorar si cierta va-

riante terapéutica para tratar a pacientes quemados es mejor que una
convencional. Supongamos que la tasa de recuperación usando la tera-
pia convencional resultó ser 45%, en tanto que para el tratamiento
experimental asciende a 66%. En principio los investigadores, quienes
tenían fundadas expectativas en cuanto a las ventajas terapéuticas del
tratamiento novedoso, ven confirmadas empíricamente tales esperan-
zas y se disponen a preparar una publicación. Uno de ellos carece de
formación estadística alguna y está muy entusiasmado; pero el otro es
más cauteloso, ya que ha aprobado algunos cursos básicos de estadísti-
ca donde se ha explicado que esta diferencia pudiera deberse a mero
azar, y que sólo una PSE puede avalar la supremacía del tratamiento
novedoso. Consecuentemente, se procede a comparar dichos porcenta-
jes por medio de una prueba convencional de significación.
Supongamos que se obtuvo una p=0,12. El primer investigador
recibe la explicación del segundo y no tiene más remedio que aceptar
que ha de comunicarse que «no hay significación», o más formalmen-
te, que «no hay suficiente evidencia muestral como para afirmar que
los dos tratamientos difieren entre sí». Pero en el fondo se rebela ante
la idea de desestimar totalmente el resultado. En rigor, tiene que des-
deñarlo para ser consecuente con las reglas del método que ha elegido,
pero íntimamente se insubordina ante la idea de actuar como si esa
diferencia del 21% estuviera diciendo lo mismo que una diferencia,
por ejemplo, de 2%. De modo que es posible que sugiriera agregar:
«pero obsérvese que la diferencia es notable; si hubiéramos trabajado
con una muestra mayor, muy posiblemente sí hubiéramos encontrado
significación».
Esto es enteramente comprensible. Schmidt (1996) advertía: «si la
hipótesis nula es cierta, según la posición de Fisher no se puede con-
cluir nada. Pero los investigadores se resisten a la idea de haber pasado
tanto trabajo con el estudio sólo para concluir que no pueden concluir
nada».
Pero en rigor resulta patética, pues lo peor de la afirmación «No se
ha encontrado significación, pero con una muestra mayor muy verosí-
milmente podríamos haberla hallado» es que siempre es verdadera. Es
tan ridícula y estéril como afirmar «No hemos podido demostrar que
estas dos hormigas son diferentes; pero probablemente, con una lupa
de mayor potencia, hubiéramos podido hallar suficientes indicios como
para afirmarlo».
Por otra parte, tiene tanta validez como otra afirmación que nunca
se hace cuando el resultado es coherente con lo que desean los investigadores: «sí
hubiéramos trabajado con una muestra menor, muy posiblemente no
hubiéramos encontrado significación» (Benavídes y Silva, 2000).
La práctica internacional está plagada de ejemplos. Sólo con la fi-
nalidad de testimoniar el estilo elegido cuando se acude a este recurso,
consideremos los siguientes ejemplos tomados al azar de la literatura
más reciente:
– Con un tamaño de muestra mayor, estas diferencias pudieran

pasar a ser estadísticamente significativas (Kowatch et al., 2000).
– Se tomaron mediciones de la RVIP, pero no mostraron efectos

de la ingestión de agua; sin embargo, no podemos descartar la
posibilidad de que se hubieran detectado cambios con un tama-
ño de muestra mayor (Neave et al., 2001).
– La adición de fluoxetina a la PUVA ha mostrado una tendencia
hacia una más rápida mejoría, pero no alcanza el nivel de signi-
ficación estadística. Por lo tanto, una muestra mayor puede ser
considerada (Mitra, 2001).
– Es de esperar que en un estudio con un tamaño de muestra
mayor, la diferencia entre estos valores y los del resto del grupo
sea estadísticamente significativa (Perich et al., 2002).
– El presente estudio de salud mostró un aumento en el riesgo
para mortalidad neonatal, pero éste no fue significativo. Sin
embargo,… con un mayor tamaño de muestra esta asociación,
después del ajuste, podría ser significativa (Delgado et al., 2003).
– En lo que concierne al tamaño muestral, es concebible que las
diferencias en homeostasis de la glucosa y en la distribución de
tejido adiposo entre los grupos pudieran haber sido detectadas
con un tamaño de muestra mayor (Bitnun, 2003).
– Aunque no confiable a los niveles convencionales de signifi-
cación estadística, la tendencia de los datos sugiere que, de
haber tenido una muestra mayor, y por tanto mayor potencia,
los hallazgos relacionados con el folato hubieran sido simila-
res a los hallados para la vitamina B12 (Bunce, Kivipelto y
Wahlin, 2004).
No es casualidad que no se haya encontrado ni un solo ejemplo en

que los autores adujesen que con una muestra más pequeña probable-
mente no hubieran conseguido la significación que alcanzaron con la
muestra empleada.
Enfoque arbitrariamente binario
Un experimento en particular casi nunca dará respuesta definitiva a

la pregunta planteada; lo que suele hacer es una contribución al proceso
de permanente reajuste de nuestras convicciones, y en ese sentido ser
útil para ir construyendo respuestas científicamente fructíferas.
Las pruebas de significación constituyen un proceso de decisión
sobre una hipótesis (que se ha de rechazar o no); pero el pensamiento
científico no discurre así realmente. La noción de encarar una hipóte-
sis como si fuera una invitación al cine, que aceptamos o rechazamos,
poco tiene que ver con el avance del conocimiento científico tal y
como se ha verificado históricamente. En el caso de las ciencias mé-
dicas y la salud pública, podría decirse que tal conocimiento más bien
se ha conseguido a pesar del esquematismo propio de las PSE.
Nuestras convicciones científicas pueden ser más o ser menos fir-
mes, pero siempre son provisionales, y nuestras representaciones de
la realidad tienen en cada momento un cierto grado de credibilidad,
pero abierto a cambios y perfeccionamientos en la medida que nue-
vos datos lo aconsejen. Lo ideal sería contar con procedimientos que,
en lugar de convocarnos a desechar o no una hipótesis, asuma lo que
de hecho siempre termina haciéndose en la investigación verdadera,
háyase o no usado el ceremonial de las PSE: «poner al día» la opinión
que la hipótesis nos merece a la luz de dichos datos.
Como afirmara Rozeboom (1960): «El proceso central de un expe-
rimento no consiste en precipitar la toma de decisiones sino en propiciar
un reajuste en el grado en que uno acepta (o cree en) la veracidad de
la hipótesis que se valora».
En palabras de Cohen (1990):
"La predominante decisión de sí-no… que se obtiene de una única

investigación está muy lejos del clamor de usar juicios informados. La
ciencia simplemente no actúa de esa forma. Una parte exitosa de la
investigación no resuelve de manera concluyente un problema, sino
que se reduce a formular alguna proposición teórica con un grado

mayor o menor de probabilidad."
Es típico que el investigador lleve adelante su estudio, aplique una

PSE y, a partir del resultado derive una conclusión. Se hace una mera
transformación lingüística del valor que asume p, y se arriba a una con-
clusión sin que medie una genuina discusión, como si ella pudiera ser
un corolario directo de los resultados. Al menos, eso es lo que se espera
que haga como parte de un método estadístico que viene conspirando
exitosamente contra nuestra capacidad para distinguir entre resultados
estadísticos y conclusiones científicas. Resulta difícil exagerar la natu-
raleza perniciosa de tal práctica. La dicotomía «significación – no
significación» cincela la presunta legitimidad del enfoque binario pro-
pio de las PSE.
La desazón que genera el empleo desmedido de las PSE en la litera-
tura aumenta cuando se repara en que el empleo de estas expresiones es
con extrema frecuencia ambiguo, ya que a menudo no queda claro si se
quiere decir que se rechaza la nulidad, que se ha hallado algo sustanti-
vamente importante en términos prácticos, o que se ha encontrado un
resultado que modifica apreciablemente nuestra opinión científica.
Mc Closkey y Ziliak (1996), por ejemplo, dan cuenta de que el 59%
de los artículos publicados en American Economic Review usan el término
«significación» de manera ambigua. Como apuntara Chia (1997): «…
muchos investigadores ven el análisis estadístico como un medio de
obtener un resultado estadísticamente significativo, y por tanto, a la
larga, desarrollan una obsesión compulsiva denominada significantitis».
En un artículo donde se aborda el uso abusivo del lenguaje estadís-
tico, Silva (2003) señalaba que el marco de las pruebas de hipótesis es
terreno especialmente abonado para la aparición de dislates parcial-
mente debidos a la complejidad interpretativa inherente a este recurso
estadístico.
Consideremos el ejemplo más simple: se comparan las tasas de
recuperación para cierta enfermedad tras la administración de sendos
tratamientos (por ejemplo, uno convencional y otro novedoso). Su-

pongamos que al aplicar una prueba de hipótesis, ésta arroja que la
diferencia entre las tasas es significativamente diferente de cero. Lo que se po-
dría afirmar es que tenemos indicios fundados para creer que los dos
tratamientos no son exactamente iguales. Ni más ni menos. Sin em-
bargo, se ha generalizado la costumbre de suplir esta declaración por
la afirmación de que la «diferencia es significativa». Es un abuso de
lenguaje cuya relevancia radica en que, implícitamente, se está di-
ciendo que «la diferencia es importante o sustantiva». De hecho,
muchos autores están convencidos de que un tratamiento es efectivo
o de gran magnitud cuando p es pequeño o menor que cierto umbral
especificado de antemano (es decir, cuando hallan significación).
En la discusión de los resultados, los autores emplean con frecuen-
cia un lenguaje que sugiere tal interpretación. El asunto, sin embargo,
pudiera no ser demasiado grave, ya que podría admitirse que el lector
entiende que se ha querido decir que los tratamientos no son iguales.
Pero las cosas van más lejos cuando lo que se califica como «significa-
tivo» o «muy significativo» es el efecto de un tratamiento, en lugar de
limitarse a decir que «la diferencia entre los porcentajes de éxito de los
tratamientos es estadísticamente significativa».
Escudriñando el motor de búsqueda Google Scholar, sólo de-
dicado a documentos científicos, se puede hacer una experiencia
que permite, grosso modo, tener una idea de la magnitud de este
fenómeno.
Si pedimos que busque sitios que contengan la frase «significant
effect», obtendremos (junio de 2008) 803.000 entradas. Las entradas
de este tipo, desde luego, abarcan situaciones en que la frase en cues-
tión se emplea en un contexto no estadístico, o con una intención no
relacionada con las PSE. Siendo así, el verdadero número de sitios en
que sí se está aludiendo a una PSE, será menor. Trabajando con una
muestra informal de ese conjunto de 803.000 sitios, pude estimar que
el porcentaje de veces en que dicha frase se emplea para aludir a algo
ajeno a la significación estadística asciende a alrededor del 15%, de
modo que aquel 803.000 se reduciría en propiedad, aproximadamen-

te, a 682.500. Por otra parte, si se piden las entradas en que figura
«statistically significant effect» obtenemos 50.500. Es decir, sólo el
7% de las veces se aclara que no se trata de que el efecto sea significativo
sino de que se halló una diferencia o efecto estadísticamente significativo.
Por otra parte, si agregamos a «significant effect» la restricción de que
en el sitio figure la expresión «p<0.05», el número de entradas ascien-
de a 265.000. Vale decir, aproximadamente el 41% de las veces que
se concluye que hay un efecto significativo, tal afirmación se basa en la
aplicación mecánica de una PSE donde se ha empleado el famoso
umbral.
Seguramente existen muchos trabajos en que no se llega a escri-
bir la expresión «p<0,05» como tal (tal sería el caso, por ejemplo,
cuando se emplea 0.05 en lugar de 0,05, así como cuando se comu-
nica al principio que se trabajaría con α = 0,05 o α = 0.05 y luego se
informan los valores p concretamente hallados); éstos no habrían
quedado contabilizados en la estimación anterior; lo contrario pu-
diera ocurrir con otros en que, para afirmar que el efecto es
significativo se hayan tenido en cuenta otros elementos además del
valor de p. Sin embargo, aun sin tener en cuenta estos matices y ser
por tanto poco refinado, el ejercicio demuestra a grandes rasgos que
el abuso de lenguaje conceptual al que nos hemos referido está su-
mamente extendido.
Sólo a modo de ejemplo, consideremos el siguiente, donde Agüe-
ro et al. (1997) concluyen que «los antiinflamatorios no esteroideos
mostraron un efecto significativo sobre el tumor primario, medido
tanto por retardo del crecimiento del diámetro del miembro inocu-
lado como por un menor peso del mismo». En esta situación se está
invitando crudamente al lector a que piense en una equivalencia
entre significación clínica y significación estadística; se sugiere así
que la diferencia entre la p hallada y el nivel de significación prefija-
do es un índice de la trascendencia o relevancia clínica del nuevo
tratamiento (Nickerson, 2000).
Solucionando el problema equivocado
Subyacente en el asunto que nos ocupa se halla uno de los proble-

mas más graves de las PSE: su carácter irrelevante debido a que están
concebidas para resolver un problema que no interesa. Como se ha
señalado, la tarea de la PSE se reduce a dar elementos para pronun-
ciarse dicotómicamente (significativo - no significativo; rechazo - no
rechazo; compatible - incompatible). Esto conduce a afirmaciones
como la de Lecoutre (2006) quien textualmente apunta: «La PSE es
un método inadecuado para el análisis de datos experimentales, no
porque sea un modelo normativo incorrecto sino simplemente por-
que no atiende a las preguntas que la investigación científica reclama».
En Silva (2005) se puntualiza que las preguntas de investigación
nunca son estadísticas. Consecuentemente, tampoco las respuestas
pueden serlo. No tiene sentido, por ejemplo, que en una conclusión
comparezca el concepto de «significación». Las PSE, si se usan, sólo
pueden tener el cometido de ser intermediarias metodológicas de un
propósito cognoscitivo. Pero, por su propia naturaleza, invitan a la
confusión en esta materia. De hecho, las reglas implícitas en su lógica
—siempre que se empleen de la manera en que están concebidas—
inducen a que se encare el problema equivocado.
Veámoslo con un ejemplo que apela, una vez más, al modelo de un
simple ensayo clínico controlado. Llamemos ∆ a la magnitud P2 - P1
que expresa cuánto mejor es una terapia que otra.
Si pudiéramos consultar a un dios omnisciente, ¿qué pregunta rea-
lizar? ¿Se le preguntaría si se puede rechazar la hipótesis nula o se le
preguntaría cuánto es ∆? Obviamente, lo segundo. La estadística no
es un fin; es un mero intermediario metodológico para llegar a una
respuesta. Si se nos comunicara la magnitud de ∆, ya la estadística no
haría falta, no hay lugar para ella, pues ya tendríamos la respuesta. El
problema es que se realiza investigación científica porque no se le
puede preguntar a dios (en rigor sí se puede, lo que pasa es que no
contesta). Es esta simple reflexión la que hace que los intervalos de
confianza sirvan para suplir a las PSE (véase apartado Los intervalos de
confianza como sucedáneos, p. 418), la que al final legitima la idea de que
la mejor manera de lidiar con el silencio de dios es la estadística baye-
siana (véase Introducción a la racionalidad bayesiana, p. 426).
Algunos defensores de los valores p, llegado el caso conceden (oca-
sionalmente, lo deslizan tímidamente) que «es aconsejable» calcular
intervalos de confianza como complemento de las PSE. Curiosa ti-
bieza: si las conclusiones se basan en el conocimiento que ellos dan
acerca de la magnitud de ∆, entonces ¿para qué se necesita la p?
Según recuerda Chatfield (1991), a los estadísticos les resulta muy
familiar un diálogo que discurre del modo siguiente:
– Pregunta: ¿cuál es el propósito de su estudio?

– Respuesta: Yo quiero hacer una prueba de significación.
– Pregunta: No, yo lo que quiero saber es cuál el objetivo
general que Ud. se traza.
– Respuesta (algo desconcertado): Yo lo que quiero es saber
si mis resultados son significativos.
Y así sucesivamente….
Pero más importante: precisamente debido a que se sabe que ∆ ≠ 0,

no es necesario hacer ninguna experiencia para corroborarlo. Es decir,
esa discusión es absolutamente irrelevante. Lo que interesa a la ciencia
no es saber si ∆ es nula o no. Lo que pudiera interesar es saber a cuánto
asciende ∆.
Para cerrar este punto, una última reflexión. Imaginemos que al
bioestadístico de un laboratorio farmacéutico se le encomienda de-
terminar el tamaño muestral necesario para llevar a cabo un ensayo
clínico destinado a valorar un nuevo medicamento al que se le atribu-
yen propiedades capaces de producir notable mejoría a pacientes con
cierto tipo de leucemia. El diseño básico consiste en configurar al
azar dos grupos de pacientes con esta dolencia. A todos se les dispen-
sará la atención pautada para estos casos; pero a la mitad de ellos,
determinados aleatoriamente, se le aplicará, además, el nuevo medi-
camento y a los restantes se le suministrará, en su lugar, un placebo.
Es una situación típica, y lo que se relata a continuación es la conduc-
ta canónica de cualquiera que haya pasado un curso básico de
bioestadística, o de quien consulte cualquier libro convencional sobre
el tema.
Se quiere demostrar que entre los efectos de los tratamientos hay
una diferencia estadísticamente significativa. Lo primero será fijar una
hipótesis nula; supongamos que ésta es Ho : P2 - P1 = 0 donde P1 es la
tasa de recuperación conseguida con el tratamiento convencional y P2
es la que corresponde al novedoso. Ahora toca establecer con clari-
dad qué PSE se realizará para cumplir su encomienda. En este caso
sencillo, nuestro bioestadístico usará la prueba convencional de Ji-
Cuadrado para la tabla de 2 x 2. Procederá entonces a determinar un
tamaño muestral suficientemente grande como para declarar signifi-
cativa una diferencia igual o mayor que cierta magnitud preestablecida.
Se trata de conseguir que, si no se hallara significación, no sea por
culpa de un tamaño muestral demasiado pequeño. Formalmente, el
procedimiento habitual exige:
– establecer la mínima diferencia δ entre las tasas de recupera-

ción que deberíamos declarar como significativa en caso de
producirse;
– fijar la probabilidad máxima de incurrir en el error de primer
tipo α, y en el de segundo tipo β;
– sugerir un valor que se considere verosímil para P1.
La determinación de estos cuatro valores es necesariamente espe-

culativa como ya se explicó antes (véase un análisis detallado de este
problema en el Capítulo 4), pero dejemos ahora de lado este problema
y supongamos que se opta por los siguientes:
P1 = 0,15 δ = 0,08 α = 0,05 β = 0,20
Empleando estos datos, el investigador aplicará las fórmulas que

dan lugar al menor tamaño de muestra necesario (para ello, proba-
blemente acudirá a una aplicación informática tal como EPIINFO
o EPIDAT). Bajo tales condiciones, según una de las fórmulas clá-
sicas:
se tendrá que el tamaño mínimo es aproximadamente 400 pacientes

en cada grupo.
Cuando ya se dispone a comunicarlo a las autoridades, le informan
que acaba de aparecer un filántropo millonario, obsesionado por la
enfermedad, quien desea donar una gran cantidad de dinero, con la
condición de que sólo puede ser destinada a financiar este estudio.
Realizando el análisis económico, determinan que ahora se cuenta
con recursos para hacer un enorme estudio multicéntrico con un ta-
maño muestral de 7.000 pacientes en cada grupo.
Con esta información, ¿en qué situación se vería ahora el bioes-
tadístico? Lo primero que debe hacer es tirar a la basura los papeles
con sus cálculos. Pero quizás, súbitamente comprenda que lo más
razonable sería sugerir no hacer el estudio, pues lo que él procuraba
era tener un tamaño suficiente como para declarar estadísticamente
significativa la diferencia entre el fármaco novedoso y el conven-
cional. Sin embargo, el enorme tamaño muestral, ahora posible
gracias al aporte del millonario, ya garantizaría sin duda el carácter
significativo de la diferencia que se encuentre, cualquiera que ésta
sea. Vale decir, ya está asegurado el propósito que se habían trazado
los investigadores: valorar si la diferencia era significativa y asegu-
rarse de que si se fallaba en hallarla no fuera por culpa de que el
tamaño fuera muy pequeño.
Supongamos finalmente que en este punto le dicen que la historia

del filántropo era una broma y que éste no existe. Lo único coherente
para el bioestadístico sería razonar así: si la información acerca del
filántropo habría de producir la cancelación del estudio antes de ha-
cer absolutamente nada en la práctica, entonces no es necesaria su
existencia para mantener aquella decisión. Pero cualquiera intuye que
en todo esto hay algo absurdo. ¿Dónde está entonces el problema?
La clave del asunto radica en lo siguiente: toda esta madeja de
despropósitos no se produciría si en la tarea del bioestadístico no fi-
gurara en absoluto el concepto de significación sino que, por ejemplo,
él se planteara simplemente computar un intervalo de confianza para
la diferencia de los efectos. En tal caso, el dinero caído del cielo sería
bienvenido, pues aseguraría que a la postre el grado de precisión de
esta estimación sería muy alto; es decir, en tal caso terminaría cono-
ciendo casi sin error a cuánto asciende la diferencia entre los dos
porcentajes de recuperación. La valoración acerca de si tal diferencia
es sustantiva o no desde el punto de vista oncológico o de la salud
pública, ya no es en absoluto un problema de la estadística. Sinteti-
zando: la PSE sobra.
Esta endeblez del método fue una de las razones principales que
motivaron el ya cincuentenario planteamiento de Lipset, Trow y Co-
leman (1956) según el cual no es necesario utilizar estas pruebas por
ser, simplemente, irrelevantes. En un reciente debate sobre las PSE
recogido en un número monográfico de la revista Research in the Schools,
Bruce Thompson, conocido epistemólogo y estudioso durante mu-
chos años del tema, resumía así su posición (Thompson 1998):
"Nunca he sostenido que las PSE deban ser prohibidas. Si sintiera

que dichas pruebas fueran intrínsicamente diabólicas, como editor
de 3 revistas, necesariamente hubiera redactado guías a los autores
proscribiéndolas. Y como autor nunca hubiera hecho uso de los va-
lores p. En cambio, lo que pienso es que las PSE son marcadamente
irrelevantes."
Carácter descontextualizado del análisis
No es de extrañar que, si la práctica de hacer análisis descontex-

tualizados basados en valores p aislados está tan extendida, nos
encontremos con realidades tan chocantes como que el número de
resultados equivocados que resultan publicados en revistas, incluso
de gran prestigio, sea tan alto (véase un comentario al respecto en el
apartado Falsa objetividad, p. 191).
No es aventurado afirmar que otra de las deficiencias más serias
que exhiben las PSE en términos epistemológicos es que, conceptual-
mente, están concebidas para examinar resultados aislados. Para algunos
autores (Howard, Maxwell y Fleming, 2000), se trata directamente de
«la más seria de las deficiencias», opinión que comparto enteramente
en cuanto a sus aplicaciones.
Guyatt, Mills y Elbourne (2008) señalaban recientemente que «es
una ingenuidad creer que ha de conseguirse un tamaño de muestra
suficientemente grande como para permitir que un solo estudio deje
zanjado algún asunto en discusión, y un espejismo, por tanto, la idea
de que los cálculos del tamaño muestral para estudios individuales
sea algo con importancia en la era de Internet».
El análisis estadístico es un componente de los estudios clínicos y
de salud pública, y como tal ha de representar sólo una pieza de infor-
mación dentro del proceso investigativo. Las conclusiones de un
estudio pueden (y, muchas veces, deben) estar basadas en un análisis
estadístico, pero hay datos adicionales que, ineludiblemente, deben
ser considerados para arribar a conclusiones racionales. Barnett y
Mathisen (1997) advierten que cuando la significación o ausencia de
significación se usa como el criterio único para adoptar o no una deci-
sión, se puede producir un conflicto entre análisis estadístico y sentido
común. El mecanicismo implícito en el dictamen binario deja a este
último en grave estado de indefensión. Los resultados estadísticos,
frecuentemente condensados en un simple valor p, se usan por los
investigadores o por otros individuos para evitar la engorrosa tarea de
evaluar crítica y activamente toda la situación a la hora de pronuncia-

se sobre el significado de un estudio.
Al decir de Marks (2003):
"En la era en que el tránsito de los hallazgos clínicos que van desde
New England Journal of Medicine al Wall Street Journal se hace más
corto que nunca, es también mayor que nunca la necesidad de tener
en cuenta la advertencia de Fisher acerca de la naturaleza provisio-
nal del conocimiento empírico y sobre la necesidad de medir la
incertidumbre."
También Goodman (1999) subrayaba que las pruebas de significación

«constituyen una metodología que sugiere que cada estudio por sí solo
genera conclusiones con cierta tasa de error en lugar de integrarlas a las
evidencias procedentes de otras fuentes y otros estudios». Los métodos
estadísticos clásicos, con su énfasis en los valores p y en estimaciones
sobre la base de los resultados de estudios individuales, no proporcionan
una base adecuada para adicionar la información procedente del nuevo
estudio al conocimiento acumulado (Spiegelhalter et al.,1999).
Ciertamente, el conocimiento acumulado sobre un tema no inter-
viene de manera alguna en el proceso analítico formal con el que operan
las PSE. Consecuentemente, el veredicto que ellas permiten (y exi-
gen), puede verificarse sin que tal conocimiento gravite en las
conclusiones. Como ya se había consignado en la Sección precedente,
no es extraño encontrarse con el caso extremo de trabajos en los que
los autores concluyen que «la diferencia es significativa», a pesar que
bajo ningún concepto el resultado de la prueba puede considerarse
más que lo que es: un resultado y no una conclusión. Esta observa-
ción crítica puede parecer extraña al lector; es tan habitual convertir
un resultado (significación) en una conclusión (juicio crítico) que tal
despropósito no escandaliza a casi nadie.
Sin embargo, dicha descontextualización es tan absurda que los
mejores investigadores, aunque usen las PSE, se desentienden de su
esencia autorreferencial: construyen sus conclusiones complementando

el resultado de la PSE con el de estudios previos, integrándolos críti-
camente dentro del marco teórico del problema, haciendo
razonamientos matizadores y empleando para ello su sentido común.
No deja de ser irónico, pues en ese caso la presunta objetividad que
legitimaría a las PSE termina por «contaminarse» con la ineludible
subjetividad presente en todo pensamiento racional.
Quienes atacan la impureza del enfoque bayesiano (véase apartado
Introducción a la racionalidad bayesiana, p. 426) sobre la base de que éste
suele contaminarse con elementos subjetivos al comienzo del análi-
sis, parecen no percatarse de que ellos mismos no tienen más remedio
que introducirlos en algún punto, aunque sea al final.
Desafortunadamente, sin embargo, abundan los trabajos en que se
procede a «concluir» sin otra consideración que el veredicto emitido
por el programa informático favorito de los autores. Basta destinar
media hora al examen de entradas en Internet que arroje cualquier
motor de búsqueda para las palabras statistically significant para corro-
borar que son muy numerosos los artículos que no hacen referencias
al cuerpo de evidencias previas contenidas en estudios del mismo cam-
po al que pertenece el trabajo examinado. Esto ha sido formalmente
estudiado y demostrado. Véase, por ejemplo, el trabajo de Clarke y
Chalmers (1998) sobre ensayos controlados aparecidos en las más im-
portantes revistas médicas.
Cuando se realiza un ensayo clínico, los problemas estadísticos
que han de enfrentarse incluyen la elección del tamaño de muestra,
decidir cuándo detener el estudio, elegir la técnica de análisis apro-
piada y proceder al análisis de los resultados. En cada una de estas
etapas es de gran utilidad incorporar información externa al ensayo.
Sin embargo, en el mejor de los casos, en los estudios vertebrados
alrededor de las PSE, tales datos son introducidos de manera difusa
y no estructurada.
Para apreciar mejor el absurdo de esta conducta, imaginemos que
se discute si la aspirina (ASA) tiene o no propiedades que mitigan el
efecto de la artrosis. Supongamos que un investigador emprende un

estudio con vistas a valorar la hipótesis de trabajo según la cual el
ASA sí tiene tal propiedad. Realiza un ensayo clínico con 40 pacien-
tes que padecen el mismo nivel de artrosis: 20 a los que se les suministra
el fármaco y 20 tratados con un placebo. Supongamos que se obtie-
nen los resultados que se recogen en la Tabla 6.2.
Tabla 6.2. Resultados de un ECC para valorar

mejoría de la artrosis asociada al uso de aspirina.
Tratamiento
Total
Aspirina Placebo
Mejoran a=8 c=5 a+c=13
No mejoran b=12 d=15 b+d=27
Total n1=20 n2=20 n=40
La tasa de mejoría es del 40% para el caso de la aspirina y del 25%

para el placebo. Si se mide la asociación a través del OR, tendríamos:
Al aplicar la vía convencional para valorar si este valor es significati-

vamente mayor que 1, se recurre al cómputo del estadígrafo .
Esto es:
que en este caso arroja el valor al cual se asocia un muy

descorazonador p = 0,31. Lo indicado en cualquier texto de bioestadísti-
ca es simplemente declarar que «no hay significación» y reconocer que no

se pudo demostrar el efecto de la aspirina. Supuestamente, hay que con-
cluir que no se puede concluir nada y punto.
Pero imaginemos ahora que el investigador no se resigna a some-
terse a tal mecanicismo. Apelando al espíritu fisheriano, procura matizar
este resultado y hace un escrutinio de los estudios previos. Encuentra
que se habían realizado antes tres estudios prácticamente idénticos.
Supongamos, además, que al examinar los resultados de los tres es-
tudios anteriores, nos encontramos con lo que se recoge en la Tabla 6.3.
Tabla 6.3. Resultados de tres ECC para valorar

el efecto de la aspirina sobre la artrosis.
Tratamiento
Estudio Nº1 Total
Aspirina Placebo
Mejoran 9 5 14
No mejoran 11 15 26
Total 20 20 40
OR=2,45; p=0,18
Tratamiento
Estudio Nº2 Total
Aspirina Placebo
Mejoran 6 2 8
No mejoran 14 18 32
Total 20 20 40
OR=3,86; p=0,11
Tratamiento
Estudio Nº3 Total
Aspirina Placebo
Mejoran 7 3 10
No mejoran 13 17 30
Total 20 20 40
OR=3,05; p=0,14
Para su desazón, en todos los casos se obtuvieron «resultados no

significativos» (p=0,18; p=0,11 y p=0,14). Todo indica que, por mu-
chos esfuerzos realizados, no se ha podido encontrar suficiente respaldo
para sus expectativas. En definitiva, el examen retrospectivo no vino
más que a ratificar reiteradamente el resultado del experimento actual,
de modo que, en principio, teóricamente habría que abandonar la hipó-
tesis. Pero supongamos finalmente que este investigador particular decide
conjugar los resultados de los cuatro ECC; en ese caso, obtendría la
Tabla 6.4:
Tabla 6.4. Resultado de reunir los cuatro ECC.
Los cuatro Tratamiento

Total
Aspirina Placebo
Mejoran 30 50 45
No mejoran 50 65 115
Total 80 80 160
Ahora el análisis da lugar a los valores OR=2,60 y =6,96 a lo

cual se asocia un contundente valor p=0,008.
Esto es, al contextualizar su estudio, las conclusiones se invierten
aparatosamente.
Desde luego, lo que se acaba de aplicar es la «filosofía» del metanáli-
sis. Esta técnica puede tener sus propias limitaciones y sus propios méritos
(no es el momento ahora de enjuiciarla); pero lo que está claro es que
hacer un metaanálisis no es lo mismo que reducirse a emplear una PSE
cuyo marco conceptual y cuya forma de aplicación abrumadoramente
generalizada nada tienen que ver con el análisis de datos combinados,
sino que procede a concluir a partir de cada estudio particular.
Tan arraigada está la idea de que han de sacarse conclusiones
y reglas operativas a partir de cada estudio aislado que un crite-
rio sumamente extendido es que desarrollar estudios con «potencia
reducida» (es decir, con tamaños de muestra pequeños) entraña de

por sí una falta a la ética. Tal es el punto de vista sostenido en una
de las «biblias» de los ensayos clínicos (Pocock, 1983), o en textos
posteriores (Meinert, 1986, Halpern, Karlawish y Berlin, 2002), o
por especialistas emblemáticos (Sackett y Cook, 1993). El razona-
miento estriba en que cuando el tamaño muestral no es grande, es
muy probable que no se pueda rechazar Ho y los pacientes habrían
sido objeto de experimentación estéril (que probablemente fue per-
niciosa para una parte de ellos). Es obvio que si no rigiera la
concepción de que cada estudio aislado debe dejar una conclusión
basada en el valor p, tal precepto ético no tendría sentido alguno.
Volviendo al metaanálisis, cabe recordar que se trata de una
técnica surgida como alternativa para superar las limitaciones de
las PSE aisladas. Sin embargo, el análisis de los datos conjugados
no exonera a las PSE de sus notables endebleces; simplemente
mitiga una de sus más perniciosas limitaciones, pero deja intacta
todas las restantes.
Pseudo objetividad
Uno de los argumentos esgrimidos por algunos «defensores» de las

PSE es que nos proveen de un criterio demarcatorio enteramente ob-
jetivo. Este punto de vista es insostenible. En efecto, la presencia de
la subjetividad en el contexto de las PSE es evidente, de modo que
están lejos de garantizar automáticamente el desideratum de objetivi-
dad. Es bien sabido que la forma de operacionalizar las variables, los
puntos de corte que se eligen para declarar o no a una persona hiper-
tensa, las escalas de medición seleccionadas, o la decisión del umbral
a partir del cual se considera que un riesgo relativo es apreciablemen-
te grande son sólo algunos ejemplos de la larga lista de decisiones que
irremediablemente han de adoptarse según un punto de vista que va-
ría entre investigadores.
Sin embargo, la más notable manifestación radica en que, en el

acto de fijar un umbral para adoptar una decisión u otra, inexorable-
mente se estará adoptando una decisión subjetiva.
Detengámonos en el famoso 0,05. Lo que parece más verosímil es
que la norma de emplear como referencia este número «mágico» que
tanta influencia ha tenido en que se acepten o no trabajos para su
publicación o en que se consideren o no de interés ciertos resultados,
parece derivarse de una simple casualidad. En el contexto de la distri-
bución normal, al restar de la media y sumar a ella dos veces la
desviación estándar, se obtienen respectivos números tales que el área
bajo la curva y fuera del intervalo determinado por ellos asciende casi
exactamente a 0,05. La casualidad de que ese entero tan singular (el
2, número de manos del ser humano) quedara así vinculado con el 5
(número de dedos de la mano) y todo bajo el manto de «lo normal»
resultó fascinante y cómoda. Si el área mencionada abarcara el 3,2%
del total bajo la curva de densidad normal (en lugar del 5%), quizás
no se hubiera entronizado un «antipático» 0,032 como umbral univer-
sal de comparación.
Pero lo más curioso es que a la subjetividad —que pudiera ser
aceptable— del 0,05 o el 0,01, se suma otra muchísimo menos racio-
nal. Se trata de que, en última instancia la práctica asociada a este
criterio «objetivo» es más bien esquizofrénica.
Es muy frecuente que los autores de texto adviertan acerca de que
no pueden considerarse equivalentes la significación estadística y la
significación cualitativa (en términos de la materia de que se trate:
biológica, social, clínica, etc). Pero es hábito muy generalizado que
quienes conducen estudios reales sólo aludan a ello cuando «convie-
ne». Cuando los efectos sin relevancia no alcanzan significación y por
ende, no molestan, se da por sentado que la significación estadística
no manifiesta nada sustantivo. Como señalan Howard, Maxwell y Fle-
ming (2000): «Cuando los investigadores diseñan estudios con baja
potencia, la inclinación natural (y desafortunada) ante la no significa-
ción es la de considerar el resultado también como científicamente
insignificante». Pero los resultados relevantes son, desde luego, bien-

venidos cuando vienen respaldados por la significación. Y las
diferencias sin importancia que, sin embargo, resultan ser significati-
vas, se tornan irritantes. Finalmente, las diferencias importantes que
no llegan a ser significativas son deprimentes. La situación fue esque-
matizada por Nester (1996) como se ve en la Tabla 6.5.
Tabla 6.5. Reacción del investigador hacia los resultados de la PSE.
Significación No significación
Gran relevancia práctica Euforia Depresión
Sin relevancia práctica Irritación Satisfacción
Como en las malas películas de vaqueros, los obstáculos se resuel-

ven buscando un falso culpable; en este caso, los tamaños muestrales.
Para conjurar la irritación se dice que la muestra fue demasiado gran-
de; para superar la depresión se dice que la muestra fue demasiado
pequeña, tal y como se resume en la Tabla 6.6.
Tabla 6.6. Valoración del tamaño muestral en dependencia de lo que ocurra.
Significación No significación
Gran relevancia práctica OK Demasiado pequeña
Sin relevancia práctica Demasiado grande OK
Si no hay problemas, entonces el tamaño muestral no es siquiera

mencionado. Pero no ha de pensarse que se trata de un acto de cinis-
mo. Es una reacción nacida de la desesperación que produce toda
camisa de fuerza. Tampoco es una regla subrepticia. Repárese deteni-
damente en la siguiente indicación metodológica de un artículo
concebido especialmente para enseñar a los autores cómo deben con-
ducirse para escribir artículos adecuados (Hopkins, 1999):
"Si el efecto observado no es sustancial —algo que ocurre sólo rara-

mente para un efecto estadísticamente significativo, porque ello significa
que la muestra fue demasiado grande— Ud. puede de hecho concluir
que el verdadero valor del efecto es probable que sea trivial, ¡incluso
en el caso en haya alcanzado significación!"
ALGUNAS CONSIDERACIONES PUNTUALES
Además de las objeciones generales que se han enumerado e ilus-

trado en secciones precedentes, existen otras, correspondientes a
situaciones específicas donde las PSE presentan aristas peculiares. A
continuación se examinan cuatro enclaves aplicativos particulares, que
son a la vez elocuentes y polémicos.
Maldad de ajuste
La endeblez de la doctrina oficial de las PSE es tan acusada y a la

vez tan irracional la pauta que impone, que resulta natural que cons-
tantemente ésta se pase por alto, o se olvide, o directamente se viole.
No en balde, uno de los fenómenos más notables en el uso cotidiano
de las PSE es la reiterada y extendida falta de consecuencia de quie-
nes las emplean.
El caso más singular o más evidente es en mi opinión el de las
llamadas pruebas de bondad de ajuste (PBA). El objetivo con que se rea-
liza la PSE es en ese caso validar un modelo, corroborar que éste rige
para ciertos datos. Más concretamente, las PBA se proponen por lo
general para enjuiciar una hipótesis que afirma que cierta distribución
es válida en determinado contexto.
Es bien sabido que todos los modelos son incorrectos, aunque
muchos de ellos resultan, no obstante, útiles. En efecto, en tanto re-
presentaciones que deliberadamente idealizan la realidad, los mode-

los son, por definición, imperfectos. Consecuentemente, es risible que
se considere útil un modelo por el solo hecho de que no se ha podido
demostrar que es imperfecto.
Si la hipótesis nula afirma, como ocurre con las PBA, que los datos
siguen cierta distribución, entonces sensu strictu dicha hipótesis siempre
es falsa; y por lo tanto, la hipótesis se rechazará inexorablemente si la
muestra es suficientemente grande.
Esta realidad ya se había examinado detalladamente en el aparta-
do La nulidad siempre puede ser rechazada, p. 375, pero allí se había
dicho que virtualmente siempre se sabe de antemano que Ho es falsa.
En la aplicación que nos ocupa, podemos suprimir este adverbio:
ahora se sabe que la hipótesis nula siempre es falsa. Consecuentemen-
te, en este caso sin ninguna duda, se rechazaría Ho con un tamaño
suficientemente grande.
Ahora bien, lo verdaderamente digno de ser destacado radica en
que, al aplicar una PBA, el rechazo de la hipótesis nula no es el desen-
lace deseado. De tal suerte, la mejor manera de conseguir lo que se
desea es adoptar la absurda medida cautelar de no tomar una muestra
demasiado grande.
Las PBA son integralmente ridículas. Son improcedentes no sólo
por el consabido problema de que si el tamaño muestral es grande el
dictamen que arrojan se sabe de antemano (rechazo), sino también y
sobre todo debido a que, violentando olímpicamente la machacona
advertencia de que jamás ha de aceptarse Ho, las PBA se llevan ade-
lante, casi sin excepción, exacta y exclusivamente con la esperanza de
«no rechazar» y, tan pronto esto se consigue, se procede a dar por
sentado que Ho es válida. Siendo así, el afán de no rechazar para dar
por válida la hipótesis (y por ende la distribución que ésta postula) se
satisface mediante el comodísimo recurso de tomar ¡una muestra sufi-
cientemente pequeña!
Grupos no balanceados
Otra aplicación ceremonial y absurda de las PSE se verifica con

mucha frecuencia en el contexto de los ECC. Supongamos que se
forman dos grupos de igual tamaño mediante asignación aleatoria de
un conjunto de pacientes a respectivos tratamientos. Se supone que la
ley de los grandes números se ocupará de «equilibrar» ambos grupos a
cualquier efecto. Por ejemplo, la edad media de los pacientes, el por-
centaje de zurdos o el número de hipertensos debe ser el mismo salvo
fluctuaciones aleatorias.
Sin embargo, si el tamaño muestral no es muy grande, tal equilibrio
pudiera no verificarse. Una manera de «corroborar» que no se ha pro-
ducido tal desbalance consiste en seleccionar algunas variables que se
consideren relevantes y comparar medias o porcentajes en ambos gru-
pos mediante respectivas PSE. La regla regularmente empleada es
aceptar que los grupos están adecuadamente equilibrados si no se
encuentra ninguna diferencia significativa. Este socorrido recurso es
especialmente absurdo por varias razones.
Por una parte, la situación es análoga a la de las pruebas de bondad
de ajuste (examinada en el apartado Definición de p, p. 357): como lo
que se quiere es no rechazar, ello se lograría fácilmente siempre que
los grupos sean pequeños; por otra, lo verdaderamente atinado sería
incorporar la información sobre el posible desbalance (sea de la mag-
nitud que sea) en el análisis, de modo que se neutralice por esa vía su
ocasional efecto confusor. Para conseguirlo se puede emplear la re-
gresión logística, tal y como se explica e ilustra en Silva (1995).
Pero la objeción más notable es de índole lógica: la PSE se realiza
para dirimir si la diferencia hallada es atribuible a mero azar o si es tan
acusada que tal explicación puede descartarse. Pero la realización de
la prueba es entonces directamente absurda, pues ¡ya se sabe que los
grupos se conformaron al azar! Es algo así como preparar una limona-
da y luego hacer un examen químico del líquido para valorar si contiene
o no ácido cítrico. Si se hallara significación, entonces necesariamen-
te se habría cometido el error de primer tipo, del mismo modo que un

resultado negativo del análisis sobre la limonada sólo indicaría que el
laboratorio se ha equivocado.
Problema de las comparaciones múltiples
Como sabemos, es frecuente que los investigadores informen muchos

valores p en el marco de un solo estudio. Consideremos el caso de un
investigador que valora el desempeño relativo de dos tratamientos en un
único ensayo clínico, pero empleando sucesivamente diversos criterios
(mejoría una vez transcurrido cierto lapso, mortalidad, aparición de efec-
tos adversos, etc.). Si se usa una prueba de significación estándar para
cada comparación, entonces la probabilidad de encontrar al menos una
diferencia significativa se incrementa rápidamente con el número de cri-
terios según los cuales los tratamientos son comparados, aun cuando las
hipótesis nulas en juego sean en todos los casos verdaderas. Este incre-
mento se conoce como problema de las comparaciones múltiples.
Cuando se ejecutan k pruebas de hipótesis usando el nivel λ, la
probabilidad de obtener erróneamente algún rechazo sería igual a 1-
(1-λ)k; basándose en ello, se ha propuesto el llamado ajuste de Bonferroni,
que consiste en disminuir el nivel que ha de emplearse para cada
prueba. Para que la tasa de error para el estudio completo permanez-
ca al nivel α (por ejemplo, α=0,05). El nivel de significación que
habría de fijarse sería igual a λ=1-(1-α)1/k, resultado de un simple
despeje de la ecuación α=1+(1-λ)k.
Por ejemplo, si se realizan, digamos, 25 pruebas de significación in-
dependientes (por ejemplo, los grupos estudiados son comparados con
respecto a 25 variables de respuesta no relacionadas) y la hipótesis nula
es la misma para las 25 comparaciones, la probabilidad de encontrar
que al menos una de las 25 diferencias sea significativa al nivel α=0,05
sólo por azar se eleva a 0,72, resultado de computar 1-(1-0,05)25. Por
tanto, algunos estadísticos y editores de revistas exigirían un criterio de
«significación estadística» más estricto que el convencional p<0,05, en

este caso habría que trabajar con un nivel de λ=0,002.
Esta es la explicación de que la «teoría oficial» plantee que cuando
se ejecutan varias pruebas simultáneamente, el cálculo y la interpre-
tación de los valores p tiene que ser reconsiderado. Por ejemplo, Beach
(2001) indica a los clínicos en la prestigiosa Anesthesiology que, si no
han hecho los debidos ajustes, reexaminen sus conclusiones con acuer-
do a la corrección de Bonferroni.
Pero lo cierto es que los expertos más especializados sostienen que
cada comparación es cualitativamente diferente y que debe ser consi-
derada por sus propios méritos; opinan que, en realidad, el ajuste de la
significación estadística de acuerdo al número de pruebas realizadas a
partir de un estudio, por ejemplo a través del mencionado método de
Bonferroni, crea más problemas de los que supuestamente resuelve
(Rothman, 1990; Perneger, 1998; Savitz y Olshan 1995; Greenland, 2008).
El problema es real, pero la solución no. La necesidad imperiosa
de que cada hipótesis sea valorada previa y separadamente, funda-
mentando su plausibilidad biológica y las razones para considerar
que se trata, en efecto, de una hipótesis científica, está fuera de toda
duda. Astin et al. (2006) realizaron un divertido ejercicio que ilustra
los peligros propios del examen masivo de hipótesis no preespecifi-
cadas: tomaron los 10 millones y medio de adultos que residen en
Ontario, Canadá y observaron las tasas de incidencia de diversas
dolencias de acuerdo al signo zodiacal de estas personas y hallaron
un par de asociaciones estadísticamente significativas para cada sig-
no del zodíaco. Es decir, encontraron numerosos resultados del tipo
siguiente: «quienes correspondían al signo de Sagitario tenían una
probabilidad significativamente más alta de padecer una fractura de
húmero que todos los restantes». Hacer más difícil el rechazo me-
diante el expediente de reducir el umbral de significación no modifica
la naturaleza irracional inherente a la pesquería de hipótesis.
El hecho de que la interpretación de un resultado dependa del nú-
mero de pruebas realizadas es chocante, pues supedita el juicio que
merezca una hipótesis a una decisión por entero ajena a los datos;
puede provocar de hecho que una comparación específica pueda ser
interpretada de forma diferente en dependencia de la cantidad de hi-
pótesis evaluadas.
Por ejemplo, con esa estrategia, la diferencia entre las tasas de re-
cuperación de una infección cuando se comparan dos tratamientos
antibacterianos podría ser interpretada como estadísticamente signi-
ficativa en dependencia de que también hayan sido o no valoradas
otras hipótesis asociadas a variables de respuesta tales como fallecer,
que disminuya la fiebre, estar inapetente, etc.
Valoración de coeficientes de correlación o

concordancia
Otra situación donde se observa claramente el uso inercial y des-

provisto de sentido que puede llegar a hacerse de las PSE lo ofrecen
algunos estudios donde son usadas para valorar si un coeficiente de
correlación o de concordancia es o no diferente de cero.
En efecto, con frecuencia se hacen pruebas para valorar la hipóte-
sis que establece que un coeficiente de correlación (ρ) es igual a cero.
Calculado el coeficiente de correlación muestral, llamémosle r, se plan-
tea la hipótesis Ho : ρ = 0 y se decide sobre su validez usando el valor
p que arroja la prueba de hipótesis.
En primer lugar, se produce el consabido problema de que el coefi-
ciente de correlación lineal puede ser muy pequeño y, no obstante,
resultar significativamente diferente de cero; basta con que haya cier-
ta relación (aunque sea mínima) y que el tamaño muestral sea
suficientemente grande. Por ejemplo, un valor r=0,25, siempre que se
haya obtenido con no menos de 85 pares, ya se declarará significati-
vamente distinto de cero al nivel 0,05. Paralelamente, un valor de r
relativamente alto —digamos, por ejemplo, r=0,7— casi con seguri-
dad será «significativo»; es decir, muy probablemente revelará que la
correlación lineal existe más allá del azar (basta que el susodicho r=0,7,
se haya obtenido con una muestra de tamaño mayor que 8).
Ahora bien, el problema en este caso es sobre todo conceptual. Por
ejemplo, en un estudio que se propone valorar la influencia de la hemo-
globina glicosilada sobre el control de la diabetes, Zabalegui et al. (1997)
escriben textualmente: «En los diabéticos tipo II hallamos una correla-
ción significativa entre los valores de HbA1 y colesterol (n = 1.089; r =
0,12; p < 0,05)». Sin embargo, los autores deberían ceñirse a comunicar
que: «El coeficiente de correlación obtenido es significativamente dife-
rente de cero» y no que «la correlación es significativa», lo cual es
radicalmente diferente. En este caso, el abuso de lenguaje es especial-
mente grave en virtud de la facilidad para conseguir que la hipótesis de
nulidad sea rechazada. Para que ello no ocurra, el valor r de tiene que
ser ínfimo, o el tamaño de muestra muy pequeño. En el ejemplo, ocurre
que el paupérrimo 0,12 encontrado resulta estadísticamente significati-
vo gracias al enorme tamaño muestral (n=1.089).
Pero aún no hemos llegado a lo más contraproducente. El proble-
ma es que casi siempre en este caso «la significación» es irrelevante.
Descubrir que la asociación (o la concordancia) no es nula, resulta
por lo general de todo punto inútil y casi siempre ridícula.
Imaginemos, por ejemplo, que la verdadera correlación entre las
mediciones correspondientes a un equipo convencional para medir la
tensión arterial y las de un nuevo modelo de manómetro fuera igual a
0,15. Supongamos que un investigador realiza 200 pares de medicio-
nes y obtiene un coeficiente de correlación empírico acorde con esa
realidad (o sea, de magnitud tan reducida como r=0,15). Para que esa
pésima correlación sea significativamente diferente de 0 basta que se
haya empleado un tamaño muestral superior a 180. De modo que si
el autor afirma que ha corroborado la existencia de una correlación sig-
nificativa entre los valores de ambos dispositivos, lo que ha
comprobado, en todo caso, es que existen razones para creer que tal
correlación no es nula. Sin embargo el mencionado giro está confi-
riendo una connotación cualitativa absolutamente infundamentada a
la correlación. Obsérvese en la Figura 6.4 el aspecto gráfico que ofre-

cería tal situación. El ajuste es pésimo y los puntos se ubican
caóticamente y muy lejos de la primera diagonal (dos hechos diferen-
tes, ambos catastróficos), pero la correlación lineal, como no, es
estadísticamente significativa.
Figura 6.4. Diagrama de dispersión de niveles tensionales

medidos por dos equipos.
En este ejemplo, lo que en realidad interesa destacar es que sería el

colmo que la asociación no llegara siquiera a ser 0,15; en rigor, la asocia-
ción hallada es significativamente... escuálida, aunque estadísticamente
haya motivos para creer que la situación no llega a ser tan desastrosa
como para afirmar que no hay indicios de asociación alguna entre los
resultados de uno y otro instrumento. Adviértase que la ausencia de aso-
ciación equivaldría a declarar que el nuevo esfigmomanómetro arroja
resultados que nada tienen que ver con los del convencional (sería como
decir que el equipo novedoso es tan útil a los efectos de medir la tensión
arterial como un termómetro o un test de inteligencia). De modo que la
naturaleza significativa de la correlación hallada no aporta absolutamen-

te nada a nuestra valoración del nuevo artilugio. Hasta un trabajo que
explícitamente defiende las PSE (Abelson, 1997) registra ruborizadamente
la situación cuando subraya que comunicar que un coeficiente de correla-
ción sea diferente de cero «sólo puede generar estupor debido a la vacuidad
de la información que transmite».
SUMISIÓN Y REBELIÓN ANTE LA DICTADURA DEL 0,05
La sumisión es sin duda notable. No resulta para nada estimulante

el grado en que la significación estadística se ha adueñado de la prác-
tica inferencial contemporánea. Si el lector busca en Google la
expresión statistically significant obtiene un impactante número de en-
tradas donde figura tal combinación: nada menos que 10,6 millones
en junio de 2008; de ellas, hay 1,8 millones antecedidas por el voca-
blo not; es decir el 17% corresponden a not statistically significant. Este
impresionante resultado habla por sí solo acerca del grado en que se
ha extendido esta manera de entender el cometido de la ciencia. Ade-
más, esta presencia masiva es retroalimentadora. Los autores tropiezan
a diario con un patrón de conducta inferencial tan universal que la
tendencia inercial a reproducirlo tiende a ser irrefrenable.
Por si fuera poco, nuevos y nuevos libros de texto que abordan el
tema de la inferencia se conducen como si no existieran polémicas ni
problemas, y propagan infatigablemente la misma doctrina. Gliner,
Leech, y Morgan (2002) realizaron un riguroso estudio sobre el tema;
seleccionaron 12 libros regularmente empleados para la enseñanza de
la estadística o de la metodología de la investigación en el ambiente
académico norteamericano, todos con al menos una segunda edición
producida entre 1993 y 2000. Simplemente, ninguno de ellos alude a
la polémica vigente en esta materia.
El rechazo a la tiranía del 0,05 es ciertamente generalizado. No en
la práctica, donde la dictadura se sigue ejerciendo en gran medida,
pero sí en el marco de las reflexiones teóricas. Por ejemplo, Prieto y

Herranz (2005) reniegan de ese umbral, aunque no critican el hecho
de que se pueda «rechazar» la hipótesis nula. Sin embargo, el verdade-
ro problema no radica en el umbral que se elija, sino en el hecho de
adoptar una «decisión» sobre la hipótesis.
Para escapar a la regla del 0,05 se han hecho propuestas diversas.
Sobre la base legítimamente reiterada de que es absurdo sacar una
conclusión distinta si p=0,049 que si es p=0,053, se ha manejado que
sólo se declare que Ho es falsa cuando sea «muy difícil llegar al valor
obtenido o uno mayor» supuesto que vale la nulidad.
Según este enfoque, un valor tal como p=0,000003 sí sería sufi-
cientemente pequeño como para identificar un alto grado de
incompatibilidad de los datos con la nulidad. Pero un valor p=0,03 o
p=0,07, no sería en cambio suficientemente pequeño como para ello.
Sin embargo, el verdadero escollo es anterior a la definición de un
nivel demarcatorio u otro para el rechazo; el problema crucial es si
procede o no dicotomizar el análisis. Al colocarse en la situación de
rechazar o no, ya se está dicotomizando. Quienes así razonan no pue-
den decir que rechazan cualquier umbral, pues si no lo hubiera,
¿entonces cómo se sabe que la primera de las p mencionadas es sufi-
cientemente pequeña? El criterio demarcatorio que permite afirmar
que ciertos datos son incompatibles y otros no incompatibles con la
hipótesis nula se queda en un limbo. Si se hace una defensa del carác-
ter objetivo de las PSE, pero a la vez se torna subjetiva la valoración
de lo objetivo, entonces lo objetivo se pierde y estamos en las mismas.
Ahí radica parte de la fuerza del enfoque bayesiano: reconoce la sub-
jetividad y no se ruboriza por ello, ni usa subterfugios para ocultar su
inevitabilidad. Todo lo contrario, la asume y la aprovecha.
En cualquier caso, la dificultad conceptual estriba en la dicoto-
mía y en el mecanicismo. Si una afir mación dada resultara
descabellada o careciera de todo aval teórico racional y se opusiera
a leyes bien establecidas, siempre despertaría suspicacias sin impor-
tar cuán pequeño pudiera ser un valor p que la respalde.
Por ejemplo, algunas respetadas instituciones académicas han in-

vestigado la transmisión extrasensorial de información de una persona
a otra (telepatía). Uno de los resultados más espectaculares concierne
a la técnica del llamado autoganzfeld (Radin 1997), según la cual el
receptor debe identificar cuál de cuatro imágenes ha sido «enviada»
mentalmente por un emisor. La hipótesis nula afirma que no existe
transmisión telepática alguna, en cuyo caso la tasa de aciertos sería
0,25. Según ha testimoniado Radin en el trabajo citado, en miles de
sesiones, la tasa ascendió a 0,332. El valor p asociado es nada menos
que 10-15. Según los estándares de «la inferencia estadística oficial» el
grado de incompatibilidad entre estos resultados y la hipótesis de nu-
lidad es aplastante. Consecuentemente, hasta el más escéptico tendría
que rendirse a la evidencia.
Sin embargo, lo que realmente ocurre es que la abrumadora mayoría
de los científicos rechaza esta «evidencia», arguyendo la ausencia de
racionalidad, la falta de una teoría subyacente que explique el milagro,
así como otras experiencias donde han aflorado supercherías o errores
de los parapsicólogos. En el fondo, ello revela que los usuarios aceptan
las reglas de las PSE sólo cuando el resultado que arrojan no entre en
colisión con la racionalidad o con lo que ya se conoce con certeza.
El autor del trabajo, Dean Radin, es un ingeniero eléctrico, quien
ha actuado durante años como presidente de la Asociación Parasico-
lógica en Estados Unidos. A lo largo de varios lustros ha trabajado en
(y vivido de) áreas como la telekinesis, telepatía y temas afines. Y ha
publicado no pocos trabajos en los que supuestamente se demuestran
cosas como que la mente puede influir en los resultados que se obtie-
nen al lanzar unos dados (véase Radin y Ferrari, 1991).
En un artículo directamente motivado por uno de sus fantasmales
experimentos, Pigliucci (2002) señala que si aplicamos a los datos los
métodos estadísticos convencionales de prueba de hipótesis que cien-
tíficos y escépticos aprenden en sus cursos de Estadística, debemos
aceptar la conclusión de Radin; pero que si aplicamos, en cambio, un
análisis estadístico mucho más sensato (el enfoque bayesiano), con-
cluiríamos que la hipótesis de que los resultados fueron debidos al

azar es muchas más veces más probable que el supuesto de que real-
mente hemos sido testigos de un fenómeno de telekinesis, ya que los
valores p se hacen más y más pequeños en la medida que crece el
tamaño muestral, y la más nimia asimetría (sesgo) experimental con-
ducirá a la significación. Un análisis bayesiano que respalda esta
afirmación de Pigliucci puede verse en Bayarri y Berger (2002).
Es esta realidad la que conduce a apreciaciones tales como las de
Tryon (1998)
"Al margen de los méritos o deméritos técnicos de las PSE, el hecho

de que los expertos estadísticos e investigadores que publican en las
más encumbradas revistas no puedan interpretar de manera consis-
tente los resultados de sus análisis es extremadamente perturbador.
Setenta y dos años de educación han resultado en un minúsculo o
nulo progreso a los efectos de corregir la situación. Es difícil estimar
el daño que el extendido uso incorrecto e inescrutable de los méto-
dos analíticos ha tenido en una disciplina; sin embargo, los efectos
deletéreos son indudablemente sustanciales y pueden constituir la más
fuerte razón para adoptar otros métodos de análisis."
Un ejemplo concreto ante el cual los propios usuarios de las PSE

tienen que elegir entre hacer el ridículo o renegar de las reglas que
teóricamente aceptan y aplican en sus estudios lo ofrece el trabajo de
Harris et al. (1999) sobre los ruegos mediante intercesores que se ex-
puso detalladamente en el Capítulo 4.
SITUACIÓN ACTUAL DE LAS PSE

Como se ha visto, a lo largo de varias décadas se han ido acumu-
lando no pocos y persuasivos reparos de todo tipo al uso de las PSE.
Y parece indiscutible que estas objeciones son, práctica y epistémica-
mente, de enorme entidad, por tanto: ¿cuál es, a la luz de esta reali-
dad, la situación actual en que se hallan las PSE?
¿Empate técnico?
Algunos consideran que la pugna en torno a las PSE se encuentra

en un estado de cierto «empate técnico» ya que, si bien desde el punto
de vista conceptual y teórico los opositores de esta práctica llevan
notoria ventaja, habida cuenta de que la mayoría de sus impugnacio-
nes no ha podido ser refutada desde el punto de vista práctico, en
cambio, la modificación en las conductas ha sido menguada (Haller y
Krauzer, 2002).
Personalmente, no lo veo así. Creo que cada una de estas posturas
lleva clara ventaja sobre la otra, pero en respectivos ejes valorativos bien
diferenciados: el de las aplicaciones y el de la reflexión.
No puede pasarse por alto en este análisis que el éxito de los obje-
tores es hijo, básicamente, de la racionalidad, mientras que el de los
«aplicadores» dimana sobre todo del desconocimiento y, en no escasa
medida, de la pereza o el oportunismo.
Por otra parte, se ha hecho notar (Hopkins, 1999; Matthews, 2000)
que, miradas las cosas en su tendencia, emerge un signo claro: cada
vez son más los investigadores (y, por ende, los trabajos) que reaccio-
nan contra la inercia y van abandonando el adocenamiento propio de
las PSE. No hay dudas de que al final de este largo proceso las cosas
han empezado a moverse de manera consistente, acaso bajo la in-
fluencia de las nuevas políticas que han ido implantándose.
Nuevas políticas editoriales
Hace ya varios años que diversas revistas punteras de la producción

científica internacional empezaron a rechazar trabajos en los cuales sólo
aparecían pruebas de este tipo. Por ejemplo, British Heart Journal anun-
ció en un editorial de 1988 que se unía a la exhortación de British Medical
Journal, revista que, ya desde 1986, si bien permitía que se prescindiera
de las PSE, pedía a los autores que incluyeran intervalos de confianza
(IC), fuesen acompañados o no de pruebas de significación.
Tal postura pasó a ser compartida por revistas tan importantes como
American Journal of Public Health, The Lancet y Annals of Internal Medici-
ne y, en ese propio año 1988, fue adoptada por el llamado Grupo de
Vancouver, creado en 1979 para velar por la calidad y uniformidad de
los artículos científicos en cuyo apartado de requisitos técnicos dedi-
cado al empleo de la estadística se consignaba textualmente:
"Siempre que sea posible, cuantifique los resultados y preséntelos con

indicadores apropiados de error o la incertidumbre de la medición
(por ej., intervalos de confianza). No dependa exclusivamente de las
pruebas estadísticas de comprobación de hipótesis, tales como el uso
de los valores p, que no transmiten información importante."
Esta recomendación ha sido ratificada con apenas alguna varia-

ción marginal en todas las versiones posteriores a lo largo de las dos
décadas transcurridas.
En los últimos años (véase Thompson, 2003) 23 revistas, sólo del
ámbito de la educación, han implantado políticas para asegurar que
los trabajos publicados no dependan exclusivamente de los valores p.
Otro tanto ha ocurrido con la poderosa Asociación Americana de Psi-
cología tras la creación de una comisión ad hoc (Task Force on Statistical
Inference) para encarar el problema (véase Wilkinson, 1999). No pocas
revistas han editorializado sobre el tema en la línea de fundamentar la
necesidad de un cambio de paradigma (véanse por ejemplo Smith,
2003; Clark, 2004; Marshall, 2004).
Lo que se observa, en definitiva, es una tendencia marcada hacia
un sustantivo cambio de paradigma en nuestra manera de realizar
análisis estadísticos. El coeficiente de rozamiento es alto, (Fidler et
al., 2004) pero la deriva mencionada se manifiesta de diversas ma-

neras.
Al examinar la última versión del texto de Hopkins (2000) obser-
vamos el siguiente anuncio:
"Cuándo inicialmente publiqué este libro, aún pensaba que los valores
p tenían alguna utilidad para informar sobre muchos efectos. Por ejem-
plo, con 20 correlaciones en una tabla, aquellas marcadas con asteriscos
se destacaban de las demás. Actualmente, ya no estoy tan seguro acerca
de la utilidad de esos asteriscos. Los resultados no-significativos quizás
sean igualmente interesantes. Por ejemplo, si el tamaño de la muestra
es suficientemente grande, un resultado no-significativo significa que
el efecto puede ser trivial, algo tan importante como que el efecto
sea substancial… Así que endurezco mi actitud: no más valores p."
Un rápido escrutinio a diversas fuentes (véanse Guthery, Lusk y

Peterson 2001; Almenara et al., 2003; Rushton, Ormerod y Kerby 2004)
muestra que el debate que se extendió durante buena parte del siglo XX,
ha cambiado claramente su centro de gravedad. Ya no se trata de si los
valores p son o no útiles, sino de si son o no perniciosos, y si deben por
tanto ser o no taxativamente erradicados. Keneth Rothman, editor fun-
dador de la revista Epidemiology fue tan lejos, por ejemplo, como para
virtualmente prohibir el uso de valores p.
Aunque resulta algo pintoresco, cierro el tema con el siguiente seg-
mento de Nix y Barnette (1998), que ya anunciaba con claridad esta
realidad de finales de siglo:
"Nosotros somos respetuosos de los principios democráticos y no

podemos por ende respaldar una prohibición al empleo de las PSE,
ya que ello representaría una censura y una trasgresión a las liberta-
des individuales. Sin embargo, creemos que la mayoría de los
estadísticos daría la bienvenida a un cambio ordenado que se orien-
te al abandono de las PSE. Tal proceso no debería en modo alguno
prohibir al investigador obcecado el empleo de las PSE, sino que

todo el énfasis estaría volcado a conseguir la adherencia a métodos
legítimos de investigación."
¿Por qué sobrevive el ritual de los valores p?
El tratamiento científico que ha recibido la pregunta que titula esta

Sección no es aún completo. Los trabajos de Matthews (1995), Nester
(1996) y Goodman (1999) recogen algunos esfuerzos interesantes en la
dirección de sopesar influencias de diferentes fuerzas científicas y so-
ciológicas que expliquen la supervivencia de un procedimiento tan
estridentemente cuestionado, que ha llegado incluso a considerarse in-
cluso como una expresión de pseudociencia (Johnson, 1998).
La razón fundamental por la cual las PSE como estrategia fueran
ampliamente promovidas y llegaran a ser casi universalmente acepta-
das en el mundo investigativo es simple y evidente: tanto para los
investigadores, como para los editores de revistas, agencias oficiales y
responsables administrativos, resulta muy atractivo contar con méto-
dos cuantitativos capaces de generar conclusiones independientemente
de las personas que realizan el estudio. Tal afán era y es enteramente
legítimo.
El problema es —como se ha visto— que las PSE simplemente no
cubren esa expectativa y que sus numerosas limitaciones parecen es-
tar fuera de discusión. Sin embargo, como es obvio, sobreviven. Y
puede decirse que la mayor parte de los trabajos que se publican sus-
tentan sus resultados en este método tan intensamente criticado.
En síntesis, a pesar de la larga y fundamentada secuencia de cuestio-
namientos, del espaldarazo que éstos reciben de influyentes
organizaciones, y de la abultada y prestigiosa nómina de sus objetores,
las PSE se mantienen como el método estadístico casi universalmente
empleado para hacer inferencias en los más diversos circuitos de la ciencia
biomédica.
Finch et al. (2004) llamaban la atención acerca de que aunque

Geoffrey Loftus, quien fuera editor de la revista Memory and Cognition
entre 1994 y 1997, había abogado enfáticamente contra el empleo de
las PSE, el impacto de tales invocaciones fue reducido. Estos autores
examinaron 696 artículos publicados en la citada revista antes, duran-
te y después del periodo de Loftus, y no encontraron más que un
reinado sostenido de las PSE. El análisis de otros 309 trabajos adicio-
nales, procedentes de otras revistas, reveló que sólo durante el periodo
de Loftus se observó cierta modificación.
¿Cómo explicar el divorcio entre el consenso teórico prevalecien-
te, consagrado incluso en las recomendaciones de Vancouver, y la
práctica cotidiana?
Entre las más verosímiles explicaciones, se hallan las siguientes
(Sarria y Silva, 2004):
• Es cómodo dejarse llevar por la inercia y la costumbre de usar

un procedimiento que proporciona una "solución" inmediata.
• Se esgrime el argumento de la supuesta ausencia de alternati-
vas, en parte justificado, pues muchas críticas no vienen
acompañadas de propuestas simples y comprensibles.
• Existe el mito de que se trata de métodos "objetivos", capaces
por tanto de generar conclusiones "científicas" por sí mismos.
• Resulta fácil aplicar amigables programas estadísticos, cuya ofer-
ta es amplia.
• Todo el mundo lo usa.
• Tanto a estudiantes como a investigadores se les instruye para
que lo empleen.
• Aportan una aureola de cientificismo y rigor.
Parte de estas realidades son enteramente coherentes con la adver-

tencia que hiciera Feinstein (1985):
"Puesto que la historia de la investigación médica también muestra

una larga tradición de mantenerse por mucho tiempo fiel a doctrinas

establecidas después de que esas doctrinas han sido desacreditadas, o
de haberse demostrado su escaso valor, no podemos esperar un súbi-
to cambio en esta política por el mero hecho de que ha sido denunciada
por connotados conocedores de la estadística."
Por otra parte, como suele ocurrir en tantos otros terrenos, no se

pueden desdeñar los intereses que puedan resultar tocados por un
cambio de paradigma. Desde los muy modestos de un profesor que
vive apaciblemente repitiendo cada año las mismas ideas hasta los de
una transnacional comercializadora de software. Consideremos a modo
de ejercicio intelectual que se prohibieran súbitamente las PSE. En-
tonces el profesor se vería obligado a cambiar su discurso, su
presentación en Power Point, sus chistes, sus ejemplos… en tanto
que una trasnacional del software como el SPSS, iría casi directamen-
te a la quiebra.
Es posible, sin embargo, que el problema tenga connotaciones adi-
cionales; resulta verosímil pensar que algunos editores prefieran "no
buscarse problemas" con los autores y viceversa, acudiendo para ello
a los recursos convencionales. Es relativamente natural que los inves-
tigadores simples lo hagan si se tiene en cuenta que, como han señalado
algunos autores (Greenwald et al. 1996), muchos de los objetores teó-
ricos de las PSE «las han usado en sus propios estudios después de
haberlas criticado».
Un solo ejemplo palmario de este fenómeno es sumamente elo-
cuente: Altman, Goodman y Schroter (2002) publicaron un artículo
en Journal of the American Medical Association donde se daba cuenta de
un estudio bibliométrico sobre la posible influencia de contar con un
especialista en metodología (bioestadístico, epidemiólogo, etc.) den-
tro de un proyecto a efectos de que fuese aceptado para su publicación.
El estudio se concentra en lo acaecido en dos importantes revistas de
alto impacto: British Medical Journal y Annals of Internal Medicine. El nú-
cleo empírico del trabajo es la información contenida en la Tabla 6.7.
Tabla 6.7. Distribución de frecuencias (y porcentual) de los resultados de los trabajos

presentados según el desenlace editorial para distintas condiciones relacionadas con la
participación o no de personal con experiencia metodológica.
Decisión Bio- Epi- Sin

Otro Total
editorial estadístico demiólogo metodólogo
Rechazado sin
152 (56) 92 (57) 49 (62) 134 (71) 427 (61)
arbitraje
Rechazado por 95 (35) 46 (28) 25 (32) 43 (23) 209 (30)
los árbitros
Aceptado 22 (8) 21 (13) 4 (5) 12 (6) 59 (8)
Aún se ignora
4 (1) 3 (2) 1 (1) 1 (0) 9 (1)
el resultado
Total 273 (100) 162 (100) 79 (100) 190 (100) 704 (100)
Los autores resumen la situación expresando que fueron rechaza-

dos sin arbitraje el 71% de los que no contaban con un metodólogo
entre los coautores, contra 57% para los que sí lo tenían (χ2 = 10,06;
p = 0,001) y adicionan que la investigación que cuenta con asisten-
cia metodológica es más probable que sea aceptada que la que carecía
de tal asistencia (7% vs 11%; χ2 = 2,37; p = 0,12). Concluyen que, si
bien la participación de estadísticos en la investigación médica está
ampliamente recomendada, ella se produce de manera inconsisten-
te, los sujetos que tienen la capacidad de hacerlo no están
involucrados hasta la fase de análisis de los datos, y muchos no son
siquiera reconocidos como coautores ni en los agradecimientos.
Asombrosamente, el trabajo se caracteriza por la máxima ortodo-
xia metodológica. En efecto, como se puede apreciar, el artículo se
ciñe al empleo de las PSE a pesar de que ambos autores son connota-
dos detractores de las PSE: Douglas Altman, en su calidad de
emblemático y precoz impulsor de los intervalos de confianza como
alternativa (Gardner y Altman, 1986) y Steven Goodman como seve-
rísimo crítico de las PSE desde a la perspectiva bayesiana. Basta
recordar las numerosas veces que se ha citado en este mismo texto un
magnífico artículo suyo (Goodman, 1999) casi enteramente destina-

do a desacreditarlas. Por más señas, dicho artículo concluía con una
afirmación tan tajante como atinada:
"Si la falacia del valor p estuviera limitada al ámbito de la estadística,

esto sería una mera nota técnica al pie de una página, que no exigiría
de una exposición tan extensa. Pero al igual que un único gen defec-
tuoso puede interrumpir el funcionamiento de un organismo complejo,
la falacia de los valores p permitió la creación de un método que
amplificó el problema y desembocó en un error conceptual que tiene
una influencia profunda sobre el modo de pensar acerca del proceso
de la ciencia y la naturaleza de la verdad científica."
¿Cómo explicarse algo tan inverosímil como que, tres años más
tarde, el autor de esta cita, junto con el líder de la cruzada de décadas
atrás contra los valores p publiquen en una revista de máxima visibi-
lidad mundial un artículo donde las PSE son empleadas en su versión
más convencional? En una comunicación personal, el primer autor
me dio una respuesta desconcertante: que tal elección se debió en
buena medida a que «se hallaban bajo presión de tiempo por parte de
los editores». Curiosa explicación; resulta obvio que el cómputo de
intervalos de confianza y su comunicación en lugar (o además de)
valores p no lleva más que pocos minutos. Parecería verosímil que los
autores se hayan visto fuertemente presionados, hasta el punto de
actuar en esta ocasión en contradicción con su propia prédica, pero
no precisamente en términos de tiempo.
La realidad actual, entonces, parece susceptible de ser caracteriza-
da del modo siguiente. La comunidad de aquellos estadísticos e
investigadores conocedores del debate y que se preocupan por el de-
sarrollo metodológico de la disciplina se divide en tres sectores: un
crecido y creciente número de colegas que se pronuncian contra este
estado de cosas (aunque con diversos grados de beligerancia), un pe-
queñísimo grupo, en franco proceso de extinción, que aún defiende
(más bien tímidamente) el proceder clásico, y una mayoría que mira

hacia otro lado, acaso ganados por la comodidad o la pereza.
LOS INTERVALOS DE CONFIANZA COMO SUCEDÁNEOS
Ante una catarata de objeciones y de posicionamientos académicos

sobre las PSE como la contenida en este capítulo, algún lector puede
reaccionar airadamente por el hecho de que estos puntos de vista lo
dejarían huérfano de recursos, ya que sólo estarían formando parte de
un enfoque destructivo que no incluye alternativas eficientes.
Suponiendo que así fuera, tal reacción sería similar a la de un náu-
frago que descalifica la información de que beber agua de mar favorece
el proceso de deshidratación. Se le ha explicado que al tomar agua
salada, no sólo ingiere agua sino también sal y no en una cuantía baja,
con lo cual se incrementan las concentraciones de sales en plasma.
Esto agrava la hiperosmolaridad, lo que conduce a su vez a una acele-
ración de la deshidratación. Pero el náufrago de nuestro ejemplo no
rechaza los argumentos bioquímicos que se le dan en virtud de que le
parezcan endebles, sino porque no se le comunica dónde obtener agua
potable (Silva, 1997).
Sin embargo, lo cierto es que no hay tal orfandad. A la par con las
críticas, se han ido proponiendo diversas alternativas.
Por ejemplo, Peter Killeen ha propuesto un estadístico alternativo
que calcula la probabilidad de replicar un efecto (Killeen, 2005,) al
que la revista Psychological Science le ha dado una especie de aval oficial.
El estadístico en cuestión es el siguiente:
La filosofía subyacente que respalda la propuesta es interesante

(Killeen 2006), en particular debido a que tiene sin duda una interpre-
tación mucho más transparente que p. Pero me abstendré de exponerla,
pues lo cierto es que se trata de una simple transformación del valor
p, de manera que hereda casi todos los problemas que aquejan a aquél.
Otras alternativas existen. Además del arsenal bayesiano, que se dis-
cutirá más adelante, pueden mencionarse, por ejemplo, el Criterio de Información de
Akaike (Burnham y Anderson, 2002), la técnica de validación cruzada (Brow-
ne, 2000) o los métodos bootstrap (Efron y Tibshirani, 1997). Pero sin lugar
a dudas, la más extendida es la de emplear intervalos de confianza. A ella
destinaremos las siguientes dos secciones.
La definición del intervalo de confianza
Puesto que la más generalizada limitación de las PSE consiste

en que se desentienden de la magnitud de los efectos para concen-
trarse en un dictamen binario, el recurso natural para suplirlas son
los intervalos de confianza, sin duda lo mejor que se puede hacer
en el marco de la estadística frecuentista para caracterizar la mag-
nitud de los efectos. Dado que dicha magnitud no se puede conocer
real o cabalmente, el investigador ha de conformarse con estimarla.
Acto inferencial al fin, el proceso de estimación está inexorablemente
sujeto a error. Cuando se afirma, por ejemplo, que la tasa de recupera-
ción conseguida en un estudio por cierto recurso terapéutico N
supera a la de otro recurso C en 18%, es obvio que lo que se está
comunicando no es que dicho efecto sea exactamente igual a 18%
sino que es «más o menos» igual a 18%. Lo natural en este contex-
to es aspirar a que se nos diga «más o menos cuánto»; es decir,
conocer, aunque sea aproximadamente, en qué medida se aleja ese
18% del verdadero valor.
El argumento central en que se sustenta la corriente de opinión
que nos ocupa proclama que los intervalos son cuantitativa y cualita-
tivamente más informativos que el mero valor de p, el cual no aporta

información alguna sobre lo que más interesa: la magnitud de los efec-
tos (de la diferencia entre porcentajes, por ejemplo, o de la asociación
que se valora).
En lugar de una dicotomía intrascendente, el intervalo nos provee
precisamente de una estimación del efecto y a la vez recoge el grado
de incertidumbre de tal estimación (cuanto más estrecho el intervalo,
más precisa es).
Un intervalo de confianza para un parámetro Ω se define como
una pareja de números Ω1 y Ω2 entre los cuales se halla el parámetro
con un nivel de «confianza» dado. Esto significa que el intervalo en
cuestión ha sido obtenido por un método que un alto porcentaje de
las veces que se emplee (usualmente 95%) da lugar a intervalos que
contienen al verdadero valor del parámetro.
Es precisamente por eso que se dice que es «de confianza»; el
método produce con tanta frecuencia intervalos que incluyen el
parámetro que, una vez aplicado, es razonable confiar en que así
haya sido esta vez.
La más extendida interpretación errónea consiste (Grunkemeyer y
Payne, 2002) en decir que cuando se construye un intervalo concreto,
digamos con confianza del 95%, entre sus extremos se halla el pará-
metro con probabilidad 0,95. Tal afirmación carece de sentido: el
intervalo contiene o no contiene al parámetro, aunque uno no sepa en
qué caso está. No se trata de que a veces lo contenga y otras no, como
afirma implícitamente el empleo de la palabra probabilidad en este
contexto.
Con frecuencia se dice que los extremos delimitan un recorrido de
valores «compatibles» con los datos. Esto no es más que un recurso
semántico que carece de significado por sí mismo: en definitiva, la
expresión «intervalo de confianza» no es más que una manera de alu-
dir a que podemos estar confiados en que el intervalo concretamente
obtenido tenga el rasgo que casi siempre tiene de incluir al parámetro
desconocido.
Tampoco ofrece, por cierto, un recorrido de «valores posibles» para

el valor poblacional, como a menudo se dice. Muchos creen que si,
pongamos por caso, a la diferencia estimada d =18% le corresponde
un intervalo de confianza al 95% igual a [15% - 21%], ello significa
que la diferencia estará entre 15 y 21% en 95 de cada 100 veces que
se repita en el futuro la experiencia. Esto es absurdo; pudiera ocurrir
que la verdadera diferencia fuera 44% y no obstante haber obtenido
en nuestro estudio ese 18%. En tal caso, la inmensa mayoría de los
valores que hipotéticamente pudieran arrojar nuevas repeticiones,
quedarán fuera del intervalo mencionado. La naturaleza frecuentista
del intervalo de confianza es sin duda esquiva. La interpretación an-
terior, a menudo presente en la mente de no pocos alumnos, aparece
incluso entre supuestos expertos. Veamos un ejemplo interesante.
En el año 2006, investigadores de la Universidad Johns Hopkins
estimaban que la cifra de muertes acaecidas en Iraq en los 40 meses
posteriores a la invasión norteamericana ascendía a 654.965 (intervalo
de 95% de confianza: [392.979 – 942.636]). Los pavorosos resultados
dieron la vuelta al mundo tras su publicación en The Lancet (Burnham G
et al., 2006). Si bien la metodología para el análisis no estuvo exenta de
polémica, el procedimiento recibió el aval de destacados estadísticos y
epidemiólogos; por ejemplo, el de Richard Peto, afamado profesor de
Estadística y Epidemiología de la Universidad de Oxford, quien en una
entrevista concedida a la emisora televisiva BBC describió el informe
como estadísticamente válido, o el que otorgaran 27 epidemiólogos me-
diante carta enviada a la prensa (Angus et al., 2006).
Dos años más tarde, un equipo del Ministerio Sanidad de Iraq bajo
el patrocinio de la OMS (Iraq Family Health Survey Study Group,
2008) publicó en The New England Journal of Medicine un trabajo que
ofrecía estimaciones radicalmente inferiores: el estudio, basándose en
un complejo procedimiento de estimación, cifra los muertos en alre-
dedor de 151.000 entre marzo de 2003 y junio de 2006, y comunica
un intervalo de confianza del 95% igual a [104.000 – 223.000]. Des-
de el punto de vista moral, a mi juicio, las cosas no cambian sea una u
otra la verdad: las consecuencias de la invasión han sido cultural, eco-

nómica, moral y humanamente oprobiosas. Al margen de la indignación
que pueda producir el nuevo estudio a los autores del primero o a sus
defensores, y más generalmente, más allá de las pasiones que puedan
levantar estas cifras, de los conflictos de intereses en juego (obvia-
mente el gobierno iraquí está muy seriamente involucrado en aquello
que se examina) y de las dudas metodológicas que pueda generar el
alambicado procedimiento seguido en el nuevo estudio, lo cierto es
que ambos trabajos ofrecen estimaciones con sus respectivos interva-
los de confianza.
Lo que interesa destacar ahora es la interpretación que se ha hecho
de ellos en algunos medios. En un trabajo destinado a denunciar el
manejo espurio que a juicio del autor (Cockburn, 2008) se hace de este
último artículo, se señala correctamente que «el intervalo que va de
104.000 a 223.000, con un grado de incertidumbre de un 95% no signi-
fica, como mucha gente no experta asume, que haya un 95% de
posibilidades de que la ‘cifra real’ se encuentre entre esos dos núme-
ros», pero el autor se hace eco de la siguiente interpretación desarrollada
por Pierre Spray, un consultor en estadística de CounterPunch’s, la cual
incurre en el error que acaba de señalarse:
«Si se hubiera ido y se hubiera hecho el mismo estudio mil veces

utilizando los mismos métodos y el mismo tamaño de muestra, pero
en hogares diferentes, entonces ocurriría que 950 de esos estudios
llegarían a una cifra entre 104.000 y 223.0000.»
Los límites Ω1 y Ω2 se expresan en las mismas unidades en las

cuales se hizo la medición, lo que por lo general permite valorar la
relevancia cualitativa del parámetro estimado. El ejemplo de las
plegarias remotas, extensamente abordado en la Sección 5.4, resulta
bien elocuente. Como se recordará, el valor medio del IDC (índice de
complicaciones) correspondiente a los sujetos no «beneficiados» por
los ruegos a un ser divino superaba en aproximadamente 0,78 al va-
lor medio de dicho índice para los individuos del grupo experi-
mental. El intervalo de confianza al 99% resultaba ser [0,76 – 0,80];
vale decir, se puede estar sumamente confiados en que la diferen-
cia es, a lo sumo, muy inferior a un solo punto de la escala con que
se mide el IDC. Consecuentemente, si la descabellada idea según
la cual los rezos anónimos pudieran tener un efecto sobre las com-
plicaciones fuera cierta, éste sería absolutamente insignificante
desde un punto de vista cualitativo, ya que no llegaría ni por aso-
mo a alcanzar un punto de aquella escala, algo que se produciría
por una complicación como tener un poco de fiebre.
Aunque la alternativa que nos ocupa tiene antecedentes diver-
sos, no fue hasta avanzada la década de los 80 del siglo XX, que
fue sustentada y defendida con vehemencia por diversos autores
entre los que se destacaron los connotados estadísticos británicos
Martin Gardner y Douglas Altman (véase Gardner y Altman, 1986)
y secundada posteriormente, como ya se comentó, por la mayoría
de los editores de revistas médicas. Estos autores sugieren que los
intervalos sean empleados como recurso expresivo básico. No sos-
tienen que los valores p deban ser necesariamente erradicados. Se
contemporiza con ellos, pero se deja claro que se pueden omitir
sin reparos. En la actualidad, esta insistente demanda ha dejado
algunos dividendos claros; por ejemplo, al informar valores de odds
ratios (OR), lo más común es que los autores comuniquen el inter-
valo correspondiente (con o sin valores p asociados). Callahan y
Reio (2006) señalan que por lo menos 23 journals de las ciencias
sociales insisten en que los autores han de comunicar los efectos,
la mayoría de los cuales sugieren que se haga a través de intervalos
de confianza.
Ha de consignarse, finalmente, que los intervalos incluyen toda la
información necesaria para aplicar la prueba de significación si se
deseara realizarla. Sin embargo, obviamente, ese sería el peor uso que
pudiera darse a dichos intervalos.
Intervalos de confianza y tamaños muestrales
Los intervalos de confianza se pueden estrechar tanto como se

quiera tomando muestras suficientemente grandes.
Algunos se muestran sorprendidos de que aquellos mismos que
vituperan a los valores p arguyendo el tan llevado y traído problema
de que estos se pueden hacer tan pequeños como se desee, sugieran la
alternativa de los intervalos de confianza, a pesar de que éstos adole-
cen del mismo problema. En efecto, el intervalo se acorta en la medida
que el tamaño muestral se incrementa, y tomando una muestra sufi-
cientemente grande, el intervalo se puede estrechar tanto como se
desee.
Sin embargo, lejos de ser un inconveniente, el hecho de que se
acorten en la medida que se cuente con más información es un rasgo
altamente atractivo de este recurso. Vale la pena detenerse en el aná-
lisis de este "detalle". Recurramos una vez más al modelo que nos
ofrecen las monedas.
Los señores Fulánez y Mengánez quieren valorar una moneda adqui-
rida en un viaje turístico. Ellos dudan acerca de si dicha moneda es
suficientemente «equilibrada» como para que sea empleada para ju-
gar. Es decir, se preguntan si la probabilidad de obtener «cruz»,
llamémosle ∆, es suficientemente cercana a la de obtener «cara». Ambos
coinciden subjetivamente en que sería «suficientemente cercana» si ∆
no dista de 0,5 más que en 0,02.
Supongamos por un momento que hay un dios que conoce todo lo
concerniente a tal moneda, y que admite que se le formule una sola
pregunta al respecto. ¿Qué pregunta formular? Desde luego, no malgas-
tarían su oportunidad indagando si es o no cierto que ∆=0,5. Ya se sabe
que la respuesta sería negativa. Fulánez y Mengánez quieren conocer la
verdadera probabilidad de que el resultado de un lanzamiento sea «cara».
Ya decidirán luego acerca de la utilidad de la moneda para jugar.
Supongamos que Fulánez es más ágil y pregunta primero. Dios le
comunica que la probabilidad de que salga cara es exactamente igual
a ∆ =0,53. Consecuentemente, Fulánez da por concluido el asunto.

Ya tiene la respuesta deseada. Su reflexión ahora ya no es estadísti-
ca: directamente, de acuerdo a una reflexión previa, considera que
con una moneda tan sesgada no vale la pena jugar.
Desconocedor de la respuesta de Dios, el Sr. Mengánez no tiene
más remedio que emprender una investigación para dirimir este asun-
to. Su situación es, en definitiva, la que tenemos regularmente todos
todo el tiempo; puede preguntársele a Dios, pero no contesta.
Supongamos que Mengánez hace la experiencia de lanzar la moneda
n veces. Consideremos varios tamaños muestrales. En principio, cabe
esperar que se obtendrá un número de caras próximo al 53% de n,
especialmente cuando este número sea de suficiente magnitud como
para que «funcione» adecuadamente la ley de los grandes números.
Pero en lo que resta asumiremos que la estimación de ∆ ha sido per-
fecta en todos los casos, supuesto que no compromete en absoluto lo
que se procura discutir ahora.
La Tabla 6.8 muestra los intervalos de confianza que obtendría
Mengánez para cada tamaño de muestra.
Tabla 6.8. Intervalos de confianza (95%) para ∆ en función del tamaño muestral
bajo el supuesto de que no hay errores de muestreo.
Tamaño de Número Estimación Intervalo

error
muestra de éxitos puntual de confianza
100 53 0,530 0,098 0,432 0,628
200 106 0,530 0,069 0,461 0,599
800 424 0,530 0,035 0,495 0,565
1.600 848 0,530 0,024 0,506 0,554
10.000 5.300 0,530 0,010 0,520 0,540
Como se aprecia, las longitudes de los intervalos disminuyen sos-

tenidamente en la medida que aumenta n. Desde luego, se puede
emplear el intervalo para hacer una prueba de hipótesis clásica; pero
la hipótesis de nulidad (∆ =0,5) siempre se podrá rechazar (será posi-
ble conseguir que 0,5 quede fuera del intervalo si n es suficientemen-

te grande). De modo que, así empleado, el intervalo de confianza no
tiene utilidad alguna.
Pero lo importante es que cuanto mayor sea n, más cerca está el
conocimiento de Mengánez a la verdad conocida por Fulánez. Si opera
con n =50, no podrá adoptar decisión alguna; tampoco en caso de que
emplee n =800. Incluso con n =1.600 sólo podría estar confiado de que
∆ no es inferior a 0,506, ni supera a 0,554, dato insuficiente para pro-
nunciarse. Trabajando con n =10.000 sí podría, en cambio, descartar
razonablemente la moneda, ya que en ese caso podría tener una gran
confianza en que la probabilidad de que salga cara es superior a 0,52.
INTRODUCCIÓN A LA RACIONALIDAD BAYESIANA
Como un colofón natural a este libro, cuyo objetivo central es re-

clamar y promover una urgente recuperación de la racionalidad, destino
la última sección a tratar muy someramente una opción que ha ido
ganando fuerza en los últimos años: la aproximación inferencial baye-
siana, a mi juicio la más atractiva y promisoria. A ella destinaremos
un espacio considerable.
Por una parte, este enfoque está bien establecido como una posibi-
lidad alternativa a las pruebas de significación y a los intervalos de
confianza. Por otra, la teoría bayesiana vive un momento de reemer-
gencia para todo el quehacer inferencial, precisamente como recurso
mucho más racional que los aplicados de manera predominante a lo
largo de casi todo el siglo XX (Silva, Benavides y Almenara, 2002).
De hecho, muchas veces he expresado que lo que menos me agra-
da de la inferencia bayesiana es su nombre, que deja en algunos la
sensación de que está entrando en una secta, algo exactamente opuesto
a su verdadera vocación. Me gustaría precisamente llamarla, por ejem-
plo, «inferencia racional», aunque admito que a esta altura el adjetivo
«bayesiana» ha hecho fortuna y se ha consolidado a lo largo de un
larguísimo proceso de tres siglos (véase Fienberg, 2006) desde que

Thomas Bayes diera a conocer su célebre teorema.
A continuación se hace una introducción en extremo elemental de
las ideas básicas de la inferencia bayesiana. No pocos libros igualmente
introductorios han visto la luz recientemente. Entre ellos, sugiero los
siguientes: Gill (2002), Jaynes (2003), O’Hagan y Forster (2004).
El reverendo Bayes
Bayes nació en Londres en 1702 y falleció el 17 de abril de 1761 en

Tunbridge Wells, Kent. Su padre fue uno de los primeros seis ministros
disidentes ordenados en Inglaterra. Thomas fue educado por un maes-
tro privado y, aunque no se conoce nada de su tutor, se cree que pudo
haber sido Abraham De Moivre, el autor del famoso libro La doctrina de
las probabilidades. Bayes fue ordenado, al igual que su padre, como mi-
nistro disidente, y en 1731 se convirtió en reverendo de la iglesia
presbiteriana en Tunbridge Wells; aparentemente trató de retirarse en
1749, pero continuó ejerciendo hasta 1752, y permaneció en ese lugar
hasta su muerte en 1761 (O’Connor y Robertson, 2000). Su tumba fue
remozada en 1969 con financiación aportada por estadísticos de todo
el mundo y se halla en el cementerio Bunhill Fields de Londres.
Sus primeros estudios son de tipo teológico (en Edimburgo entre
1719 y 1722), pero no demoró en interesarse en las matemáticas, las
ciencias naturales y, por último, en la inferencia estadística. Se ha di-
cho que el célebre ensayo de Bayes era en parte una respuesta a los
trabajos del filósofo escocés David Hume, sobre todo a su conocido
Tratado de la naturaleza humana publicado por primera vez en 1739
pero también a otros como Sobre los milagros.
En la obra de Hume se plantea una consistente crítica a la induc-
ción, matizada por un marcado escepticismo hacia las generalizaciones:
¿Puede algún número de instancias observadas, a falta de un examen
completo, hacer razonable que creamos en una generalización? (Hac-
king, 1995). La pregunta resume lo que ha dado en llamarse el problema

escéptico acerca del futuro, en palabras del propio Hume: «el argumento
inductivo no porta una fuerza lógica; es decir, tal argumento no repre-
senta más que una suposición de que ciertos eventos seguirán en el futuro
el mismo patrón que tenían en el pasado» (Rothman y Greenland, 1998).
La preocupación por los milagros era en aquella época una cues-
tión de vida y de ultratumba, y se consideraba que el pueblo llano
podía estar afectado por su credulidad sobre el tema, algo inaceptable
entre las personas ilustradas. Para los defensores de un pensamiento
racional, por tanto, era de suma importancia dirimir si determinados
testimonios, entonces en boga, constituían o no evidencias reales acer-
ca de la existencia de ciertos fenómenos en principio poco creíbles. Se
necesitaba establecer procedimientos que permitieran enjuiciar la ve-
racidad implícita en las afirmaciones de una serie de testigos.
Ocasionalmente, se tenía una información procedente de alguien que
era digno de alguna pero no total credibilidad, quien informaba sobre
el testimonio de otro testigo cuya credibilidad también era imperfec-
ta. La probabilidad que cupiese atribuir a «realidades» así testimoniadas
(probabilidad condicional de que el hecho fuese cierto, supuesto que
se contaba con ciertas revelaciones) se presentaba entonces como «el
escudo con el que un hombre podía guardarse del entusiasmo» (Hac-
king, 1995); es decir, como un recurso que cuantificaba el grado de
aceptación racional que pudiera conferírsele a las afirmaciones sobre
acontecimientos aparentemente milagrosos.
Se reconoce a Bayes como el primero que captó la importancia de
desarrollar una teoría cuantitativa y exacta de razonamiento inductivo.
Se dice que desarrolla su teorema para demostrar la existencia de Dios
pero, como al final necesita conocer la probabilidad a priori de esa pro-
pia existencia, no pudo demostrarla y abandona el trabajo (Cobo, 1993)5.
5
No deja de ser cómica una delirante noticia de prensa (Villapadierna, 2006) en la que con
toda seriedad se daba cuenta de recientes descubrimientos acerca de la existencia de Dios
basados en el Teorema de Bayes.
Lo cierto es que, si bien pudo percibir el problema y desarrollar un

teorema por cuyo conducto se soluciona el problema de la inferencia
inversa en el ámbito de la teoría de probabilidad matemática, fue sufi-
cientemente cauteloso sobre su validez y aplicabilidad como para
retener la publicación de todos sus trabajos mientras sus dudas no
fueran disipadas.
Figura 6.5. Thomas Bayes (1702-1761).
El enfoque bayesiano: una mirada global
El enfoque bayesiano es en realidad un cuerpo teórico complejo y

abarcador, cuyo alcance práctico y teórico es enorme, y aunque des-
borda ampliamente la problemática de las PSE, aquí se pondrá el énfasis
en esa área. No pocos autores se van sumando cada día a la corriente
que afirma que la inferencia bayesiana es el sucedáneo natural para
las PSE (Mathews, 2000; Lecoture, 2006; Wagenmakers, 2007).
Uno de los elementos distintivos entre la escuela bayesiana y la
estadística frecuentista a la que pertenecen las pruebas de significa-
ción, consiste en que esta última entiende la probabilidad como la
frecuencia relativa con que ocurre un acontecimiento dentro de un

marco experimental u observacional bien definido, en tanto que aqué-
lla también admite que pueda ser expresión de un grado de convicción
personal. Tal convicción, si bien puede modificarse a la luz de nue-
vos datos, no necesariamente se calcula a través de frecuencias
asociadas a resultados experimentales u observaciones formales.
Para un «frecuentista» estricto, una oración cotidiana tal como «es
muy probable que Pedro haya sido el ladrón» carece de todo sentido,
ya que no se ha calculado el porcentaje de veces que, para un gran
número de robos idénticos, el ladrón haya resultado ser Pedro. Para
un bayesiano, el juicio de que Pedro sea muy probablemente el ladrón
—supuesto que se tienen indicios razonables para ello— no sólo sería
perfectamente sensato (como lo es, por cierto, para todo ciudadano
común) sino que, de hecho, como se expuso en el apartado Probabili-
dades subjetivas: cuando un erudito se equivoca, p. 201, así es como
se maneja el concepto de culpabilidad en todos los juicios que se de-
sarrollan según las pautas de la jurisprudencia occidental.
Esta probabilidad a priori de transforma entonces en una probabilidad a
posteriori. Para «actualizar» nuestra apreciación probabilística se emplean
los datos de que se disponga en cada momento específico, y para comple-
tar ese proceso se emplea a un instrumento especial: el Teorema de Bayes.
Las convicciones a priori son, o pueden ser, en buena medida sub-
jetivas; pueden variar de un momento a otro y de un analista a otro.
Tal subjetividad se ha señalado, con razón, como una limitación del
enfoque bayesiano. Pero no constituye una acusación demasiado gra-
ve. No sólo porque la subjetividad es ineludible (véase Capítulo 3)
sino porque constituye un ingrediente natural al reflexionar en un marco
de incertidumbre.
Las probabilidades a posteriori, por su parte, configuran el grado de
convicción emergente luego de haberse incorporado la nueva infor-
mación (empírica) al conocimiento precedente, como ocurre, por
ejemplo, cuando el miembro de un jurado va reconfigurando su opi-
nión en el contexto de un juicio en la medida que nuevas evidencias le
son presentadas.
Para fijar las ideas acerca de la diferencia de enfoques ante un pro-

blema concreto, apelaré una vez más al que tal vez sea el más simple y
socorrido modelo, varias veces considerado en este libro.
Imaginemos que se quiere evaluar la equidad de una moneda. Al
examinarla visualmente, parece ligeramente doblada con la CARA en
la superficie cóncava, lo cual hace pensar que hay cierto favoritismo
para esta opción (quizás la probabilidad de obtener CARA pudiéra-
mos cifrarla en alrededor de 51%); pero quisiéramos ir más allá de la
simple inspección y de la conclusión subjetiva —aunque no arbitra-
ria— de que verosímilmente, si estuviera desequilibrada, no sería por
un margen muy grande y sería a favor de CARA.
En principio, el plan es enteramente convencional: lanzar la mone-
da cierta cantidad de veces, contar el número de «caras» y enjuiciar la
situación a través de la frecuencia con que ocurre el acontecimiento.
Supongamos que n=200 y que se obtienen 120 caras. Lo primero que
probablemente haría el analista convencional sería una prueba de sig-
nificación. Es fácil corroborar que usando la prueba Z, obtendría p
=0,04, lo que permitiría declarar que hay una diferencia significativa en-
tre el 60% obtenido y el 50% esperado bajo la hipótesis de nulidad.
Pero ya sabemos que ese recurso se aplicaría para responder la
pregunta equivocada (véase apartado Solucionando el problema equi-
vocado, p. 384). Si el analista aborda el problema de verdadero
interés —estimar la probabilidad de que salga cara, llamémosle
π— mediante el enfoque frecuentista debería en cambio construir
un intervalo de confianza para π. Las bien conocidas fórmulas para
hallar los límites inferior y superior ( y respectivamente) de dicho
intervalo son:
donde es la estimación puntual de π, y es el percentil (1-

α) 100% de la distribución normal estándar. En el ejemplo, p=0,60 y
Z 1- α = 1,96 (suponiendo que se trabaja con el consabido α=0,05),

2
de modo que un intervalo de confianza al 95% en el marco conven-
cional vendría definido por los límites: I=0,53 y S=0,65.
En resumen, según este enfoque podríamos estar confiados en que la
probabilidad π de obtener cara no es inferior a 53% ni superior a 67%.
El enfoque bayesiano seguirá otro trillo. En lugar de sacar conclu-
sión dicotómica alguna, e incluso de obtener un intervalo de confianza
que parte del presupuesto de que desconocemos totalmente la realidad
que se estudia, el analista bayesiano procurará «actualizar» el grado de
convicción que prevalecía hasta ese momento sobre la probabilidad de
que el resultado fuese CARA. Los datos resultantes de la experiencia
empírica constituirán la materia prima para dicha «puesta al día».
Es obvio que esta manera de apreciar la información novedosa se
acerca mucho más al razonamiento natural de todo investigador,
ya que es absurdo desdeñar una información de cuyo valor difícil-
mente se podría dudar. En el caso que nos ocupa, basta examinar
visualmente la moneda para comprender —por ejemplo— que el
valor de π no puede ser muy lejano a 50%. Podría, con sólo mirar-
la, descartarse de antemano, por ejemplo y para considerar una
situación burda, que π fuera inferior a 30%, o superior a 85%. Un
mínimo de racionalidad y sentido común hace ver que los resulta-
dos serán mucho mejores si se contempla esta información que si
no se hace.
Sólo a modo de ilustración, si partiéramos del supuesto inicial de
que π no es inferior a 48% ni superior a 54% y que la probabilidad de
los valores intermedios fuera disminuyendo en la medida que nos ale-
jamos de 51% dentro de dicho recorrido6, el enfoque bayesiano nos
llevaría a la conclusión de que π ha de estar entre 50,5% y 54,5% con
una probabilidad de 0.95. Nótese que, aparte de tener una interpreta-
ción más clara, este intervalo es mucho más estrecho, y por ende,
6
Formalmente, se ha supuesto que π sigue una distribución Beta acorde a este supuesto.
mucho más informativo, que el intervalo de confianza obtenido por

el método convencional.
Para llegar a este intervalo —que en el marco bayesiano no es de
confianza sino de probabilidad o de credibilidad— se empleó el programa
informático EPIDAT 3.0 (véase una reseña del mismo en Hervada et
al., 2004). Aplicando la tecnología bayesiana, el programa conjuga la
información sobre la moneda que teníamos a priori —antes de lanzar-
la— con la información empírica surgida de la experiencia consistente
en tirarla 200 veces. Así se obtuvo un resultado a posteriori, que en
este caso se ha sintetizado en el intervalo de probabilidad.
Además de su substrato natural —el Teorema de Bayes— las técnicas
que nos ocupan exigen cierto dominio de la teoría probabilística de
distribuciones. El cómputo de los resultados a posteriori suele deman-
dar del empleo de recursos de simulación tipo Montecarlo. Esto
conduce, casi inevitablemente, al empleo de programas computacio-
nales como el que se ha mencionado arriba, los cuales no están
incluidos en los paquetes estadísticos convencionales.
Como es fácil de intuir, las técnicas bayesianas son considerable-
mente más complejas que las que se han venido aplicando en el campo
de la salud durante los últimos decenios. Precisamente, el predominio
del paradigma frecuentista puede explicarse parcialmente por esa ra-
zón; a ello se suma, como señala Freedman (1996), la dificultad de
establecer la probabilidad a priori, empresa muy alejada de la pereza
intelectual que suele asociarse al empleo de las pruebas de significa-
ción. En efecto, como se ha visto en el sencillo ejemplo anterior, este
enfoque no es algorítmico; en su desarrollo interviene el conocimiento
previo y obliga a la reflexión.
La versión más simple del Teorema de Bayes
Para exponer la versión más simplificada del teorema, comence-

mos por considerar que se tiene cierta hipótesis H que, naturalmente,
puede ser o no válida. Si no hubiera dudas al respecto, entonces sería

una certeza, o un postulado, o un punto de vista dogmático, pero no
una conjetura. Supongamos que un investigador tiene una valoración
inicial acerca de su validez. Tal juicio, que pudiera ser subjetivo, aun-
que en tal caso seguramente se basa en la teoría o en experiencias
precedentes, o en ambas cosas, se expresa probabilísticamente; lla-
memos P(H) a dicha probabilidad.
Supongamos que se han recogido ciertos datos (procedentes de la
observación o de la experimentación, detalle ahora lateral). Por lo
general es fácil computar la probabilidad de haber obtenido tales da-
tos supuesto que H sea, en efecto, válida. Para poner el ejemplo más
simple, supongamos que H sea la hipótesis que afirma que al lanzar
una moneda que tal vez ha sido ligeramente doblada con una pinza, la
probabilidad de obtener una cara es π=0,4, y que, tras haber lanzado
dicha moneda 20 veces, se obtuvieron 11 caras. En tal caso la proba-
bilidad condicional P(datos|H) se computa directamente empleando la
fórmula de la distribución binomial:
Supongamos que se valora una hipótesis alternativa H*: la moneda

no ha sido doblada, de modo que H* afirma que π=0,5.
Debe recordarse que, sensu stricto, ambas hipótesis son falsas: aun-
que la moneda haya sido doblada, π nunca será exactamente igual a 0,4;
y en caso de que no hubiera sido manipulada, ya sabemos que no
existen monedas ideales. Todos los modelos son imperfectos; la tarea
de la ciencia, por tanto, no es rechazar un modelo por serlo ni hallar
uno que no lo sea. Lo que procura es dirimir cuál o cuáles de los que
se proponen es menos defectuoso. En este caso, se trata de optar en-
tre dos propuestas. El enfoque bayesiano nunca evalúa hipótesis
aisladas sino que se ocupa de dar elementos para que decantemos una
entre dos o más explicaciones conjeturadas.
Una primera aproximación en este caso se orienta a delimitar cuál

de las dos propuestas resulta más verosímil atendiendo exclusivamente
a lo que informan los datos. Tal y como procedimos con H, podría-
mos computar la probabilidad directa de haber obtenido 11 caras en
20 lanzamientos bajo H*. Dicho de otro modo, pudiéramos computar
P(datos|H*) y compararlo con el valor ya obtenido para dicha probabi-
lidad condicional cuando se supuso π. Esto es:
En este punto resulta bastante natural comparar ambas probabili-

dades condicionales mediante una razón:
La expresión anterior, una razón de verosimilitudes, es conocida

como el Factor de Bayes.7 En nuestro ejemplo, puede interpretarse así:
la hipótesis de que π=0,5 es casi 10 veces más verosímil que la que
afirma que π=0,4. En este análisis no ha comparecido ninguna apre-
ciación a priori sobre la probabilidad de ninguna de estas dos hipótesis;
sólo los datos se han «expresado».
El interés del Teorema de Bayes estriba en que por su conducto pu-
diera estimarse la probabilidad inversa para cada hipótesis; por ejemplo,
la probabilidad de π=0,4, supuesto que se conocen los datos de la
experiencia. Para conseguirlo, sin embargo, será necesario incorporar
valoraciones probabilísticas previas a la observación de dichos datos.
En su versión más elemental y en este contexto, el Teorema de Bayes
se deriva casi directamente (véase Anexo 6.4) de la definición de pro-
babilidad condicional y asume la forma general siguiente:
7
Para acceder a una detallada explicación del concepto como medida de la evidencia,
véase Goodman (2005).
donde P(A) y P(B) son las probabilidades de ciertos eventos A y B, la

expresión P(A|B) denota la probabilidad condicional de que sea cierto
el suceso A supuesto que se ha producido B en tanto que P(A|B) la
probabilidad para la situación inversa.
Si consideramos que A es que cierta hipótesis sea cierta y que B es
un conjunto de datos salidos de una observación o una experiencia,
entonces [6.1] se puede poner del modo siguiente:
Lo que muestra [6.2] es la probabilidad a priori de la validez de H,

P(H), transformada en una probabilidad a posteriori, P(H|datos), que
surge una vez incorporada la evidencia que aportan los datos. El de-
nominador P(datos) se puede computar mediante la expresión general
siguiente:
siempre que se cuente con una distribución a priori de cierto paráme-

tro π. En el caso en que se maneja H* como la única alternativa posible
a H, [6.3] asume la forma particular siguiente, bien conocida de la
teoría elemental de probabilidades:
Sustituyendo esta expresión en [6.2] tenemos:

En este caso, en que las hipótesis pueden expresarse en términos

del parámetro π, que sigue una distribución de tipo Bernoulli, [6.4]
pasa a ser:
Ya en términos de nuestro ejemplo, [6.5] se transformaría en:
Para concluir el cómputo de la probabilidad inversa, obviamente

necesitamos tener un valor a priori para la probabilidad P(H). Este es
el que ha de anticipar en el enfoque bayesiano el investigador. Si, por
ejemplo, hubiera motivos de mucho peso para creer que la moneda
fue efectivamente doblada, entonces quizás pudiera pensarse que
P(H)=0,9; en tal caso, [6.6] arrojaría que la probabilidad de que π=0,4,
dado que se produjeron 11 caras de las 20 posibles, sería:
Si el investigador considerara a priori que ambas hipótesis son igual-

mente probables, entonces postularía que P(H)=P(H*)=0,5 y se
obtendría:
Como se ve, el valor a priori de P(H) se reduce en este ejemplo

cuando es actualizado por los datos (de 0,90 a 0,84 en un caso, y de
0,50 a 0,38 en el otro) debido a que éstos confieren menos verosimi-

litud a esta hipótesis que a su rival.
Una manera alternativa de enunciar el Teorema de Bayes (equivalente a
[6.4]) en el caso en que se manejan sólo dos hipótesis, es:
Vale decir: los odds a posteriori de la hipótesis son iguales a los odds
a priori multiplicados por el factor de Bayes.
Para cerrar estas nociones introductorias, llamo la atención sobre
una singular propiedad asociada al Teorema de Bayes de notable conno-
tación práctica y epistemológica:
Supongamos que tenemos una información D1 que habremos de
usar para «actualizar» nuestra visión a priori sobre la probabilidad que
atribuimos a cierto parámetro π. La fórmula [6.3] se expresaría así:
Supongamos que ahora tenemos otro conjunto de información D2

y que deseamos reconsiderar (actualizar) nuestra apreciación sobre π
usando también esta nueva información (además de D1). La fórmula
[6.7] mantendría su estructura, pero ahora con D2 ocupando el sitio
de D1 y todos sus componentes condicionados por D1. Esto es:
Si suponemos, como es lógico, que D2 es independiente de D1,

entonces tendremos que:
de modo que [6.8] pasa a ser:
Esto viene a decirnos que la actualización secuencial dentro del

enfoque bayesiano adopta una forma muy particular: la probabilidad
a posteriori luego de observar D2 se calcula con la misma fórmula [6.7]
usada antes, pero ahora con la probabilidad a priori condicionada por
el conocimiento de D1. Dicho de otro modo: lo que hasta el momento
de incorporar el nuevo conocimiento era probabilidad a posteriori, pasa
a ser probabilidad a priori en el nuevo ciclo cognoscitivo que habrá de
contemplar la información aportada por D2.
«Nuestra probabilidad a posteriori de hoy, pasa a ser nuestra proba-
bilidad a priori de mañana», reza un adagio bayesiano que resume este
fenómeno. Es a mi juicio evidente el atractivo que tal propiedad otor-
ga al enfoque bayesiano, ya que es exactamente así como progresa el
conocimiento científico.
Mirando un error clásico desde la perspectiva

bayesiana
En un periódico reciente puede leerse una carta donde se expresa

lo siguiente:
"Puesto que en un artículo de la semana previa se decía que el 98%

de las personas condenadas por conducir temerariamente eran de
sexo masculino, puede concluirse que los hombres tienen una pro-
babilidad 49 veces mayor que las mujeres de ser condenados por
este concepto."
Y en la portada de otro (20 minutos, 2003) se lee:

"El director general de Tráfico atribuye la mitad de los 76 muertos

que se produjeron este fin de semana en las carreteras al hecho de
que 38 de los fallecidos no llevaban cinturón de seguridad en el mo-
mento del accidente."
El error en el que incurren es muy frecuente, sobre todo entre in-

vestigadores bisoños. Dicho en términos muy básicos, en el primer
caso se trata, como es obvio, de que hay muchos más hombres que
mujeres conduciendo automóviles. Siendo así, no es de sorprenderse
que, entre quienes conducen temerariamente, predominen los hom-
bres. En el segundo, la atribución es arbitraria hasta que no se conozca
qué porcentaje de quienes no fallecieron en los accidentes tampoco
tenían colocado el cinturón.
En términos probabilísticos, la falacia estriba en no comprender
que no basta que P(datos|H) sea grande para creer que datos es un
factor influyente en la validez de H. El grado en que los datos consti-
tuyen una evidencia de la validez de H depende no sólo de la intensidad
con que veamos los datos cuando H es cierto, sino también del grado
en que no se produzcan esos datos cuando H sea falsa.
Lo anterior se relaciona con la más burda de las inadvertencias que
se cometen en nombre de la «teoría de riesgos», consistente en consi-
derar el hecho de que algún factor se presente con alta frecuencia
entre los que sufren una dolencia como un indicio (y, en casos extre-
mos, como una prueba) de que dicho factor entraña un riesgo para
padecerla. En este desatino se viene incurriendo desde hace décadas
y, aunque la frecuencia de su aparición es decreciente, está lejos de
haber sido erradicado.
Para apreciar esta falacia a través del Teorema de Bayes, considere-
mos un ejemplo más bien caricaturesco y, quizás por eso mismo, harto
expresivo. Virtualmente todos los enfermos de cáncer de páncreas
tienen cinco dedos en la mano derecha, pero todos sabemos que ello
no es motivo para creer que si un sujeto tiene cinco dedos, entonces
sea muy probable que padezca de este cáncer. Es decir, P(5|C) es
muy próximo a 1; pero ello no hace pensar que la probabilidad de

tener cáncer supuesto que se tienen 5 dedos, P(C|5), sea grande. De
hecho, esta última probabilidad es ínfima. En términos prácticos ello
se debe a que la probabilidad de tener 5 dedos supuesto que no se
padece de cáncer también es enorme. Más concretamente, se debe a
que . En términos del Teorema de Bayes, el asunto se
plantea según [6.4], así:
Si suponemos que y puesto que ,

se tiene:
lo cual no es otra cosa que decir que la probabilidad de tener dicho

cáncer, supuesto que se tienen cinco dedos es igual a la probabilidad
incondicional de tenerlo (la cual, en efecto, es bajísima). Finalmente,
la relación P(C|5)=P(C) es también una forma, como es obvio, de
decir que el número de dedos no tiene relación alguna con el padeci-
miento.
Desde luego, errores de este tipo no aparecen a diario en artículos
científicos publicados en buenas revistas de epidemiología u otras
publicaciones científicas de alto impacto; sin embargo, no es nada
insólito que afloren en ambientes diversos del pensamiento científico
actual y, como hemos visto, la prensa incluida.
Yudkowsky (2003) ofrece una muy simplificada explicación de lo
que el Teorema de Bayes significa, la cual resulta especialmente atracti-
va y elocuente para principiantes por su carácter interactivo. Allí se
podrá apreciar vívidamente que una de las cosas que sintetiza el Teore-
ma de Bayes es que la evidencia en definitiva es el resultado de la
relación entre dos probabilidades condicionales. Una evidencia fuerte

a favor de cierta hipótesis H dada por ciertos datos no se tiene por el
hecho de que sea alta la probabilidad de que cuando se cumpla H se
produzcan esos datos; para convertirse en genuina evidencia es nece-
sario corroborar que, además, es muy baja la probabilidad de que,
cuando rige la negación de H, pudieran producirse los datos.
El ejemplo clásico de la sensibilidad y la especificidad
La mayor parte de los estudiantes de estadística tropiezan con el Teore-

ma de Bayes en su formación básica. Y a los epidemiólogos les resulta
bastante familiar su aplicación en el marco de las pruebas diagnósticas.
Repasemos brevemente este asunto con un ejemplo de corte bastante
clásico.
Examinaremos el efecto que puede producirse a nivel epidemioló-
gico como consecuencia de que la capacidad de una prueba diagnóstica
para descubrir casos nuevos depende de la prevalencia de la enferme-
dad en la comunidad donde se aplique. Situémonos para ello en el
contexto de los programas de tamizaje (screening programs); es decir, en
la situación en que se trata de aplicar pruebas diagnósticas para la
detección masiva de enfermedades.
Como es bien conocido, la eficacia inherente a una prueba diagnóstica
se resume mediante dos parámetros: sensibilidad y especificidad. El primero
mide la capacidad de la prueba para detectar a un sujeto enfermo; expre-
sa cuán «sensible» es la prueba ante la presencia de la enfermedad y viene
definido por la probabilidad condicional , donde T+ expresa
que una prueba T ha arrojado un resultado positivo y E indica que el
sujeto al que se le aplicó está verdaderamente enfermo. O sea, la sen-
sibilidad es la probabilidad de que la prueba identifique como enfermo
a aquel que realmente lo es.
El otro parámetro mide la capacidad que tiene la prueba de diag-
nosticar como sanos a los que efectivamente lo son. Se define a través
de la probabilidad condicional , donde T- expresa que una
prueba T ha arrojado un resultado negativo, y indica que el sujeto

valorado está libre de la enfermedad. Es decir, mide cuán específica
es la prueba diagnóstica en el sentido siguiente: cuanto mayor sea β,
menor será su complemento ; o sea, menor es la probabilidad
de que declare como enfermos a sujetos que no sufren esta enferme-
dad.
Ahora bien, desde el punto de vista operativo, los conceptos que
realmente interesan en relación con las pruebas diagnósticas no son la
sensibilidad y la especificidad. El clínico procede en la dirección opues-
ta: a partir del resultado de la prueba intenta inducir la condición del
paciente.
Por lo tanto, lo que resulta deseable en este contexto es que, si el
resultado de la prueba es positivo, la probabilidad de que el sujeto esté
efectivamente enfermo sea muy alta y, análogamente, que sea elevada
la de que el individuo esté sano, supuesto que la prueba arroja un resul-
tado negativo. En términos formales, lo ideal es que sean muy altos los
valores , que son probabilidades condicionales a las
que ha dado en llamarse valores predictivos de la prueba.
Si llamamos P a la probabilidad a priori de que el sujeto esté enfer-
mo, y O=1-P a su complemento, aplicando el Teorema de Bayes se
obtienen de inmediato las siguientes relaciones, que expresan la for-
ma concreta que alcanzan estos valores cuando se ponen en función
de los tres parámetros:
Consideremos una grave enfermedad que, en determinado contex-

to, tiene una tasa de prevalencia igual a P8. Por ejemplo, supongamos
que se trata de una enfermedad padecida por una de cada 300 perso-
8
Este «contexto» puede ser cierta comunidad concreta, o un subconjunto poblacional
definido por algunas restricciones (v.g. mujeres mayores de 60 años con sobrepeso).
nas de la población. Es decir, estamos en el caso en que: P=0,003.

Imaginemos que se cuenta con una prueba diagnóstica de alta eficien-
cia: concretamente, que tiene sensibilidad y especificidad del 90%.
Esto significa que α=β=0,9. La pregunta de interés ahora es, ¿cuán
probable es que un sujeto identificado por la prueba como positivo,
realmente esté enfermo? La respuesta se obtiene aplicando la fórmula
correspondiente a P(E|T+):
de donde se deriva que la tasa de falsos positivos es nada menos que

del 97%.
Por ejemplo, en una población de 15.000 cabe esperar que haya 50
enfermos. Si la población fuera íntegramente sometida a dicha prue-
ba, ésta detectará aproximadamente al 90% de los enfermos (45
individuos), y declarará como sanos al 90% de los 14.950 sujetos que
lo están (o sea, diagnostica como enfermos al 10% restante: a 1.495
sanos). En total, habrá, por tanto, 1.540 individuos diagnosticados
como enfermos, pero sólo el 3% de ellos (45 de los 1.540) realmente
lo están, tal y como arrojara la fórmula.
El interés básico de esta ilustración, que muestra una aplicación
directa del Teorema de Bayes, radica en que llama la atención sobre el
hecho de que los dividendos que se derivan de este tipo de tamizajes
no son siempre mayores que los problemas que traen consigo: posi-
blemente muchos de esa inmensa mayoría de sanos entre los positivos
serán objeto de pruebas adicionales con sus respectivos riesgos; como
mínimo, numerosas víctimas del error habrán de sumergirse en un es-
tado de zozobra, acaso acompañado de un injustificado temor a la
muerte.
El enfoque bayesiano y la tarea del investigador
Como se recordará del apartado Definición de p, p. 357, el valor p

que Fisher propuso para valorar una hipótesis (Ho) a través de unos
datos concretos (do) es la probabilidad condicional, definida como:
p=P(D=do|Ho)
Ahora bien, el problema radica en que lo que realmente interesa al

investigador no es valorar la probabilidad de haber obtenido ciertos
datos supuesta la veracidad de Ho sino lo contrario: la probabilidad
p1=P(H0|D=d0) de que sea válida Ho supuesto que se observaron los
datos que dan lugar a do. Las probabilidades p=P(D=do|H o) y
p1=P(H0|D=d0), lamentablemente, pueden ser muy diferentes. Y más
lamentablemente aún, muchos investigadores (quizás la mayoría) no
son capaces de distinguir una de otra.
Matthews (1999) sostiene, e ilustra mediante varios ejemplos to-
mados de la literatura, que los valores p exageran la significación real
de los datos obtenidos, lo que no pocas veces ha conducido a la apro-
bación de conductas terapéuticas que poco tiempo después han sido
fatalmente desacreditadas; la razón de estos escándalos, simplemente
es, a su juicio, estadística. Según este autor, la razón más persuasiva
para usar la inferencia bayesiana es la capacidad que tiene de proveer
un nivel de protección mucho mayor que el enfoque frecuentista con-
tra la posibilidad de «ver significación en hallazgos procedentes de la
investigación científica que son enteramente espurios».
En cualquier caso, el pensamiento real del investigador no se orienta
a obtener juicios sobre los datos supuesto que se cumple (o no) una
hipótesis, sino exactamente al revés. Lo que realmente interesa es
evaluar hipótesis, no datos. Veamos un ejemplo artificial pero ilustra-
tivo.
Los poliedros regulares —aquellos sólidos limitados por figuras
planas todas las cuales son iguales— son exactamente cinco: tetrae-
dro (4 caras, triángulos equiláteros); hexaedro (6 caras, todos cuadra-

dos): octaedro (8 caras, triángulos equiláteros); dodecaedro (12 caras,
todos son pentágonos) e icosaedro (20 caras, triángulos equiláteros).
Suponga que se tiene un ejemplar de cada tipo y que sus caras están
numeradas a la manera de un dado (del 1 al 4; del 1 al 6; etc.). La
Figura 6.6 muestra la representación gráfica de los mencionados po-
liedros.
Figura 6.6. Representación de los 5 poliedros regulares existentes.
Supongamos que sabemos que un sujeto ha elegido uno de esos 5

poliedros al azar y que lo ha lanzado. ¿Cuál es la probabilidad de que
el resultado sea un 3? ¿Y cuál la de que sea un 7?
De la teoría elemental de probabilidades es fácil deducir que esos
valores son 0,014 y 0,052. Si además, supiéramos que el dado lanza-
do fue, digamos, el tetraedro, entonces las probabilidades en cuestión
serían respectivamente 0,25 y 0,00. Estos resultados corresponden a
la llamada «probabilidad directa».
Pero lo que normalmente interesa a un investigador es la «probabi-
lidad inversa»; no es, como se ha dicho, valorar cuán probable es lo
que se observó en el supuesto de que se cumple determinada hipóte-
sis, sino lo contrario: dado lo que se observó, cuán probable es que
ello sea debido a determinada explicación posible. En este caso, su-
pongamos que se sabe que el resultado del lanzamiento fue un 5; las
preguntas relevantes pudieran ser: ¿Cuál es la probabilidad de que el
poliedro elegido por el sujeto haya sido el tetraedro? ¿Cuál la de que
haya sido el octaedro? O más generalmente, ¿qué probabilidad tiene
cada una de las cinco hipótesis de ser la verdadera a la vista del núme-
ro observado?
Aquí viene en nuestra ayuda nuevamente el Teorema de Bayes. Como

se explica en el Anexo 6.4, si A1, A2, A3, ···, Ak son k sucesos mutua-
mente excluyentes, uno de los cuales ha de ocurrir necesariamente;
otra forma en que suele expresarse la regla o Teorema de Bayes es:
Por ejemplo,en el caso de que se quiera conocer la probabilidad de

que se haya lanzado el octaedro, supuesto que el número entre 1 y 20
que se observó es r, la fórmula [6.10] asume la forma siguiente:
donde las iniciales T, H, O, D e I representan respectivamente al te-

traedro, hexaedro, octaedro, dodecaedro, e icosaedro. Consecuente-
mente, aceptando que la elección del poliedro fue al azar, y por tanto
que la probabilidades iniciales de cada uno de ellos fueron iguales
(0,2 en todos los casos), al aplicar la fórmula se tiene P(O|5)=0,294.
Ahora bien, si nos dijeran que un niño tomó un poliedro regular
que se hallaba entre sus juguetes, es obvio que el supuesto de equi-
probabilidad entre todos los poliedros posibles es bastante absurdo.
Todos sabemos que pocos niños tendrán dados que no sean de 6 ca-
ras, y que casi todos tendrán uno de ese tipo. La propuesta de una
distribución plausible quizás exigiría de la opinión de un «experto en
juguetes infantiles», pero cualquier mente sensata admitirá que sería
más razonable, por ejemplo, suponer a priori que:
P(T)=0,025 P(H)=0,9 P(O)=0,025 P(D)=0,025 P(I)=0,025

En ese caso, tendríamos:
En la vida real, las hipótesis pueden ser muchas, incluso infinitas.

El enfoque bayesiano encara el problema de una manera similar aun-
que con otro grado de complejidad, claro está, que desborda el nivel
de la semblanza que aquí se quiere ofrecer.
Bayes y la subjetividad
Como hemos visto, si bien la subjetividad entraña riesgos no despre-

ciables, su presencia en el ámbito de la investigación resulta inevitable,
y la inferencia estadística convencional depende vital y congénitamen-
te de los juicios subjetivos de quienes la emplean: todo hace suponer
que nos hallamos en un callejón sin salida. Pero cabe preguntarse: ¿exis-
te una alternativa estadística capaz de conjurar las amenazas
incontroladas de la subjetividad? ¿Existe una solución que la acepte (y
hasta la explote con provecho), a la vez que no desdeñe la zona objeti-
va de nuestros datos e incorpore la teoría de probabilidades para colocar
nuestros conocimientos en una debida perspectiva relativizadora? La
respuesta a estas preguntas es afirmativa.
Se trataría de contar con un método que combine las evidencias
subjetivamente acumuladas con la información concreta obtenida
de un experimento u observación en particular. Lo ideal sería que,
además, ese método fuera consistente con las demandas de la in-
tuición; y mucho mejor aún sería que, finalmente, el modo en que
participe la subjetividad del investigador se pudiera comunicar for-
mal, explícita y claramente, con lo que se daría un aporte adicional
de transparencia al proceso. Los métodos bayesianos se precian de po-
seer todos estos atributos.
El enfoque bayesiano se perfila como un nuevo paradigma inferen-

cial para la estadística. Usamos el término «paradigma» perfectamente
concientes de su carácter polémico. Su introducción por el epistemó-
logo Thomas Kuhn ha dado lugar a no pocas y enconadas controversias,
pero es una noción que consideramos enteramente apropiada en este
contexto, pues a nuestro juicio estamos básicamente en la situación
descrita por él: un sistema de ideas y convicciones con claros sínto-
mas de agotamiento y la consecuente necesidad de renovarlo (Kuhn,
1962). De hecho, no casualmente la expresión «bayesian paradigm»
aparece en miles de páginas de Internet.
En esos mismos términos se expresan Press y Tanur (2001) cuan-
do señalan que «Muchos científicos creen ahora que un cambio de
paradigma en el sentido de Kuhn ha estado produciéndose en la ma-
nera en que la inferencia científica está y estará aplicándose». Una
detallada y documentada reflexión sobre el tema puede encontrarse
en Almenara et al. (2003).
La manera de razonar de la inferencia bayesiana, radicalmente di-
ferente al enfoque clásico o frecuentista —el cual prescinde en lo
formal de toda información previa de la realidad que examina— es
sin embargo muy cercana al modo de proceder cotidiano, e inductivo,
de todos nosotros y, muy especialmente, de los clínicos.
Debe subrayarse que esta metodología, a diferencia de la conven-
cional o frecuentista, no tiene como finalidad producir una conclusión
dicotómica (significación o no significación, rechazo o aceptación)
sino que cualquier información empírica, combinada con el conoci-
miento que ya se tenga del problema que se estudia, «actualiza» dicho
conocimiento, y la trascendencia de tal visión actualizada no depen-
de de una regla mecánica. Por otra parte, la lógica subyacente en las
aplicaciones de la inferencia bayesiana no opera con una «hipótesis
nula» sino que valora diversas hipótesis rivales con las que pudiera
potencialmente explicarse lo que se ha observado.
Los métodos bayesianos han sido cuestionados argumentando que,
al consentir que se incorporen al proceso las creencias o expectativas
personales del investigador, se fertiliza un caldo de cultivo para cual-

quier arbitrariedad o manipulación de las cuales la inferencia clásica
estaría a salvo. Tal imputación, así formulada, es inválida por tres
razones (Silva y Suárez, 2000):
• el enfoque frecuentista está lejos de poder eludir las decisiones sub-

jetivas; como se fundamentó en la Sección 3.4; la subjetividad es
un fenómeno inevitable, especialmente en un marco de incertidum-
bre como en el que operan las ciencias biológicas y sociales;
• las «manipulaciones» son actos de deshonestidad, que pueden
producirse en cualquier entorno conceptual o práctico (inclu-
yendo la posibilidad de que se inventen datos), de modo que no
depende de la metodología empleada sino de la honradez o el
rigor de los investigadores;
• el enfoque bayesiano obliga a comunicar explícitamente cuál es
la participación de la subjetividad, con lo cual se dificulta que
ésta se maneje con «impunidad».
El análisis bayesiano, si bien constituye un complejo y polémico cami-

no, carente aún de arraigo generalizado en la comunidad biomédica, se
presenta como una de las vías más promisorias para satisfacer las diversas
demandas explícitas e implícitas que se han discutido en muchos puntos
de este libro. Tal es el planteamiento esencial del trabajo de Berger y
Berry (1988), autores que llaman a descartar la noción de que la estadís-
tica puede ser incontaminadamente objetiva, y a «abrazar la necesidad de
la subjetividad a través de la aproximación bayesiana, la cual puede con-
ducir a un análisis de datos más flexible, poderoso y comprensible».
Aplicaciones del enfoque bayesiano
Según comunican Wagenmakers y Grünwald (2006), a lo largo del

siglo pasado la presencia de métodos bayesianos en la literatura fue más
bien marginal, aunque con un crecimiento apreciable al final del mismo;

pero en lo que va del actual siglo XXI el proceso ha cambiado de patrón.
Por ejemplo, al menos el 30% de los artículos publicados en Journal of the
American Statistical Association se relacionan con métodos bayesianos (tie-
nen este término en el título o el resumen), una cifra ciertamente notable.
Es cierto que esto no se reproduce por igual en el área de las disciplinas
aplicadas, pero cabe esperar que éstas sigan la tendencia ya observada
en el ámbito de una revista como la mencionada por la simple razón de
que, a final de cuentas, los profesionales de la estadística trabajan su-
puestamente para beneficio práctico de las aplicaciones.
No obstante, la cantidad de ejemplos de índole muy diversa donde
se aplica el enfoque bayesiano es abrumadora. Ashby (2006) ha reali-
zado una detallada revisión del desarrollo del pensamiento bayesiano
en los últimos 25 años. Con varios cientos de citas y un pormenoriza-
do examen, muestra cómo de ser apenas mencionado hacia 1980, el
enfoque bayesiano incrementa su presencia impetuosamente durante
ese lapso en las más diversas áreas, tales como modelación espacial,
genética molecular, diagnóstico, datos perdidos, supervivencia y me-
taanálisis. Por otra parte, basta colocar el descriptor «bayesian» en
cualquier motor de búsqueda de Internet para comprobar que éste
devuelve unos 8 millones de sitios que incluyen el término9 (así fue
con en Google en junio de 2008). En castellano, los vocablos «bayesia-
no» y «bayesiana» acumulaban en esa fecha unas 340 mil entradas.
Desde luego, no todos los resultados que se obtendrán corresponden
a aplicaciones, ya que el tema tiene muchas connotaciones filosóficas
y aristas metodológicas que serán responsables de la aparición de mu-
chas de estas entradas.
Como se fundamenta excelentemente en Greenland (2006), prác-
ticamente todos los problemas que encara la epidemiología moderna
9
Nótese que, a diferencia de otras expresiones que tienen varias acepciones (como ocurre
por ejemplo con vocablos como «regresión», «significance», «variable», «parameter», etc.), el
término «bayesian» sólo puede aludir a algo relacionado con el célebre reverendo o su teoría.
pueden abordarse con los métodos bayesianos. En el programa infor-

mático EPIDAT anteriormente mencionado, se ofrecen soluciones
bayesianas para los más simples y comunes (estimación de medias y por-
centajes, comparación de estos mismos parámetros, análisis de tablas de
contingencia). Otros problemas exigen de programas considerablemente
más complicados, que consientan el empleo de técnicas de simulación y
métodos numéricos aproximados (de los cuales WINBUGS10, que pue-
de obtenerse gratuitamente en Internet, es sin duda el más connotado),
y a la vez se han venido desarrollando ideas en la línea de emplear los
resultados que arrojan aplicaciones informáticas convencionales como
SAS o BMDP para, debidamente reconsiderados, puedan interpretar-
se a la luz del enfoque bayesiano. El propio trabajo de Greenland
(2006) aporta valiosas ideas en esa dirección; mientras que en Wagen-
makers (2007) puede hallarse una brillante explicación e ilustración
en esa misma línea relacionada con la explotación del llamado Baye-
sian Information Criterion (BIC), introducido por Raftery (1995), basada
en las salidas de SPSS.
El campo de los ensayos clínicos ha visto una notable contribu-
ción por parte del enfoque bayesiano (Beckman, 2006), especialmente
a partir de los llamados ensayos ajustables, técnica conocida en inglés
como adaptive clinical trials (Berry, 2002). Se trata de aprovechar la
ductilidad que ofrece el enfoque bayesiano (que no está afectado por
la exigencia de la aproximación frecuentista de tener enteramente pre-
definido el diseño experimental para proceder al análisis) para ir
adaptando el progreso de un ensayo clínico teniendo en cuenta lo
acaecido en etapas previas. Explicaciones detalladas de esta idea pue-
den hallarse en Berry (2003 y 2005).
La creciente utilización del enfoque bayesiano en el análisis de
ensayos clínicos es manifiesta. De hecho, recientemente, la entidad
reguladora Food and Drug Administration (FDA) de Estados Unidos
10
Para acceder a una sencilla y expresiva introducción sobre WINBUGS, consúltese Fryback,
Stout y Rosenberg (2001).
ha venido impulsado con énfasis el empleo de este enfoque (véanse

Lowe, 2006 y el sitio http://www.fda.gov/cdrh/meetings/072706-
bayesian.html) como alternativa al enfoque clásico de las PSE, ya
muy difícil de sostener para la toma de decisiones de tanta trascen-
dencia como las que corresponden a dicha agencia.
Otras aplicaciones destacadas de las técnicas bayesianas en la ac-
tualidad son:
• La detección de mensajes electrónicos espurios (spam), un típi-

co problema de probabilidad inversa que opera sobre la base de
ir actualizando la probabilidad a posteriori de que un mensaje
específico, dado que exhibe ciertos rasgos, es efectivamente de
esta naturaleza. En virtud de su rapidísimo desarrollo, sobre este
tema hay, literalmente, millones de citas en Internet. No es, des-
de luego, para menos, ya que desde que el 3 de mayo de 1978 se
envió el primer «correo basura», el desarrollo de esta plaga ha
sido vertiginoso: según reporta Abril (2005), las tres cuartas
partes de los casi dos millones de mensajes que se emiten cada
segundo, caen en esta categoría. Recientemente, se han produ-
cido otros desarrollos en esta línea; el programa Stupid Filter,
por ejemplo, identifica comentarios, blogs o sitios donde abun-
dan faltas de ortografía, exceso de signos de puntuación o ciertas
onomatopeyas que confieran alta probabilidad al texto de ser
considerado «estúpido» (Criado, 2008).
• El desarrollo de sistemas expertos para optimizar el diagnóstico
y pronóstico de enfermedades, así como la optimización en la
toma de decisiones y la solución de problemas de causalidad,
todo a través de las llamadas redes bayesianas (otro tema de impe-
tuosa vivacidad sobre la que se puede hallar una verdadera jungla
de referencias).
• La solución de disputas sobre autoría a través de la llamada
estilometría. El ejemplo más emblemático quizás sea la solu-
ción bayesiana que dieron Mosteller y Wallace (1984) al debate
sobre la autoría de los llamados Federalist Papers, una serie de 85

artículos relacionados con la Constitución de Estados Unidos que
fueran publicados en periódicos neoyorquinos entre octubre de
1787 y agosto de 1788. Una aplicación interesante en esta línea
se ocupa de valorar cuáles de las 312 intervenciones radiofóni-
cas de Ronald Reagan habían sido escritas por él mismo, y cuáles
por sus asesores (Airoldi et al., 2006).
• El suavizamiento de mapas de morbilidad y mortalidad (véanse
Silva, Benavides y Vidal, 2003) para el manejo de tasas en áreas
pequeñas y la emergencia de patrones.
Con la presente reseña sobre la inferencia bayesiana se ha procurado

ofrecer, en apretada síntesis, una idea de lo que a mi juicio constituye
una importante avenida por la que habrá de transitar con prominencia
la investigación biomédica en los años venideros. Los conflictos y pro-
blemas pendientes de solución que hacen de esta actividad un complejo
laberinto son, como se ha visto, variados y numerosos; la estadística
bayesiana no es una solución mágica y universal, pero aporta una alter-
nativa extremadamente promisoria, en especial debido a su vocación
por la búsqueda de soluciones flexibles, a la vez que animada de un
espíritu de racionalidad.
ANEXO 6.1.
RESUMEN ESQUEMÁTICO DE LAS PRUEBAS DE SIGNIFICACIÓN, PRUE-
BAS DE HIPÓTESIS Y DE LAS PRUEBAS PROPIAS DE LA CONCILIACIÓN
DE AMBAS.
Para la exposición que sigue, llamaremos H0 a la hipótesis nula, HA

a la hipótesis alternativa, ∆ a cierto parámetro (por ejemplo, la verda-
dera diferencia entre dos medias poblacionales), D a un estimador de
∆ y d0 a un valor concreto asumido por esta variable aleatoria.
Pruebas de significación (Propuesta de Ronald Fisher)
• fijar una hipótesis nula (H0:∆=0)

• planificar una experiencia que permita observar D (estimar ∆)
• obtener un valor D=d0
• calcular la probabilidad condicional p=P(D=do|Ho) de haber
observado dicha diferencia d0 u otra mayor, supuesto que es
válida la hipótesis nula H0
• si p es muy pequeño, profundizar en el examen de las alter-
nativas para H0
Pruebas de hipótesis (Propuesta de Jerzy Neyman y Egon Pear-

son)
• Establecer una hipótesis nula (H0:∆=0) y una alternativa

(HA:∆=δ) con la perspectiva de decantarse por una o la otra
• Fijar cotas superiores para las probabilidades de incurrir en
los errores de primero y segundo tipo (α y β respectivamen-
te). Establecer la región crítica derivada de la decisión
precedente
• Realizar el experimento o la observación que arroja un valor
para D
• Observar si el valor que toma el estadígrafo cae o no en di-

cha región
• Aceptar H0 si no queda incluido, o HA en caso contrario
Pruebas basadas en el método combinado (Anónimo)
• Fijar una hipótesis nula (H0:∆=0)

• Planificar una experiencia que permita observar cierta dife-
rencia D
• Obtener un valor D=d0
• Calcular la probabilidad condicional p=P(D=do|Ho) de haber
observado dicha diferencia d0 u otra mayor, supuesto que es
válida la hipótesis nula
• Adoptar la decisión siguiente; si p es pequeña, entonces se
rechaza la validez de Ho; de lo contrario, no se rechaza
Nota: Típicamente, para decidir si p es "pequeña" se fija 0,05 como

umbral de comparación, pero en la actualidad a menudo los investiga-
dores se abstienen de fijar un α y lo que se hace es comunicar el valor p
obtenido para declarar que «la diferencia es significativa al nivel p» si
éste es inferior a 0,05.
ANEXO 6.2.
EJEMPLO QUE ILUSTRA EL EFECTO DE QUE OBSERVACIONES NO
REALIZADAS INTERVENGAN EN EL CÓMPUTO DE LOS VALORES P.
Imaginemos que se quiere valorar experimentalmente si una mone-

da está o no sesgada. Se trata de una situación en que hay dos
posibilidades: o bien la moneda ha sido manipulada (es «legal»), o ella
fue ligeramente doblada con una pinza a favor de que salga «cara» (la
superficie cóncava, si existe tal concavidad, correspondería a «cara»).
No es difícil demostrar que, siguiendo las reglas que se establecen
para computar p, el valor resultante puede diferir, incluso de manera
muy apreciable, para dos investigadores que obtuvieran exactamente
los mismos datos si éstos se derivan de diferentes planes experimen-
tales.
Llamamos π a la probabilidad de que al lanzarla se obtenga una
cara; entonces la hipótesis que se valora es Ho:π=0,5
Cierto investigador, llamémosle Sr. A, decide valorar tal hipótesis
luego de realizar 20 lanzamientos. Denotemos por D al número de
caras que obtiene. Los resultados posibles son 21 (D=0, D=1···,
D=20). Aplicando la definición de la distribución binomial tenemos:
donde
Es fácil corroborar que las probabilidades respectivas son las si-

guientes:
Si se obtienen d0 caras, el valor que ha de computarse es:
Supongamos que el resultado de los 20 lanzamientos es el que fi-

gura en la siguiente serie (donde «C» significa «cara» y «E» significa
«escudo»).
Es fácil apreciar que d0=12, de modo que se trata de computar
En efecto, recuérdese que el valor p es la probabilidad de lo que

ocurrió (d0=12) más la probabilidad de lo que podría haber ocurrido (su-
puesto que vale H0) en dirección opuesta a la hipótesis nula, de modo
que para calcularla hay que tener en cuenta los posibles valores de D
mayores que (d0=13, d0=14, ….). Es fácil corroborar que pA=0,25
(suma de los valores sombreados).
Supongamos que el Sr. B se traza un plan algo más complicado que
el del Sr. A: lanzar la moneda 10 veces y pronunciarse con esos datos,
salvo una excepción: que, habiéndose consumado esos 10 lanzamien-
tos, obtenga 5 caras y 5 escudos; en ese caso, y solo en ese caso, el Sr.
B hará otros 10 lanzamientos y basará entonces su dictamen en el
resultado de los 20 lanzamientos11. Ahora los desenlaces posibles son
sólo 16. Por una parte, pueden producirse los 5 valores de D que van
del 0 al 4 (que se obtendrían si el número de caras resultantes en los
primeros 10 lanzamientos fuera inferior a 5). También es posible el
resultado D=5 (se produce cuando ese es el número de caras en la
primera serie y no sale ninguna cara en los 10 lanzamientos subsi-
guientes). Adicionalmente se pueden producir los 5 valores que van
del 6 al 10; para cada uno de ellos hay dos posibilidades. Por ejemplo,
el 7 será el valor de D si se obtienen 7 caras en la primera serie o si
11
Nótese que en este punto es irrelevante detenernos en las razones que el Sr. B tiene para
haberse trazado tan extraño diseño. En lo que hay que reparar es en la encrucijada conceptual
que por su conducto se pone de manifiesto y lo que importa ahora es que el diseño está bien
definido y, cualquiera sea el resultado, dicho analista va a computar el valor de p usando la
definición establecida.
ésta arroja 5 caras y luego se obtienen sólo 2 más en la segunda).

Finalmente, están los valores que van de 11 a 15, sólo posibles si la
primera serie arroja exactamente 5 caras y la segunda aporta las res-
tantes (por ejemplo, D = 12 si salen 5 caras en la primera y 7 en la
segunda).
El cómputo de las probabilidades respectivas ofrece una pequeña difi-
cultad algebraica, pero no es difícil convencerse de que, si llamamos:
λ=0,510 y (para j:0, 1, ···,10)
las fórmulas para calcularlas son las siguientes:
La tabla siguiente contiene esos 16 posibles desenlaces y sus res-

pectivas probabilidades.
Supongamos ahora que el Sr. B inicia su experiencia con los prime-

ros 10 lanzamientos y obtiene lo siguiente:
Puesto que obtuvo 5 caras y 5 escudos, de acuerdo con su plan,

lanza la moneda otras 10 veces. Supongamos que esta segunda tanda
discurre del modo siguiente:
El Sr. B obtuvo 5 caras en los primeros 10 lanzamientos y 7 en los

otros 10. De modo que d0=12. Al igual que el Sr. A, tiene que calcular
p=P(D12| π =0,5). Pero para B, esta expresión asume el valor
PB=λ2F5(F7+F8+F9+F10). Haciendo ese cálculo o, equivalentemente,
sumando los valores sombreados en la tabla, se constatará que
PB=0,04.
Supongamos ahora que el Sr. C, quien ignora los planes experimen-
tales de los Señores A y B, está presenciando los experimentos. Él
observa que, físicamente, los dos analistas hacen exactamente lo mis-
mo: ambos lanzan 20 veces seguidas la moneda y van registrando los
resultados. También observa que ambos obtienen exactamente lo mis-
mo12 (los mismos resultados:12 caras y 8 escudos). Pero se enteraría
con estupor de que las respectivas conclusiones serían completamen-
te divergentes, ya que los dos valores de p ¡son radicalmente diferen-
tes!
Tal realidad es profundamente chocante, ya que las experiencias
de los señores A y B sólo difieren en lo que ellos tienen dentro de sus
respectivas cabezas.
12
Incluso en el mismo orden, aunque este es irrelevante.
Además de ilustrar la notable dependencia que el valor p tiene de

elementos subjetivos, que no se relacionan en absoluto con lo que se
ha observado ni antes ni durante la experiencia, el ejemplo ayuda a
comprender mejor la interpretación frecuentista que le corresponde
(de hecho, la única posible).
Figura 6.7. La ambivalencia de p.
Estamos, en síntesis, ante la "paradoja" de que los valores p son

muy diferentes, los cuales podrían producir conclusiones notoriamen-
te distintas.
Pero lo cierto es que la realidad es como es; por definición, ella
nunca puede ser paradójica. Cuando percibimos algo como paradóji-
co, siempre será debido a que ese algo choca con algún prejuicio o una
convicción errónea consolidada en nuestra propia mente. ¿Cuál es en
este caso tal convicción y dónde radica nuestro error? El quid del
asunto estriba en que regularmente, cuando computamos un valor p,
nos olvidamos de que su interpretación correcta entraña no sólo lo
que ha ocurrido sino también lo que podría haber ocurrido. Aprecia-
mos instintivamente el valor p como una medida de la evidencia y no
como lo que es: una estimación de la frecuencia con que algo ocurre o
pudiera ocurrir si repitiéramos muchas veces cierto experimento u ob-
servación. La notable diferencia entre Pa y Pb es exclusivamente debi-
da a que los experimentadores tenían diferentes representaciones
mentales de cuáles podrían ser los resultados si el experimento fuera
repetido.
En términos resumidos, el problema consiste en que p no es una
medida de la evidencia asociada a una experiencia concreta que per-
mita enjuiciar la realidad que la produjo, y la embrollada situación se
disipa tan pronto reparamos en que lo que p describe es un comporta-
miento "a la larga", de modo que no es válida nuestra inclinación a
aquilatar por su conducto el significado "a la corta" del resultado ex-
perimental. Consecuentemente, tampoco lo es la práctica de rechazar
o no una hipótesis en dependencia de la magnitud de p.
ANEXO 6.3.
PRUEBA E ILUSTRACIÓN PRÁCTICA DE QUE EL VALOR DE P SE
PUEDE HACER TAN PEQUEÑA COMO SE QUIERA AUMENTANDO EL
TAMAÑO MUESTRAL.
Benavides y Silva (2000) plantean un escenario en que ciertos in-

vestigadores tienen razones teóricas e indicios empíricos nacidos del
trabajo de enfermería para pensar que los pacientes afectados por que-
maduras se recuperan más rápidamente cuando el tratamiento combina
cierta crema antiséptica con un apósito hidrocoloide que cuando se
utiliza la crema antiséptica solamente.
Con el fin de contrastar esta conjetura diseñan un experimento
animados por la esperanza de rechazar la hipótesis nula que afirma
que el tratamiento simple es tan efectivo como el combinado. La ex-
periencia es muy simple: se tienen n pacientes; aleatoriamente se eli-
gen n/2 para ser tratados con la combinación de crema antiséptica y
apósito hidrocoloide, en tanto que a los n/2 restantes se les aplica el
tratamiento convencional (crema solamente). La hipótesis nula afir-
ma que las tasas verdaderas de recuperación son idénticas: H0:P1=P2
Una vez obtenido el dato (porcentajes estimados de recuperación
en uno y otro grupo, p1 y p2, y su diferencia, d0=P1-P2), se calcula el
valor p asociado a ese resultado bajo H0.
Nuevamente, aunque en el momento del estudio pudiéramos no sa-
berlo con certeza, casi con entera seguridad ocurrirá que la verdadera
diferencia no es exactamente igual a cero. Puesto que los tratamientos
son objetivamente distintos, sería insólito que los porcentajes fueran
exactamente iguales (de hecho, el estudio se emprende porque sobran
motivos para creer que hay una diferencia apreciable). Supongamos que
los resultados son los que se recogen en la Tabla 6.9.
Tabla 6.9. Resultados de un ECC para valorar mejoría según

dos tratamientos para quemados.
El valor del estadístico será igual a al cual co-

rresponderá un valor p igual al área bajo la densidad de una distribu-
ción Ji Cuadrado con un grado de libertad y a la derecha de tal y
como refleja la Figura 6.4.
Figura 6.8. Función de densidad de una distribución Ji Cuadrado con 1 gl.

Obviamente, cuanto mayor sea , menor será el valor de p. Como

es bien sabido, si el tamaño muestral es bastante grande se tendrá que
y . Es fácil probar que será un número mayor que 0
salvo en el impensable caso de que estos dos números fueran exacta-
mente iguales. Y por otra parte, es evidente que no hay razón alguna
para pensar que P1 sea igual a P2.
Supongamos que se aumenta el tamaño muestral de manera que la
experiencia se realiza con un tamaño n*=λn, donde λ>1.
La Tabla 6.9, salvo fluctuaciones casuales inesenciales, pasará a
tener la estructura de la Tabla 6.10.
Tabla 6.10. Resultados de un ECC para valorar mejoría según dos tratamientos para
quemados con un tamaño de muestra veces mayor.
Es fácil comprobar entonces que:
En síntesis: aumentando λ veces el tamaño muestral, el valor de Ji

Cuadrado será λ veces mayor. Consecuentemente, incrementando el
valor de λ (es decir, aumentando el tamaño muestral) convenientemen-
te, se obtendrá un valor p (área a la derecha del valor observado) tan
pequeño como se quiera.
ANEXO 6.4.
DERIVACIÓN DE LA REGLA DE BAYES.
Si se tienen dos sucesos A y B, la probabilidad condicional de A dado

B, como es bien conocido, se define del modo siguiente:
Análogamente, se tiene que
de modo que, sustituyendo esta expresión en

P(A∩B)=P(B|A)P(A),
llegamos a la forma más simple de expresar la regla de Bayes:
Ahora bien, supongamos que A1, A2, A3,···, Ak son k sucesos mu-
tuamente excluyentes, uno de los cuales ha de ocurrir necesariamen-
te; entonces la conocida (e intuitiva) ley de la probabilidad total esta-
blece que
De modo que, tomando el suceso Aj en lugar de A en la fórmula y

aplicando al denominador la mencionada ley, tenemos:
BIBLIOGRAFÍA
20 minutos. La mitad de los fallecidos en la carretera no llevaban

cinturón. Periódico 20 Minutos del 23 de noviembre, 2003. Madrid.
Abelson RP. On the surprising longevity of flogged horses: Why there
is a case for the significance test. Psychological Science 1997; 8:12-15.
Abramson JH. Survey methods in community medicine: Epidemiological stu-
dies, program evaluation, clinical trials. 40 ed, Edinburgh: Churchill
Livingstone. 1990.
Abril G. 30 años recibiendo ‘spam’. Periódico El País del 3 de mayo,
2005. Madrid.
Agüero RE et al. Efecto antitumoral de los AINES en el melanoma
b16f1. Estudio en ratones de la cepa c57bl/6. Acta Científica Vene-
zolana 1997; 48:79.
Airoldi EM et al. Who wrote Ronald Reagan’s radio addresses? Baye-
sian Analysis 2006; 1:289-320.
Albert J. The Numbers Guy. Periódico Wall Street Journal del 7 de di-
ciembre, 2007. Nueva York.
Almenara J et al. Historia de la bioestadística: la génesis, la normalidad y la
crisis. Cádiz: Quórum SA. 2003.
Altman DG, Goodman SN, Schroter S. How statistical expertise is
used in medical research. Journal of the American Medical Association
2002; 287:2817-2820.
Anderson DR, Burnham KP. Avoiding pitfalls when using informa-
tion-theoretic methods. Journal of Wildlife Management 2002;
66:912-918.
Angus JA et al. The Iraq deaths study was valid and correct. Periódico
The Age del 21 de octubre, 2006. Sidney.
Arbuthnot J. An argument for divine providence taken from the cons-
tant regularity in the births of both sexes. Philosophical Transactions
of the Royal Society 1710; 27:186-190.
Ashby D. Bayesian statistics in medicine: A 25 year review. Statistics in
Medicine 2006; 25:3589-3631.
Astin PC et al. Testing multiple statistical hypothesis resulted in spurious

associations: a study of astrological signs and health. Journal of Clinical
Epidemiology 2006; 59:964-969.
Bakan D. The test of significance in psychological research. Psychologi-
cal Bulletin 1966; 66:423-437.
Barnett ML, Mathisen A. Tyranny of the p-value: The conflict bet-
ween statistical significance and common sense. Guest Editorial.
Journal of Dental Research. 1997; 76:534-536.
Bayarri MJ, Berger JO. Hypothesis testing and model selection. Acce-
sible en www.stat.duke.edu/~berger/talks/valencia7.ps en agosto
de 2007. 2002.
Beach ML. Statistics for the clinician. Anesthesiology 2001; 29:21-29.
Beckman M. Are Bayes’ days upon us? Statistical methods could chan-
ge the conduct of clinical trials. Journal of the National Cancer Insititute
2006; 98:1512-1513.
Bellhouse DR. Probability and statistics ideas in the classroom-les-
sons from history. Invited session on «Using the history of statistics
to improve the teaching of statistics». Presentado en el Joint Statis-
tical Meetings in San Francisco, California, August 7. 2003.
Benavides A, Silva LC. Contra la sumisión estadística: un apunte so-
bre las pruebas de significación. Metas de Enfermería 2000; 3:35-40.
Berger JO, Berry DA. Statistical analysis and the illusion of objectivi-
ty. The American Scientist 1988; 76:159-165.
Berkson J. Tests of significance considered as evidence. Journal of the
American Statistical Association 1942; 37:325-335.
Berry DA. Adaptive clinical trials and Bayesian statistics. Pharmnaceu-
tical Report 2002; 9:1-11.
Berry DA. Statistical ininovations in cancer research. En Kufe DW et
al. eds. Cancer medicine, Sexta Edición. London: BC Decker, 2003;
465-478.
Berry DA. Introduction to Bayesian methods I: Use and interpreta-
tion of Bayesian tools in design and analysis. Clinical Trials 2005;
2:295-300.
Bitnun A. Serum lipids, glucose homeostasis and abdominal adipose tis-

sue distribution in protease inhibitor-treated and naive HIV-infected
children. AIDS 2003; 17:1319-1327.
Browne M. Cross-validation methods. Journal of Mathematical Psycholo-
gy 2000; 44:108-132.
Bunce D, Kivipelto M, Wahlin A. Utilization of cognitive support in
episodic free recall as a function of apolipoprotein e and vitamin
b12 or folate among adults aged 75 years and older. Neuropsychology
2004; 18:362-370.
Burnham KP, Anderson DR (2002). Model selection and multimodel
inference: A practical information-theoretic approach (2nd ed.).
New York: Springer Verlag.
Burnham G et al. Mortality after the 2003 invasion of Iraq: a cross-
sectional cluster sample survey. The Lancet 2006; 368:1421-1428.
Callahan JL, Reio TG. Making subjective judgments in quantitative
studies: The importance of using effect sizes and confidence inter-
vals. Human Resource Development Quarterly 2006; 17:159-173.
Carver RP. The case against statistical significance testing. Harvard
Educaction Review 1978; 48:378-99.
Chatfield C. Avoiding statistical pitfalls. Statistical Science 1991; 6:240-
268.
Chia KS. «Significantitis» –an obsession with the p-value. Scandina-
vian Journal of Work and Environmental Health 1997; 23:152-154.
Chow SL. Statistical significance. Rationale, validity and utility. Londres:
Sage. 1996.
Christensen R. Testing Fisher, Neyman, Pearson, and Bayes. The Ame-
rican Statistician 2005; 59:121-126.
Clark ML. Los valores P y los intervalos de confianza: ¿en qué con-
fiar? Revista Panamericana de Salud Pública /Pan American Journal of
Public Health 2004; 15:293-296.
Clarke M, Chalmers I. Discussion sections in reports of controlled trials
published in general medical journals: islands in search of continents?
Journal of the American Medical Association 1998; 280:280-282.
Cobo E. Estadística para no estadísticos. Barcelona: Eada Gestion. 1993.

Cockburn A. How the New England Journal of Medicine undercounted
Iraqi civilian deaths Accesible en http://www.counterpunch.org/
andrew01122008.html en junio de 2008.
Cohen J. Things I have learned (so far). American Psychologist 1990;
45:1304-1312.
Cohen J. The earth is round (p < .05). American Psychologist 1994; 49:997-
1003.
Criado MA. Un filtro para frenar la estupidez. Periódico Publico del 30
de marzo, 2008. Madrid.
Daniel LG. Statistical significance testing: A historical overview of
misuse and misinterpretation with implications for the editorial poli-
cies of educational journals. Research in the Schools 1998; 5:23-32.
Delgado M et al.Algunos factores de riesgo para la mortalidad neona-
tal en un hospital de III nivel, Popayán. Colombia Médica 2003; 34:
179-185
Efron B, Tibshirani R. Improvements on cross-validation: The: 632+
bootstrap method. Journal of the American Statistical Association 1997;
92:548-560.
Feinstein AR. Clinical Epidemiology: The architecture of clinical research.
Philadelphia: W.B. Saunders Company. 1985.
Fienberg SE. When did bayesian inference become «Bayesian»? Baye-
sian Analysis 2006; 1:1-40.
Fidler F et al. Editors can lead researchers to confidence intervals, but
can’t make them think: statistical reform lessons from medicine.
Psychology Science 2004; 15:119-126.
Finch S et al. Reform of statistical inference in psychology: The case
of Memory & Cognition. Behavior Research Methods, Instruments &
Computers 2004; 36:312-324.
Fisher RA. The statistical method in psychical research. Proceedings of
the Society for Psychical Research 1929; 39:189-192.
Fisher RA. The design of experiments. New York: Hafner. 1935.
Fisher RA. Statistical methods and scientific induction. Journal of the

Royal Statististical Society 1955; B 17:69-78.
Fisher RA. Statistical methods and scientific inference. New York: Hafner.
1956.
Freedman L. Bayesian statistical methods. A natural way to assess evi-
dence (Editorial). Bristish Medical Journal 1996; 313:569-570.
Fryback DG, Stout NK, Rosenberg MA. An elementary introduction
to Bayesian computing using WINBUGS. International Journal of
Technology Assessment in Helath Care 2001; 17:98-113.
García FM. Popper, el contraste de hipótesis y el método crítico. Re-
vista Cubana de Salud Pública 2003; 29:52-60.
Gardner MJ, Altman DG. Confidence intervals rather than P values:
estimation rather than hypothesis testing. British Medical Journal
1986; 292:746-750.
Gigerenzer G, Krauss S, Vitouch O. The null ritual: What you always
wanted to know about significance testing but were afraid to ask.
En: David Kaplan (ed). The Handbook of Methodology for the
Social Sciences. 2004. (cap.21).
Gill J. Bayesian methods: A social and behavioral sciences approach. Boca
Raton (FL): CRC Press. 2002.
Gill J. Grappling with Fisher’s legacy in social science hypothesis tes-
ting. Journal de la Société Française de Statistique. Accesible en
psblade.ucdavis.edu/papers/denis.pdf en agosto de 2007. 2004.
Gliner JA, Leech NL, Morgan GA. Problems with null hipótesis signi-
ficance testing (NHST): What do the textbooks say? The Journal of
Experimental Education 2002; 71(1):83-92.
Goodman SN. Toward evidence-based medical statistics (I): The p
value fallacy. Annals of Internal Medicine 1999; 130:995-1004.
Goodman SN. Introduction to Bayesian methods III: Measuring the
strength of evidence. Clinical Trials 2005; 2:282-290.
Greenwald AG et al. Effect sizes and p-values: what should be repor-
ted and what should be replicated? Psychophysiology 1996;
33:175-183.
Greenland S. Bayesian perspectives for epidemiological research: I.

Foundations and basic methods. International Journal of Epidemiolo-
gy 2006; 35:765-777.
Greenland S. Multiple-comparisons problems are real—and common.
International Journal of Epidemiology 2008; 37:430-434.
Grunkemeyer GL, Payne N. Bayesian analysis: A new statistical para-
digm for new technology. The Annals of Thoracic Surgery 2002; 74:
1901-1908.
Guthery FS, Lusk JJ, Peterson MJ. The fall of the null hypothesis:
liabilities and opportunities. Journal of Wildlife Management 2001;
65:379-384.
Guyatt GH, Mills EJ, Elbourne D. In the era of systematic reviews,
does the size of an individual trial still matter? PLoS Med 2008;
5(1):e4.
Hacking I. La domesticación del azar. La erosión del determinismo y el naci-
miento de las ciencias del caos. Barcelona: Gedisa Editorial. 1995.
Haller H, Krauss S. Misinterpretations of significance: A problem stu-
dents share with their teachers? Methods of Psychological Research
Online 2002; 7:1-20.
Halpern SD, Karlawish JH, Berlin JA. The continuing unethical con-
duct of underpowered clinical trials. Journal of the American Medical
Association 2002; 288:358-362.
intercessory prayer on outcomes in patients admitted to the co-
ronary care unit. Archives of Internal Medicine 1999; 159:2273-2278.
Hervada X et al. EPIDAT 3.0 Programa para análisis epidemiológico de
datos tabulados. Revista Española de Salud Pública 2004; 78:277-280.
Heyes S, Hardy M, Humphreys P, Rookes P. Starting Statistics. En:
Psychology and Education. 2nd Edn, London: Weidenfeld & Nicol-
son. 1993
Hopkins WG. How to write a literature review. Sportscience 3. Acce-
sible en: www.sportsci.org/jour/9901/wghreview.html en agosto
de 2007. 1999.
Hopkins WG. A new view of statistics. Internet Society for Sport Scien-
ce. Accesible en: http://www.sportsci.org/resource/stats/ en agosto
de 2007. 2000.
Howard GS, Maxwell SE, Fleming KJ. The proof of the pudding:
an illustration of the relative strengths of null hypothesis, meta-
analysis, and Bayesian analysis. Psychological Methods 2000;
5:315-332.
Howson C, Urbach P. Scientific reasoning: The Bayesian approach. (3rd.
ed.). Chicago: Open Court. 2006.
Iraq Family Health Survey Study Group. Violence-Related Mortality in
Iraq from 2002 to 2006. The New England Journal of Medicine 2008;
358:484-493.
Jaynes ET. Probability theory: The logic of science. Cambridge, UK: Cam-
bridge University Press. 2003
Johnson DH. Hypothesis testing: statistics as pseudoscience. Fifth Annual
Conference of the Wildlife Society, Buffalo, New York, September
1998; 22–26.
Killeen PR. An alternative to null-hypothesis significance tests. Psy-
chological Science 12005; 6:345-353.
Killeen PR. Beyond statistical inference: A decision theory for scien-
ce. Psychonomic Bulletin and Review 2006; 13:549-562.
Kowatch RA et al. Effect size of lithium, divalproex sodium, and
carbamazepine in children and adolescents with bipolar disorder.
Journal of the American Academy of Child and Adolescent Psychiatry
2000; 39:713-720.
Kuhn TS. The structure of scientific revolutions. Chicago: University of
Chicago Press. 1962.
Lecoutre B. Training students and researchers in Bayesian methods
for experimental data analysis. Journal of Data Science 2006; 4:207-
232.
Lipset SM, Trow MA, Coleman JS. Statistical problems. Apéndice 1-
B de Union Democracy, Glencoe, Illinois: Free Press. 1956.
Loftus GR. On the tyranny of hypothesis testing in the social scien-

ces. Contemporary Psychology 1991; 36:102-105.
Lowe D. FDA Shows Interest in 18th Century Presbyterian Minister.
Periódico Medical Progress Today del 19 de enero. 2006.
Marks HM. Rigorous uncertainty: why RA Fisher is important. Inter-
national Journal of Epidemiology 2003; 32:932-937.
Marshall S. Testing with confidence: The use (and misuse) of confi-
dence intervals in biomedical research. Journal of Science and Medicine in
Sport 2004; 7:135-137.
Matthews JR. Quantification and the quest for medical certainty. Princeton:
Princeton University Press. 1995.
Matthews RA. Significance levels for the assessment of anomalous phe-
nomena. Journal of Scientific Exploration 1999; 13:1-7.
Matthews RA. Facts versus Factions: the use and abuse of subjectivity in
scientific research. European Science and Environment Forum Wor-
king Paper; reprinted in Rethinking Risk and the Precautionary
Principle. Ed: Morris, J. Oxford: Butterworth. 2000.
McCloskey DN, Ziliak ST. The standard error of regressions. Journal
of Economic Literature 1996; 34:97-114.
Meinert CL. Clinical trials: design, conduct, and analysis. New York: Oxford
University Press. 1986.
Mitra A. Role of antidepressant fluoxetine in the puva treatment of
psoriasis vulgaris. Indian Journal of Dermatology, Venereology and Le-
prology 2001; 67:292-293
Mosteller F, Wallace DL. Applied Bayesian and Classical Inference: The Case
of The Federalist Papers. New York: Springer-Verlag. 1984.
Neave N, et al. Water ingestion improves subjective alertness, but has
no effect on cognitive performance in dehydrated healthy young
volunteers. Appetite 2001; 37:255-256.
Nester MR. An applied statistician’s creed. Applied Statistics 1996;
45:401-410.
Neyman J, Pearson ES. On the problem of the most efficient tests of
statistical hypotheses. Philosophical Transactions of the Royal Society,

Series A. 1933; 231:289-337.
Nickerson RS. Null hypothesis significance testing: a review of an old
and continuing controversy. Psychological Methods 2000; 5:241-301.
Nix TW, Barnette JJ. The data analysis dilemma: ban or abandon. A
review of null hypothesis significance testing. Research in the Schools
1998; 5:3-14.
O’Connor JJ, Robertson EF. Thomas Bayes Accesible en http://www-
groups.dcs.st-and.ac.uk/~history/Biographies/Bayes.html en
agosto de 2007. 2000.
O’Hagan A, Forster J. Kendall’s advanced theory of statistics vol. 2B: Ba-
yesian inference (2nd ed.). London: Arnold. 2004.
Perich P et al. Desarrollo de diabetes mellitus en pacientes con tolerancia
a la glucosa alterada. Seguimiento de 18 años. Revista Cubana de Endo-
crinología 2002; 13:101-109.
Perneger TV. What’s wrong with Bonferroni adjustments? British Me-
dical Journal 1998: 316:1236-1238.
Pigliucci M. Hypothesis testing and the nature of skeptical investigatio-
ns. Skeptical Inquirer. Accesible en: http://www.findarticles.com/p/
articles/mi_m2843/is_6_26 en agosto de 2007. 2002.
Pocock SJ. Clinical trials: a practical approach. Chichester: Wiley. 1983.
Press SJ, Tanur JM. The subjectivity of scientists and the Bayesian approach.
New York: Wiley. 2001.
Prieto L, Herranz I. ¿Qué significa estadísticamente significativo? La falacia del
criterio del 5% en la investigación científica. Madrid: Díaz de Santos. 2005.
Radin D. The conscious universe: the scientific truth of psychic phenomena. San
Francisco: Harper. 1997.
Radin D, Ferrari DC. Effects of consciousness on the fall of dice: A
metaanalysis. Journal of Scientific Exploration 1991; 5:61-83.
Raftery AE. Bayesian model selection in social research. En: PV Mar-
sden (ed.), Sociological methodology (pp. 111-196). Cambridge:
Blackwells. 1995.
Rossi JS. A case study in the failure of psychology as a cumulative
science: The spontaneous recovery of verbal learning. En: LL Har-

low, SA Mulaik, JH Steiger (eds.). What if there were no significance
tests? Hillsdale, NJ: Erlbaum. 1977. (pp. 175-197).
Rothman KJ. No adjustments are needed for multiple comparisons.
Epidemiology 1990; 1:43-46.
Rothman KJ, Greenland S. Epidemiología moderna. Madrid: Díaz de San-
tos. 1999.
Royall RM. Statistical evidence: A likelihood paradigm. Chapman & Hall/
CRC. 1997.
Rozeboom WW. The fallacy of the null hypothesis sig-nificance test.
Psychological Bulletin 1960; 56:26-47.
Rozeboom WW. Good science is abductive, not hypothetico-deductive.
En: LL Harlow, SA Mulaik, JH Steiger (eds.). What if there were no
significance tests? (pp. 335-391). Hillsdale, NJ: Erlbaum. 1997.
Rushton SP, Ormerod SJ, Kerby G. New paradigms for modelling spe-
cies’ distributions? Journal of Applied Ecology 2004; 41:193-200.
Sackett DL. Bias in analytic research. Journal of Chronic Diseases 1993;
32:51-57.
Sackett DL, Cook DJ. Can we learn anything from small trials? Annals
of the New York Academy of Science 1993; 703:25-31.
Sarria M, Silva LC. Las pruebas de significación estadística en tres
revistas biomédicas: una revisión crítica. Revista Panamericana de
Salud Pública 2004; 15:300-306.
Savage IR. Nonparametric statistics. Journal of the American Statistical
Association 1957; 52:332-333.
Savitz DA, Olshan AF. Multiple comparisons and related issues in
epidemiologic research. American Journal of Epidemiology 1995;
142:904908.
Schmidt FL. Statistical significance testing and cumulative knowled-
ge in psychology: implications for training of researchers. Psychological Methods
1996; 1:115-129.
Senn S. Two cheers for p-values and two cheers for Bayes. Journal of
Epidemiology and Biostatistics 2001; 6:193-210.
Silva LC. Excursión a la regresión logística. Madrid: Díaz de Santos. 1995.

Silva LC. Los peligros del lenguaje estadístico. En: Locutora J, editor.
De la idea a la palabra. Cómo preparar, elaborar y difundir una comunica-
ción científica. Barcelona: Publicaciones Permanyer. 2003.
Silva LC. Una ceremonia estadística para identificar factores de ries-
go. Revista Salud Colectiva 2005; 1:329-342.
Silva LC. Los límites de las pruebas de significación estadística y los
valores p. Actualización en Medicina de Familia 2008; 4:62-63.
Silva LC, Benavides A, Almenara J. El péndulo bayesiano: crónica de
una polémica estadística. Llull 2002; 25:109-128.
Silva LC, Benavides A, Vidal CL. Análisis espacial de la mortalidad
en áreas geográficas pequeñas. El enfoque bayesiano. Revista Cu-
bana de Salud Pública 2003; 29:314-322.
Silva LC, Suárez P. ¿Qué es la inferencia bayesiana? Jano Profesional
2000; 58(1338):65-66.
Smith GD. Uncertainty and significance. International Journal of Epide-
miology 2003; 32:683-685.
Smith LD et al. Psychology without p values. Data analysis at the turn
of the 19th century. American Psychologist 2000; 55:260-263.
Spiegelhalter DJ et al. An introduction to bayesian methods in heal-
thy technology assessment. The British Medical Journal 1999;
319:508-512.
Stearns PN. Why study History essay from the American Historical
Association historians. Accesible en: http://www.org/pubs/free/
WhyStudyHistory.htm en agosto de 2007. 2003.
Thompson B. The use of statistical significance tests in research:
Bootstrap and other alternatives. Journal of Experimental Education
1993; 6:361-377.
Thompson B. In praise of brilliance: Where that praise really belongs.
American Psychologist 1998; 53:799-800.
Thompson B. Various editorial policies regarding statistical significance

tests and effect sizes. Accesible en: http://www.coe.tamu.edu/
~bthompson en agosto de 2007. 2003.
Tryon WW. The inscrutable null hypothesis. American Psychologist 1998;
53:796.
Villapadierna R. Dios es bastante probable. Periódico ABC del 28 de
diciembre, 2006. Madrid.
Wagenmakers EJ, Grünwald P. A Bayesian perspective on hypothesis
testing. Psychological Science 2006; 17:641-642.
Wagenmakers EJ. A practical solution to the pervasive problems of p
values. Psychonomic Bulletin and Review 2007; 14:779-804.
Williams RH et al. On the intellectual versatility of Karl Pearson.
Human Nature Review 2003; 3:296-301.
Wilkinson L. Task force on statistical inference. Statistical methods
in psychology journals. American Psychologist 1999; 54:594-604.
Yudkowsky E. An intuitive explanation of bayesian reasoning. Acce-
sible en: http://yudkowsky.net/bayes/bayes.html en agosto de
2007. 2003.
Zabalegui A et al. Influencia de la hemoglobina glicosilada sobre el
control de la diabetes en el área de salud V de Navarra. Anales del
Sistema Sanitario de Navarra Suplemento 1997; 2:175
Zou KH et al. Hypothesis testing I: Proportions. Radiology 2003;
226:609-613.
481
7
Índice onomástico
Abelson RP, 406, 468 Astin JA, 302, 341,
Abramson JH, 376, 468 Astin PC, 402, 469
Ábrego E, 319, 344 Atiénzar E, 131, 158
Abril G, 453, 468 Ayllón JD, 282, 286
Adamenko AA, 147-148, 158 Bacchetti P, 333, 341
Adams M, 40, 102 Baena JM, 319, 341
Agüero RE, 383, 468 Bagiella E, 307, 346
Ahmed I, 314, 344 Bakan D, 308, 341, 372, 469
Airoldi EM, 454, 468 Baker R, 278, 285
Akhtar N, 270, 286 Baquedano FJ, 172, 206
Albert J, 376, 468 Barcat JA, 262, 286
Alegría A, 319, 341 Bar-Hillel M, 89, 102
Alemany E, 131, 158 Barnes DE, 22, 102
Al-Marzouki S, 270, 286 Barnett ML, 389, 469
Almeida N, 199, 206 Barnette JJ, 412, 476
Almenara J, 353, 366, 412, 426, 449, 468, Barroso I, 272, 290, 301, 322, 324, 345
478 Baudrillard J, 117, 158
Alonso JC, 332, 346 Bayarri MJ, 409, 469
Alper P, 40, 102 Beach ML, 372, 402, 469
Als-Nielsen B, 49, 102 Beaglehole R, 320, 341
Althusser L, 113, 123-124, 158 Beckman M, 452, 469
Altman DG, 415, 416, 423, 468, 472 Bellhouse DR, 349, 469
Álvarez J, 145, 158 Benavides A, 172, 208, 318, 345, 366,
Ameneiro J, 131, 134, 158 426, 454, 464, 469, 478
Anderson DR, 348, 419, 468, 470 Benet M, 145, 161
Angell M, 22-24, 102, 320 Benford F, 279-288
Angus JA, 421, 468 Bensen H, 314, 341
Arbuthnot J, 350, 468 Berger JO, 197, 206, 409, 450, 469
Aréchaga JM, 51, 52, 102 Berkson J, 372, 469
Arévalo JM, 172, 206 Berlin JA, 395, 473
Armstrong D, 20, 102 Bernal E, 9, 11, 108
Arribas C, 29, 101 Bernal J, 182, 206
Ashby D, 451, 468 Bero LA, 22, 49, 102, 104
481
Berry DA, 197, 206, 450, 452, 469 Carey B, 11, 102, 314, 341
Best LA, 351, 478 Carey RG, 279, 287
Best N, 278, 291 Carlston M, 251, 286, 308, 342
Bitnun A, 379, 470 Carver RP, 360, 470
Blech J, 28-31, 102 Cassels A, 24, 28, 107
Bloomfield HH, 13, 106 Castells M, 58, 59, 103
Bodenheimer T, 48, 102 Castro A, 131, 144, 162
Bogdan R, 200, 208 Cebrián JL, 69, 103
Bolsin S, 278, 286 Cereijido M, 2, 103
Bolton RJ, 270, 273, 286 Cervera J, 56, 103
Bombardier C, 42, 103 Cervera P, 9, 11, 108
Bonita R, 320, 341 Cevasco M, 32, 104
Boseley S, 22, 103 Chalmers I, 391, 470
Bradlow E, 269, 286 Chambers CD, 19, 104
Branagan MA, 17, 108 Charlton BG, 295, 342
Bratman S, 239, 286 Chatfield C, 385, 470
Breen L, 262, 286 Chia KS, 381, 470
Breggin GR, 8, 103 Cho MK, 49, 104
Breggin P, 8, 104 Chow SL, 356, 47
Breilh J, 285, 328, 341 Christensen R, 356, 470
Brickmont J, 126, 162 Clark ML, 411, 470
Broad W, 267, 286 Clarke M, 391, 470
Brown RJC, 284, 287 Cobo E, 428, 471
Browne M, 419, 470 Cockburn A, 422, 471
Brownlee S, 13, 106 Cohen J, 362-364, 380, 471
Bunce D, 379, 470 Cohen LS, 19-20, 103
Bunge M, 3, 103, 114, 126, 161, 203- Coleman JS, 388, 474
206, 211-212, 262, 287, 341 Coleman V, 41, 104
Burmeister LF, 17, 108 Collazo C, 216, 286
Burnham G, 421, 470 Collins HM, 113, 158
Burnham KP, 348, 419, 421, 468, 470 Colson M, 278, 286
Bustamante J, 64, 69, 103 Cook DJ, 395, 477
Bustos R, 173, 206 Cornu C, 253, 287
Buyse M, 270, 287 Coyle S, 49, 104
Byrd RC, 305, 341 Criado MA, 453, 471
Callahan JL, 423, 470 Cucherat M, 256, 287
Capanna P, 80, 103 Dadidoff F, 255, 287
Cárdenas S, 319, 344 Daniel LG, 363, 471
ÍNDICE ONOMÁSTICO 483
Dausset J, 3, 104 Ferrari DC, 408, 476

Davenas E, 256-260, 287 Feyerabend P, 187, 206
Davidson JRT, 15, 16, 104 Feynman RP, 190, 206
Davidson RA, 49, 104 Fidler F, 411, 471
Daw J, 29, 104 Fienberg SE, 427, 471
De Angelis CD, 47, 104 Finch S, 414, 471
de Irala J, 299, 342 Fischer CS, 151, 159
de la Osa E, 251, 288 Fisher RA, 151-153, 276, 288-290, 352-
de Melo O, 131, 137 356, 357-358, 365-372, 378, 390, 445,
Delgado M, 379, 471 455, 470-472, 475
Desdín LF, 131, 136, 137, 158 Fleming KJ, 389, 396, 474
Devereaux PJ, 37, 104 Follari R, 127, 159
Devlin M, 262, 287 Fontanarosa PB, 47, 104
Di Trochio F, 158, 257, 263, 288 Forster J, 427, 476
Díaz H, 113, 159 Fraser S, 151, 159
Díaz OL, 318, 342 Freedman L, 433, 472
Diekmann A, 284, 288 Fryback DG, 452, 472
Doblin BH, 33, 110 Fuertes J, 319, 342
Donohue JM, 32, 104 García FM, 356, 472
Doval HC, 49, 104 Gardner MJ, 416, 423, 472
Drosnin M, 221-236, 288 Gérvas J, 34, 105
Durtschi C, 284, 288 Gigerenzer G, 364, 472
Efron B, 419, 471 Giles J, 63, 105
Ehgartner B, 24, 106 Gill J, 348, 427, 472
Eisenberg DM, 237, 287 Gimenoa D, 319, 342
Elbourne D, 389, 473 Gliner JA, 406, 472
Endicott J, 29, 104 Goldblatt P, 278, 285
Ercegovac Z, 262, 28 González A, 131, 134, 136, 159
Ernest E, 302, 341 González R, 472, 476
Ernst E, 255, 290 Good CB, 45, 105
Evans RG, 328, 342 Goodman SN, 360, 370, 390, 413, 415-
Evans S, 43, 109, 270, 288 417, 435, 468, 472
Farthir M, 263, 289 Gor F, 339, 342
Feinstein AR, 294, 414, 471 Gould SJ, 151, 159
Fenton NE, 203, 206 Greenland S, 294, 402, 428, 451-452,
Fernández A, 62, 105 473, 477
Fernández L, 131, 159 Greenwald AG, 415, 472
Ferrado ML, 12, 105 Grimes DA, 196, 207, 333, 345
Gross P, 126, 159 Hollon MF, 33, 105

Groves T, 340, 344 Holton G, 189-190, 206
Gruber RP, 262, 288 Hopkins WG, 397, 410, 473, 474
Grünwald P, 450, 479 Hosmer DW, 332, 343
Grunkemeyer GL, 420, 473 Howard GS, 389, 396, 474
Gualdoni F, 92, 105 Howson C, 371, 474
Guillén F, 299, 342 Hubbard B, 24, 105
Gurvitch G, 199, 206 Humphreys P, 361, 473
Guthery FS, 412, 473 Illich I, 4-5, 105
Guthrie D, 415, 472 Ingenieros J, 134, 160
Guttman L, 326, 342 Introna L, 262, 288
Guyatt GH, 389, 473 Ioannidis JPA, 192-193, 206
Hacking I, 428, 473 Irigaray L, 116-117, 160
Hair JF, 272, 287 Jara M, 24, 105
Hall S, 314, 344 Jaynes ET, 427, 474
Haller H, 360, 410, 473 Johnson C, 24, 25, 41, 107
Halpern SD, 395, 473 Johnson DH, 413, 474
Hand DJ, 270, 273, 286 Jones DR, 278, 286
Hardy M, 361, 473 Jones K, 199, 206
Harkness E, 302, 341 Judson FH, 263, 289
Harris G, 11, 103, Karlawish JH, 395, 473
Harris RJ, 415, 472 Kastelein JJP, 36, 39, 105
Harris WS, 193, 206, 302-313, 342, 409, Katime I, 263, 290
473 Kelley CL, 45, 106
Hart C, 131, 136, 159 Kerby G, 412, 477
Hauptman R, 266, 287 Killeen PR, 418, 419, 474
Hayes N, 262, 287 Kilty KT, 86, 105
Heath I, 30, 107 Kirsch I, 11-13, 105, 107
Henry D, 27, 30, 107 Kitiagorodski A, 165, 207
Hernández A, 76, 105 Kivipelto M, 379, 470
Hernández PL, 145, 153, 159 Kjellström T, 320, 341
Herranz I, 407, 476 Klar J, 332, 343
Herrnstein RJ, 150, 159, 276, 288 Kleinbaum DG, 324, 342
Hervada X, 433, 473 Klijnen J, 208, 254
Heyes S, 361, 473 Knipschild P, 254, 288
Hill TP, 284, 288 Koertge N, 127, 160
Hillison W, 284, 288 Kondro W, 10, 106
Hobsbawn E, 119, 159 Kooshkghazi M, 270, 285
Kowatch RA, 378, 474 Lock S, 263, 288

Kramer P, 12, 105 Loftus GR, 348, 414, 475
Krauss S, 360, 364, 472, 473 López S, 318, 343
Kronmal RA, 45, 46, 107 Lord FM, 325, 343
Kuhn TS, 449, 474 Lowe D, 453, 475
Kupper LL, 324, 342 Lusk JJ, 412, 473
Lacan J, 113-116, 123-127, 158, 160 Lwanga SK, 332, 343
Lacasse JR, 8, 105 Maassen M, 262, 285
Lakatos I, 184, 207 MacTaggart L, 24, 105
Landart JM, 90, 105 Maddox J, 257-259, 288
Landsberg PT, 312, 342 Marko D, 319, 342
Laney D, 279, 288 Marks HM, 368, 390, 475
Langbein K, 24, 105 Marmor TR, 328, 342
Laporte JR, 44, 105 Marrugat J, 332, 343
Lasprilla E, 247, 252, 288 Marshall S, 411, 475
Latour B, 113, 125, 160 Martínez D, 50, 105
Laudan L, 118-119, 160 Martínez CA, 319, 342
Laumann EO, 32, 105 Martínez MA, 299, 342
Laurance J, 12, 105 Mathisen A, 389, 469
Le Fanu J, 295, 343 Matthews JR, 413, 475
Leamer EE, 326, 343 Matthews R, 284, 288
Lecoutre, 384, 474 Matthews RA, 195, 207, 410, 445, 475
Lee PR, 24, 108 Maxwell SE, 389, 396, 474
Leech NL, 406, 472 Mc Cabe DL, 262, 288
Leibovici L, 311-313, 343 Mc Closkey DN, 311, 343, 381, 475
Lemeshow S, 332, 343 Mc Entegart DJ, 284, 290
Lenzer J, 13, 105 Mc Kay B, 232, 234, 288
Leo J, 8, 105 Mc Williams P, 13, 105
Levchook YN, 147-148, 158 Meadows J, 185, 207
Lévi-Strauss C, 112, 160 Medawar P, 268, 288
Levitt N, 126, 159 Meinert CL, 395, 475
Lewis M, 126, 159 Mejía JM, 331, 332, 344
Lexchin J, 49, 105 Melander H, 9, 105
Linde K, 255-256, 288 Melchart D, 256, 288
Lipset SM, 388, 474 Melville A, 24, 25, 41, 106
Lizarralde E, 319, 343 Meza AM, 319, 344
Lleó A, 318, 343 Midence C, 114, 139, 160
Llop JM, 319, 343 Mills EJ, 389, 473
Mintzes B, 29, 107 Ovejero F, 157, 160

Mirowski P, 48, 107 Pacini C, 284, 288
Mitra AB, 379, 475 Paik A, 32, 106
Mohammed MA, 279, 289 Pande PN, 307, 344
Moncrieff J, 11, 107 Park A, 40, 108
Morgan GA, 406, 472 Park RL, 129, 130, 142, 160, 179, 207,
Morris LB, 328, 342 209, 217, 263, 290, 329
Mosteller F, 453, 475 Paulos JA, 91, 108, 178-179, 207
Moynihan R, 24, 27-28, 30, 107 Pavesi M, 332, 343
Mucchielli A, 200, 207 Payer L, 27, 108
Muller KE, 340, 344 Payne D, 267, 290
Müllner M, 324, 342 Payne N, 420, 473
Murray C, 150, 159, 276, 288 Pearson ES, 274, 351-356, 368, 369-
Muntaner C, 151, 160 370, 455, 470, 475, 479
Myers DG, 88, 107 Peiró S, 9, 11, 108
Navarro C, 44, 107 Perancho I, 6, 108
Neave N, 379, 475 Peregil F, 97, 108
Neil M, 203, 206 Perera A, 145, 159
Nester MR, 397, 413, 475 Perera M, 282, 286
Newcomb S, 279, 280, 289 Pérez C, 200, 207
Neyman J, 354-356, 368-370, 455, 470, Perich P, 379, 476
475 Perneger TV, 402, 476
Nickerson RS, 383, 476 Peterson MJ, 412, 473
Nieto A, 49, 107 Piegorsch WW, 276, 289
Nieto FJ, 151, 160 Pigliucci M, 408-409, 476
Nigrini MJ, 284, 289 Pignarre P, 24, 108
Nix TW, 412, 476 Pitkin RM, 17, 108
Nizam A, 324, 342 Pocock SJ, 395, 476
Nordfors M, 13, 106 Poitevin B, 243, 257, 259-261, 289
Núñez M, 44, 107 Pollack R, 26, 108
O'Connor JJ, 427, 476 Ponce AL, 319, 344
O'Campo P, 151, 160 Poole R, 49, 110
O'Hagan A, 427, 476 Popper KR, 112-113, 141, 160, 355-
Olshan AF, 402, 477 356, 472
Olvera R, 173, 207 Porter P, 200, 207
Orbera L, 131, 160 Pradas T, 131, 161
Ormerod SJ, 412, 477 Press SJ, 185-186, 207, 449, 476
Ortiz F, 238, 290 Prieto L, 407, 476
Psaty BM, 45, 46, 108 Rushton SP, 412, 477

Quintana CA, 210, 290 Sabadell MA, 178, 208, 261, 291
Radin D, 408, 476 Sackett DL, 294, 376, 395, 477
Raftery AE, 452, 476 Said E, 123, 127, 161
Randi J, 258, 259, 289 Salles G, 131, 144, 162
Rebullido PD, 145, 161 Salomone M, 263, 290
Recabarren A, 319, 344 Salsburg D, 153, 161
Reio TG, 423, 470 Sanz VJ, 178, 208, 261, 291
Resch KL, 255, 290 Sarria M, 414, 477
Reventós L, 63, 109 Savage IR, 373, 477
Richardson JV, 262, 288 Savitz DA, 402, 477
Ríos A, 319, 344 Schmidt FL, 378, 477
Rips E, 219-220, 226-227, 232-235, 291 Schroter S, 415, 468
Rispau A, 327, 344 Schulz KF, 207, 333, 345
Robbins B, 122, 161 Schulz PC, 263, 290
Roberts I, 340, 346 Schwarz MJ, 82, 83, 109
Roberts L, 314, 344 Senn S, 348, 477
Robertson EF, 427, 476 Serroni R, 114, 161
Robinson ET, 200, 208 Shamos MH, 76, 109
Rodríguez A, 319, 344 Shang A, 256, 289
Rodríguez B, 18, 109, 161 Shapiro MF, 33, 110
Romero G, 299, 344 Shapiro R, 237, 290
Rookes P, 361, 473 Shaw B, 59, 157
Rosales M, 319, 344 Shaw IF, 200, 207
Rosas M, 319, 344 Shermer M, 139, 161
Roselló M, 319, 345 Shuchman M, 48, 109
Rosen RC, 32, 106 Sibbad B, 10, 106
Rosenberg MA, 219, 220, 232, 234, Silva LC, 77, 90, 94, 99, 109, 112, 130,
235, 291 145, 151, 154, 161, 164, 172, 178,
Rosenberg Y, 452, 472 188, 196, 198, 207-208, 216, 242,
Rosenthal MB, 32, 104 257, 272, 290, 293-294, 296, 301,
Ross JS, 46, 109 308, 315, 318, 322, 324, 329-332,
Rossi JS, 376, 476 337, 345, 356, 366, 375, 378, 381,
Rothman JK, 294, 332, 345, 402, 412, 384, 400, 414, 418, 426, 450, 454,
428, 477 464, 469, 477, 478
Rothman KE, 43, 109 Silverman M, 24, 109
Royall RM, 356, 371, 477 Sloan RP, 307, 346
Rozeboom WW, 348, 380, 477 Smith GD, 411, 478
Smith LD, 351, 478 Van Horn R, 48, 107

Smith R, 32, 43, 48, 109, 135, 340, 346 Verdonck K, 319, 346
Sokal A, 114, 119-127, 139, 159, 161- Vessuri H, 144, 162
162, 187 Vickers J, 312, 342
Sosa M, 174, 208 Vidal CL, 454, 478
Sosa U, 130-133, 136, 138, 139-140, Vila J, 332, 343
144, 146-147, 152, 154, 160, 162, Villanueva P, 33, 110
Spiegelhalter DJ, 278-279, 291, 390, 478 Villapadierna R, 428, 479
Stearns PN, 349, 478 Vitouch O, 364, 472
Stelfox HT, 22, 49, 109 Wade N, 267, 286
Stewart WW, 258-259, 289 Wagenmakers EJ, 429, 450, 452, 479
Stillman EC, 284, 291 Wahlin A, 379, 470
Stout NK, 452, 472 Walker J, 91, 110
Suárez P, 332, 346, 450, 478 Wallace DL, 453, 475
Szabo A, 262, 291 Warn J, 270, 291
Tanner L, 192, 208 Waxman H, 45, 110
Tanur JM, 185-186, 207-449, 476 Weaver D, 264, 291
Taubes G, 142, 162, 294, 320, 346 Wells F, 263, 289
Taylor RN, 284, 291 Wilkes MS, 33, 110
Taylor SJ, 200, 208 Wilkinson L, 411, 479
Tellería C, 178, 208, 261, 291 Williams RH, 352, 479
ter Riet G, 254, 289 Wilson EO, 164, 208
Terceiro JB, 65, 70, 110 Winner L, 5, 110
Thompson B, 374, 388, 411, 478, 479 Wise J, 178, 208
Tibshirani R, 419, 471 Wittington CJ, 17, 110
Tolley EE, 200, 208 Witztum D, 219-220, 235, 290
Trow MA, 388, 474 Wolfe A, 33, 110
Tryon WW, 409, 479 Wolfe SM, 65, 110
Tucher WH, 275, 291 Woodall WH, 279, 291
Tungaraza T, 49, 110 Woolgar S, 113, 160
Turner EH, 21, 49, 110 Yudkowsky E, 441, 479
Ulin PR, 200, 208 Yusuf S, 37, 104
Ulloa A, 145, 153, 159 Zabalegui A, 404, 479
Underwood J, 262, 291 Ziliak ST, 381, 475
Urbach P, 371, 474 Zou KH, 363, 479
Valerio M, 26, 110, 267, 291 Zweig S, 191, 208
Van der Does W, 309, 346
489
8
Índice de materias
Analfabetismo informático, 69 Cuotas de sexo y edad, 335, 338
Anumerismo, 91 Datos aberrantes, 196, 271-272
Asociación entre variables, 171, 299-301, Debate científico, 130-132, 149, 154-155
313-327, 402-405 Demoscopia, 99, 336
Bayes, Thomas, 427-429 Depresión, 8-9, 12, 15-16, 20, 31, 131,
Bayesian information criterion, 452 327, 397
Burt, Ciryl, 263, 273-278 Diferencia significativa, 176, 310, 400-401,
Bondad de ajuste, 398-400 431
Bonferroni, 401-402 Disease mongering, 27
Brainstorming, 199 Efecto
Bunge, Mario, 3, 114, 126, 203-204, 211- piramidal, 134, 138-139
212, 262 placebo, 78, 153, 179, 180, 247, 255
Causalidad, 174, 298-300, 318, 326-327, significativo, 383
453 Encuestas, 66-68, 92-100, 174, 199, 334,
Ciencia alternativa, 118 337-338
Ciencia y tecnología, 2-3 Endpoint, 37-39, 42
Código de la Biblia, 220-235 Energía piramidal, 129-130, 134-138, 143,
Coeficiente 147, 151, 153
de concordancia, 403-404 Enfoque bayesiano, 203, 391, 407-408,
de correlación, 274, 300, 321, 353, 429-439, 445, 448-452
372, 403-406 Ensayos clínicos, 9-12, 21-23, 36-38, 42,
Congruencia temporal, 299 46, 48, 144, 178, 181, 194, 254-256,
Control de variables, 321 268-270, 300-302, 312, 377, 384, 391-
Correo electrónico, 56, 59, 71 395, 401, 452
Criptomnesia, 262 Epidat, 387, 433, 452
Criterio Epistemología, 111, 129, 163, 247
de autoridad, 145-146, 149 Especificidad, 442-444
de información de Akaike, 419 Espiritismo, 80-81
Contract Research Organization, 48, 106 Estadística
Cuestionarios, 67, 167-168, 200, 327 bayesiana, 203, 255, 385, 391, 407-
Cultura científica, 2, 22, 56, 60, 65, 75, 409, 416, 419, 426-433, 437-439,
79, 100, 164 445, 448-454
489
frecuentista, 201, 205, 255, 348, 371, Historia de la estadística, 124, 142, 155,
419, 421, 429-433, 445, 449-452, 263, 350-355, 388, 414
462 Homeopatía, 178, 180, 239-257, 260-261
Estilometría, 453 Horóscopo, 76
Estructuralismo, 112-113 Industria farmacéutica, 6, 10, 20-29, 35,
Estudios 40-41, 47-48, 259-261
de casos y controles, 19, 301, 317, Inhibidores selectivos de la recaptación
327 de serotonina, 6, 8, 15, 29, 31
experimentales, 44 Internet, 50, 53, 55-60, 64-66, 67, 71-72,
repetidos, 267 81, 85, 91, 131, 142, 146, 147-148,
Ética, 69, 122, 129, 151, 153, 157, 262, 262-263, 317-318, 340, 389, 391, 449,
267, 352, 395 451-453
Exceso de mortalidad, 276 Intervalo
Experimentación, 78, 153, 297, 300, 395, de confianza, 34, 192, 311, 364, 385,
434 388, 411, 416-419, 424, 431-433
Explicación y predicción, 316, 324-326 de probabilidad, 433
Factor Investigación científica, 3, 47, 163, 164,
de Bayes, 435 169, 174, 211, 241, 314, 384, 445
de confusión, 299, 315 ISRS, 6-12, 17, 19-21, 31
de impacto, 51-52, 110, 254 Lacan, Jackes, 113, 115, 116, 123-127
de riesgo, 297-298, 316, 325 Ley
predictivo, 316 de Avogrado, 258
Falsabilidad, 141 de Benford, 278-284
Fichas técnicas, 334-339 de individualización, 245, 254
Fisher, Ronald, 151, 153, 276, 352-358, de los grandes números, 400, 425
365-370, 372, 378, 390, 445, 455 de similitud, 245
Fraude científico, 10-11, 13, 35, 38, 42- Lilly, 12, 17, 29, 31
44, 130, 133, 181, 210, 235, 259-276, Linux, 60, 64
284 Lógica del debate, 139, 143
Frecuentismo, 201, 205, 255, 348, 371, Marcador de riesgo, 298, 322
419, 421, 429-433, 445, 449-452, 462 Marco teórico, 164, 174, 210, 241, 330,
Fusión fría, 141-142, 148-149 391
Gardasil, 34 Medicamentos esenciales, 23, 107
Glaxo, 10-11, 17, 20 Medicina
Grupo de Vancouver, 411, 414 alopática, 244, 248
Hahnemann, Samuel, 242-243 alternativa, 237-239
Hierba de San Juan, 14-16 basada en la evidencia, 33, 178, 314
ÍNDICE DE MATERIAS 491
no convencional, 236-237 Postmodernismo, 114, 117, 120, 125

tradicional, 237 Potencia
Merck, 30, 34-47 de una dilusión, 245-246
Metaanálisis, 12, 17, 196, 394-395, 451 de una prueba, 376, 378-379, 394,
Método 396
boosstrap, 419 Prácticas médicas alternativas, 217, 236-
combinado, 351, 369-370, 456 239, 251, 312,
de secuencias equidistantes, 222 Predicción, 316, 323-326
de las sumas acumuladas, 278 Pregunta de investigación, 166
Metodología cualitativa, 173, 198-200 Prensa, 22, 76, 91-100, 149, 192, 209,
Microsoft, 64, 73, 283 334-340, 428
Millikan, Robert, 188-190 Prescripción, 8, 16
Modelo Principio
ELPS, 340 de máxima indeterminación, 343-
multivariado, 301, 315, 320, 326-328, 346
profundo, 317-320 de parsimonia, 323
Movimiento escéptico, 213 Probabilidad
Newcomb, Simon, 279-280 a posteriori, 430, 436, 439, 453
Neyman, Jerzy, 354-356, 368-370, 455 a priori, 428, 430, 433, 436, 439, 443
Nihilismo, 132 inversa, 435, 437, 453
Objetividad, 46, 184-187, 191-199, 225, subjetivas, 201
260, 391, 395 Problema
Objetivos de investigación, 167 de investigación, 164-165
Observación aberrante, 196, 271-272 de la inferencia inversa, 361, 429
Ontología, 128 de comparaciones múltiples, 401
Outliers, 196, 271-272 Promoción de la enfermedad, 27-29
Paradigmas, 175, 241, 411, 415, 433, 449 Proyecto de investigación, 52, 166
Parapsicología, 192, 408 Prozac, 7, 12, 29, 31
Park, Robert, 40, 129, 130, 142, 179, 209, Prueba
217, 263, 329 de hipótesis, 195, 198, 349, 351, 355,
Pearson, Egon, 354-355, 455 369, 381, 401, 455
Pearson, Karl, 351-354 diagnóstica, 442-443
Peer review, 33, 51, 65, 120-121, 233 de significación, 191-193, 306, 308-
Piramidoterapia, 131, 239 309, 311-314, 317, 320-321, 347-
Plausibilidad biológica, 255, 298, 354, 351, 354-357, 361-365, 373-377,
370, 402 380-391, 394-401, 403, 406-419,
PLoS Medicine, 8, 12, 27, 52-54 423, 426, 429, 431, 433, 453, 455
Políticas editoriales, 410
Pseudociencia, 3, 75, 91, 133, 165, 209- Thomson Scientific, 51, 52, 110
219, 235, 243, 413 Transposición de condicionantes, 360-
Redes bayesianas, 453 361
Regresión Valores p, 34, 315-316, 347-349, 354-366,
paso a paso, 318, 321-329 369-375, 383, 385, 389-395, 401-402,
logística, 301, 315, 327, 400 407-413, 417, 421-424, 443-456, 457-
Resultados y conclusiones, 174-177, 196, 459, 462-466
389-391 Valores predictivos de una prueba, 443
Rituales metodológicos, 293, 297, 301, Versomilitud, 300, 358, 362, 438
307, 316-318, 329-331, 333, 362, 375, Vioxx, 39, 42-45
413 Watson, James, 149-150
Selección algorítmica de modelos, 322- Wikipedia, 60-63
329 Winbugs, 452
Semmelweiss, Ignatz, 141, 190-191
Sensibilidad, 442-444
Sesgos 9, 21, 43, 49, 66, 171, 255, 269,
299-300, 303, 375, 409
Significación
cualitativa, 396
estadística, 37, 191, 193, 308, 347,
356, 363, 382-383, 396, 402, 406
Sokal, Alan, 114, 119-127, 139, 187
Spam, 74, 453
Stepwise regresion, 326
Suavizamiento de mapas, 454
Subjetividad, 183, 185-191, 195-200, 275,
331-332, 391, 395-96, 407, 430, 448,
450
Tamaño de muestra, 97, 196, 330-337,
372- 379, 385-391, 395, 397, 399-400,
403, 404, 409, 422-425, 466
Técnica de validación cruzada, 419
Tecnologías médicas emergentes, 177
Telekinesis, 148, 408-409
Telepatía, 310, 408
Teorema de Bayes, 205, 428, 430, 433,
435, 438, 440-444, 447
Teoría de los biorritmos, 213-218
ISBN: 978-84-7978-896·4
L7.

La Investigacion Biomedica y Sus Laberintos - Silva Ayçaguer

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Investigacion Biomedica y Sus Laberintos - Silva Ayçaguer

Cargado por

Copyright:

Formatos disponibles

I

II LA INVESTIGACIÓN BIOMÉDICA Y SUS LABERINTOS

Luis Carlos Silva Ayçaguer

© Luis Carlos Silva Ayçaguer, 2009

«No está permitida la reproducción total o parcial de este libro, ni su

Ediciones Díaz de Santos

Fotocomposición: P55 Servicios Culturales

Printed in Spain - Impreso en España

A Maite, por aparecer.

A mi amigo Urra, por estar siempre cuando y

A mi hijo Daniel, por recordarme a diario lo

Hay quienes observan la realidad tal cual es

Prólogo ............................................................................................. XIX

Introducción ................................................................................ XXVII

1. Incultura científica: una amenaza en la

– El nuevo conocimiento ¿vuelve a ser de todos

2. Imposturas y sinrazones en el diálogo

El legado de Ronald Fisher ................................................ 151

3. El camino hacia el nuevo conocimiento .......................... 163

4. Los enemigos de la ciencia .................................................. 209

– Un dislate bíblico ................................................................. 219

5. Adocenamiento y ceremonias metodológicas ................... 293

6. Valores p y pruebas de significación

Antecedentes ....................................................................... 350

– Los intervalos de confianza como sucedáneos ............... 418

Índice onomástico ....................................................................... 481

Índice de materias ....................................................................... 489

El error ignora la crítica, la mentira le teme;

El lenguaje ha de ser matemático, geométrico, escultórico.

Estas dos profundamente reveladoras citas notables capturan,

parte, como el mismo autor admite, precursor del actual— alude

la actividad científica; es también la racionalidad el conjuro contra

Swan— la estadística y las ciencias probabilísticas aplicadas son el

entrañar las ceremonias metodológicas y, en particular, los rituales

ficos y la sociedad son obra y gracia de un peculiar conglomerado

En el centro —que no en el final— de todo laberinto6 está la

Me permitiré comenzar con una breve reflexión que explique el

Luego de tres decenios trabajando en materia de investigación

Aunque no faltan las advertencias en la bibliografía más reflexi-

La Habana, septiembre de 2008

LA INCULTURA CIENTÍFICA DE LA SOCIEDAD

Vivimos en una sociedad científicamente inculta. No me refiero

ciencia sea parte medular de la cultura, cuando en realidad es a mi jui-

CIENCIA VERSUS TECNOLOGÍA

"La mera enunciación del tema ciencia y tecnología pone de manifies-

Ahora bien, el estrecho nexo entre ciencia y tecnología, no sólo

a diferencia de los productos tecnológicos, los conocimientos no son,

truir las condiciones ambientales y culturales para que la gente disfru-

2005), la epidemia del uso de fármacos se despliega en numerosos

VIAJE AL CENTRO DE LA DEPRESIÓN

Consideremos en lo que sigue el caso de una única gama de pro-

(ISRS). Se trata de fármacos de diseño que bloquean la recaptación

Figura 1.1. El deprimente destino de los automovilistas.

¿Sobre qué bases ha alcanzado el Zoloft tan notable éxito comer-

En primer lugar porque, como es bien conocido, la depresión es

Lo que se dice, lo que se oculta

Luego de algunas exitosas escaramuzas legales y mediáticas protago-

Figura 1.2. Zoloft y suicidio.

En este punto, cabe preguntarse, ¿fue la propia industria farmacéuti-

de sus ganancias a partir de lo que el comerciante paga por cada acce-

"La información útil para decidir si un medicamento es beneficioso o

En el corto lapso transcurrido desde los hechos relatados, los moti-

Pero el sustrato científico para los ISRS no ha dejado de resquebra-