Está en la página 1de 20

Filosofía de las Ciencias 2023 Prof.

Alejandro Cassini

Clase teórica N° 12

La confirmación de las teorías científicas (II)

La teoría de la confirmación de Hempel

En 1945, en un artículo que marcó una época, titulado “Studies in the Logic of
Confirmation”, Carl Gustav Hempel formuló una teoría cualitativa de la confirmación
diferente de la hipotético-deductiva. La teoría de Hempel no es deductivista, sino
inductivista y admite, por tanto, que una hipótesis pueda ser confirmada por evidencias
que no se deducen de ella. Hempel pretendía construir una teoría cuantitativa del grado
de confirmación, pero consideró que era conveniente comenzar por una teoría cualitativa
que estableciera ciertas condiciones de adecuación lo suficientemente generales como
para que pudieran aplicarse también a cualquier concepto cuantitativo de confirmación.
Las condiciones de adecuación, cuando se las considera aisladamente, parecen todas
razonables e intuitivas, pero conjuntamente dieron lugar a consecuencias inaceptables que
se conocen desde entonces como las paradojas de la confirmación.

Las condiciones de adecuación que Hempel propuso son las cinco siguientes.

1. Condición de implicación: si E ⊨ H, entonces, E confirma H.

Esta condición parece inobjetable, ya que si una evidencia implica una hipótesis,
la verifica, por tanto, a fortiori también la confirma. No obstante, rara vez se da en la
ciencia el hecho de que la evidencia disponible implique una teoría, por lo que esta
condición tiene en la práctica muy pocas aplicaciones.

2. Condición de equivalencia: si E confirma H y ⊨ (H  G), entonces, E


confirma G.

Esta condición afirma que si una evidencia confirma una hipótesis dada, también
confirma a todas las hipótesis que son lógicamente equivalentes a ella. También parece

1
una condición inobjetable, ya que sería absurdo aceptar, por ejemplo, que una evidencia
confirma una teoría formulada en cierto lenguaje y no confirma la misma teoría formulada
en otro lenguaje. Lo natural es admitir que si confirma una formulación de una teoría,
también confirma todas sus formulaciones.

3. Condición de consistencia: si E confirma H y también G, entonces, ⊭  (H &


G).

Esta condición afirma que si una evidencia confirma dos hipótesis diferentes, la
conjunción de ambas hipótesis no es inconsistente. Es decir, suponiendo que H y G son
consistentes, su conjunción (H & G) también lo es. La consecuencia de esta condición es
que una misma evidencia no confirma hipótesis inconsistentes entre sí.

4. Condición especial de consecuencia: si E confirma H y (H ⊨ G), entonces, E


confirma G.

Esta condición afirma que si una evidencia confirma una hipótesis H también
confirma a todas las hipótesis implicadas por H. Por ejemplo, si la evidencia confirma
una hipótesis deducida de las hipótesis fundamentales de una teoría, también confirma a
todas las hipótesis derivadas de esa hipótesis. También parece razonable aceptarla aunque
esta condición es incompatible con la confirmación deductiva, como se verá enseguida.

5. Condición conversa de consecuencia: si E confirma H y (G ⊨ H), entonces, E


confirma G.

Esta condición afirma que si una evidencia confirma una hipótesis H, también
confirma todas las hipótesis que implican H. Parece una condición indispensable si las
teorías se conciben como sistemas hipotético-deductivos de enunciados, ya que las
hipótesis fundamentales se confirman a través de sus consecuencias, por tanto, si una
evidencia confirma una hipótesis derivada, también debe confirmar a todas las hipótesis
de las cuales se dedujo, incluidas las hipótesis fundamentales. Más sencillamente, la
confirmación de un teorema también confirma los axiomas de los cuales ese teorema se
deduce.

Adviértase que la condición de equivalencia (2) ya está contenida como un caso


de las condiciones especial de consecuencia (4) y conversa de consecuencia (5). Pero se

2
trata de un caso especial. En la mayoría de los casos en que se cumplan las dos
condiciones de consecuencia H y E no serán lógicamente equivalentes.

Comparemos ahora estas condiciones con la teoría hipotético-deductiva de la


confirmación y veamos si son compatibles. Sabemos que la condición fundamental de la
teoría deductivista es que E confirma H  (H ⊨ E), esto es, que solo la evidencia
implicada por una hipótesis la confirma. Revisemos, entonces, todas las condiciones de
Hempel a la luz de la condición hipotético-deductiva de la confirmación para comprobar
si son válidas desde el punto de vista deductivista.

La condición de implicación no resulta válida en general, porque si es verdadero


que (E ⊨ H), de allí no se sigue que sea verdadero (H ⊨ E). El único caso en que esa
implicación está garantizada es cuando E y H son lógicamente equivalentes (pues, en tal
caso, se implican mutuamente), pero en la mayoría de las ocasiones no serán equivalentes.

La condición de equivalencia resulta válida, porque si (H ⊨ E), cualquier otra


hipótesis lógicamente equivalente a H también implicará E.

La condición de consistencia no resulta válida, porque si (H ⊨ E), E confirma


también dos hipótesis mutuamente inconsistentes como (H & G) y (H &  G), ya que
ambas implican E. Adviértase que este es un caso de la paradoja de la conjunción
irrelevante, inevitable en cualquier teoría deductivista de la confirmación a causa de la
propiedad de monotonía de la deducción.

La condición especial de consecuencia no resulta válida, porque si (H ⊨ E) y (H


⊨ G), no se sigue que (G ⊨ E). Eso puede ocurrir en algunos casos, pero no ocurre
siempre. La implicación solamente está garantizada cuando H y G son lógicamente
equivalentes, ya que en ese caso, si una de ellas implica E, también lo hará la otra. Pero,
cuando no hay equivalencia, G será una hipótesis lógicamente más débil que H, por lo
cual no tendrá todas las consecuencias lógicas que tiene H. Por esa razón, no hay garantía
alguna de que G implique E.

La condición conversa de consecuencia resulta válida, por la propiedad de


transitividad de la deducción: si (H ⊨ E) y (G ⊨ H), entonces, (G ⊨ E). Por consiguiente,
esta condición debe ser válida en cualquier teoría deductivista de la confirmación. Como
podrá advertirse, esta condición da lugar a la paradoja de la conjunción irrelevante,
cuando G = H & F ( donde F es una hipótesis cualquiera).
3
El resultado de la comparación muestra que solo dos de las cinco condiciones de
Hempel (la de equivalencia y la de consecuencia conversa) son válidas en la teoría
hipotético-deductiva de la confirmación y, más en general, en cualquier teoría
deductivista de la confirmación. Así pues, la teoría cualitativa de la confirmación de
Hempel resulta incompatible con toda teoría deductivista de la confirmación.

Las paradojas de la confirmación

Las condiciones de adecuación de Hempel parecen todas aceptables cuando se las


examina aisladamente, pero conjuntamente tienen consecuencias inaceptables, o al
menos, poco intuitivas y no pretendidas. Se las ha llamado “paradojas de la
confirmación”, aunque no son paradojas en el sentido de que se deduzca una
contradicción de la teoría de Hempel. Si se aceptan conjuntamente todas estas
condiciones, resulta la consecuencia inaceptable de que cualquier evidencia confirma
cualquier hipótesis, lo cual vuelve trivial a la teoría de la confirmación.

La prueba es la siguiente:

1. Si E ⊨ H, entonces, E confirma H. [Condición de implicación]


2. E ⊨ (E v G). [Por lógica proposicional]
3. E confirma (E v G). [De 1 y 2]
4. G ⊨ (E v G). [Por lógica proposicional]
5. Si E confirma H y (G ⊨ H), entonces, [Condición conversa de
E confirma G. consecuencia]
6. E confirma G. [De 3, 4 y 5] 

Así, empleando solamente la condición de implicación y la condición de conversa


de consecuencia, se deduce que si una evidencia confirma una hipótesis dada, también
confirma a cualquier otra (ya que G es una hipótesis cualquiera). El resultado sería
aceptable solo en el caso de G fuera lógicamente equivalente a H, pero no tiene por qué
serlo. De hecho, el argumento es válido para cualesquiera otras hipótesis, I, J, etc., sean
o no equivalentes a H. Esta no es una paradoja en el sentido lógico del término, ya que
no se ha mostrado que las condiciones de adecuación de Hempel sean inconsistentes o
impliquen una contradicción, pero es una consecuencia fatal para la teoría de Hempel
porque la vuelve trivial. Desde ningún punto de vista resulta aceptable una teoría de la

4
confirmación que tenga la consecuencia de que cualquier evidencia confirma cualquier
hipótesis, porque, en tal caso, no es posible distinguir entre las evidencias que confirman
una hipótesis dada y las que no la confirman (que es lo mínimo que debería hacer una
teoría cualitativa de la confirmación).

Para evitar la consecuencia de que cualquier evidencia confirme cualquier


hipótesis, Hempel decidió mantener la condición de implicación pero descartó la
condición conversa de consecuencia (adviértase que solo se necesitan esas dos
condiciones para deducir la paradoja). El costo de renunciar a esa consecuencia es alto
porque implica aceptar que la confirmación no es una relación transitiva. Por ejemplo,
se debe admitir que si una evidencia confirma una hipótesis derivada, no confirma, sin
embargo, a las hipótesis fundamentales de las que se deriva; o que si confirma un teorema,
no confirma los axiomas de los cuales dicho teorema se deduce. Las teorías de la
confirmación que tienen esa característica se denominan no transitivas. Pero es evidente
que no resultan demasiado atractivas ni desde el punto de vista lógico ni desde el punto
de vista epistemológico. Hempel, sin embargo, estuvo dispuesto a pagar el costo de la no
transitividad de su teoría de la confirmación.

Hempel advirtió otra paradoja de su teoría de la confirmación, que, debido al


ejemplo que empleó, se hizo famosa con el nombre de “la paradoja de los cuervos”. La
paradoja se refiere a la confirmación de enunciados generales universales como “Todos
los cuervos son negros”, que se formaliza como x (Cx  Nx). El ejemplo, que
seguiremos usando, como es habitual, es meramente ilustrativo, ya que la paradoja afecta
a cualquier enunciado universal irrestricto, aunque sea mucho más complejo, tales como
los que se usan para formular las leyes deterministas de la física.

Para la confirmación de esa clase de enunciados universales Hempel utiliza una


condición que él llama “el criterio de Nicod”, porque atribuye su formulación al lógico
francés Jean Nicod (1893-1924) (que murió de tuberculosis a los 30 años). El criterio
afirma lo siguiente.

Criterio de Nicod: un enunciado universal es confirmado por sus instancias


positivas.

Esto quiere decir que un enunciado como x (Cx  Nx) será confirmado por todos
los enunciados singulares como (Ca & Na), (Cb & Nb), etc., que son instancias, es decir,

5
que ejemplifican, ese enunciado general (como puede verse, ejemplifican tanto el
antecedente como el consecuente del condicional generalizado).

El criterio de Nicod, junto con la condición de equivalencia, sin embargo, genera


la paradoja de los cuervos. En efecto, si E = (Ca & Na) es la evidencia que confirma la
hipótesis H = x (Cx  Nx), entonces, por la condición de equivalencia, también debe
confirmar la hipótesis G = x ( Nx   Cx), ya que, por trasposición del condicional,
G es equivalente a H. Ahora bien, las instancias positivas de G son enunciados singulares
como ( Na &  Ca), ( Nb &  Cb), etc., los cuales, por la condición de equivalencia,
también deben confirmar H. Sin embargo, intuitivamente no aceptaríamos que un
enunciado singular en el que se afirme que un objeto particular no es negro y que no es
un cuervo confirme un enunciado general como “Todos los cuervos son negros”.

Hempel, por su parte, no considera que se trate de una paradoja, por lo cual decide
mantener tanto la condición de equivalencia como el criterio de Nicod. Sostiene que no
hay aquí ninguna inconsistencia y que la apariencia paradojal de esta consecuencia de su
teoría de la confirmación es puramente psicológica. Se debe, según él, al presupuesto
erróneo de que un enunciado universal irrestricto como “Todos los cuervos son negros”
se refiere a los objetos que integran la clase de los cuervos cuando, en realidad, se refiere
a todos los objetos del universo, sean o no cuervos. Por tanto, desde un punto de vista
lógico, el único tipo de evidencia que refuta este enunciado general es la que forman los
enunciados singulares que satisfacen el antecedente del condicional y no el consecuente,
es decir, todos los enunciados como (Ca &  Na), (Cb &  Nb), etc. Desde un punto de
vista cualitativo, prosigue Hempel, todos los enunciados que sean instancias de x (Cx
 Nx), o de cualquiera de sus equivalentes, confirman ese enunciado general. Por
consiguiente, tanto x (Cx  Nx) como x ( Nx   Cx) son confirmados, por
ejemplo, por enunciados singulares como (Ca & Na), pero también por cualquier otro
enunciado que no los refute, como ( Ca &  Na), o ( Ca & Na).

Adviértase que Hempel emplea de manera implícita una condición de


equivalencia para la evidencia, por ejemplo, cuando considera que (Ca & Na) y (Na &
Ca) son la misma evidencia. En ese caso es obvio, aunque se trata de dos enunciados
diferentes; en otros casos, la equivalencia puede no ser tan evidente. La condición puede
formularse de la siguiente manera:

6
6. *Condición de equivalencia de la evidencia: si E1 confirma H y ⊨ (E1  E2),
entonces, E2 confirma H.

Hempel, en trabajos posteriores, también intentó construir una teoría cuantitativa


de la confirmación en la cual se pudiera medir el grado en que una evidencia confirma
una hipótesis. En dicha teoría, que no resultó exitosa por razones técnicas que no
analizaremos aquí, debería ser posible probar que el grado de confirmación de una
hipótesis como H = x (Cx  Nx) aumenta cuando se verifica la evidencia E1 = (Ca &
Na), pero aumento mucho menos cuando se verifica la evidencia E2 = ( Ca &  Na).
De esta manera, la observación de un cuervo negro debería aumentar mucho más el grado
de confirmación de una hipótesis como “Todos los cuervos son negros” que la
observación, digamos, de una pared blanca o de un árbol verde (o de cualquier otro objeto
que no sea un cuervo o no sea negro).

La teoría bayesiana de la confirmación

La principal teoría cuantitativa de la confirmación es la teoría bayesiana, que


constituye todo un programa de investigación en curso de desarrollo. Recibe su nombre
de Thomas Bayes (1702-1761) un matemático inglés que demostró el teorema de la teoría
de la probabilidad que lleva su nombre. De hecho, toda la teoría bayesiana de la
confirmación es una aplicación del teorema de Bayes. Se trata de una aplicación,
entonces, de la teoría de la probabilidad para medir el grado de confirmación de una
hipótesis H respecto de una evidencia E y un fondo de conocimiento aceptado K, llamado
conocimiento antecedente (background knowledge). Es, pues, una teoría probabilista de
la confirmación, cuyo punto de partida es la siguiente ecuación:

C (H, E & K) = Pr (H E & K)

Esto es: el grado de confirmación de H respecto de E y K es igual a la probabilidad


condicional de H dados E y K.

La teoría bayesiana emplea el cálculo de probabilidades estándar en matemática,


que es una teoría formal axiomatizada, y, como tal, admite diferentes interpretaciones. Lo
característico del bayesianismo ortodoxo es emplear la interpretación subjetiva de las
probabilidades que fue propuesta por el filósofo inglés Frank Plumpton Ramsey (1903-
1930) y desarrollada con detalle por el matemático italiano Bruno de Finetti (1906-1985).
7
La explicaremos brevemente. Ante todo, el cálculo de probabilidades debe formularse en
un dominio infinito formado por todas las combinaciones veritativo-funcionales finitas
de proposiciones (véase el Apéndice). Luego, todas las probabilidades se conciben como
probabilidades condicionales, es decir, como la probabilidad de que una proposición sea
verdadera, dado que otras proposiciones son verdaderas. Así, el enunciado Pr (H E &
K) = r debe leerse como “la probabilidad de que H sea verdadera, dado que E y K son
verdaderas es r” (donde r es un número real entre 1 y 0, incluyendo los extremos). En el
Apéndice se formula de manera axiomática la teoría de la probabilidad tal como la
emplean los filósofos de la ciencia, esto es, en el lenguaje de la lógica proposicional.

La interpretación propiamente subjetiva consiste en concebir a las probabilidades


como una expresión de los grados de creencia de un agente individual en la verdad de
ciertas proposiciones. Así, el enunciado Pr (AB) = 0,1 debe leerse como “el grado de
creencia de un agente dado en que la proposición A sea verdadera dado que la proposición
B es verdadera es de 0,1”. Cada agente puede asignar el valor que considere adecuado a
cada una de sus creencias. El único requisito al que está sometida la asignación de grados
de creencia es la coherencia probabilista, la cual exige que los grados de creencia
satisfagan el cálculo matemático de probabilidades. Este es un requisito mucho más fuerte
que la mera consistencia lógica (ya que se presupone, aunque no hay prueba absoluta, que
la teoría matemática de la probabilidad es consistente). La coherencia probabilística
exige, por ejemplo, que si un agente asigna un grado de creencia igual a 0,6 a su creencia
en que mañana lloverá, sobre la base de la información de que dispone, deberá asignar un
grado de creencia igual a 0,4 a la creencia en que mañana no lloverá, sobre la base de esa
misma información. En símbolos: si Pr (LK) = 0,6, entonces, Pr ( LK) = 0,4. Asignar
cualquier otro valor a Pr ( LK) sería probabilísticamente incoherente, ya que las
probabilidades no sumarían 1, pero es un teorema de la teoría de la probabilidad que Pr
( ) = 1 – Pr () (donde  es una proposición cualquiera). El carácter esencialmente
subjetivo de estas probabilidades se revela en el hecho de que dos agentes pueden asignar
grados de creencia diferentes a la misma proposición sobre la base del mismo
conocimiento antecedente. Es decir, un agente puede asignar al enunciado Pr (LK) el
valor 0,6 y otro agente puede asignarle el valor 0,3, o cualquier otro. Ninguno de los dos
valores es en sí mismo correcto o verdadero en ningún sentido, ya que para esta
interpretación no existen probabilidades objetivas a las que las creencias de los agentes
deban adecuarse. Los dos grados de creencia de los dos agentes son aceptables en tanto

8
sean probabilísticamente coherentes con los grados de creencia asignados a sus otras
creencias, entre ellas, a Pr ( LK).

El teorema de Bayes, en su forma más simple, es el siguiente:

𝑷𝒓 (𝛼) 𝑷𝒓 (𝛽𝛼)
𝑷𝒓(𝛼𝛽) =
𝑷𝒓 (𝛽)

[𝑆uponiendo que 𝑷𝒓(𝛽) ≠ 0].

El teorema permite calcular la probabilidad condicional de una proposición


respecto de otras, pero requiere como datos otras probabilidades que se denominan
probabilidades previas (prior probabilities). Por su parte, las probabilidades calculadas
mediante el teorema se denominan probabilidades posteriores (posterior probabilities).

Si el teorema se aplica al caso de H, E y K, resulta la siguiente forma:

𝑷𝒓 𝐻𝐾 𝑷𝒓 (𝐸𝐻 & 𝐾)


𝑷𝒓(𝐻𝐸 & 𝐾) =
𝑷𝒓 (𝐸𝐾)

[𝑆uponiendo que 𝑷𝒓 𝐸𝐾 ≠ 0]

Dada una asignación coherente de valores de probabilidad a las probabilidades


previas que están en el lado derecho de la ecuación, se puede probar que el valor de la
probabilidad asignado a la proposición que está en el lado izquierdo cambia o permanece
igual. Si el valor sube, la hipótesis H ha sido confirmada por la evidencia E, si el valor
baja, la hipótesis ha sido disconfirmada por esa evidencia, y, por último, si permanece
igual, la evidencia es neutral respecto de esa hipótesis, es decir, no la confirma ni la
disconfirma. Las probabilidades previas son subjetivas, por lo que cada agente puede
asignarlas libremente, siempre que las asignaciones sean probabilísticamente coherentes.
Si dos agentes parten de probabilidades previas diferentes, las probabilidades posteriores
que calculen usando el teorema de Bayes serán necesariamente diferentes, salvo por mera
coincidencia. Sin embargo, si las probabilidades previas no son extremas, es decir, si no

9
tienen los valores 1 y 0, o números muy cercanos a estos valores extremos, los valores de
las probabilidades posteriores convergen, en el sentido matemático del término. Por
ejemplo, si dos agentes asignan a la probabilidad previa Pr (HK) dos valores bastante
diferentes, pero no extremos, digamos, 0,4 y 0,8, luego de una serie de reiteradas
condicionalizaciones bayesianas (es decir, de aplicaciones del teorema de Bayes) respecto
de nuevas evidencias, finalizarán con probabilidades posteriores mucho más cercanas,
digamos, 0,75 y 0,85 (estos valores son puramente arbitrarios, pero posibles).

En la práctica, el teorema de Bayes se emplea en una formulación equivalente,


donde el denominador Pr (EK) se reemplaza por la llamada fórmula de probabilidad
total:

Pr (E) = Pr (H) x Pr (EH) + Pr (H) x Pr (EH).

De esta manera, el teorema de Bayes se escribe como

𝑷𝒓 𝐻𝐾 𝑷𝒓 (𝐸𝐻 & 𝐾)


𝑷𝒓(𝐻𝐸 & 𝐾) =
𝑷 𝑟 𝐻𝐾 𝑷𝒓 (𝐸 𝐻 & 𝐾) + 𝑷𝒓 (𝐻 𝐾) 𝑷𝒓 (𝐸𝐻 & 𝐾)

Las probabilidades previas Pr (H  K) y Pr (H  K) no son independientes, ya


que deben sumar 1, por lo que el valor de una de ellas fija el valor de la otra (si la
asignación ha de ser coherente). Las probabilidades Pr (EH & K) y Pr (EH & K) se
denominan likelihoods y son mutuamente independientes, de modo que pueden tomar
cualquier valor entre 0 y 1. De este modo, para aplicar el teorema de Bayes es necesario
asignar valores a las probabilidades previas y a las likelihoods.

El teorema de Bayes tiene un número sorprendente de consecuencias para la teoría


de la confirmación, consecuencias que resuelven muchos problemas tradicionales,
incluidas las paradojas de la confirmación y la de la conjunción irrelevante. Aquí solo
podemos considerarlas de manera general, sin ofrecer sus respectivas demostraciones.

En primer lugar, la teoría bayesiana se aplica tanto a las hipótesis universales


como a las hipótesis probabilistas. Cuando ocurre que H ⊨ E, como en el caso de las

10
hipótesis universales, la probabilidad previa Pr (EH & K) es igual a 1, por lo que puede
eliminarse del numerador del teorema. Si la hipótesis es probabilista, entonces, H ⊭ E,
por lo cual, la probabilidad previa Pr (EH & K) será en general menor que 1, pero el
teorema de Bayes se aplica en ambos casos.

En segundo lugar, conserva la idea de refutación en términos probabilísticos,


como un caso extremo de disconfirmación. En efecto, son teoremas de la teoría de la
probabilidad que

(H ⊨  E)  Pr (HE & K) = 0

(H ⊨ E)  Pr (H E & K) = 0

Es decir, si una hipótesis implica una evidencia falsa, entonces, su probabilidad


dada esa evidencia es igual cero (y no puede subirse a menos que la evidencia falsa sea
removida del cuerpo de creencias de cada agente).

En tercer lugar, la teoría bayesiana conserva la idea de confirmación mediante


implicación. En efecto, es un teorema de la teoría de la probabilidad que

(H ⊨ E)  Pr (HE & K)  Pr (HK)

En la mayoría de los casos, la nueva evidencia E aumentará la probabilidad previa


de H, por lo que, la hipótesis resultará confirmada.

En cambio, el siguiente enunciado no es un teorema de la teoría de la probabilidad:

*(Pr (HE & K)  Pr (HK))  (H ⊨ E)

Por consiguiente, la teoría bayesiana de la confirmación no es deductivista.


Admite que una hipótesis pueda ser confirmada por evidencias que no están implicadas
por ella. Esto vale tanto para hipótesis universales como para hipótesis probabilistas.
Dado que las hipótesis probabilistas no implican por sí mismas ningún enunciado
singular, la única posibilidad de confirmarlas es mediante evidencias no implicadas. Las
hipótesis universales, en cambio, pueden ser confirmadas tanto por evidencias implicadas
como no implicadas por ellas.

Veamos ahora de qué manera la teoría bayesiana soluciona el problema de la


conjunción irrelevante. Sabemos que si (H & K) ⊨ E, debido al carácter monótono de la

11
deducción, también ocurre que (H & B & K) ⊨ E, donde B es un enunciado cualquiera,

posiblemente irrelevante para H. De acuerdo con la definición de confirmación H-D, E


confirma a la vez a H y a H & B. La teoría bayesiana de la confirmación acepta la
confirmación por implicación y, por tanto, debe admitir que E confirma incrementalmente
tanto a H como a H & B (suponiendo que P(H & BK)  0). Así, es verdad tanto que
P(HE & K)  P(HK) como que P(H & BE & K)  P(H & BK). Sin embargo, esto
nada dice acerca del incremento en los respectivos grados de confirmación. La solución
bayesiana del problema consiste en probar que, en general, el grado de apoyo que E da a
H & B es mucho menor que el grado de apoyo que E da a H. La razón de ello es que, bajo
la condición de que 0  P(BK)  1, siempre ocurre que P(H & BK)  P(HK). Por
tanto, dada la desigualdad de las probabilidades previas, y dada la misma evidencia E, las
probabilidades posteriores mantendrán la desigualdad, es decir, P(H & BE & K) 
P(HE & K).

Este resultado se basa en un teorema de la teoría de la probabilidad.

(0  P(BK)  1)  [P(H & BE & K)  P(HE & K)].

Así pues, si a una hipótesis H que implica la evidencia E se la pone en conjunción


con un conjunto cualquiera de enunciados B, entonces, el grado de confirmación de H &
B será menor que el grado de confirmación de H relativamente a dicha evidencia.

En síntesis, la teoría bayesiana de la confirmación es una teoría inductivista que


retiene algunas de las virtudes fundamentales de la confirmación hipotético-deductiva y
tiene, además, muchas otras ventajas. Entre otras, es más general, ya que se aplica tanto
a las hipótesis y teorías universales como a las probabilistas.

La principal dificultad que tiene la teoría bayesiana es el llamado problema de la


vieja evidencia (old evidence). Este consiste en el hecho de que la evidencia conocida, es
decir, ya verificada, debe tener probabilidad 1. Por consiguiente, no puede incrementar la
probabilidad previa de una hipótesis. En efecto, es un teorema de la teoría de la
probabilidad que

Pr (EK) = 1  (Pr (HE & K)  Pr (HK))

12
Así pues, para la teoría bayesiana, la evidencia conocida con certeza, con
probabilidad 1, no tiene valor confirmatorio. Si se observa el teorema de Bayes, para el
caso de las hipótesis universales que implican la evidencia, Pr (EH & K) = 1 y si,
además, Pr (EK) = 1, entonces, resulta que Pr (HE & K) = Pr (HK). Para el caso de
las hipótesis probabilistas, si Pr (EH & K)  1 y si, además, Pr (EK) = 1, entonces,
resulta que Pr (HE & K)  Pr (HK). En suma, la evidencia conocida con certeza no
puede elevar el valor de la probabilidad previa de una hipótesis. Si la hipótesis implica la
evidencia, el valor queda igual; si no la implica, el valor disminuye. En ninguno de los
dos casos la hipótesis resulta confirmada. Existen diferentes propuestas para solucionar
el problema de la vieja evidencia dentro del marco bayesiano, pero no se ha alcanzado
consenso acerca de alguna de ellas, por lo que todavía permanece como un problema
abierto.

Aceptación y rechazo de hipótesis y teorías

El objetivo implícito de las teorías de la confirmación, al menos de las teorías


cuantitativas, era el de poder comparar hipótesis o teorías rivales de modo tal que se
pudiera elegir o aceptar aquella que tuviera el grado de confirmación más alto respecto
de toda la evidencia disponible en un momento dado. Sin embargo, esta idea resulta
demasiado simplista, porque la aceptación y el rechazo de teorías es un asunto complejo.
Ante todo, no debe confundirse la confirmación y refutación de teorías con su aceptación
o rechazo. La confirmación y la refutación son relaciones lógicas entre enunciados,
mientras que la aceptación y el rechazo son actitudes pragmáticas que tienen los agentes
respecto de las hipótesis y las teorías. En principio, es perfectamente posible que un
agente (o una comunidad científica) acepte una teoría que tiene un bajo grado de
confirmación y rechace una teoría que tiene un alto grado de confirmación. Esto puede
ocurrir, y de hecho ha ocurrido a lo largo de la historia de la ciencia, porque la
confirmación por la evidencia disponible no es el único criterio que se emplea para
aceptar o rechazar teorías.

Un criterio ampliamente utilizado por los científicos es el de la coherencia o


compatibilidad de una nueva teoría respecto de las teorías previamente aceptadas y bien
confirmadas. Por ejemplo, la teoría de la relatividad especial es una teoría fundamental
de la física, aceptada desde hace décadas y confirmada por numerosa evidencia

13
experimental. Una de las consecuencias de esta teoría es que ningún cuerpo masivo puede
ser acelerado hasta alcanzar la velocidad de la luz en el vacío. Si una teoría nueva implica
que puede haber cuerpos cuya masa no es nula que son capaces de moverse a la velocidad
de la luz, dicha teoría, por el hecho de ser incompatible con la relatividad especial, será
fuertemente resistida por los físicos y no será aceptada a menos que resulte confirmada
por abundante evidencia experimental y muestre, además, tener otras virtudes epistémicas
(como la simplicidad, la generalidad y otras) que la distingan como superior en algunos
aspectos a la relatividad general. También serán resistidas las teorías que postulen la
existencia de nuevos tipos de entidades nunca observadas, sobre todo, si la existencia de
tales entidades resulta prohibida por alguna teoría aceptada o es incompatible con ella.

Otro criterio muy extendido es el de la unificación: una teoría resulta


especialmente valorada por los científicos si consigue explicar una diversidad de
fenómenos conocidos aparentemente desconectados entre sí, por ejemplo, fenómenos de
distinto tipo (mecánicos, ópticos y electromagnéticos, por ejemplo). Si una teoría resulta
unificadora en este sentido, puede ser aceptada aunque muchas de sus predicciones más
novedosas no hayan sido confirmadas. La teoría de la relatividad especial proporciona un
buen ejemplo de esa situación. Einstein la formuló en 1905 y en Alemania se la aceptó
tempranamente hacia 1914, aproximadamente (en otros países, como Francia, la
aceptación fue mucho más tardía). Sin embargo, en 1914 todavía no se habían confirmado
algunas de las predicciones más significativas de dicha teoría. La dilatación del tiempo,
el hecho de que los relojes en movimiento marchan más lento que los relojes en reposo,
es una predicción novedosa de esta teoría que solo se confirmó durante la década de 1960.
En cambio, la contracción de las longitudes, el hecho de que un cuerpo se contrae en la
dirección paralela a su movimiento, todavía no ha podido ser confirmada. Nadie ha
medido la contracción de un objeto macroscópico, como una varilla, que se mueve
rápidamente. Para que la contracción resultara medible debería acelerárselo a una fracción
significativa de la velocidad de la luz en el vacío (por lo menos el 50% o más), algo que
no es técnicamente posible, ni sabemos si lo será alguna vez. Sin embargo, la teoría de la
relatividad especial tiene un enorme poder unificatorio, ya que permitió explicar una gran
diversidad de resultados experimentales conocidos (como los resultados nulos de los
experimentos de Michelson y Morley y otros que buscaban detectar el movimiento de la
Tierra respecto del éter luminífero). Esa capacidad unificatoria, sin duda, compensó la

14
falta de confirmación de las predicciones novedosas y llevó a la aceptación de la teoría
antes de que esas predicciones fueran siquiera contrastadas.

La posición de los empiristas lógicos, como Carnap, Hempel y otros que


elaboraron las primeras teorías de la confirmación, era que las virtudes epistémicas, como
la simplicidad, la generalidad y el poder unificatorio, solo se empleaban como criterios
de aceptación o rechazo de teorías cuando el grado de confirmación de dos o más teorías
rivales era el mismo (o muy semejante) de modo que la evidencia no resultaba suficiente
para discriminar entre ellas. En tal caso, debería preferirse la teoría más simple, más
general o más unificatoria. Por supuesto, podía haber conflictos irresolubles entre esas
virtudes epistémicas, de modo que una teoría fuera más simple que su rival, pero la otra
resultara más unificatoria o de mayor generalidad y alcance. En esa situación, se prefería
posponer la elección hasta que se dispusiera de nueva evidencia que permitiera confirmar
mejor una sola de tales teorías. En el caso de que las teorías rivales fueran empíricamente
equivalentes, sin embargo, la elección de una de ellas solo podía basarse en criterios no
factuales como los mencionados.

En la práctica científica, las cosas no siempre ocurren de esta manera, como lo


muestra el ejemplo de la teoría de la relatividad especial. En ocasiones, las virtudes
epistémicas no factuales, como el poder unificatorio, pueden compensar la escasez de
evidencia confirmatoria. En otros casos, la aceptación o el rechazo de una teoría resulta
discutido por las comunidades científicas, que a veces tomas posiciones contrapuestas.
En esas ocasiones, el consenso puede tardar mucho tiempo en alcanzarse.

La teoría bayesiana de la confirmación, al menos en su versión ortodoxa, admite


que no proporciona reglas de aceptación o rechazo de teorías. Solo ofrece un método para
probabilizar las teorías respecto de la evidencia disponible, pero ello no determina cuál
sea el grado de probabilidad necesario para aceptar o rechazar una teoría. En efecto, sería
arbitrario fijar un umbral de aceptabilidad, como, digamos, Pr (T  E & K) = 0,70, de
modo que deban rechazarse las teorías con un grado de probabilidad apenas inferior,
como 0,69. Esa decisión, en todo caso, solo puede ser convencional, pero no se advierte
qué razones podrían justificarla. ¿Por qué el umbral debería ser el mismo para todas las
teorías de todas las disciplinas científicas? ¿Por qué debería adoptarse el valor 0,70 y no
0,75 o cualquier otro? No parece haber respuestas evidentes a estas preguntas. Por lo
demás, el grado de confirmación de una teoría depende de la evidencia disponible y puede

15
variar rápidamente con el descubrimiento de nuevas evidencias, de manera que en un
tiempo corto oscile por encima y por debajo de cualquier umbral que se establezca
convencionalmente.

La historia de la ciencia muestra, en muchos casos, que la aceptación y el rechazo


de teorías son procesos sumamente complejos, cuya duración puede extenderse mucho
en el tiempo. La adecuación empírica de las teorías (el hecho de que sus consecuencias
observacionales se verifiquen) es, sin duda, un criterio básico para la aceptación: nunca
se aceptan teorías cuyas predicciones resultan sistemáticamente falsas. No obstante,
difícilmente se abandona una teoría que tiene anomalías empíricas, evidencias
refutadoras, si no se dispone de una teoría mejor. El poder explicativo de una teoría es
otro de los criterios fundamentales para su aceptación. Pero, con todo, raramente se exige
de una teoría que explique todos los fenómenos conocidos que se encuentran en su
dominio de aplicación, pues, tal vez no haya habido nunca una teoría que explique la
totalidad de los fenómenos. Siempre hay fenómenos inexplicados, pero una teoría se
muestra explicativamente fértil cuando consigue explicar cada vez más fenómenos.

Las virtudes epistémicas de una teoría, como la simplicidad o la parsimonia


ontológica, por otra parte, raramente resultan criterios decisivos por sí solos. Si una teoría,
por simple que sea, no tiene poder predictivo alguno o implica predicciones
sistemáticamente falsas nunca será aceptada. La adecuación empírica de las teorías se
considera una condición suficiente para su aceptación, aunque no siempre sea suficiente.
Lo más frecuente, aunque no siempre ocurre así, es que una teoría se acepte por una
combinación de criterios diferentes, que van desde la verificación de alguna predicción
novedosa, hasta su poder explicativo o unificatorio. Es lo que ocurrió, por ejemplo, con
la teoría electromagnética de Maxwell, que unificaba la óptica, la electricidad y el
magnetismo, explicando una diversidad de fenómenos que hasta ese momento se
consideraban desconectados. Pero la aceptación de la teoría no se debió solo a su poder
unificatorio. La teoría de Maxwell predecía, además, la existencia de las ondas de radio,
que fueron detectadas por Heinrich Hertz (1857-1894) en una serie de experimentos
realizados entre 1887 y 1889. Ese descubrimiento proporcionó una evidencia
confirmatoria que fue decisiva para la aceptación de la teoría electromagnética. A
menudo, sin embargo, la acumulación de evidencia confirmatoria es gradual y no se funda
en la verificación de una predicción novedosa, como ocurrió con la teoría atómica de la
materia, cuya evidencia provino de los resultados de muy diversos experimentos.

16
Por otra parte, la resistencia a la aceptación de una teoría en ocasiones se debe a
su incompatibilidad, real o aparente, no solo con otras teorías aceptadas, sino con
ideologías políticas o religiosas o con presupuestos metafísicos muy arraigados. Hay
muchos ejemplos históricos de estas situaciones. La resistencia a la teoría de la evolución
de Darwin por parte de los creacionistas norteamericanos (eufemísticamente rebautizados
como partidarios del “diseño inteligente) no se debe primariamente a razones
epistemológicas, sino a su conflicto con creencias religiosas. Otro caso bien conocido es
el de la prohibición (severamente castigada con la muerte o la deportación a campos de
concentración) de la genética mendeliana en la Unión Soviética en tiempos de Stalin,
porque se la consideraba incompatible con la filosofía oficial del materialismo dialéctico.
También se produce el fenómeno inverso, esto es, la aceptación por razones ideológicas
de una teoría que carece de toda confirmación experimental, como fue el caso del
lamarckismo (esencialmente la tesis de que los caracteres adquiridos, incluso culturales,
son heredables) entre los bolcheviques, que era aceptado por razones políticas, porque,
simplemente, se deseaba que fuera verdadero (aunque ninguno de los bolcheviques tenía
conocimiento suficiente de la biología como para evaluar la evidencia disponible). De
hecho, el lamarckismo retorna una y otra vez, aunque no tiene evidencia alguna que lo
confirme. Se trata, simplemente, de lo que en inglés se denomina, muy apropiadamente,
wishful thinking.

Estos son temas actualmente muy discutidos, sobre todo, porque numerosos
filósofos de la ciencia (todas las epistemólogas feministas, por ejemplo), rechazan la tesis
de la neutralidad valorativa de la ciencia y sostienen que los valores éticos y sociales
deberían desempeñar un papel (de alguna manera que varía según los autores) en la
aceptación y el rechazo de las teorías científicas. Esto conlleva el riesgo de que la ciencia
se vuelva politizada o ideologizada y que determinadas teorías se acepten o rechacen solo
porque se las considera políticamente correctas o incorrectas. Mi posición al respecto es
que la ciencia ideologizada es directamente seudociencia, como lo fueron la ciencia aria
de los nazis (contrapuesta a la ciencia judía) o la ciencia proletaria soviética (contrapuesta
a la ciencia burguesa). ¿Tiene algún sentido decir que hay una física judía o una química
burguesa? ¿O una biología cristiana y otra atea? En mi opinión, ese tipo de afirmaciones
no tienen ningún sentido. Sin embargo, fueron tomadas en serio y no solo defendidas,
sino, en algunos casos, impuestas por la fuerza. Los valores epistémicos o cognitivos
(simplicidad, generalidad, poder unificatorio y explicativo) siempre se utilizan en la

17
evaluación epistémica de las teorías, pero los valores éticos, estéticos, políticos o sociales
no deberían emplearse en el contexto de justificación de la ciencia. La aceptación y el
rechazo de las teorías científicas no puede ser una cuestión de gusto ni de corrección
política.

Apéndice

La teoría matemática de la probabilidad

Sea ℰ un conjunto de proposiciones cerrado respecto de las combinaciones finitas

veritativo-funcionales. La probabilidad Pr es una función que asigna un número real a


cada elemento de ℰ (Pr: ℰℝ) y cumple con los siguientes axiomas:

Axioma 1: para toda proposición   ℰ,

0  Pr ()  1.

Axioma 2: para toda proposición   ℰ tal que ⊨,

Pr () = 1.

Axioma 3: para cualesquiera proposiciones ,   ℰ tales que ⊨ ( & ),

Pr ( v ) = Pr () + Pr ().

Axioma 4: para cualesquiera proposiciones ,   ℰ,

Pr ( & ) = Pr () x Pr ().

El conjunto ℰ, por estar cerrado respecto de combinaciones veritativo-funcionales,

es siempre infinito, aunque, obviamente, es contable porque es un conjunto discreto. El


axioma 1 afirma que toda proposición tiene una probabilidad positiva y normalizada, es
decir, comprendida entre 1 y 0. El axioma 2 afirma que todas las verdades lógicas tienen
la máxima probabilidad (pero no la conversa, es decir, no toda proposición con

18
probabilidad 1 es una verdad lógica). El axioma 3 afirma que si dos proposiciones son
lógicamente incompatibles, la probabilidad de su disyunción es igual a la suma de las
probabilidades de cada una de ellas. El axioma 4 afirma que la probabilidad de la
conjunción de dos proposiciones cualesquiera es igual al producto de la probabilidad de
la segunda y la probabilidad condicional de la primera respecto de la segunda. Este
axioma introduce como primitivo a la probabilidad condicional. Todos los axiomas
también pueden formularse como probabilidades condicionales. La probabilidad absoluta
de una proposición se introduce mediante la siguiente definición:

Definición: para toda proposición, α  ℰ y para toda proposición β  ℰ

tal que ⊨β,

Pr () =def Pr ().

De acuerdo con esta definición, la probabilidad absoluta de una proposición es su


probabilidad condicional respecto de una verdad lógica.

Los axiomas 3 y 4, de aditividad y multiplicación, respectivamente, se pueden


escribir de una manera más general para cualquier secuencia finita de proposiciones.

Axioma 3*: para toda secuencia finita de proposiciones 1, 2, ... n  ℰ tal que

para toda i  j, ⊨ (i & j),

Pr (1 v 2 v ... v n) = Pr (1) + Pr (2) + … + Pr (n).

Axioma 4*: para toda secuencia finita de proposiciones 1, 2, 3 ... n  ℰ,

Pr (1 & 2, & 3 &... & n) = Pr (1) x Pr (21) x Pr (31 &
2) x … x Pr (n1 & … & n1).

Los axiomas 1, 2, 3* y 4* formulan la teoría de la probabilidad con aditividad


finita. Ello significa que en la teoría pueden sumarse cualquier número finito de
probabilidades, pero no un número infinito. Una teoría más fuerte (la que originalmente
axiomatizó Kolmogorov) es la teoría de la probabilidad con aditividad contable, que
permite sumar un número infinito (contable) de probabilidades.

19
Bibliografía obligatoria

Hempel, C. G. (1965) La explicación científica. Buenos Aires: Paidós, 1979. [Capítulo 1,


pp. 13-43].

Bibliografía complementaria

Cassini, A. (2003) “Confirmación hipotético-deductiva y confirmación bayesiana”.


Análisis Filosófico 23: 41-84.

20

También podría gustarte