Está en la página 1de 341

D ESDE los viejos tiempos

«Ir A m a te le s , lis u a y filosofía son dos maneras de acercarse a la


« iiiiipirnsióM ilrl mundo que se han desarrollado en conexión mutua. Más
«|iir i'u.ili|iner olra disciplina científica, la física ha presionado sobre los
limites «le nuestro conocimiento más general acerca de las estructuras
pmlunilas del entendimiento y de la realidad, por lo que posee muchos
puntos comunes con el pensamiento ontológico y epistem ológico,
tradicionalmente objeto de la filosofía. LA W REN CE SK LAR traza un
mapa de las áreas principales en la que se plantean cuestiones
fundamentales de filosofía del conocimiento del mundo físico. FILOSOFÍA
DE LA F IS IC A estudia la estructura del espacio, el tiem po y el
movimiento, la geometría del mundo y el tipo de entidades fundamentales
que lo constituyen. Aborda también el problema de la probabilidad y el
carácter aleatorio de los procesos básicos de la naturaleza, y termina con un
examen de las implicaciones ontológicas y epistemológicas de la mecánica
cuántica, la teoría más precisa y fecunda de cuantas han existido nunca, así
como la más extraña y difícil de conjugar con la imagen del mundo del
sentido común. También en Alianza Editorial, «Sobre la realidad de los
cuantos», de J. M. Jauch (AU 428), y «El debate de la teoría cuántica», de
Franco Selleri (AU 453).

Alianza Editorial
Filosofía de la física
Lawrence Sklar

Filosofía de la física

Versión española
de Rosa Álvarez Ulloa

Alianza
Editorial
T ítulo original: Philosophy o f Physics

Reservados todos los derechos. De conformidad con lo dispuesto en el art. 534-bis


del Código Penal vigente, podrán ser castigados con penas de multa y privación de
libertad quienes reprodujeren o plagiaren, en todo o en parte, una obra literaria,
artística o científica fijada en cualquier tipo de soporte sin la preceptiva autorización.

© Westview Press, Inc., 1992


© Ed. cast.: Alianza Editorial, S. A., Madrid, 1994
Calle Juan Ignacio Luca de Tena, 15; 28027 Madrid; teléf. 741 66 00
ISBN : 84-206-2797-6
Depósito legal: M. 38.916-1994
Impreso en Lavel. Los Llanos, C/ Gran Canaria, 12. Humanes (Madrid)
Printed in Spain
PatyRubby
ÍNDICE

Agradecimientos ............................................................................. 11

1. In tr o d u c c ió n : L a f ilo s o f ía y l a s c ie n c ia s f í s i c a s ..................... 13

La relación de la ciencia a la filosofía .................................. 13


Física moderna y filosofía ..................................................... 16
Filosofía de la física y filosofía general ................................. 22
Finalidad y estructura de este lib r o ...................................... 24

2. E s p a c io , t ie m p o , m o v im ie n t o ................................................... 27

Problemas filosóficos tradicionales del espacio y el tiempo.. 27


El debate entre Newton y Leibniz ....................................... 38
Del espacio y el tiempo al espacio-tiempo .......................... 47
La gravedad y la curvatura del espacio-tiempo ................... 67
¿Cómo conocemos la verdadera geometría del mundo? .... 85
¿Qué clase de entidad tiene el espacio-tiempo? .................. 109
Lecturas adicionales .............. ................................................ 138

3. L a INTRODUCCIÓN DE LA PROBABILIDAD EN LA FÍSICA .................. 141

Los filósofos acerca de la probabilidad y la explicación es­


tadística ................................................................................... 141
9
10 Indice

De la termodinámica a la mecánica estadística ................... 164


El problema de la irreversibilidad y las tentativas de resol­
verlo ........................................................................................ 180
El problema de «la dirección del tiempo» ............................ 216
Lecturas adicionales .............................................................. 227

4. L a IMAGEN CUÁNTICA DEL MUNDO ................................................... 231

La base experimental de la teoría cuántica .......................... 231


Primeras tentativas de interpretar la teoría: el principio de
incertidumbre ........................................................................ 241
¿Qué es la medición en la teoría cuántica? .......................... 260
El problema de las variables ocultas y el determinismo..... 292
La inseparabilidad de los sistemas ....................................... 307
Lecturas complementarias .................................................... 324

5. R e f l e x io n e s s o b r e la in t e r d e p e n d e n c ia d e l a f il o s o f ía y

la c ie n c ia ................................................................................. 327

B i b l i o g r a f í a ...................................................................................................... 335

Í n d ic e a n a l ít ic o ............................................................................. 341
AGRADECIMIENTOS

En un trabajo de esta clase, concebido como un examen del


estado actual del campo, las fuentes de influencia intelectual son de­
masiado numerosas para mencionarlas en una sección de agradeci­
mientos. Las lecturas sugeridas al final de los tres capítulos principa­
les indicarán al lector dónde he encontrado las fuentes de muchas
ideas importantes en la filosofía de la física.
Las discusiones mantenidas con muchas personas a lo largo de
los años me han ayudado a poner en orden mis ideas sobre los tópi­
cos que presento aquí. Jim Joyce y Bob Batterman han sido de gran
ayuda, y de John Earman, Clark Glymour, David Malament, Paul
Horwich, y Michael Friedman he aprendido mucho.
Michele Vaidic fue de inestimable ayuda a la hora de confeccio­
nar el manuscrito. Spencer Carr y los dos refereesde Westview Press
me ayudaron mucho a mejorar el primer borrador del manuscrito,
especialmente en lo que a estilo y organización se refiere. A Marian
Safran, redactora jefe, le agradezco mucho la ayuda proporcionada
en llevar el manuscrito a su forma final.
Parte de la investigación que contribuyó a reunir el material del
capítulo 3 fue subvencionada por la National Science Foundation,
cuya ayuda agradezco sinceramente. También debo dar gracias a la
Universidad de Michigan por una beca que contribuyó a sufragar al­
gunos de los costes de la preparación del manuscrito*

Lawrence Sklar
11
Capítulo 1

INTRODUCCIÓN: LA FILOSOFÍA
Y LAS CIENCIAS FÍSICAS

La relación de la ciencia a la filosofía

La demarcación entre las ciencias naturales y la filosofía ha sido un


proceso largo y gradual dentro del pensamiento occidental. En un
principio la indagación en la naturaleza de las cosas consistía en una
amalgama de lo que hoy concebiríamos como filosofía: consideracio­
nes generales del tipo más amplio sobre la naturaleza del ser y la na­
turaleza de nuestro acceso cognitivo al mismo, y lo que hoy se consi­
deraría característico de las ciencias específicas: la acumulación de
hechos observacionales y la formulación de hipótesis generales y teó­
ricas que los expliquen. Si atendemos a los restos fragmentarios de
las obras de los filósofos presocráticos, encontramos no sólo im por­
tantes e ingeniosas tentativas de aplicar la razón a amplias cuestiones '
metafísicas y epistemológicas, sino también los primeros conatos de
teorías físicas, si bien extraordinariamente imaginativas, sobre la na­
turaleza de la materia y sus aspectos cambiantes.
En la época de la filosofía griega clásica podemos ya apreciar una
cierta disociación de las dos disciplinas. E n sus obras metafísicas,
Aristóteles está haciendo exactamente lo mismo que harían los filóso­
fos hoy día. Pero en la mayoría de sus obras biológicas, astronómicas
y físicas, encontramos métodos de investigación que nos son hoy día
familiares en la práctica de los científicos.
13
14 Filosofía de la física

A medida que las ciencias especiales, como la física, la química y


la biología, han ido multiplicándose, dominando cada vez más recur­
sos y desarrollando metodologías sumamente individualizadas, han
demostrado poseer capacidad para describir y explicar las caracterís­
ticas fundamentales del mundo en el que vivimos. Debido al éxito de
los practicantes de las ciencias especiales, muchos se preguntan si
aun queda algo que los filósofos puedan hacer. Algunos filósofos
creen que hay dominios de investigación radicalmente diferentes a
los de las ciencias particulares, por ejemplo, la indagación en la natu­
raleza de Dios, de «ser ello mismo» o de alguna otra cosa. Otros filó­
sofos han buscado de diversas maneras un dominio distinto de inves­
tigación para la filosofía más estrechamente vinculado a los recientes
y sofisticados desarrollos de las ciencias naturales.
Una concepción todavía más antigua, cuya popularidad fue dis­
minuyendo con el paso de los siglos, aunque sin llegar a desaparecer
totalmente, sostiene que hay una forma de conocer el m undo cuyo
fundamento no necesita descansar en la investigación observacional
o experimental, el método de las ciencias específicas. Esta vieja con­
cepción se vio influida en parte por la existencia de la lógica pura y
las matemáticas, cuyas verdades firmemente establecidas no parecen
descansar para su justificación en un fundamento observacional o ex­
perimental. Desde Platón y Aristóteles a Leibniz y otros racionalistas,
pasando por Kant y los idealistas, y llegando hasta nuestros tiempos,
ha perdurado la esperanza de que, siendo lo suficientemente inteli­
gentes y reflexivos, podríamos establecer un cuerpo de proposiciones
descriptivas del mundo, si bien conocidas con la certeza con la que
afirmamos conocer las verdades de la lógica y las matemáticas. Esto
sería creíble con independencia de cualquier soporte inductivo de
los hechps particulares de la observación. Si este cuerpo de conoci­
miento estuviese a nuestra disposición, ¿no sería el objetivo anhelado
durante siglos por la disciplina tradicionalmente llamada filosofía?
Una concepción más contemporánea sostiene que el papel de la
filosofía es servir, no ya de. fundamento para las ciencias o como ex­
tensión de ellas, sino antes bien de observador crítico de las mismas.
La idea aquí es que las disciplinas científicas particulares usan con­
ceptos y métodos. Las relaciones entre unos conceptos y otros, aun­
que implícitas en el uso que la ciencia hace de ellos, podrían no estar
claras de manera explícita para nosotros. En este caso sería tarea de
la filosofía el esclarecimiento de estas relaciones conceptuales. De
Introducción: la filosofía y las ciencias físicas 15

nuevo, las ciencias particulares emplean métodos específicos para ge­


neralizar de los datos observacionales a las hipótesis y a la teoría. El
cometido de la filosofía es, desde esta perspectiva, describir ios méto­
dos que las ciencias utilizan y explorar el terreno para justificar estos
métodos. Es decir, compete a la filosofía mostrar que se trata de los
métodos adecuados para hallar la verdad en la disciplina científica en
cuestión.
Pero, ¿está claro desde alguna de estas dos perspectivas que la fi­
losofía y la ciencia puedan ser diferenciadas una de la otra en una
forma más rotunda? Muchos insinúan que no. En las ciencias especí­
ficas, las teorías se adoptan a veces no sólo por ser consistentes con
los datos observacionales, sino también por otros motivos como el
grado de simplicidad, el poder explicativo u otras consideraciones
que se cree que contribuyen a su plausibilidad intrínseca. Cuando
advertimos esto, comenzamos a perder confianza en la idea de que
hay dos reinos muy diferentes de proposiciones, aquéllas respaldadas
sólo por los datos y aquéllas respaldadas sólo por la razón. Muchos
metodólogos contemporáneos, como W. V. Quine, mantendrían que
las ciencias naturales, las matemáticas y hasta la lógica pura forman
un continuo unificado de creencias sobre el mundo. Todas ellas, afir­
man estos metodólogos, están indirectamente respaldadas por los
datos observacionales, pero todas ellas contienen asimismo elemen­
tos de apoyo «racionales». Si esto es cierto, ¿no formaría incluso la fi­
losofía, entendida como las verdades de la razón, parte integrante asi­
mismo del todo unificado? Esto es, ¿no sería también la filosofía
simplemente un componente del cuerpo de las ciencias especiali­
zadas?
Cuando preguntamos por la adecuada descripción y justificación
de los métodos de la ciencia, parece que esperamos que los resulta­
dos específicos de las ciencias particulares entren de nuevo en juego.
¿Cómo podríamos entender la aptitud de los métodos de la ciencia
para conducirnos a la verdad sin ser capaces de demostrar que estos
métodos poseen efectivamente la fiabilidad que se les ha atribuido?
Y ¿cómo podríamos hacer esto sin emplear el conocimiento sobre
cómo es el m undo que nuestra mejor ciencia disponible nos ha reve­
lado? ¿Cómo podríamos, por ejemplo, justificar nuestra confianza en
la observación sensorial en la ciencia si nuestro entendimiento de los
procesos perceptivos, un entendimiento que descansa en la física, la
neurología y la psicología, no nos garantizase que la percepción, en la
16 Filosofía de la física

forma que se utiliza para probar las teorías científicas, era efecti­
vamente una buena guía hacia la verdad sobre la naturaleza del
mundo?
Es en la discusión de las teorías más fundamentales y generales
de la física donde la indistinción de la frontera entre las ciencias na­
turales y la filosofía se hace más evidente. Dada la clara ambición de
estas teorías por describir el mundo natural en sus aspectos más fun­
damentales y generales, no resulta sorprendente que los tipos de ra­
zonamiento aplicados en el desarrollo de estas teorías sumamente
abstractas parezcan a veces más próximos al razonamiento filosófico
que a los métodos empleados en llevar a cabo una investigación cien­
tífica más limitada y particular. Más adelante, cuando exploremos los
conceptos y métodos utilizados por la fi'sica en el estudio de sus
cuestiones más fundamentales, veremos una y otra vez cómo puede
no estar claro en absoluto si estamos explorando cuestiones de la
ciencia natural o cuestiones de la filosofía. De hecho, en este domi­
nio de nuestra exploración de la naturaleza del mundo, la distinción
entre las dos disciplinas se torna muy confusa.

Física moderna y filosofía

Nos será de ayuda echar una mirada preliminar a algunas de las for­
mas en que los resultados de la física moderna han afectado a las
cuestiones filosóficas. Esto puede suceder cuando un estudio teórico
en física ejerce presión contra lo que se ha considerado que son lími­
tes de su dominio de indagación. Consideremos, por ejemplo, la cos­
mología moderna. El modelo más ampliamente aceptado de la es­
tructura a gran escala de nuestro universo es el big bang. En él se
traza la evolución del universo actual hacia atrás en el tiempo, con
un contraimiento de las dimensiones espaciales del universo en esa
dirección temporal de retroceso. Una gran parte de la estructura y di­
námica actuales del universo puede ser aparentemente explicada si
suponemos que el universo se ha desarrollado de una manera explo­
siva a partir de una singularidad en un tiempo finito en el pasado. Es
decir, parece que en algún momento del pasado (del orden de como
mucho unas cuantas decenas de billones de años atrás) toda la mate­
ria del universo estaba concentrada «en un punto» del espacio (o,
mejor aún, el espacio mismo estaba concentrado en esa forma).
Introducción: la filosofía y las ciencias físicas 17

Pero semejante modelo del universo obviamente da lugar a cues­


tiones asombrosas que parecen llevarnos más allá de los modos de
búsqueda de una respuesta que nos son familiares en la discusión de
cuestiones de causalidad a la escala astronómica. Si el estado actual
del universo puede retrotraerse en el tiempo a través de una serie de
causas y efectos a la singularidad inicial, ¿qué podemos hacer enton­
ces para continuar el proceso de pregunta-y-respuesta de la ciencia y
buscar la explicación causal de la existencia y naturaleza de ese mis­
mo estado inicial singular? Sencillamente, no tenemos claro qué tipo
de respuesta explicativa podríamos dar a una pregunta como, «¿por
qué tuvo lugar el big bang
y por qué se dio en la forma que lo hizo?
Hemos, por así decirlo, rebasado el ámbito de las respuestas explica­
tivas del tipo familiar. La cadena de razonamiento causal regresivo de
un estado a un estado anterior postulado como causa suficiente pare­
ce detenerse en la singularidad inicial del big bang.
Esto no significa que no se pueda imaginar algo parecido a una
explicación de la ocurrencia y naturaleza del big bang,
sólo que en
este punto parece que los modos de pensamiento científicos habitua­
les han de ser complementados con otros modos familiares al filóso­
fo. Lo que se cuestiona es la naturaleza misma de nuestra demanda
de una explicación, el tipo de contestación que podríamos esperar
como respuesta a dicha demanda. A quí la física y la filosofía parecen
converger, pasando las cuestiones específicas sobre la naturaleza del
mundo a estar inextricablemente entrelazadas con cuestiones de un ti­
po más metodológico acerca precisamente de qué tipo de descripción
y explicación del mundo puede esperarse propiamente de la ciencia.
Otra presión a «filosofar» en la física contemporánea proviene de
que los cambios en nuestra imagen física del m undo exigen una revi­
sión radical de nuestra conceptualización del mismo. Cuando inten­
tamos acomodar los desconcertantes datos observacionales que nos
abocaron a las nuevas revoluciones científicas, descubrimos pronto
que muchos de nuestros preciados conceptos para tratar con el m u n ­
do dependen para su viabilidad de la presencia de ciertas caracterís­
ticas estructurales en nuestra imagen del mundo. En algunos casos se
trata de características cuya existencia ni siquiera advertimos hasta
que son cuestionadas por las nuevas teorías físicas revolucionarias.
Pero, una vez que estas características de nuestra imagen teórica son
puestas en tela de juicio, los conceptos que dependen de ellas dejan
de funcionar para nosotros como lo han hecho hasta entonces y
18 Filosofía de la física

debemos revisar nuestros conceptos. Pero semejante revisión concep­


tual es justamente la clase de cosa que nos impone una investigación
típicamente filosófica del significado mismo de los conceptos que he­
mos estado utilizando todo el tiempo y de las revisiones de significa­
do necesarias para acomodar el nuevo entendimiento conceptual del
mundo.
Consideremos, por ejemplo, la revisión de nuestro concepto del
tiempo implicada por la teoría especial de la relatividad. Por razones
que analizaremos más tarde, la adopción de esta teoría exige que di­
gamos muchas cosas sobre el tiempo que parecen ser manifiestamen­
te absurdas. Dos sucesos que ocurren al mismo tiempo para un «ob­
servador» pueden, en esta teoría, no ser simultáneos para algún otro
observador en movimiento con respecto al primero. El mismo orden
temporal de algunos sucesos (sucesos que no son causalmente conec­
tables entre sí) puede invertirse con respecto a observadores diferen­
tes. Sin embargo, nuestro anterior concepto del tiempo suponía, casi
inconscientemente, que lo que es simultáneo para un observador es
simultáneo para todos, y que si el suceso a es anterior al suceso b,
esto es un hecho «absoluto» para todos los observadores.
La naturaleza de la nueva teoría del espacio y el tiempo, trayen­
do consigo sus conceptos revolucionarios, nos impone una profunda
reconsideración de todo lo que conformaba nuestras viejas presupo­
siciones teóricas y nuestro viejo aparato conceptual. Dicha reconside­
ración nos lleva a examinar con detenimiento justamente lo que en
nuestra concepción anterior estaba fundado en la experiencia y lo
que se presuponía sin razón o justificación. Y los cambios revolucio­
narios nos imponen el deber de explorar detenidamente la forma en
que los conceptos dependen de la estructura teórica en la que se en­
cuentran inmersos, y cómo los cambios en esa estructura pueden le­
gítimamente exigir una renovación conceptual de nuestra parte.
Como veremos, al pasar de la teoría especial a la teoría general de la
relatividad, necesitaremos estructuras todavía más noveles del espa­
cio y el tiempo. Será posible considerar al menos la posibilidad de
mundos en los que, por ejemplo, un suceso dado se encuentre, en un
sentido perfectamente coherente, en su propio pasado y futuro. Cla­
ramente, esta clase de cambio cuenta como una revolución concep­
tual. El entendimiento de justamente cómo pueden darse dichas re­
voluciones conceptuales, y de lo que ocurre exactamente cuando una
tiene de hecho lugar, es el tipo de problema apropiado para la inves­
Introducción: la filosofía y las ciencias físicas 19

tigación filosófica. La filosofía queda ahora integrada en la teoriza­


ción física.
Otro ejemplo más de la clase de revolución científica conceptual
que exige que la reflexión filosófica pase a formar parte de la prácti­
ca científica concierne al impacto de la teoría cuántica en nuestras
nociones tradicionales de causalidad. Una gran parte de nuestra cien­
cia presuponía la idea de que cada suceso podía ser explicado aso­
ciándolo de una forma legal con alguna condición anterior del m un­
do. Dicha suposición era en muchos sentidos un principio guía en la
búsqueda de explicaciones científicas cada vez más globales de los
fenómenos de la experiencia. Si un suceso parecía no responder a
ninguna causa, sólo podía ser un reflejo de nuestra ignorancia, del
hecho de que aún no habíamos hallado la causa cuya existencia
estaba asegurada por el principio general de que «todo suceso tiene
una causa».
Pero, según veremos, muchos han afirmado que este principio no
puede seguir siendo considerado como verdadero en un mundo des­
crito por la mecánica cuántica. ¿Qué tipo de teoría podría decirnos
que hay sucesos no causados en el mundo, sucesos para los que la
búsqueda de una causa determinante subyacente es una empresa
abocada al fracaso? La respuesta no es una cuestión sencilla. El fallo
de la causalidad universal implicado por la mecánica cuántica es par­
te de una revuelta conceptual mucho más profunda a la que nos he­
mos visto forzados por esta teoría. De hecho, pocos de los que han
explorado las cuestiones con detenimiento piensan que alguna de las
descripciones del mundo ya construidas llegará a hacer justicia a los
hechos que la mecánica cuántica nos dice que encontraremos en el
mundo. Ideas básicas sobre lo que constituye «la realidad objetiva»,
como opuesta a nuestra experiencia subjetiva de ella, devienen pro­
blemáticas a la luz de esta asombrosa teoría. Una vez más (y éste es el
único comentario que haré aquí), la naturaleza revolucionaria de los
datos de la experiencia y de la teoría construida para dar cuenta de
ellos en la física moderna nos impone el tipo de examen crítico y de­
tenido del papel desempeñado (algunas veces sólo implícita e incons­
cientemente) por ciertos conceptos fundamentales en nuestras viejas
teorías. Además, esa misma naturaleza revolucionaria requiere un
examen filosófico detenido sobre la forma en que lat revisión de la
teoría nos impone una revisión de la estructura conceptual. Los tipos
de pensamiento y razonamiento familiares en contextos filosóficos
20 Filosofía de la física

pasan a ser parte integrante de la ciencia en el contexto de las revo­


luciones conceptuales.
La filosofía ha sido también integrada en la práctica científica de
la física moderna mediante la irrupción en la teorización científica de
un tipo de crítica epistemológica que antes sólo se encontraba en la
filosofía. La física anterior descansaba en suposiciones sobre qué po­
día constituir datos legítimos para fundamentar la inferencia a teorías
físicas y qué podía constituir reglas legítimas de inferencia por las
que uno pasaba de las compilaciones de datos observados a las hipó­
tesis generalizadas y a las teorías postuladas. Con frecuencia se deja­
ba a los filósofos la tarea de desentrañar las suposiciones implícitas
hechas por las ciencias, de esclarecer su naturaleza y examinar su le­
gitimidad. Pero en la física moderna se ha hecho ineludible para los
teóricos, como parte de su práctica científica, el explorar estas cues­
tiones básicas concernientes a nuestras razones para aceptar y recusar
hipótesis. Los trabajos de Einstein en la teoría de la relatividad y de
Bohr en la mecánica cuántica son particularmente reveladores de
esta nueva corriente epistemológica.
En su artículo seminal sobre la teoría especial de la relatividad,
por ejemplo, A. Einstein afronta una serie de dificultades teóricas y
observacionales sumamente complejas de la física existente. Su forma
de abordar estos problemas se funda en una discusión extraordina­
riamente original y brillante de la pregunta, «¿cómo podemos deter­
minar si dos sucesos separados espacialmente ocurren o no al mismo
tiempo?». Esta exploración en la base evidencial e inferencial de
nuestra legítima postulación teórica conduce a Einstein al núcleo
central de su nueva teoría, la relatividad de la simultaneidad respecto
al estado de movimiento del observador. Si bien Einstein deriva, de
hecho, de sus postulados básicos algunas consecuencias observacio­
nales asombrosamente nuevas y de importancia fundamental, mu­
chos de sus resultados predichos estaban contenidos en la teoría an­
terior de H. Lorentz. Pero incluso para estas consecuencias, el
trabajo de Einstein constituye un avance de una importancia funda­
mental. Vistas desde su nueva perspectiva, las fórmulas anteriores ad­
quieren un significado completamente diferente. Es esencial observar
que esta nueva perspectiva se funda en un examen filosófico-crítico
de la base evidencial de nuestras inferencias teóricas. Sorprendente­
mente, como veremos más adelante, un examen epistemológico críti­
co muy similar de otras teorías más antiguas se encuentra en el pro-
Introducción: la filosofía y las ciencias físicas 21

pió núcleo de la otra teoría fundamental de Einstein sobre el espacio


y el tiempo: la teoría general de la relatividad.
La mecánica cuántica nos proporciona otro ejemplo principal de
cómo la crítica epistemológica juega un papel crucial en la física mo­
derna. La cuestión sobre la naturaleza del proceso de medida, el pro­
ceso mediante el que un observador exterior explora un sistema físi­
co con la intención de determinar su estado, resulta fundamental
para un entendimiento del significado de las fórmulas centrales de la
mecánica cuántica. Desde los primeros comienzos de esta teoría, las
cuestiones sobre lo que es observable jugaron un importante papel
conceptual. Más tarde, las tentativas llevadas a cabo para entender
consecuencias tan curiosas de la teoría como el denominado Princi­
pio de Incertidumbre exigieron, una vez más, un examen crítico de
aquello que podía ser determinado observacionalmente. Por último,
las tentativas de entender el marco de trabajo conceptual fundamen­
tal de la teoría llevaron a Niels Bohr a afirmar que la nueva teoría fí­
sica exigía una revisión extraordinariamente radical de nuestras ideas
tradicionales sobre la relación entre lo que sabemos del m undo y lo
que de hecho es el caso sobre él. La idea misma de una naturaleza
objetiva del mundo independiente de nuestro conocimiento sobre el
mismo fue atacada en el programa de Bohr. Una vez más, ideas pre­
viamente familiares en el contexto de la filosofía pasaron a formar
parte de la física. En filosofía, la negación de la objetividad y las vin­
dicaciones a favor de varias doctrinas de la relatividad o de la subje­
tividad para el mundo son una vieja historia.
La interacción entre la filosofía y la física no comenzó con estas
teorías del siglo XX. Como veremos, hubo cuestiones filosóficas entre­
lazadas con los primeros desarrollos de la dinámica (especialmente
en I. Newton). En el siglo XIX, los debates filosóficos desempeñaron
un papel crucial en el desarrollo de la nueva teoría atómico-molecu-
lar de la materia. Otras polémicas de cariz filosófico fueron importan­
tes para establecer la base conceptual de la teoría del electromagne­
tismo, con su invocación del «campo» como un componente
fundamental del mundo físico. Pero la física moderna ha llevado sus
exploraciones hasta los mismos límites del mundo. Al hacer esto, ha
forzado el aparato conceptual adecuado para tratar con cuestiones
más limitadas. La física, en su intento de hacer justicia a los comple­
jos e inesperados fenómenos revelados por las técnicas experimenta­
les modernas, exige la revisión radical de conceptos anteriormente
22 Filosofía de la física

no cuestionados. Las nuevas teorías demandan un examen de las ba­


ses evidencíales e inferenciales tras sus postulados. En consecuencia,
la física teórica moderna se ha convertido en un foro en el que los
modos filosóficos de pensamiento son un componente esencial del
progreso físico. Es este entrelazamiento de la física y la filosofía lo
que vamos a explorar.

Filosofía de la física y filosofía general

Acabamos de ver algunas de las razones por las que la filosofía ha ad­
quirido importancia para quienes se preocupan por la naturaleza de
la teoría física. Podría ser de ayuda explicar también porqué el estu­
dio de los fundamentos de la teoría física y de sus aspectos filosófi­
cos reviste valor para los filósofos que no se interesan específicamen­
te por la naturaleza de la física. A mí me gustaría sugerir que los
problemas investigados por los filósofos de la física y los métodos
que emplean para explorar estos problemas pueden arrojar luz sobre
cuestiones filosóficas más generales asimismo.
Los filósofos de la ciencia están interesados en cuestiones tales
como la naturaleza de las teorías científicas, la manera en que éstas
explican los fenómenos del mundo, la base evidencial e inferencial
de estas teorías y la forma en que esa evidencia puede ser utilizada
para respaldar justificadamente o desalentar la creencia en una hipó­
tesis. Podemos lograr un mayor discernimiento explorando estas
cuestiones más generales en el contexto de teorías específicas de la
física contemporánea. El vasto alcance de las teorías y su naturaleza
sumamente explícita proporcionan un contexto en el que muchas
cuestiones de la filosofía general de la ciencia, de lo contrario bastan­
te vagas, se hacen más «fijas» cuando centramos nuestra atención en
estas teorías físicas especiales.
Al estar las teorías sumamente formalizadas, el lugar que en ellas
ocupan conceptos cruciales está sencilla y claramente delimitado. Las
cuestiones sobre el significado de los conceptos cruciales, su elimina-
bilidad o irreducibilidad, sus relaciones definitorias y otras más, pa­
san a ser sometidas a un examen riguroso. Dicho examen es más difí­
cil de realizar cuando se trata de los conceptos más «relajados» de
ciencias no tan bien formalizadas. Como también veremos, la rela­
ción de la estructura postulada teóricamente a los hechos obser-
Introducción: la filosofía y las ciencias físicas 23

vacionales de los que es inferida está particularmente clara en m u­


chos de los casos de la física formalizada. En las teorías del espacio y
el tiempo, por ejemplo, el propio contexto de teorización científica
presupone nociones bastante definidas de lo que ha de considerarse
como «hechos accesibles a la inspección observacional directa», los
cuales han de proporcionar la totalidad del soporte evidencial de la
teoría. Así, cuestiones sobre si la totalidad de dichos hechos podría
seleccionar un único competidor teórico viable, respaldándolo frente
a todos sus contendientes, son tratadas en una forma iluminadora,
una de la que carecemos en el contexto científico general. En este úl­
timo contexto no hay una noción clara de los límites de la observa­
ción, ni una clara delimitación de la clase de posibles alternativas
teóricas a considerar. Si exploramos cuestiones tales como la elimina-
bilidad o no eliminabilidad de los conceptos teóricos o el grado al
que las elecciones teóricas están condicionadas por los hechos obser­
vacionales en el contexto de las teorías fundamentales de la física, te­
nemos una forma de tratar con estas cuestiones metodológicas gene­
rales: examinamos casos específicos que confieren una agudeza
especial a las cuestiones filosóficas. El discernimiento logrado en este
dominio, más formalizable y delimitado, puede resultar de provecho
a quienes están involucrados en cuestiones más amplias.
Estas consideraciones pueden de algún modo ser generalizadas.
Los filósofos que se ocupan de las cuestiones generales de la metafí­
sica, la epistemología y la filosofía del lenguaje descubrirán que la ex­
ploración de cuestiones en estos campos, al ser las cuestiones ejem­
plificadas en los casos particulares concretos de la teoría física,
arrojará luz sobre las formas adecuadas de tratar con las cuestiones
generales. N o se puede avanzar mucho en el entendimiento de las es­
tructuras específicas de las teorías físicas parciales sin utilizar los re­
cursos aportados por quienes exploran las cuestiones más generales y
fundamentales de la filosofía. Lo que es más, no se puede realizar
ningún claro progreso en estas áreas más generales sin ver cómo se
comportan los métodos y las soluciones generales cuando se aplican
a casos específicos. Y los casos específicos de los fundamentos filosó­
ficos de la teoría física fundamental son, de nuevo, particularmente
adecuados como casos prueba de las vindicaciones filosóficas gene­
rales. ,
Una última cuestión relacionada merece un momento de aten­
ción. Uno encuentra con frecuencia en la literatura afirmaciones muy
Filosofía de la física

.11 revidas de que la física contemporánea ha resuelto decisivamente


viejos debates filosóficos de una vez por todas. «La mecánica cuánti­
ca reiuta la afirmación de que todos los sucesos tienen una causa» es
un ejemplo frecuente. Algunas veces, asombrosamente, los dos ban­
dos de un debate filosófico sostienen que una teoría resuelve un pro­
blema en su favor. Así, se ha argüido que la teoría general de la rela­
tividad resuelve decisivamente la cuestión de la naturaleza del
espacio. Pero algunos arguyen que refuta el sustantivismo, mientras
otros arguyen que resuelve el debate ¡en favor de esa doctrina! Vindi­
caciones tan burdas e incompetentes son decepcionantes porque las
cuestiones son complejas y los razonamientos a menudo frustrante-
mente sutiles y opacos. Bajo dichas circunstancias, las vindicaciones
de una victoria decisiva de cualquier tipo deberían ser tratadas al
menos con cierto escepticismo.
Tendremos que tener un cuidado especial con las conclusiones
filosóficas derivadas de los resultados físicos. En analogía con el Prin­
cipio G IG O de la ciencia de los computadores («garbage in, garbage
out») [«basura in, basura out»], podemos llamar a esto el Principio
M IM O : «metafísica in, metafísica out». N o hay duda de que cual­
quier vindicación filosófica debe ser reconciliada con los mejores re­
sultados de la ciencia física a nuestra disposición. Ni hay duda algu­
na de que el progreso de la ciencia ha proporcionado un útil
antídoto contra mucho dogmatismo en la filosofía. Pero al examinar
lo que la física nos dice sobre las cuestiones filosóficas, debemos te­
ner siempre presente preguntar si se han insertado presuposiciones
filosóficas en la propia teoría. Si descubrimos que dichas presuposi­
ciones han sido incluidas en la propia teoría, debemos de estar prepa­
rados para examinar detenidamente la cuestión de si esa forma de
presentar la teoría es la única forma en la que sus resultados científi­
cos podían haber sido acomodados o si pudiera haber otras presupo­
siciones que nos llevarían a derivar conclusiones filosóficas bastante
diferentes en caso de formar parte de la teoría.

Finalidad y estructura de este libro

Por último, ofreceré unas pocas observaciones sobre la finalidad y la


estructura de este libro. La investigación sistemática y exhaustiva de
cualquiera de los principales problemas de la filosofía es una tarea
Introducción: la filosofía y las ciencias físicas

larga y ardua. Un dominio de los contenidos de''l»»J&tí¿i*sí\í funda­


mentales de la física contemporánea requiere un estudio preSuJk del
difícil y extenso cuerpo de las matemáticas, ya que las teorías están a
menudo gestadas en el poderoso y abstracto lenguaje de la matemáti­
ca contemporánea. El estudio de los elementos físicos especiales de
las teorías debe añadirse al trasfondo matemático. Por encima de
esto, la indagación filosófica requiere un conocimiento firme de m u­
chos aspectos de la filosofía analítica contemporánea: la metafísica, la
epistemología, y la filosofía del lenguaje.
Un intento de hacer plena justicia a cualquiera de los problemas
centrales de la filosofía en una obra introductoria como la presente
está claramente fuera de toda cuestión. Nuestra finalidad aquí, antes
bien, es suministrar al lector un mapa de carreteras de las áreas don­
de se encuentran los problemas centrales en el campo. El libro se
centra en lo que, a mi entender, parecen ser las cuestiones más im ­
portantes de la filosofía de la física. Muchos otros tópicos interesan­
tes apenas serán tocados y algunos serán dejados completamente a
un lado, con la intención de dirigir toda la atención posible a las
cuestiones más cruciales y centrales.
En lo que a los tópicos considerados respecta, proporciono un
bosquejo o resumen de las principales características de las teorías fí­
sicas que interaccionan más crucialmente con la filosofía. M i propósi­
to es ofrecer un tratamiento suficientemente claro y conciso de estas
cuestiones a fin de conducir al lector interesado a través de los cami­
nos, en ocasiones laberínticos, seguidos por los debates centrales. Los
capítulos 2, 3 y 4 están complementados con una guía comentada de
la literatura. El lector interesado en seguir con detalle las cuestiones
esbozadas en el texto encontrará en estas secciones de referencia una
guía a los materiales de fondo básicos en matemáticas, física y filoso­
fía, así como una guía a las discusiones contemporáneas más impor­
tantes del problema específico. Las secciones de referencia no están
concebidas como un examen exhaustivo de la literatura sobre cual­
quiera de los temas tratados (una literatura en ocasiones muy exten­
sa) sino, antes bien, como una guía selectiva de los materiales más
útiles para hacer avanzar al lector de una forma sistemática.
Pese a haber intentado incluir en las secciones de referencia ma­
terial accesible a aquellos que no dispongan de unos conocimientos
básicos extensos de matemáticas y física teórica, no he excluido ma­
terial que requiera conocimiento en estas áreas para su comprensión.
26 Filosofía de la física

El material que requiere un conocimiento bastante modesto de este


tipo (digamos al nivel medio de una licenciatura) está señalado con
(*). El material que requiere una mayor familiaridad con los concep­
tos y métodos técnicos está señalado con (**)■
Las tres áreas principales que exploraremos en este libro son las
concernientes al espacio y tiempo, a las teorías probabilísticas y esta­
dísticas de tipo «clásico», y a la mecánica cuántica. Esto nos permiti­
rá examinar muchas de las áreas problemáticas actuales más asom­
brosas y fundamentales en la filosofía de la física. Otra área principal
será tratada sólo incidentalmente, aunque introduce de suyo muchas
cuestiones sumamente interesantes que han sido sólo parcialmente
exploradas. Se trata de la teoría general de la materia y su constitu­
ción tal y como es descrita por la física contemporánea. Las cuestio­
nes que derivan de la postulación del campo como un elemento bási­
co del mundo, de problemas en la teoría de la constitución de la
materia a partir de sus microconstituyentes en una jerarquía descen­
dente que nos lleva a través de las moléculas y los átomos a las partí­
culas elementales (y quizá más allá), y de la teoría fundamental de las
propias partículas elementales serán tocadas solamente de paso al
ocuparnos de las tres áreas de problemas centrales mencionadas más
arriba.
Capítulo 2
ESPACIO, TIEMPO, MOVIMIENTO

Problemas filosóficos tradicionales del espacio y el tiempo

Cuestiones acerca del conocimiento


Los grandes filósofos de la Grecia Antigua confrontaron el problema
de entender qué significa tener conocimiento del mundo. ¿Cuáles
son los fundamentos, se preguntaron, y cuáles los límites de nuestra
capacidad de conocer cómo es realmente el mundo que nos rodea?
No es sorprendente que esta empresa, dirigida a intentar distinguir el
conocimiento verdadero de la mera opinión, comenzase examinando
las creencias ordinarias sobre aquello que, al entender de la persona
racional corriente, podía constituir un conocimiento bien fundado.
Había, claro está, muchas creencias particulares compartidas
acerca de la existencia y de la naturaleza de los objetos individuales
del mundo que hallamos en nuestra vida cotidiana. Pero, ¿había tam­
bién verdades generales sobre el m undo que pudieran asimismo ser
conocidas, verdades sobre todos los objetos o características de un ti­
po dado?
Algunas verdades generales parecía que podían ser establecidas
por generalización de nuestra experiencia cotidiana. Así, parecía po­
der inferirse de la observación que las estaciones del año seguirían
perpetuamente su curso habitual. Que las rocas caían, que el fuego
27
28 Filosofía de la física

ascendía, que los seres vivos procreaban y después, tras un proceso


de maduración, perecían, y muchas otras verdades generales forma­
ban parte de un haber común de creencias. Pero la reflexión crítica
demostró que en la observación, expuesta como estaba a la ilusión y
al error de percepción, no se podía con frecuencia confiar. Y con fre­
cuencia se halló que las creencias generales derivadas de la experien­
cia dejaban de ser válidas cuando se añadían nuevas experiencias.
Además, las verdades derivadas parecían carecer de exactitud y pre­
cisión, salvo en esferas de la experiencia tan reducidas como la de la
astronomía, donde se observaba una regularidad más perfecta y per­
manente que la hallada en la experiencia de las cosas terrenales ordi­
narias.
No obstante, en su búsqueda en pos de las verdades generales
acerca de la estructura fundamental del mundo, los griegos también
contaron con las teorías de los primeros grandes filósofos especulati­
vos. Entre las muchas teorías generales principales que se propusie­
ron estaba que todas las cosas están formadas por un pequeño núme­
ro de sustancias básicas; que el cambio debe explicarse por el
reordenamiento de los átomos invariables; que el m undo es funda­
mentalmente inmutable o, por el contrario, que está en flujo constan­
te. Pero, si bien estas teorías fundamentales del universo eran apasio­
nantes y profundas, parecían carecer de la clase de soporte evidencial
que podría persuadir a un escéptico a aceptarlas como verdaderas.
Sus proponentes, por supuesto, las defendieron, unas veces invocan­
do burdas verdades generales derivadas de la observación, otras afir­
mando abiertamente que podían llevar al convencimiento por el pro­
ceso del razonamiento puro. Pero ninguna doctrina gozó de
aceptación universal, es decir, ninguna doctrina probó ser verdadera
por una evidencia incuestionable.
¡Y entonces se hizo la geometría! Aquí uno parecía contar con un
cuerpo de aserciones de significado completamente claro, aserciones
sobre la naturaleza del m undo que eran exactas y precisas y de las
que se podía saber si eran verdaderas con certeza. Ejemplos de esta
clase de verdades son que al duplicar la longitud de un lado de un
cuadrado su área queda multiplicada por cuatro, y que el cuadrado
de la longitud de la hipotenusa de un triángulo rectángulo es la suma
de los cuadrados de las longitudes de los otros dos lados. Éstas y
otras afirmaciones de la geometría poseían una claridad y una certeza
no presente en ningún otro tipo de enunciados sobre el mundo.
Espacio, tiempo, movimiento 29

Esta certeza existía porque las proposiciones de la geometría po­


dían ser demostradas, un hecho que había sido descubierto por los
griegos poco antes de la gran era de la filosofía griega clásica. Las
proposiciones podían ser derivadas por razonamiento puramenteTó-
gico a partir de primeros principios, axiomas o postulados, que pare­
cían verdaderos en sí mismos a la mente razonable. El razonamiento
utilizado procedía seguro intuitivamente de no llevar de una verdad
a una falsedad. Uno partía de verdades tan obvias como que dos
puntos fijos determinaban una, y solo una, recta que contenía a los
dos y que iguales sumados a iguales daban iguales. Entonces, por una
cadena de razonamientos en la que cada paso era una transición de
una proposición a otra proposición que conducía a uno de‘ manera
autoevidefite de una verdad a otra, se podía finalmente alcanzar una
conclusión cuya verdad quedaba entonces garantizada con seguridad.
Éstas eran las verdades acerca d^ la compleja estructura geométrica
del mundo.
Tan asombrosa es esta característica de la geometría, su capaci­
dad de aportarnos un conocimiento sobre la estructura del m undo
avalado por una inferencia incuestionable a partir de verdades bási­
cas, simples e incuestionables, que todo otro tipo de conocimiento
putativo les pareció a los filósofos a lo más un tipo de conocimiento
de segunda clase. El conocimiento fundado en los sentidos estaba su­
jeto a los familiares tipos de errores sensoriales — percepción errónea
e ilusión. Y el conocimiento que surgía por vía de generalización a
partir de los datos concretos de la sensación contaba con un doble
inconveniente, la posibilidad de error sensorial y la posibilidad de
que nuestras inferencias generalizadoras pudieran de suyo conducir­
nos de la verdad a la falsedad. Mientras la preservación de la verdad
de las inferencias puramente lógicas que nos conducían de los postu­
lados básicos a los teoremas geométricos parecía estar garantizada
por la intuición, las reglas para trascender la experiencia de los senti­
dos y pasar a afirmaciones generales sobre la naturaleza parecían ca­
recer de dicha garantía avalada por la intuición.
Para muchos, la creencia fundada en la observación sensorial y
en la inferencia a partir de ésta se convirtió simplemente en un preli­
minar al establecimiento de un conocimiento auténtico por el méto­
do «geométrico». Los filósofos insistieron durante mucho tiempo en
el ideal de que, sólo con ser lo suficientemente inteligentes, podría­
mos algún día construir un edificio de conocimiento que compren-
30 Filosofía de la física

diese todos los campos de investigación, la física de la naturaleza, la


psicología de la mente, incluso los principios básicos de la moral que
rigen las verdades de lo bueno y lo malo, así como de lo correcto y
lo incorrecto, al descubrir en todos estos campos sus primeros princi­
pios, verdaderos en sí mismos, análogos a los axiomas de la geome­
tría. Podríamos entonces derivar a partir de estos primeros principios
el conjunto entero de verdades en cada área, de la misma forma que
los teoremas de la geometría se siguen por la lógica solamente de los
postulados geométricos básicos.
Con la creciente influencia de la observación y del experimento
en la fundamentación de la ciencia que surgió tras la revolución
científica, y dada la incapacidad para formular una «geometría» de la
naturaleza y la moral, la gente se volvió escéptica respecto a la conve­
niencia del modelo geométrico para la estructura del conocimiento
científico. En su lugar, los modelos del conocimiento basados en la
observación y la generalización a partir de ésta se hicieron más atrac­
tivos, al menos para la mayoría de los filósofos.
David Hume sugirió que, de hecho, no podía existir un conoci­
miento auténtico del mundo fundado en la autoevidencia intuitiva y
la inferencia lógica. Dicho conocimiento infalible, sugirió, sólo podía
ser conocimiento de proposiciones «vacías», proposiciones verdade­
ras sólo en virtud de la definición de sus términos (tal como la pro­
posición de que ningún soltero está casado). Toda proposición verda­
dera, llena de contenido, podía conocerse, si es que podía, sólo con
dependencia de los sentidos y por la generalización de los mismos
que nos condujo a las creencias en las relaciones causales en el m un­
do. En particular, Hume negó toda posibilidad a la metafísica, la ra­
ma de la filosofía que se ocupa de establecer verdades profundas y
generales acerca de la naturaleza del mundo sobre la base del razona­
miento puro únicamente.
La respuesta de Immanuel Kant a Hum e fue especialmente im ­
portante.. Pese a coincidir con Hum e en el rechazo escéptico de la
mayor parte de la metafísica tradicional, Kant reservó una pequeña
parte de ésta como constituida por aserciones verdaderamente llenas
de contenido, establecidas sin referencia alguna a la observación o al
experimento. Que semejantes verdades llenas de contenido pudieran
ser conocidas por la razón pura, argumentaba, quedaba demostrado
por la existencia de las dos ramas de la verdad matemática pura, la
geometría y la aritmética. Estas dos disciplinas consistían en verdades
Espacio, tiempo, m ovim iento 31

de las que ninguna persona racional podía dudar y que habían sido
establecidas por medio de la razón pura únicamente. Pero las verda­
des de estas disciplinas, pensó, no eran del tipo «vacío» evidentemen­
te. No forma parte del significado de «triángulo» que los ángulos in­
teriores de un triángulo sumen 180° en el mismo sentido que forma
parte del significado de «soltero» que un soltero no esté casado.
Kant sostenía que semejantes verdades llenas de contenido, que
podían ser establecidas por la razón, existían porque reflejaban la es­
tructura del aparato perceptivo y cognitivo de nuestras mentes con el
que aprehendíamos la naturaleza del mundo. Decía que una porción
limitada de la metafísica tradicional, la cual incluía aserciones tales
como «todo suceso tiene una. causa», compartía con la geometría y
con la aritmética la cualidad de poseer un contenido verdadero y, pe­
se a ello, ser cognoscible con independencia de la observación y del
experimento. Lo importante acerca de estas afirmaciones generales
para nuestros propósitos es el papel que en ellas juega la geometría.
Aun cuando la esperanza en una física, una psicología o una ética
fundada en la razón pura sea vana, ¿no persiste la teoría del espacio
— la geometría— , junto a la aritmética, como un cuerpo de conoci­
miento que no se funda en una generalización de los hechos concre­
tos observados que nos proporcionan los sentidos?
Muchos intentaron en los años posteriores a Kant justificar el pa­
recer de Hum e de que sólo podía demostrarse que las aserciones
que contenían enunciados verdaderamente informativos sobre el
mundo fuesen correctas mediante su confrontación con los datos de
la experiencia observacional. El estatus problemático de la geometría
y la aritmética recibió una gran dosis de atención, pues, si Hum e te­
nía razón, las disciplinas matemáticas podrían versar sobre el mundo
o podrían ser conocidas por la razón pura, pero nunca ambas cosas a
la vez. Algunos intentaron mostrar que esas disciplinas podían rete­
ner su estatus de cognoscibilidad con independencia de la experien­
cia observacional, pero sólo porque estaban libres de un contenido
verdaderamente informativo. Varias tentativas de mostrar que la ver­
dad matemática era el resultado de la lógica pura, combinada con la
definición de los términos matemáticos en el vocabulario puramente
lógico, se vieron suscitadas de esta forma.
Otros buscaron, por el contrario, preservar el contenido verdade­
ramente informativo de las ciencias matemáticas, pero rechazar la
pretensión kantiana de que pudieran ser establecidas por cualquier
Filosofía de la física

proceso <Je razonamiento puro que las hiciera, a diferencia de las


ciencias ordinarias, inmunes a la confrontación con la observación
como prueba definitiva de su credibilidad. J. S. Mili, por ejemplo, ar­
guyo que incluso las proposiciones de la aritmética eran establecidas
por un proceso de generalización a partir de los resultados de obser­
vaciones particulares. Podía parecer que las leyes básicas de la arit­
mética poseían un tipo de certeza autogarantizada. Pero esto era una
ilusión. Nosotros derivamos las leyes de la aritmética de nuestra ex­
periencia sensorial. Esta experiencia, sin embargo, nos es tan familiar
y está tan extendida que nos lleva a pensar erróneamente que las le­
yes de la aritmética no precisan de ninguna confirmación empírica.
De hecho, Mili pensó que, al igual que las leyes de la física y la quí­
mica, las leyes de la aritmética sólo podían ser establecidas por gene­
ralización a partir de la experiencia empírica.
Algunos teóricos del conocimiento reflexionaron sobre el modo
en que nuestras creencias forman una red compleja de aserciones, al­
gunas de las cuales son invocadas siempre que la sensatez de creer
en algunas de las otras es cuestionada. También observaron el grado
al que nuestras creencias deben estar fundadas en principios de infe­
rencia, tales como aceptar como razonable la teoría más simple que
podamos imaginar en consonancia con los datos empíricamente rele­
vantes. Los teóricos también argumentaron que estos principios pare­
cían inteligibles y justificables sólo si se admitía un conjunto ya exis­
tente de creencias que permanecían irrebatibles por el momento.
Veían con escepticismo la utilidad de cualquier distinción rígida en­
tre proposiciones cognoscibles mediante la razón pura y aquellas cog­
noscibles sólo con dependencia de los datos experimentales. De he­
cho, muchos veían con escepticismo la posibilidad de dividir
nuestras creencias, como Hum e quería hacer, en dos grupos: aquellas
que son verdaderas por convención (o por definición o por el mero
significado de los términos) y aquellas con un contenido informativo
genuino.
Desde esta perspectiva, todas nuestras creencias forman parte de
un tejido sin costuras de creencia teórica. Cada proposición contiene
elementos de convención y elementos de objetividad. En opinión de
estos filósofos, cada proposición confronta la experiencia sensorial
sólo cuando se une a un amplio cuerpo de creencias aceptadas. Sólo
como parte de una estructura teórica general puede ser una proposi­
ción probada por la experiencia o confirmada por ella. Es este cuer­
Espacio, tiempo, movimiento 33

po de creencias aceptadas, afirmaban, lo que fundamenta nuestros


principios de legítima inferencia científica.
No va a ser tarea nuestra en este libro examinar las diferentes op­
ciones en alguna profundidad. En lugar de ello exploraremos más
adelante el impacto de los cambios en el lugar ocupado por la geo­
metría en las matemáticas y en la física que influyeron en, y se vieron
influidos por, el problema más general de los fundamentos de la legí­
tima creencia científica. Ya hemos indicado que la existencia tempra­
na de la geometría como cuerpo ideal de un conocimiento verdade­
ramente científico sobre el m undo condujo a muchos filósofos a
limitar el conocimiento auténtico a aquél que pudiera ser establecido
por una impecable derivación lógica a partir de primeros postulados
autoevidentes e incuestionables. El descubrimiento y la exploración
por los matemáticos de alternativas a la familiar geometría euclídea,
que había reinado como la única geometría matemática durante m u­
chos siglos, y la posterior aplicación de las recién descubiertas geo­
metrías alternativas a las teorías físicas que intentaban describir el
mundo real fueron influencias clave sobre los filósofos que buscaron
polemizar con las cuestiones planteadas por el conflicto entre Kant y
Hume y llevadas adelante por otros. Estas eran las cuestiones concer­
nientes al fundamento último de nuestra creencia científica sobre el
mundo y a la medida en que esa creencia era responsable de los
datos evidencíales particulares de la observación y del experimento.

Cuestiones acerca de la naturaleza de la realidad

La geometría es la ciencia descriptiva del espacio. Pero, ¿qué clase de


cosa es el espacio? O mejor dicho, ¿cómo podemos integrar la espa-
cialidad del m undo en nuestra concepción global sobre la clase de
cosas y propiedades que existen? Es evidente que la espacialidad es
uno de los aspectos más generales y fundamentales del m undo según
lo experimentamos y según construimos su naturaleza por inferencia
a partir de dicha experiencia. En nuestro lenguaje y práctica corrien­
tes nos sentimos plenamente contentos con el uso que hacemos de
nociones espaciales tales como distancia, contención espacial, y conti­
nuidad y discontinuidad en el espacio, cuando tratamos con las im ­
portantes estructuras que rigen el mundo material que nos rodea.
Filosofía de la física

Pero cuando intentamos reflexionar sobre lo que el espacio es en y


por sí mismo nos vemos desconcertados.
Quizá lo primero que nos venga a la mente es que el espacio es
una suerte de «continente» de la materia del mundo. Pensamos en
las cosas como existentes en el espacio, de hecho, en un único espa­
cio total que contiene todas las cosas materiales del mundo. Pero in­
cluso esta idea de contención causa perplejidad, pues parece que el
espacio contiene objetos en virtud de la coincidencia virtual de los
objetos con los trozos del espacio mismo. Un objeto ocupa la parte
de espacio en la que se encuentra. Esto es claramente una clase de
contención diferente a la de, pongamos, un objeto contenido en una
caja.
Se nos ocurre de manera natural que podemos imaginar un mun­
do vacío de todas las cosas materiales, pero conservando aún una cla­
se de realidad. Se trataría de un espacio vacío esperando a ser llena­
do, o parcialmente llenado, por trozos de materia. Esta idea de
espacio como una clase de entidad, el continente fijo e invariable de
las cosas materiales ordinarias que pueden llegar a ser y dejar de ser
y pueden sufrir cambios en su naturaleza, está probablemente pre­
sente en el diálogo de Platón en el Timeo acerca del espacio como
«receptáculo» del ser material.
Pero, ¿qué clase de cosa o sustancia singular es esta fantasmal en­
tidad. el espacio mismo? Nos sentimos ciertamente con derecho a
hablar de «el espacio vacío entre las estrellas» o, incluso, a imaginar
el espacio completamente vacío de un mundo en el que toda la ma­
teria fue de alguna forma destruida como por arte de magia. Pero,
¿qué clase de cosa es esta sustancia que pretendemos llamar «espacio
vacío»? ¿Se trata de un único objeto particular del que forman parte
ciertos espacios, como el espacio de una habitación, al igual que un
trozo de pan forma parte de una barra entera? Esta cosa, el espacio,
tiene características, por ejemplo, las características descritas por las
verdades de la geometría. N o obstante, nuestra intuición nos dice
que pl espacio mismo es demasiado diferente de la materia ordinaria,
demasiado insustancial, para poder ser considerado como una cosa
en el mundo, junto a las cosas ordinarias que se encuentran en el es­
pacio. Pero, ¿de qué otra manera podemos ver la cuestión?
Aristóteles hablaba de «lugar». Es difícil descifrar lo que tenía en
mente exactamente, pero parece como si por lugar entendiese el con­
torno o límite de un trozo de materia. El movimiento es cambio de
Espacio, tiempo, m ovimiento 35

lugar, ya que un objeto cambia la superficie que lo limita por otra.


Pero, ¿significa esto que el espacio es alguna cosa adicional sobre y
por encima de la materia contenida en él? Uno presiente que Aristó­
teles está intentando escapar a esa conclusión, pero que no sabe qué
esquema conceptual poner en su lugar. Pronto examinaremos la prin­
cipal tentativa llevada a cabo por los filósofos posteriores para encon­
trar un esquema conceptual que haga justicia a las afirmaciones que
queremos hacer sobre objetos que existen en el espacio, que ocupan
un lugar, que son capaces de cambiar de lugar, etcétera, y que haga
también justicia a nociones intuitivas tales como la posibilidad de un
espacio desprovisto de materia. Esa propuesta posterior intentará
también evitar el escándalo de pensar en el espacio como un compo­
nente adicional del ser que puede tener una realidad independiente
de la existencia misma de la materia en él.
Si el espacio nos causa perplejidad, el tiempo nos desconcierta
todavía más. Nuestra intuición nos dice de nuevo que todo lo que
ocurre en el mundo ocurre en el tiempo. Aun cuando pensemos al­
gunas veces que nuestros estados mentales subjetivos podrían no
estar en el espacio (¿dónde, por ejemplo, se localizan los pensamien­
tos?), pensamos que incluso nuestros pensamientos deben producirse
en algún momento en el tiempo. Tenemos la impresión de que hay
un único tiempo en el que ocurre todo lo que ocurre, abarcando
cualquier proceso extenso una parte del tiempo total del mundo.
Algo similar al aspecto de continente del espacio parece ser cierto
también para el tiempo. Los tiempos de procesos que ocupan tiempo
coinciden con momentos del «tiempo mismo». Y, pensamos, es posi­
ble imaginar intervalos de tiempo en los que no se dan acontecimien­
tos materiales. ¿No podemos imaginar un mundo en el que toda la
materia y sus manifestaciones hubieran desaparecido, pero en el que
el tiempo proseguiría como siempre lo había hecho?
Pero si concebir el espacio como una «cosa» es extraño, mucho
más extraño es concebir el tiempo como una «entidad» en el sentido
ordinario. Pero si puede haber un flujo del tiempo aun cuando la
materia cese de existir, ¿no debemos reconocer al tiempo un tipo de
ser independiente de la existencia de las cosas ordinarias del mundo
y de sus cambios ordinarios en el tiempo?
Otras conexiones entre temporalidad y ser nos dejan más perple­
jos todavía. Parece que pensamos que la existencia misma de las
cosas ordinarias está vinculada al tiempo en una forma que no lo está
36 Filosofía de la física

al espacio. Si algo existió en el pasado, pero no existe ahora, pensa­


mos que no existe en absoluto, propiamente hablando. Y lo mismo
puede decirse de los objetos futuros que todavía no existen. Pero,
como san Agustín indicó, el presente es un instante evanescente de
tiempo, que hace que nos preguntemos cómo podemos decir con
propiedad de las cosas, dada su naturaleza temporal, que tienen una
existencia. A diferencia del espacio, el tiempo parece tener un aspec­
to asimétrico. El pasado y el futuro nos parecen muy diferentes, con
el pasado como una realidad fija, si bien desaparecida, y el futuro
como algo, quizá, sin una clase determinada de ser hasta que ocurre.
Otras características de la temporalidad de las cosas desconcerta­
ron tanto a los antiguos filósofos que algunos se volvieron completa­
mente escépticos respecto a la realidad del tiempo y a su cambio
concomitante. Zenón de Elea propuso argumentos tratando de mos­
trar que las nociones ordinarias de tiempo estaban plagadas de con­
tradicciones. ¿Cómo podía darse algo semejante al movimiento, por
ejemplo, si en cualquier instante particular un objeto estaba en repo­
so en el espacio que ocupaba en ese momento? Sucede que algunos
de los argumentos con los que Zenón pretendió poner de manifiesto
ciertas contradicciones internas en las nociones mismas de tiempo y
movimiento serían ahora juzgadas falaces. N o obstante, los dilemas
que Zenón planteó en otros argumentos proporcionan todavía un
punto de partida ventajoso a la discusión de cuestiones tales como
los esquemas conceptuales correctos para tratar la noción de espacio
y tiempo como continuos y del concepto de movimiento. Muchos lo­
gros valiosos en filosofía, así como el desarrollo de las matemáticas
apropiadas para tratar el movimiento, se han visto inspirados por las
tentativas de resolver los enigmas planteados por Zenón.
Aristóteles sorprende de nuevo al lector moderno con su pene­
tración, aun cuando, desde la perspectiva moderna, lo que tiene que
decir pueda ser interpretado de una multiplicidad de maneras. Aris­
tóteles concibe el tiempo como algo distinto al movimiento, o cam­
bio de las cosas materiales, así como el espacio no puede ser identifi­
cado con los objetos que hay en él. Pero, señala, sin movimiento o
cambio no tendríamos conciencia alguna del paso del tiempo. Así, en
una forma paralela a su noción de lugar como espacialidad de los
cuerpos, distinto al cuerpo pero sin existir como entidad indepen­
diente separada de los cuerpos en el mundo, habla del tiempo como
una medida del movimiento y del cambio. Pero queda sin aclarar jus-
Espacio, tiempo, movim iento 37

tamente qué se supone entonces que es el tiempo. Es algo que de­


pende de las cosas y de sus movimientos y cambios, pero no es esos
movimientos y cambios. ¿Qué es entonces?
El desconcierto sobre la naturaleza del espacio y del tiempo se
debe en gran parte a su doble papel como proveedor de un foro, tan­
to para la evolución de los fenómenos físicos, como para los conteni­
dos de lo que intuitivamente consideramos como nuestra conciencia
subjetiva o privada. Los filósofos argumentaron con frecuencia que
mientras los objetos físicos y sus procesos tenían lugar en el espacio y
en el tiempo, los contenidos mentales de nuestras mentes existían
sólo en el tiempo. Sin embargo, sentimos que un modo espacial es
apropiado incluso para describir, pongamos, los contenidos visuales
de nuestros sueños. El gato soñado y el felpudo soñado pueden ser
irreales como objetos auténticos, pero el gato soñado puede parecer-
nos que está sobre el felpudo de una forma similar al menos a como
pensamos que un gato real puede estar sobre un felpudo real. Algún
tipo de espacialidad parece, pues, formar parte integrante incluso de
nuestros fantasmas mentales.
Seguramente, además, los sucesos de nuestros sueños ocurren en
un orden temporal, aun cuando estemos convencidos de que se trata
de un orden en el tiempo de acontecimientos irreales. N o obstante,
parece haber de nuevo algunas diferencias entre el espacio de lo
mental y su temporalidad. El espacio en el que existen el gato y el
felpudo soñados parece no estar en «ningún lugar» en lo que con­
cierne al espacio real. Parece tratarse de una clase de espacio separa­
do del espacio de las cosas físicas. Pero los procesos soñados nos pa­
recen ocurrir en el mismo tiempo que el tiempo que comprende los
sucesos físicos. El sueño del golpe con el coche ocurrió después de
que me fuera a dormir y antes de que despertara, en el mismo orden
temporal en que estuve echado en la cama. Pero el espacio del golpe
ilusorio con el coche no puede ser adaptado a ningún lugar real, ni
siquiera al espacio real de mi cabeza donde el mecanismo de mi sue­
ño, mi cerebro, está localizado.
Como veremos, no existe una solución sencilla al problema de
poner en un esquema coherente un modelo sobre la naturaleza del
tiempo y del espacio que haga justicia a las intuiciones que acabamos
de examinar. Nuestro relato debería explicar en qué consiste la natu­
raleza del espacio y el tiempo. ¿Qué tipo de ser poseen y cómo se re­
laciona su ser con el de las cosas y procesos más ordinarios que ocu­
38 Filosofía de la física

pan espacio y acaecen en el tiempo? ¿Cómo hace justicia esta natura­


leza del espacio y el tiempo a nuestras intuiciones sobre la espaciali-
dad y la temporalidad, ya sea de los acontecimientos físicos del mun­
do o de los contenidos de nuestra experiencia subjetiva? Y, por
último, ¿qué es lo que en la naturaleza del espacio y el tiempo nos da
acceso al conocimiento que decimos poseer sobre su naturaleza, una
clase de conocimiento que algunos consideraron el modelo mismo
de la certeza que podíamos obtener sobre el mundo generada por
nuestra razón pura únicamente?

El debate entre Newton y Leibniz

En el siglo xvil, la filosofía del espacio y el tiempo se convirtió en


una cuestión central de la metafísica y la epistemología. La discusión
alcanzó un punto culminante en el importante debate entre G. W.
von Leibniz, el gran filósofo y matemático alemán, y Newton, el gran
físico y matemático inglés. En su debate se perfilaron dos teorías con­
trarías acerca del lugar del espacio y el tiempo en el mundo, y m u­
chas de las cuestiones fundamentales que en los años posteriores
ocuparon a los filósofos interesados en el espacio y el tiempo reci­
bieron su formulación más clara.
Leibniz ofreció una descripción del espacio y el tiempo que por
fin presentaba un claro entendimiento de cómo la teoría podía, al es­
tilo aristotélico, negar al espacio y al tiempo un tipo de ser indepen­
diente sobre y por encima del ser de las cosas materiales ordinarias y
de los acontecimientos materiales, pero podía conservar para el espa­
cio y el tiempo un lugar crucial en la estructura del mundo. En la fi­
losofía «profunda» de Leibniz, su verdadera metafísica, se niega la
existencia per se de la materia, así como la del espacio y el tiempo. En
este Leibniz esotérico, el mundo está constituido por entidades fun­
damentales de tipo mental, las mónadas, que existen en un total ais­
lamiento unas de otras, sin siquiera interaccionar por medio de la
causalidad. Cada mónada contiene dentro de su naturaleza una ima­
gen completa del universo entero, lo cual explica cómo, sin interac­
ción, pueden mostrar una evolución coherente en el tiempo.
Debemos dejar a un lado esta concepción leibniziana «profunda» del
mundo que, si bien es extraña, ha sido defendida de formas ingenio­
sas e importantes. Su concepción menos profunda, exotérica, del es­
Espacio, tiempo, m ovim iento 39

pació y el tiempo posee una suerte de estatus intermedio entre la


concepción que dota de existencia a la materia, al espacio y al tiem­
po, y la última concepción monadológica.
En esta posición intermedia puede suponerse la existencia de ob­
jetos materiales y de sucesos materiales. ¿Qué son entonces el espa­
cio y el tiempo? Consideremos dos sucesos cualesquiera que imagi­
namos como acontecimientos instantáneos entre las cosas materiales.
Los sucesos tienen una relación temporal entre sí, siendo el primer
suceso posterior a, simultáneo con, o anterior al segundo suceso en el
tiempo. Podemos avanzar aún más a una relación cuantitativa entre
los sucesos, estando el primer suceso separado del segundo en el
tiempo por algún intervalo-temporal definido, que podría ser positi­
vo, cero o negativo. La idea sencilla de Leibniz es que el tiempo es
justamente la colección de todas las relacionestemporales de esa ín­
dole entre los sucesos. Si no hubiera sucesos, no habría relaciones, de
manera que el tiempo en el sentido indicado carece de una existen­
cia independiente de los sucesos en él. Pero las relaciones entre los
sucesos son una componente real del m undo (desde esta perspectiva
exotérica). Así, sería erróneo decir que no hay en absoluto una tal
cosa como el tiempo.
Si consideramos todas las cosas del m undo en un tiempo dado,
vemos relaciones espaciales entre ellas. Las cosas se encuentran a
ciertas distancias unas de otras y en ciertas direcciones unas respecto
de otras. La colección de todas estas relaciones espaciales entre los
objetos del m undo en un tiempo dado es lo que es el espacio. De
nuevo, no hay ningún continente, ningún espacio mismo, esperando
a ser ocupado por objetos. Tan sólo están los objetos y las innumera­
bles relaciones espaciales que mantienen entre sí.
La analogía con las relaciones de parentesco nos puede ayudar a
ver esto con mayor claridad. Cualquier gran familia consiste en un
número de personas. Éstas se encuentran relacionadas entre sí en las
formas conocidas. A
puede ser padre de B, C primo-hermano de D,
etcétera. ¿De qué «materia» está hecha la realidad de una gran fami­
lia? Respuesta: de las personas en la familia. Pero, claro está, las rela­
ciones que unen a estas personas constituyen aspectos perfectamente
reales del mundo. ¿Podríamos, pues, pensar que las relaciones existen
con independencia de las personas? ¿Podría haber un tipo de «espa­
cio relacional» que existe en y por sí mismo, esperando a ser ocupa­
do por personas? Semejante conversación es manifiestamente absur-
■10 Filosofía de la física

tía. Mués bien, dice Leibniz, lo mismo que sucede con el «espacio re-
lacional», sucede con el espacio ordinario. Hay cosas y hay relaciones
espaciales entre las cosas. Pero no hay ningún continente que exista
independientemente, el espacio mismo, de la misma forma que no
hay nada que exista independientemente, el «espacio relacional».
Todo suceso que acontece en el m undo material o mental está
relacionado en el tiempo con todo otro suceso. Y todo objeto mate­
rial está relacionado espacialmente con todo otro objeto material.
Estas dos familias de relaciones comprenden, pues, toda la realidad.
Pero existen como una colección de relaciones entre los sucesos y las
cosas sustanciales del m undo, no como sustancias independientes
ellas mismas.
Vaya, esto no es tan sencillo. ¿Qué es de los momentos de tiem­
po cuando no ocurre nada? ¿Qué es de las regiones desocupadas del
espacio donde no hay nada? ¿Deberíamos negar sencillamente su
realidad? Leibniz sugiere un medio que nos permite mantener estas
nociones como legítimas sin dejar de ser relacionistas. Consideremos
el espacio vacío entre el lugar donde nos encontramos y una estrella.
No hay nada que mantenga con nosotros la relación espacial de estar
a medio camino entre nosotros y la estrella. Sin embargo, algo podría
tener esa relación espacial con nosotros y con la estrella. Así pues,
podríamos imaginar los lugares desocupados como relaciones espa­
ciales que algopodría poseer con los objetos del m undo pero que en
realidad no son poseídos por nada. El espacio es, dice Leibniz, «en
cuanto a posibilidad», el conjunto de relaciones espaciales entre las
cosas. De manera que la familia de relaciones contiene relaciones
tanto posibles como reales. Podríamos incluso pensar en restaurar la
noción de un espacio totalmente vacío en esta forma. Aun cuando no
hubiera objetos reales, podría haber objetos, y si los hubiera, presen­
tarían relaciones espaciales entre sí. Así pues, el espacio totalmente
vacío, que para los antirrelacionistas es una noción inteligible, podría
convertirse para el relacionista en la colección de las relaciones posi­
bles (pero no reales) que los objetos materiales posibles (pero no re­
ales) podrían presentar entre sí, si tales objetos existiesen. Si el tole­
rar tales «relaciones en posibilidad» significa dejar el juego en manos
de los antirrelacionistas, sigue siendo una cuestión de debate filo­
sófico.
Leibniz no propone simplemente su descripción relacionista del
espacio y el tiempo de manera dogmática como una alternativa a la
Espacio, tiempo, m ovimiento 41

concepción según la cual el espacio y el tiempo son cosas con una


existencia independiente. La concepción del continente parece consi­
derar el espacio como un tipo de sustancia. Las cosas existen en el
espacio, según esta concepción, por coincidir con un trozo limitado
de sustancia espacial. Pero, afirma Leibniz, dicha concepción está
plagada de dificultades.
Imaginemos que existe el espacio vacío y a Dios intentando deci­
dir dónde colocar al universo material en el espacio. N o hay razón al­
guna para poner al universo en un lugar y no en otro. Como cada
punto o región del «espacio mismo» es igual a cualquier otto punto o
región, no podría haber un motivo por el que elegir un lugar para el
mundo material frente a otro. Pero Leibniz cree que todo hecho
debe tener una razón suficiente para darse. Como la ubicación del
universo material en el espacio mismo no puede tener tal razón sufi­
ciente, no puede darse tal cosa. Pero la concepción del espacio como
continente, y no como mero conjunto de relaciones espaciales entre
las cosas, entraña la existencia de ubicación en el espacio mismo. Por
lo tanto, dicho espacio continente no puede existir.
Leibniz argumenta además que no habría ninguna diferencia ob­
servacional por estar el mundo material ubicado en un lugar del es­
pacio mismo y no en otro, pero sostiene que un hecho semejante (la
ubicación en el espacio mismo) sin consecuencias observacionales no
es realmente un hecho. De hecho, haciendo uso del principio según
el cual un mundo posible que es exactamente igual en todas sus ca­
racterísticas a otro mundo posible debe ser el mismo m undo posible,
arguye que la propia noción de espacio mismo es incoherente. Si el
espacio mismo existiese, podría haber dos espacios posibles exacta­
mente iguales, excepto en la diferente ubicación en el espacio mismo
del mundo material en cada uno de dichos mundos posibles. Pero tal
diferencia de ubicación en el espacio mismo no es una diferencia re­
al. No puede haber, pues, dos mundos posibles semejantes y, por
consiguiente, la teoría del espacio mismo como continente, según la
cual podría haber dos mundos posibles semejantes, debe estar equi­
vocada.
La postura relacionista leibniziana es, pues, que concebir el espa­
cio como una cosa por derecho propio conduce a la incoherencia.
Además, el concebirlo como la colección de todas las relaciones es­
paciales entre las cosas materiales nos permite decir todo lo que ne­
cesitamos decir que es coherente sobre la espacialidad del mundo.
42 Filosofía de la física

La descripción relacionista es, pues, la que deberíamos adoptar. Y


una concepción similar del tiempo como la familia de las relaciones
temporales entre los sucesos materiales se supone que da al traste
con toda conversación sobre el «tiempo mismo» como una entidad
constituyente del mundo.
Pero hay objeciones abiertamente filosóficas al relacionismo, es­
pecialmente al tipo de relacionismo que recurre a relaciones posibles.
Para el relacionista, la estructura del espacio, tal y como es revelada
por la geometría, es la estructura de la colección de todas las relacio­
nes espaciales posibles entre los objetos. Pero ¿cuál es el «fundamen­
to» de esta estructura de posibilidades? Con esto quiero decir lo si­
guiente: Si pensamos en la mayoría de las posibilidades físicas, éstas
son comprensibles sólo debido a alguna estructura real subyacente.
Un trozo de sal, por ejemplo, aun cuando no se haya disuelto, contie­
ne la «posibilidad» de pasar a la solución. Es, decimos, soluble. Pero
esta solubilidad estriba en la constitución real del trozo de sal no di­
suelta por iones. En el caso de la estructura del espacio mismo, que
los relacionistas entienden como la estructura que describe la colec­
ción de todas las relaciones espaciales posibles, ¿cuál es la realidad
subyacente que fundamenta este orden entre posibilidades, si no es
la estructura del «espacio mismo» como los antirrelacionistas ima­
ginan?
El oponente de Leibniz, el gran físico Newton, fue un antirrela-
cionista. Newton considera al espacio y al tiempo como algo más que
meras relaciones espaciales y temporales entre los objetos y sucesos
materiales. Qué era exactamente este algo más, no podía decirlo con
seguridad. Considera que es algo similar a la sustancia, pero en oca­
siones prefiere pensar que es un atributo o propiedad, de hecho una
propiedad de Dios. Aunque aporta algunos argumentos puramente fi­
losóficos en contra del relacionismo leibniziano, Newton es famoso
principalmente por sostener que los resultados de la observación y
del experimento pueden refutar de manera concluyente la doctrina
relacionista.
En la física desarrollada por Newton a partir de los trabajos ante­
riores de Galileo y otros, hay un claro contraste entre movimientos
inerciales y movimientos no inerciales. Los movimientos inerciales se
considera que son movimientos de un objeto con una velocidad
constante, esto es, con una velocidad invariable y en una dirección
fija. Ahora bien, para un relacionista, nociones tales como «velocidad
Espacio, tiempo, m ovim iento •43

invariable» y «dirección fija» pueden ser entendidas solamente en re­


lación a un marco de referencia determinado por algunos objetos
materiales. Algo que está en reposo en relación a la superficie de la
tierra, por ejemplo, está en rápido movimiento en una dirección que
varía constantemente en relación a un sistema de referencia fijo, pon­
gamos, en el sol. Pero, arguye Newton, la noción de movimiento no
inercial no es la de un movimiento «meramente relativo», sino la de
un movimiento que es «absoluto».
¿Por qué? Los movimientos no inerciales generan «fuerzas» que
se ponen de manifiesto en efectos demostrables. El agua en un cubo
giratorio desborda la pared del cubo. Los pasajeros se balancean ha­
cia delante o hacia atrás cuando un tren acelera o frena para parar. Si
dos trenes se encuentran en aceleración relativa, podría suceder que
los pasajeros en uno de los trenes sintieran la aceleración mientras
que los del otro no sintieran nada en absoluto. Por ejemplo, un tren
puede estar parado en la estación, mientras el otro está frenando pre­
cipitadamente. N o obstante, ambos trenes están acelerando uno con
respecto al otro. La única explicación posible para la asimetría entre
los trenes es que existe una aceleración «absoluta», aceleración que
es cambio de velocidad no sólo en relación a algún sistema de refe­
rencia material arbitrario.
Newton sostiene que dichos efectos inerciales serán los mismos
en todo lugar y en todo tiempo a lo largo del universo. Después de
todo, tales efectos inerciales son justamente los que evitan, por ejem­
plo, que los planetas se precipiten sobre el sol. Así, la aceleración, la
aceleración absoluta, genera efectos observables. Pero la aceleración,
incluida la aceleración absoluta, es aceleración relativa a algo. Si no
puede ser entendida como una aceleración relativa a los objetos ma­
teriales ordinarios del mundo, sólo puede ser entendida como una
aceleración relativa al «espacio mismo». Así, el espacio mismo no es
simplemente un «continente» de objetos, un modo algo torpe quizá
de referirse al hecho de que las cosas materiales están relacionadas
espacialmente unas con otras. Es un objeto que entra en una relación
causal con los objetos materiales. Así como el movimiento relativo de
un ladrillo y una ventana hace que el ladrillo rompa la ventana, así la
aceleración relativa de los pasajeros y el espacio mismo se manifiesta
mismamente en las fuerzas inerciales generadas como resultado de
dicho movimiento relativo.
Aunque concebir el tiempo como un tipo de «objeto» resulta me­
II Filosofía de la física

nos convincente que en el caso del espacio mismo, el tiempo debe,


según Newton, ser también absoluto en un sentido importante. Para
el relacionista, la medida del paso del tiempo es algún cambio o mo­
vimiento en una cosa material. En relación a un reloj, un proceso po­
dría ser regular, con algún suceso recurrente en intervalos iguales de
tiempo. En relación a otro reloj diferente, sin embargo, el mismo pro­
ceso podría parecer irregular. Éste será el caso a no ser que el segun­
do reloj sea «regular» según los criterios del primer reloj. Para el rela­
cionista no hay una medida «absoluta» del paso del tiempo, tan sólo
la elección de algunos relojes como preferidos debido a la simplici­
dad de nuestra descripción del mundo en su medida del tiempo.
Ahora bien, el movimiento acelerado da lugar a efectos no presentes
en el movimiento no acelerado. Y esta aceleración es absoluta. Pero
el movimiento acelerado en una línea recta puede ser representado
como no acelerado si se elige una medida de tiempo suficientemente
singular, una que haga parecer uniforme a la velocidad, acelerando y
retardando la medida del tiempo en función del cambio de veloci­
dad del objeto. Pero la aceleración real es absoluta, de manera que la
medida del tiempo debe ser asimismo absoluta. Hay un tiempo «en
sí mismo» que «fluye uniformemente con independencia de la medi­
da de los relojes particulares». Los buenos relojes se ajustan a este
tiempo absoluto; los malos relojes no lo hacen.
Con Newton, pues, un nuevo elemento es introducido en el viejo
debate filosófico entre aquellos que considerarían el espacio y el tiem­
po como constituyentes autónomos del mundo y aquellos que verían
en ellos un compendio meramente de relaciones entre las cosas fun­
damentales del mundo, los objetos materiales y sus cambios. Para el
newtoniano, el espacio y el tiempo son elementos teóricos postulados,
cuya existencia debe presuponerse para poder explicar los fenómenos
a nuestro alcance en el nivel observacional-experimental.
Las reacciones a la transformación que sufrió con Newton el vie­
jo debate filosófico fueron múltiples y variadas a lo largo de los dos
siglos que siguieron a sus argumentos. Las propuestas tempranas que
intentaron encontrar una explicación para los fenómenos newtonia-
nos y que postularon solamente las cosas materiales y las relaciones
entre éstas de los relacionistas, fracasaron. El mismo Leibniz admitió
que era esencial tener una idea de «cuál es el objeto que se mueve»
en los movimientos relativos. Él buscó una explicación de esta distin­
ción en el objeto sobre el que actuaba la causa del movimiento.
Espacio, tiempo, movim iento 45

Muy pronto se hizo evidente que la doctrina de Newton tenía


consecuencias peculiares. D ado que el «espacio mismo» existía, la
posición de un objeto en el espacio mismo y el movimiento unifor­
me de un objeto con respecto al espacio mismo eran características
reales del m undo, aun cuando, a diferencia de la aceleración del
objeto con respecto al espacio mismo, no dieran lugar a ningún fe­
nómeno observacional. Algunos resultados de la física sugerían que
el movimiento uniforme absoluto podría entrañar fenómenos de ti­
po óptico, en lugar de mecánicos, como detectables; como vere­
mos, estas conclusiones resultaron ser erróneas. Propuestas poste­
riores, planteadas tras las innovaciones en nuestras ideas .sobre el
espacio y el tiempo inspiradas en la teoría de la relatividad, postu­
laron nociones del espacio y el tiempo que iban a permitir definir
la aceleración absoluta, pero no la posición espacial y la velocidad
absolutas.
En el siglo xix, el filósofo y físico E. Mach intentó, una vez más,
reconciliar los resultados de la física newtoniana con el enfoque rela­
cionista del espacio y el tiempo. Señaló el importante hecho de que
la velocidad de rotación de la tierra, determinada mediante la obser­
vación de las estrellas fijas, y la velocidad de rotación absoluta de la
tierra, determinada mediante experimentos puramente mecánicos,
dependientes de las fuerzas generadas por la rotación, eran la misma.
¿Podría esto sugerir un origen para las fuerzas inerciales, uno no ima­
ginado por Newton? Supongamos que la aceleración de un objeto
material con respecto a otro genera fuerzas, al igual que la velocidad
relativa de dos partículas cargadas genera una interacción magnética.
Supongamos que esta fuerza es sumamente independiente de la sepa­
ración de los objetos, pero dependiente de sus masas. ¿No debería­
mos imputar las fuerzas generadas por las aceleraciones, que Newton
atribuyó a la interacción causal entre el objeto prueba y el espacio
mismo, a la aceleración relativa del objeto prueba respecto a las es­
trellas fijas o, mejor dicho, respecto al promedio de materia «infor­
me» del universo? Si esto fuera así, ¿no estaríamos en posición de re­
conciliar los hechos observacionales que Newton utilizó para
defender la existencia de un tipo de espacio sustancial, con un rela-
cionismo leibniziano para el que todas las posiciones, velocidades y
aceleraciones eran características de una cosa material en relación a
otra cosa material?
Al final de l siglo XIX, pues, la situación era más o m enos la si-
4<) Filosofía de la física

guíente: todos coincidían en que había dos vastas dimensiones de la


realidad, todas las cosas materiales existentes en el espacio y todos
los acontecimientos, materiales o mentales, que se daban en el tiem­
po. La estructura de estos foros del mundo se conocía. El tiempo po­
día ser visto como un simple continuo unidimensional. El espacio era
una estructura tridimensional descrita por la familiar geometría euclí-
dea. Parecía que podíamos conocer esta estructura por inferencia a
partir de primeros principios cuya verdad era, de alguna manera, in­
cuestionable, esto es, cuya verdad era dada a la persona racional por
algún tipo de razón pura. La naturaleza de estos continentes de todas
las cosas y acontecimientos no estaba clara desde una perspectiva fi­
losófica. Los sustantivistas en la línea de Newton contendieron con
los relacionistas, que llevaron a sus últimas consecuencias las ideas
de Leibniz. Otros, como el filósofo Kant, para quien el espacio y el
tiempo eran estructuras organizadoras de la mente por las que dotá­
bamos a la sensación de una horma comprensible, mantuvieron dife­
rentes concepciones metafísicas.
El espacio y el tiempo podían ser descritos matemáticamente,
como podía serlo el movimiento de las cosas materiales en el espa­
cio con el paso del tiempo. La caracterización mediante leyes de este
movimiento en los términos de la cinemática (la descripción del mo­
vimiento) y la dinámica (su explicación en términos de fuerzas) cons­
tituyó la disciplina central de la física. Un aspecto de esta teoría físi­
ca era la necesidad en ella de distinguir las clases preferidas de
movimiento inercial de los movimientos acelerados que generaban
fuerzas inerciales. Esto proporcionó el núcleo del argumento cientí­
fico newtoniano de la concepción sustantivista de la naturaleza del
espacio.
Mientras la aceleración con respecto al espacio mismo tenía con­
secuencias observables, la posición en el espacio mismo y la veloci­
dad uniforme con respecto al espacio mismo carecían de dichos con­
comitantes observacionales. Pero existía la esperanza de que, por
medio de fenómenos ópticos, pudiera determinarse el estado de re­
poso en el espacio mismo. La tentativa de determinar el estado de re­
poso con respecto al espacio mismo por medio de experimentos con
luz es lo que condujo a las asombrosas revisiones de nuestras ideas
sobre el espacio y el tiempo en el trabajo del gran físico Albert Eins­
tein. La posibilidad de otras ideas puramente filosóficas sobre la na­
turaleza del espacio y el tiempo había existido anteriormente a su tra­
Espacio, tiempo, m ovimiento 47

bajo, pero fue a la luz de sus logros y con las ideas suministradas por
ellos que se exploró la mayor parte de la filosofía contemporánea so­
bre el espacio y el tiempo. En los apartados «Del espacio y el tiempo
al espacio-tiempo» y «La gravedad y la curvatura del espacio-tiempo»
esbozaré las noveles teorías del espacio y el tiempo propuestas por
Einstein y retomaré entonces la filosofía del espacio y el tiempo en el
contexto de estas nuevas teorías físicas.

Del espacio y el tiempo al espacio-tiempo

Los orígenes de la teoría especial de la relatividad


Hemos visto que mientras Newton postulaba «el espacio mismo»
como el objeto de referencia en relación al cual las aceleraciones ge­
neraban fuerzas inerciales observables, se creía que el movimiento
uniforme con respecto al espacio mismo carecía de consecuencias
observables. Esto se seguía de la famosa observación de Galileo se­
gún la cual, en un laboratorio cerrado, uno no podía decir cuál era el
estado de movimiento uniforme del laboratorio mediante la realiza­
ción de un experimento mecánico. No obstante, seguía siendo conce­
bible que otros fenómenos, no mecánicos, dependieran en alguna
forma del movimiento uniforme del aparato con respecto al espacio
mismo. Este movimiento se manifestaría entonces en alguna conse­
cuencia observacional.
En el siglo XIX surgió una cierta esperanza al respecto al demos­
trarse que la luz era radiación electromagnética. Según la teoría de la
electricidad y el magnetismo debida a J. C. Maxwell, las ondas elec­
tromagnéticas, de las que las ondas luminosas son sólo una especie,
tienen una velocidad definida con respecto a un observador. Esta ve­
locidad debería ser la misma en todas direcciones y ser independien­
te de la velocidad de la fuente de luz con respecto al observador. Un
observador en reposo en un tanque de agua determinará una veloci­
dad del sonido en el agua que es la misma en todas las direcciones.
Esta velocidad del sonido será completamente independiente del
movimiento de la fuente del sonido en el agua. Una vez que la onda
de agua se ha generado, su velocidad depende solamente de las pro­
piedades del agua por la que viaja la onda. Lo mismo debería suce­
der con la luz, recibiendo el medio de transmisión de la luz (la mate-
Filosofía de la física

fin i|iif es para la luz lo que el agua para el sonido) el nombre de


«ctcr».
Un observador que se mueva a través del agua en el tanque no
verá la misma velocidad del sonido en todas las direcciones, ya que
estará aproximándose al sonido en una dirección y alejándose del
mismo en la dirección opuesta. Así pues, un observador en movi­
miento con respecto al éter debería ser capaz de detectar este movi­
miento, incluso si es un movimiento uniforme, no acelerado, midien­
do la velocidad de la luz en todas las direcciones. Si se supone que
un observador en reposo en el éter estará en reposo en uno de los
sistemas inerciales de la mecánica en el que no se generan fuerzas
mecánicas inerciales, resulta plausible identificar el éter con el espa­
cio mismo de Newton. En el siglo XIX siempre se hizo esta suposición
y, reinterpretada, sigue siendo correcta en la teoría de la relatividad.
Podríamos, pues, utilizar experimentos con luz para determinar nues­
tro movimiento uniforme con respecto al espacio mismo.
A fin de detectar cuál estado de movimiento uniforme era el
estado de reposo en el éter o en el espacio mismo se diseñó una serie
de ingeniosos experimentos. Éstos consistían en radiar luz desde un
punto a lo largo de diferentes trayectorias y en llevar a continuación
la luz a su punto de partida. La luz debería tardar diferentes cantida­
des de tiempo en recorrer las diferentes trayectorias, dependiendo de
la longitud de las trayectorias y del estado de movimiento del apara­
to en el éter. Cambiando la orientación del aparato, o dejando que el
movimiento de la tierra lo haga por nosotros según gira en torno a su
eje o viaja en su órbita alrededor del sol, se modificarían los tiempos
relativos que la luz tarda en recorrer las diferentes trayectorias. D i­
chas variaciones en el tiempo podrían ser detectadas en la fuente de
luz por un observador, que observaría un corrimiento de la posición
de las líneas de interferencia, líneas alternantes de luz y oscuridad
que se generan cuando los dos rayos de luz retornantes se encuen­
tran y sus regiones de intensidad variable se suman o se restan entre
sí. (Véase la figura 2.1.)
Cuando estos experimentos se llevaron a cabo, no se pudo apre­
ciar, para consternación de quienes los realizaron, ninguna diferencia
observable en los tiempos de recorrido de la luz. Era como si la luz
viajase a una velocidad fija, la velocidad para la luz predicha por la
teoría en el sistema de referencia en reposo en el éter, en cualquier
laboratorio que estuviese en movimiento uniforme. (Estos «resulta-
Espacio, tiempo, m ovimiento 49

E l experimento de Michelson-Morley.
F i g u r a 2.1. U n haz de luz es dividido en dos ha­
ces en el espejo semiplateado B. Un haz se dirige al espejo C donde es reflejado, el
otro al espejo D. Si el aparato se está moviendo a través del éter, el medio de trans­
misión de la luz conjeturado por la vieja teoría ondulatoria, en la dirección mostrada
por la flecha v, la luz debería tardar más tiempo en recorrer el camino ABC de longi­
l
tud que lo que tarda en recorrer el camino BDB, también de longitud l. Si el apara­
to se gira entonces 90 grados, la diferencia en el tiempo a lo largo de los caminos se
invierte. Pero cuando el experimento se lleva a cabo no se detecta semejante cambio.
Esto sigue siendo cierto incluso si la longitud del camino BC se toma diferente a la
longitud BD. E n general, ningún experimento de ida y vuelta pone de manifiesto el
movimiento del laboratorio a través del éter.

dos nulos» no son válidos, dicho sea de paso, cuando el aparato está
en movimiento no uniforme. La rotación puede ser detectada, por
ejemplo, mediante un giroscopio anular de láser, que detecta el cam­
bio en la velocidad de la luz en direcciones opuestas alrededor de
una trayectoria circular a medida que el laboratorio gira.) Ahora bien,
podría parecer que este sorprendente resultado nulo se debiese a al­
50 Filosofía de la física

guna peculiaridad de la luz o del electromagnedsmo. Sin embargo, si


se reflexiona sobre porqué la velocidad de la señal habría de variar
cuando el laboratorio está en movimiento con respecto al medio de
transmisión de la señal, uno se da pronto cuenta de que aquí se está
cuestionando una intuición muy fundamental sobre el movimiento.
La intuición es que si corremos, por ejemplo, tras una cosa en movi­
miento, ésta se moverá más despacio respecto a nosotros que respec­
to a alguien que no se hubiera unido a la carrera.
Uno podría intentar hallar una explicación a estos sorprendentes
resultados de muchas formas posibles. Una sugerencia fue que la tie­
rra arrastraba consigo en su movimiento al éter local, de manera que
la porción de éter junto a la tierra se encontraba siempre en reposo
con respecto a la tierra y al aparato. Dicha propuesta, sin embargo,
terminaría entrando en conflicto con observaciones astronómicas
bien fundadas.
Una serie de teorías compensatorias fueron concebidas para ex­
plicar los inesperados resultados nulos. Si suponemos que la longitud
del aparato se contrae en la dirección de su movimiento con respecto
al éter, y suponemos además que todos los procesos físicos medidos
por los relojes del aparato se ralentizan cuando estos relojes se ponen
en movimiento respecto al éter, uno podría entonces justificar como
una apariencia la manifiesta igualdad de la velocidad de la luz en
todas las direcciones. Aunque la luz estuviese efectivamente movién­
dose a diferentes velocidades con respecto al aparato en diferentes
direcciones, las consecuencias observacionales esperadas de ello que­
darían totalmente anuladas por los cambios inducidos (por el movi­
miento del aparato a través del éter) en los componentes del aparato
que uno utilizó para determinar las velocidades — intervalos de lon­
gitud y de tiempo medidos por medio de reglas y relojes— . El resul­
tado neto sería por consiguiente ¡la imposibilidad una vez más de de­
tectar por algún medio el movimiento uniforme con respecto al
espacio!'
Fue la brillante sugerencia de Einstein tomar la apariencia de
que la luz tiene la misma velocidad en todas las direcciones en cual­
quier estado de movimiento uniforme como un indicativo de la reali­
dad. ¿Porqué no postular, argüyó, que lo que parece ser el caso a te­
nor de los experimentos de ida y vuelta es realmente el caso? Para
todo observador en movimiento uniforme, la luz en el vacío viaja a la
velocidad predicha por la teoría del electromagnetismo en todas las
Espacio, tiempo, m ovim iento 51

direcciones. Es importante observar lo radical que es esta propuesta.


Si un rayo de luz está alejándose de un observador en una dirección
dada con una velocidad c,
y un segundo observador está viajando en
la dirección de la luz propagada con, pongamos, una velocidad con v
respecto al primer observador, consideraremos que la luz está viajan­
do con una velocidad c,
y no con una velocidad c~ v como nos dice
la intuición, también con respecto al segundo observador.
¿Cómo podía ser esto? El núcleo del argumento de Einstein es
una crítica penetrante de la noción de simultaneidad para sucesos a
una distancia uno de otro. ¿Qué significa que dos acontecimientos a
una distancia espacial uno de otro ocurran al mismo tiempo? En el
pensamiento preeinsteiniano suponemos sencillamente que si dos
sucesos ocurren al mismo tiempo para un observador, ocurrirán al
mismo tiempo para todos los observadores. Es el cuestionamiento
de esta última noción lo que constituye la diferencia principal entre
el espacio y el tiempo según la concepción anterior y el espacio-
tiempo según la así denominada teoría especial de la relatividad de
Einstein.
Einstein argumenta que, si vamos a determinar la velocidad de la
luz en una dirección dada, podríamos pensar en soslayar los resulta­
dos nulos de los experimentos de ida y vuelta midiendo directamen­
te la velocidad de la luz desde un punto A,
a otro B. Pero solamente
podríamos hacer esto si pudiésemos determinar la distancia entre los
puntos y el tiempo que la luz necesita para ir de A B,
a siendo la ve­
locidad la distancia dividida por el tiempo. Pero para obtener el in­
tervalo de tiempo entre la emisión y la recepción de una señal de luz
hemos de ser capaces de sincronizar relojes en los dos puntos de ma­
nera que señalen «cero» en el mismo momento. ¿Cómo podría llevar­
se a cabo esta sincronización?
Si pudiéramos transportar un reloj instantáneamente de a A B,
podríamos establecer la sincronización simplemente sincronizando
dos relojes en Ay moviendo uno de ellos instantáneamente a B.
Pero, según Einstein, los objetos no pueden ser transportados de un
lugar a otro en un tiempo cero. Einstein supone, de hecho, que la ve­
locidad de la luz en el vacío es una velocidad límite por encima de la
cual nada puede viajar. Pero entonces, ¿porqué no sincronizar dos
relojes en A, mover uno a una u otra velocidad hasta B,
y suponer
que cuando un reloj en A n
lee el valor y el reloj en B
lee n,
los dos
sucesos son simultáneos?
52 Filosofía de la física

En este punto debemos recordar el objeto de intentar establecer


la simultaneidad para sucesos distantes. Nuestro propósito con ello
era poder determinar la velocidad de la luz desde A
hasta B.
Y que­
ríamos hacerlo de manera que pudiésemos soslayar el problema de
los resultados nulos obtenidos en los experimentos de ida y vuelta,
un fenómeno explicado combinando la idea de que la luz tiene dife­
rentes velocidades en las diferentes direcciones con las afirmaciones
compensatorias sobre cómo las reglas se contraen y los relojes se
atrasan cuando se mueven con respecto al éter. Recordemos que el
objeto de los experimentos de ida y vuelta era determinar en primer
lugar cuál era el estado de movimiento en el que la velocidad de la
luz era realmente la misma en todas las direcciones, para poder de­
terminar a continuación cuál era el estado de movimiento que estaba
realmente en reposo en el éter o en el espacio mismo.
Pero si la teoría compensatoria es correcta, los relojes transporta­
dos desde A
hasta B no estarán, en general, sincronizados en ni B.
aun cuando lo hubieran estado en A.
Pues, en su movimiento desde
A hasta B,
viajarán por lo general a diferentes velocidades con res­
pecto al éter y sufrirán por consiguiente diferentes cantidades de «ra-
lentización». Claramente, el reloj más apropiado para determinar la
sincronización de relojes en A B
y será uno que haya sido trasladado
muy lentamente en relación al éter y haya sufrido en consecuencia
una distorsión mínima en su movimiento. Pero para saber qué reloj
es éste, tendríamos que saber qué estado de movimiento era el
estado de reposo en el éter, ¡justo lo que estábamos intentando deter­
minar en primer lugar!
Supongamos que conociéramos qué estado de movimiento es­
taba en reposo en el éter. Como la luz viaja, en relación al éter, con
la misma velocidad en todas las direcciones, una sencilla manera de
sincronizar los relojes en A y en B
sería enviando una señal de luz
desde A
que fuese reflejada en By regresara a A.
Como la luz tardó
el mismo tiempo en ir desde A hasta B
y desde B
hasta A,
el suceso
en Asimultáneo con la reflexión en B
podría ser tomado como el su­
ceso en A
a medio camino en el tiempo entre la emisión y la recep­
ción de la señal de luz en A según la medida de un reloj en reposo
en A. Pero, dice Einstein, hasta donde los experimentos de ida y
vuelta llegan, es como si la luz tuviera esta misma velocidad en todas
las direcciones sin importar cuál sea el estado de movimiento unifor­
me del observador. Supongamos que la luz viaja realmente a la mis-
Espacio, tiempo, m ovimiento 53

F i g u r a 2.2. La definición de simultaneidad por Einstein y la relatividad de la simultanei­


dad. OS representa los sucesos en la historia vital de un observador, un observador
que permanece en una posición x constante según transcurre el tiempo /. O S repre­
senta la historia vital de otro observador que se mueve (respecto a OS) hacia la iz­
quierda. Como e está a medio camino en el tiempo de O a r, los sucesos consistentes
en emitir y recibir un haz de luz reflejado en el suceso e, S, considerando que la velo­
cidad de la luz es igual hacia y desde e, considera que é es simultáneo con e. Por un
razonamiento similar, S' considera que e* es simultáneo con e porque está a medio ca­
mino en el tiempo desde O a /. Pero como una señal causal puede partir de e' y lle­
gar a tanto S como S" coinciden en que e y e* no pueden ser simultáneos. E n rela­
tividad, los sucesos son o no simultáneos sólo en relación a un «sistema inercial de
movimiento» elegido como el de S o el de S.
ma velocidad en relación a cualquier observador en movimiento uni­
forme. Cada uno de dichos observadores puede entonces utilizar el
método de la luz reflejada para determinar cuáles son los sucesos
que acontecen al mismo tiempo que otros sucesos.
54 Filosofía de la física

Es fácil ver que, si elegimos esto como nuestra definición de si­


multaneidad para sucesos distantes, habrá observadores que discre­
parán sobre qué pares de sucesos tienen lugar al mismo tiempo, se­
gún puede verse en la figura 2.2 y en su explicación. Entonces, ¿qué
observador tiene razón en sus atribuciones de simultaneidad? De
acuerdo con la teoría del éter, solamente el observador en reposo en
el éter. Los demás se ven burlados al suponer que la luz viaja a la
misma velocidad en todas las direcciones en relación a sus laborato­
rios, cuando esto no es así. De acuerdo con Einstein, todos los obser­
vadores tienen razón en sus atribuciones de simultaneidad. Sucede
simplemente que no hay tal cosa como «ocurrir al mismo tiempo», si­
no solamente «ocurrir al mismo tiempo en relación a un estado parti­
cular de movimiento uniforme». Podemos reconciliar los resultados
nulos de los experimentos de ida y vuelta con la suposición galileana
de que todos los observadores en movimiento uniforme ven los mis­
mos fenómenos físicos abandonando sencillamente la noción intuiti­
va de que existe una noción absoluta, no relativa, de «ocurrir al mis­
mo tiempo».
Podemos paliar algo la extrañeza de esta conclusión si examina­
mos el concepto de «estar en el mismo lugar». Imaginemos dos ob­
servadores en movimiento uno respecto al otro. El primer observa­
dor recibe un golpe en la cabeza en dos momentos diferentes.
¿Ocurrieron los golpes «en el mismo lugar»? «Sí», dice el observador
que ha sido golpeado, «los dos ocurrieron donde se encontraba la
parte superior de mi cabeza». «No», dice el otro observador, «uno
ocurrió cerca de mí y el otro muy lejos». ¿Quién de los dos tiene ra­
zón? A no ser que uno crea en «el espacio mismo» de Newton, en re­
lación al cual uno, y solo uno. de los observadores puede estar real­
mente en reposo, ¿porqué no decir que «en el mismo lugar» es sólo
una noción relativa? Dos sucesos pueden darse en el mismo lugar en
relación a un observador y en lugares diferentes en relación a otro en
movimiento respecto al primero. Y, si Einstein está en lo cierto, suce­
de exactamente igual con «al mismo tiempo».
Para hacernos una idea completa de la imagen del espacio y el
tiempo propuesta por Einstein necesitamos una suposición más. Ésta
comprende la afirmación de que todos los lugares y direcciones en el
espacio y el tiempo son similares, pero va más allá al hacer una supo­
sición que equivale a postular que la estructura espacio-temporal del
mundo es «plana». Nosotros examinaremos esta noción de «planari-
Espacio, tiempo, m ovimiento 55

dad» con más detalle en «La gravedad y la curvatura del espacio-


tiempo». Lo que se necesita suponer es la linearidad de las relaciones
de las separaciones espacial y temporal para un observador con res­
pecto a las de otro observador. Con este postulado adicional se cons­
truye una estructura del espacio y el tiempo en la que observadores
en movimiento relativo entre sí atribuirán separaciones espaciales de
unos sucesos a otros muy diferentes, y atribuirán también separacio­
nes temporales entre sucesos muy diferentes. Las separaciones espa­
ciales y temporales atribuidas a un par de sucesos por un observador
pueden, no obstante, ser calculadas a partir de las atribuidas a dicho
par por otro observador en movimiento respecto al primero, por me­
dio de las denominadas transformaciones de Lorentz, fórmulas origi­
nalmente derivadas en el contexto de las anteriores teorías compen­
satorias.
Aunque las distancias espaciales y temporales entre dos sucesos
variarán de un observador a otro, es importante observar que una
consecuencia de los postulados básicos de la teoría es que otra canti­
dad, el denominado cuadrado del intervalo entre los sucesos, tendrá
un valor invariante: será el mismo para todos los observadores en
movimiento uniforme. Esta cantidad puede ser calculada a partir de
la separación temporal entre los sucesos en el sistema referencial de
un observador, t,
de la separación espacial en ese mismo sistema de
x,
referencia, y de la velocidad de la luz, c,
por medio de la fórmula:
P x2 - x2t2.
= Mientras ty xvariarán de un observador a otro, P
permanecerá igual para todos ellos. Un paso crucial en esta prueba se
apoya en el hecho de que todos los observadores atribuyen a la luz la
misma velocidad invariante, c.

El espacio-tiempo de Minkowski
Todas las consecuencias de la teoría de Einstein para una nueva con-
ceptualización del espacio y el tiempo pueden ser resumidas en la
noción del espacio-tiempo de Minkowski, el escenario de todos los
procesos físicos en la teoría de la relatividad especial. La idea básica
ahora es partir de las posiciones de sucesos-puntuales como los cons­
tituyentes fundamentales de los que está construido el espacio-tiem­
po. Uno puede imaginarlos como posiciones posibles de aconteci­
mientos que son instantáneos y carecen de extensión espacial. Estos
56 Filosofía de la física

sucesos-puntuales ocupan el lugar de los puntos espaciales y de los


instantes temporales de la teoría prerrelativista. Las estructuras bási­
cas impuestas sobre el conjunto de estos puntos espacio-temporales
es lo que constituye el marco de trabajo de la nueva imagen del espa­
cio y el tiempo. (Véase la figura 2.3).

F i g u r a 2.3. Algunos elementos del espacio-tiempo de Minkouiski. t


L a línea representa
un observador inercial, siendo o un suceso en la vida de ese observador. L a línea x
o
representa los sucesos simultáneos a para el observador. A B
y representan señales
o
de luz que llegan a desde el pasado y que parten de o
hacia el futuro. L o s sucesos
o
de las regiones I y II están tan lejos de en el espacio y tan próximos al mismo en el
tiempo que una señal tendría que viajar más rápido que la luz para conectar un suce­
so de dicha índole con el suceso o. Se supone generalmente que no existen semejan­
tes señales. Los sucesos de las regiones I I I y I V son sucesos conectables al suceso o
por señales causales que viajan a una velocidad menor que la de la luz.
57

Los pares de posiciones de sucesos tienen un intervalo definido,


invariante y absoluto en la estructura. Para un observador dado en
un estado particular de movimiento uniforme, puede derivarse una
separación espacial definida y un intervalo temporal definido entre
los sucesos, pero los valores obtenidos serán relativos al estado de
movimiento particular del observador.
Dos sucesos cuyo intervalo de separación tiene el valor cero son
tales que una señal de luz en el vacío emitida en un lugar-tiempo po­
dría llegar al otro lugar-tiempo. Observad que «intervalo» difiere de
distancia espacial en que sucesos diferentes pueden tener intervalos
de separación cero. Dichos sucesos se dice que tienen una .separa­
ción cero o de tipo luz. Los sucesos cuyo intervalo al cuadrado es ne­
gativo se encuentran lo suficientemente próximos en el espacio y lo
suficientemente distantes en el tiempo para que las señales que se
propagan más despacio que la luz puedan llegar desde uno hasta el
otro. Se dice que tienen una separación de tipo temporal. Los pares
de sucesos cuyo intervalo al cuadrado es positivo están demasiado
separados en el espacio y demasiado próximos en el tiempo para que
una señal que viaje a la misma o a menor velocidad que la de la luz
pueda conectarlos. Si admitimos que la luz es la señal límite más rá­
pida, los sucesos no pueden ser conectados por ningún proceso cau­
sal y se dice entonces que tienen una separación de tipo espacial. Si
escogemos un suceso como origen, la clase de sucesos con una sepa­
ración cero de dicho origen divide el espacio-tiempo en una región
interior y otra exterior de sucesos con una separación de tipo tempo­
ral y sucesos con una separación de tipo espacial del suceso origen.
Esta clase divisoria de sucesos con una separación de tipo luz respec­
to al suceso origen consta de una componente futura y una pasada.
Juntas forman los denominados «conos de luz» del suceso origen.
(En realidad son conos solamente en un espacio-tiempo de dos en
vez de tres dimensiones espaciales reales.)
En el espacio plano ordinario de la geometría euclídea existen
las líneas rectas. El espacio-tiempo de Minkowski también tiene tra­
yectorias rectilíneas. Si los intervalos entre los puntos de la trayecto­
ria geodésica son de tipo espacial, la trayectoria representa una línea
recta espacial. Esta última es una línea recta en el espacio en un
tiempo, el cual se obtiene a partir del espacio-tiempo eligiendo un
observador en movimiento uniforme y tomando como espacio en un
tiempo para este observador una colección de sucesos que sean
58 Filosofía de la física

todos simultáneos en su sistema de referencia. Las líneas rectas cuyos


sucesos tienen separación cero representan las trayectorias de los ra­
yos de luz viajando en un vacío. Las líneas rectas de tipo temporal
representan las trayectorias a través del espacio en el tiempo de partí­
culas con movimiento uniforme.
En un diagrama podríamos representar a un observador en re­
poso en un sistema de referencia con movimiento uniforme median­
te una línea recta vertical. Cualquier otro observador con movi­
miento uniforme que coincida con nuestro primer observador en el
suceso origen estaría representado por una línea recta inclinada un
cierto ángulo respecto a la vertical. Es importante reconocer que la
elección de la recta vertical no comporta ningún significado físico.
Solamente si contásemos con una noción newtoniana acerca de
quién está realmente en reposo en el espacio mismo tendría un sig­
nificado real el representar a un observador siempre en el mismo
lugar y a los otros observadores con movimiento uniforme de mane­
ra que cambiasen de lugar con el tiempo. Pero el espacio-tiempo de
Minkowski carece de la noción de un observador en movimiento
uniforme con velocidad real cero, ya que todas las velocidades uni­
formes se encuentran físicamente apareadas en esta imagen espacio-
temporal.
Una vez elegido un observador en movimiento uniforme, pode­
mos también representar mediante una línea recta en el diagrama
todos aquellos sucesos simultáneos con el suceso origen en relación
al estado de movimiento de dicho observador. En el diagrama, esta
línea recta representa realmente «un espacio en un tiempo» para el
observador, el cual es, por supuesto, tridimensional. Pero debemos
suprimir dos dimensiones espaciales para poder dibujar el diagrama
en un plano; por lo tanto, todo «un espació en un tiempo» euclídeo
tridimensional, plano e infinito, es representado por una línea. Para
el observador en movimiento respecto a nuestro primer observador,
una línea,recta diferente representará todos los sucesos simultáneos
con el suceso origen en relación al estado de movimiento de este
nuevo observador. Se necesita una línea diferente porque los sucesos
simultáneos con el suceso origen serán diferentes para cada observa­
dor y lo que se toma como espacio en el instante del suceso origen
depende del estado de movimiento de un observador. Puede mos­
trarse fácilmente que la línea de simultaneidad (el espacio en un
tiempo) para el segundo observador representada en el diagrama ten­
Espacio, tiempo, m ovim iento 59

dría que estar inclinada respecto a la línea de simultaneidad del pri­


mer observador.
Ya observamos cómo, en las teorías compensatorias diseñadas
inicialmente para explicar los resultados nulos de los experimentos
de ida y vuelta, se postulaba que las longitudes de objetos en movi­
miento con respecto al éter se contraían y que los relojes en movi­
miento con respecto al éter se atrasaban. En el espacio-tiempo de
Minkowski no hay, por supuesto, ningün éter. Pero la contracción
de longitudes y la dilatación temporal se dan. Supongamos que una
barra de un metro de longitud se encuentra en reposo en un sistema
de referencia dotado de movimiento uniforme. En cualquier otro
sistema de referencia con movimiento uniforme se medirá una longi­
tud de la barra menor que un metro. Supongamos que un reloj se
encuentra en reposo en un sistema de referencia dotado de movi­
miento uniforme. Un observador en cualquier otro sistema de refe­
rencia con movimiento uniforme dirá que dicho reloj «corre más
despacio», es decir, tarda más de un segundo en marcar un segundo
en su esfera.
Lo que es sorprendente es que la contracción de longitudes, así
como la dilatación temporal, sean perfectamente simétricas. Y o veo
más cortas las barras de un metro en reposo en tu sistema de refe­
rencia (estando los dos en movimiento relativo), pero tú ves más cor­
tas las barras de un metro en mi sistema de referencia. Y la ralentiza-
ción de los relojes es igualmente simétrica. Pese a la apariencia de
inconsistencia, no hay ninguna, pues los intervalos de longitud y de
tiempo son ahora relativos a un observador y las afirmaciones he­
chas son perfectamente consistentes. Evidencia directa de la existen­
cia real de estos fenómenos la encontramos, por ejemplo, en el tiem­
po de vida medio — inexplicablemente dilatado en términos
prerrelativistas— de las partículas inestables que se crean en las
capas altas de la atmósfera y se observan en la superficie de la tierra.
Únicamente la ralentización relativa de sus procesos de desintegra­
ción, debido a su alta velocidad respecto a nosotros, puede dar
cuenta del fenómeno.
Este resultado de la relatividad da lugar a una gran variedad de
paradojas, contradicciones aparentes que en realidad no son tales, al­
gunas de las cuales pueden encontrarse en cualquier libro estándar
sobre relatividad. Por ejemplo, un hombre que porta una pértiga en­
tra en un cobertizo por uno de sus lados y sale por el otro. Cuando
60 Filosofía de la física

la pértiga está en reposo respecto al cobertizo, tiene la misma longi­


tud que el cobertizo. Como la pértiga en movimiento es más corta
que el cobertizo, alguien puede cerrar las dos puertas al corredor
mientras éste y la pértiga se encuentran dentro del cobertizo. Pero
para el corredor, el cobertizo es más corto que la pértiga, de mane­
ra que esto es claramente imposible. La clave está en pensar en el
orden temporal en que ocurren los sucesos desde las diferentes
perspectivas del corredor y del observador en reposo en el coberti­
zo. Para el hombre en reposo en el cobertizo ambas puertas están
cerradas mientras el corredor se encuentra con la pértiga en el co­
bertizo. El corredor ve la puerta más distante abierta y su pértiga
sale del cobertizo antes de que la puerta más próxima se haya ce­
rrado.
El espacio-tiempo de la relatividad especial, el espacio-tiempo de
Minkowski, requiere que hagamos otra distinción sobre el tiempo
que no se da en la teoría prerrelativista. Hemos observado cómo un
observador cualquiera atribuirá un cierto intervalo temporal entre
dos sucesos, y cómo este intervalo variará de un observador a otro.
Éste es denominado el intervalo temporal coordenado entre los suce­
sos relativo al observador en cuestión. Otra noción de tiempo surge
cuando consideramos a alguien que se mueve desde un suceso (un
lugar en un instante) hacia algún otro suceso (un lugar diferente en
un tiempo diferente) a lo largo de alguna trayectoria espacio-tempo-
ral, a través de una sucesión de lugares-en-un-instante. Supongamos
que este agente transporta un reloj que se ajusta a cero en el primer
suceso. Este reloj marcará un valor definido en el suceso final. Segu­
ramente todos los observadores coincidirán en cuál es dicho valor,
porque todos estarán de acuerdo en la coincidencia de la lectura de
dicho valor por el reloj con el suceso final, ya que se trata de sucesos
en el mismo lugar y no hay relatividad de la simultaneidad en este
caso. Este tiempo es denominado el tiempo propio entre los dos su­
cesos.
Pero el tiempo propio transcurrido entre dos sucesos variará de­
pendiendo de la trayectoria espacio-temporal por la que se transporta
el reloj de un suceso al otro. Este fenómeno no cuenta con ningún
precedente en la física prerrelativista. De hecho, puede demostrarse
fácilmente que el tiempo transcurrido en un reloj transportado de un
suceso a otro será máximo cuando la trayectoria seguida desde el pri­
mer suceso al segundo sea una de movimiento uniforme, no acelera­
61

do. Éste es el fundamento de la famosa paradoja de los gemelos, se­


gún la cual si un gemelo permanece en un sistema de referencia con
movimiento uniforme mientras el otro realiza un viaje por el espacio
y el tiempo que entrañe movimiento acelerado, pero que lo lleve de
vuelta a coincidir con el gemelo que se ha quedado en casa, el geme­
lo aventurero será más joven — mostrará, por ejemplo, un menor en­
vejecimiento biológico— que su gemelo cuando los dos se encuen­
tren de nuevo. Evidencia de que este efecto de la relatividad es real
la encontramos en las partículas inestables lanzadas por los canales
circulares de los aceleradores. El número de partículas desintegradas
es mucho menor entre ellas que entre sus partículas paisanas en un
grupo que permanece en reposo en el laboratorio entre el instante en
el que coinciden por primera vez y el instante en el que vuelven a
coincidir. Como de costumbre, no se trata de una contradicción en
la teoría, sólo de fenómenos que no habíamos esperado, un resulta­
do de la sorprendente naturaleza del espacio-tiempo. (Véase la figu­
ra 2.4.)
Ya observamos cómo la mecánica newtoniana se conformaba al
principio de Galileo de que todos los fenómenos físicos parecerían
iguales a cualquier observador en un estado de movimiento unifor­
me, si bien el hecho de que el laboratorio de uno estuviese en movi­
miento acelerado se revelaría en consecuencias observables. La vieja
teoría de la mecánica, una vez trasladada al nuevo espacio-tiempo re­
lativista, deja de satisfacer este principio. De aquí que Einstein desa­
rrollase una nueva mecánica que reconcilia la relatividad galileana de
los fenómenos mecánicos con la nueva imagen del espacio-tiempo. El
fundamento de esta teoría es simple. La vieja mecánica obedecía ta­
les principios como la conservación de la energía, la conservación del
impulso y la conservación del momento angular. Éstos son considera­
dos ahora el resultado de simetrías fundamentales de la estructura es­
pacio-temporal (en particular, del hecho de que todos los puntos es­
pacio-temporales son estructuralmente semejantes, como lo son todas
las direcciones espacio-temporales). Estas simetrías se dan también en
el nuevo espacio-tiempo, por lo que podemos mantener las viejas re­
glas de conservación y derivar de ellas la nueva mecánica. E n la nue­
va mecánica, por ejemplo, se encuentra la famosa consecuencia de la
relatividad de la equivalencia entre masa y energía, a saber, que
cuanta más energía cinética posea un objeto, mayor será su resisten­
cia a ser acelerado aún más por una fuerza.
Filosofía de la física

F ig u r a 2.4. La paradoja de los gemelos. S


es un observador que permanece inercial y
transporta un reloj desde el suceso o
al suceso o'.
E l tiempo transcurrido en el reloj
se representa por las esferas de reloj situadas a la izquierda. S ‘,
originalmente en re­
poso con respecto a S,
se acelera a la derecha, viaja a la derecha con una velocidad
uniforme, invierte la dirección del movimiento relativo, regresa a la posición de 5 y
S
acelera de nuevo para terminar en reposo en relación a en la posición o'. E l tiempo
transcurrido en un reloj transportado por S’
se representa por las esferas de reloj si­
tuadas a la derecha. L a relatividad especial predice que habrá transcurrido menos
tiempo en el reloj transportado por S'
a lo largo del camino acelerado de o a o' que
en el reloj de S.

También indicamos que Einstein supuso que la velocidad de la


luz en el vacío era la velocidad máxima de propagación de una señal
cualquiera. Semejante postulado encaja muy bien en la nueva imagen
espacio-temporal.
Espacio, tiempo, movim iento 63

a S b
F ig u r a 2.5. La relatividad del orden temporal de los sucesos en la relatividad especial. O es
un observador inercial. O ' es otro observador inercial que se mueve a la derecha en
relación a O. La linea S
es la clase de sucesos que O considera simultáneos con el
suceso a.
La linea S'
es la clase de sucesos que O ' considera simultáneos con el suce­
so a. c b
Para O el suceso es posterior al suceso y por consiguiente posterior al suceso
a. c b
Pero para O ', el suceso es anterior al suceso ' y por consiguiente anterior al su­
ceso a.
Semejante inversión del orden temporal puede darse sólo para sucesos, como
a
el suceso y el suceso c, que no son causalmente conectables uno al otro.

Podemos, por ejemplo, encontrar pares de sucesos, y de A y B,


observadores 01 y 02, tales que A
es anterior a en relación a 01 y B
B es anterior a A
en relación a 02. Pero éstos serán siempre sucesos
que tienen una separación de tipo espacial. Esto significa, suponien­
do la velocidad límite de la luz, que los sucesos tendrán un orden en
el tiempo diferente en relación a dos observadores sólo si los sucesos
no pueden ser conectados por ninguna señal causal. Los sucesos que
64 Filosofía de la física

pueden ser conectados por una señal causal, viajando a la misma o a


menor velocidad que la de la luz, serán observados en el mismo or­
den temporal por todos los observadores, si bien el tiempo transcu­
rrido entre ellos variará de un observador a otro. (Véase la figura 2.5.)
Se ha señalado que no es necesario mantener el postulado de la
velocidad límite de la luz para contar con una teoría consistente en
la que el espacio-tiempo sea el espacio-tiempo de Minkowski, el es-
pacio-tiempo de la relatividad especial. Si uno simplemente insiste en
que las condiciones del m undo sean tales que se eviten paradojas
causales, uno puede tolerar «taquiones», señales causales a velocida­
des mayores que la de la luz. La condición de consistencia es necesa­
ria puesto que la postulación de taquiones en el espacio-tiempo de
Minkowski dejaría un margen para lazos causales cerrados, en los
que un suceso se causa a sí mismo. Si se pudieran elegir libremente
las condiciones iniciales, se podría generar una situación paradójica
(me doy un tiro antes de apretar el gatillo que dispara la bala). No
obstante, dichas velocidades superlumínicas nunca han sido detecta­
das y las versiones estándar de la relatividad especial adoptan el pos­
tulado de la luz como señal causal máxima junto a la estructura del
espacio-tiempo de Minkowski con su velocidad de la luz invariante
para todos los observadores inerciales.
Nada en el espacio-tiempo de la relatividad especial, según he­
mos observado, juega el papel íntegro del espacio de Newton. Para
Newton, el espacio mismo aportaba un verdadero criterio de lo que
significa para un objeto estar realmente en reposo, pese a no deri­
varse consecuencias empíricas del movimiento uniforme respecto al
espacio mismo. En el espacio-tiempo de Minkowski no hay nada
que proporcione un criterio sobre cuándo dos sucesos que no son
simultáneos entre sí están «en el mismo lugar». Carece por consi­
guiente de sentido preguntar si un objeto permanece en un mismo
lugar a lo largo del tiempo, aun cuando tiene pleno sentido preguntar
si la posición relativa de un objeto, es decir, la posición respecto a
otros objetos materiales tomados como sistema de referencia, perma­
nece invariable en el tiempo. Pero la distinción entre estar realmente
en movimiento uniforme, o no, se conserva en este espacio-tiempo.
El que la trayectoria de una partícula material a través del espacio-
tiempo, la trayectoria de tipo temporal que representa la sucesión de
lugares-tiempo que el objeto ocupa, sea o no una línea recta, esto es,
el que sea una de las trayectorias de tipo temporal que constituyen
65

una geodésica del espacio-tiempo, es una cuestión que tiene perfecto


sentido.
La distinción, pues, entre que un objeto esté en movimiento uni­
forme o que esté en movimiento acelerado — representado por una
trayectoria curva de tipo temporal en el diagrama del espacio-tiem-
po— sigue siendo absoluta, en el sentido de que esta distinción no
tiene nada que ver con el movimiento del objeto en cuestión respec­
to a otros objetos materiales. Al contrario, esta distinción está deter­
minada por el movimiento de un objeto en relación a las estructuras
del espacio-tiempo mismo. En la física newtoniana, el movimiento
verdaderamente acelerado se ponía de manifiesto por la presencia
(en el laboratorio acelerado) de fuerzas inerciales que actuaban sobre
los objetos y estaban supuestamente generadas por la aceleración de
los objetos en relación al espacio mismo. En la relatividad especial, la
aceleración real se manifiesta en ésta y en otras formas también. Ya
observamos, por ejemplo, cómo los resultados nulos en los experi­
mentos de ida y vuelta se obtenían sólo cuando uno de dichos expe­
rimentos se realizaba con luz en un laboratorio en movimiento uni­
forme. En un aparato acelerado, la luz invertirá tiempos en recorrer
las trayectorias que revelan la existencia de la aceleración absoluta
del dispositivo experimental. Aunque no hay tal cosa, entonces,
como «estar en el mismo lugar» si no es en relación a algún estándar
material, el «estar en movimiento uniforme» tiene, en la relatividad
especial, tanta significación real en un sentido absoluto como lo tiene
en la teoría newtoniana.

El espacio-tiempo neo-newtoniano
Una vez que se hubo construido el espacio-tiempo de Minkowski de
la relatividad especial, se observó que uno podía volver atrás y cons­
truir un espacio-tiempo apropiado para la teoría newtoniana anterior,
un espacio-tiempo que tuviera algunas ventajas sobre la noción de es­
pacio mismo tradicionalmente postulada en la física newtoniana. Las
principales intuiciones proceden de darse cuenta de que la mejor ru­
ta sistemática para construir un espacio-tiempo apropiado a lo que se
considera como cantidades observables postuladas por cualquier teo­
ría dada es tomar las posiciones de sucesos como elementos primiti­
vos y construir a continuación el espacio-tiempo dotando de una es­
tructura al conjunto de las posiciones de sucesos.
66 Filosofía de la física

En la física newtoniana, la noción de simultaneidad para sucesos


separados se presupone como una noción absoluta. Así, para cons­
truir nuestro nuevo espacio-tiempo de la física newtoniana dotamos a
la colección de posiciones de sucesos de un intervalo temporal defi­
nido entre cualquier par de sucesos. Cuando este intervalo es cero,
los sucesos son simultáneos. En el espacio-tiempo de Minkowski de
la relatividad espacial, los espacios son colecciones de sucesos simul­
táneos en relación a un observador dado. Se supone que estos espa­
cios «relativos» tienen la estructura tridimensional ordinaria descrita
por la geometría de Euclides. En el espacio-tiempo newtoniano revi­
sado, con su noción absoluta de simultaneidad, podemos, de nuevo,
considerar los espacios como colecciones de sucesos simultáneos.
Así, cada suceso estará en un único espacio y se supone, de nuevo,
que el espacio es un espacio euclídeo tridimensional.
En el contexto newtoniano, como en la relatividad especial, lo
que hace las veces de trayectoria del movimiento uniforme de un ob­
jeto es una noción bien definida. Así, imponemos a este nuevo espa­
cio-tiempo newtoniano una condición similar a la impuesta al espa­
cio-tiempo de Minkowski: Debe haber una noción definida de
trayectorias rectilíneas que representen las posibles trayectorias del
movimiento a través del-espacio y en el tiempo de partículas que se
mueven libre y uniformemente. Ahora bien, Newton supuso que
existía una cosa tal como un suceso aconteciendo «en el mismo lu­
gar» que otro suceso no simultáneo. Si imponemos esa estructura,
una noción definida del mismo lugar para sucesos no simultáneos, al
espacio-tiempo que estamos construyendo, formaremos la imagen del
espacio absoluto de Newton para el espacio y el tiempo. Pero esto
nos daría características del mundo sin consecuencias empíricas, tales
como la magnitud de la velocidad uniforme de un objeto con respec­
to al «espacio mismo». Sin embargo, si dejamos a un lado esa estruc­
tura del «mismo lugar en tiempos diferentes», obtenemos un nuevo
espacio-tiempo, denominado algunas veces el espacio-tiempo galilea-
no, y otras el espacio-tiempo neo-newtoniano. En este espacio-tiem­
po, el movimiento uniforme absoluto está bien definido, pero la
igualdad absoluta de lugar a través del tiempo no lo está.
En esta nueva imagen del espacio-tiempo, las aceleraciones abso­
lutas existen y tienen consecuencias observables, pero no existe nada
parecido a la velocidad absoluta de un objeto. Esto es justamente lo
que queremos. La necesidad sentida por los físicos de un nuevo en­
Espacio, tiempo, m ovim iento 67

foque del espacio y el tiempo con el que hacer frente a los asombro­
sos y desconcertantes resultados de los experimentos ópticos de ida
y vuelta condujo a profundas intuiciones sobre cuáles eran los com­
ponentes de la imagen del espacio y el tiempo que poseíamos intuiti­
vamente y que, en una forma refinada, sostenían el m undo de la
ciencia newtoniana. Confrontando los nuevos hechos experimentales
y construyendo el aparato conceptual que los justificase, los físicos
lograron nuevas maneras de examinar posibles teorías para dar cuen­
ta de los viejos hechos observacionales postulados. Com o veremos, la
existencia de estas nuevas estructuras para describir y explicar las ca­
racterísticas espacio-temporales del m undo tuvo un importante efec­
to en nuestro entendimiento filosófico de la naturaleza del espacio y
el tiempo y de nuestro acceso al conocimiento sobre su naturaleza.
Pero, antes de considerar estas cuestiones, examinaremos un segun­
do cambio revolucionario en nuestras concepciones sobre la natura­
leza del espacio y el tiempo provocado una vez más por la fértil ima­
ginación científica de Einstein.

La gravedad y la curvatura del espacio-tiempo

Gravedad y relatividad
En su obra magna, los Principia
, Newton propuso una teoría que ex­
plicaba, entre otras cosas, el movimiento de los planetas alrededor
del sol y sus órbitas elípticas, que había sido tan cuidadosamente
descrito por J. Kepler. La teoría que da cuenta de este movimiento
tiene dos componentes. Una es la teoría de la dinámica de Newton,
la teoría general que relaciona los movimientos con las fuerzas que
actúan sobre los objetos en movimiento. Esta teoría, fundada en la
suposición subyacente de un espacio absoluto y de un curso absoluto
del tiempo, incorpora el principio de Galileo según el cual los obje­
tos sobre los que no actúa ninguna fuerza permanecen en un estado
constante de movimiento uniforme. Postula, además, que el cambio
de movimiento (la aceleración) será proporcional a las fuerzas que ac­
túan sobre un cuerpo e inversamente proporcional a la tendencia in­
trínseca de un cuerpo a oponer resistencia a los cambios de movi­
miento, su así denominada masa inercial.
68 Filosofía de la física

La otra componente de la teoría de Newton concierne a la fuerza


responsable de los movimientos observados de los cuerpos astronó­
micos (y de otros muchos fenómenos, como la forma en que los cuer­
pos caen hacia la superficie de la tierra, o las mareas). Apoyándose
una vez más en la importante observación de Galileo de que, dejan­
do a un lado la resistencia del aire, todos los objetos sufren una ace­
leración uniforme hacia la tierra cuando están en caída libre cerca de
su superficie, Newton postula una fuerza general de la gravedad ac­
tuando entre todos los objetos materiales. La gravedad es siempre
una fuerza atractiva. La intensidad de la fuerza ejercida entre los
cuerpos se considera que es proporcional a la masa inercial de cada
cuerpo e inversamente proporcional al cuadrado de la distancia entre
ellos. La Tercera Ley del Movimiento de Newton afirma que la fuer­
za ejercida por un cuerpo sobre un segundo cuerpo será compensada
por una fuerza de igual intensidad — pero dirigida en sentido contra­
rio— ejercida por el segundo cuerpo sobre el primero.
El hecho de que la fuerza aumenta en proporción a la masa iner­
cial, pero la resistencia del cuerpo a la aceleración es también pro­
porcional a la masa inercial, produce directamente el resultado de
Galileo según el cual todos los cuerpos sufren una misma aceleración
cuando son sometidos a la fuerza gravitacional ejercida por algún
cuerpo fijo, siempre que los cuerpos prueba estén situados en el mis­
mo lugar respecto al objeto que ejerce la fuerza gravitacional. New­
ton demostró que las leyes de la dinámica junto a la ley de la fuerza
gravitacional por él postuladas conducen a las leyes de Kepler sobre
el movimiento planetario o, mejor dicho, a una versión ligeramente
modificada de las mismas.
No debería sorprender, pues, que Einstein, una vez que hubo de­
mostrado la necesidad de un nuevo sistema dinámico y construido
uno consistente con el nuevo espacio-tiempo de la relatividad espe­
cial, abordara el problema de la construcción de una nueva teoría de
la gravedad. Esta teoría, que se necesita claramente, debe ser consis­
tente con las nuevas ideas sobre el espacio-tiempo. La teoría de New­
ton, por ejemplo, considera que la interacción gravitacional entre
cuerpos es instantánea, mientras la relatividad considera que todas
las señales se propagan a una velocidad menor que, o igual a, la de la
luz. Se puede construir una gran variedad de alternativas a la teoría
newtoniana compatibles con el nuevo espacio-tiempo relativista. De
hecho, un programa en curso en la física experimental se ocupa de
Espacio, tiempo, movim iento 69

probar cada una de estas alternativas frente a las demás, buscando


posibles observaciones que permitan eliminar algunas de las posibili­
dades. Pero la novel teoría gravitacional que mejor ha respondido a
los experimentos, y la que presenta una mayor elegancia teórica, es la
propia teoría de Einstein. Ésta se denomina la teoría general de la re­
latividad. Es también la teoría que postula una naturaleza para el
mundo que reviste un gran interés para los filósofos. Dedicaré el res­
to de esta sección a esbozar algunas de las ideas que condujeron a
Einstein a esta novel teoría de la gravedad, la cual, como veremos,
constituye una novel teoría de la estructura del espacio-tiempo mis­
mo. Perfilaré algunos de los constituyentes básicos de la teoría y ex­
ploraré algunas de las consecuencias de la misma que son de impor­
tancia para el filósofo.
Einstein parte de la observación por Galileo de que la acelera­
ción inducida por la gravedad en un objeto es independiente del ta­
maño y de la constitución del objeto. La gravedad se distingue de
cualquier otra fuerza por poseer este efecto universal. Consideremos
el caso en el que un objeto es acelerado por un objeto gravitatorio si­
tuado a una distancia lo suficientemente grande para que el campo
gravitacional sea efectivamente constante dentro del laboratorio.
Einstein hace notar que un pequeño objeto prueba en un laboratorio
se vería acelerado respecto a ese laboratorio en la misma forma exac­
tamente en que lo haría si no hubiese ninguna fuerza actuando sobre
el objeto prueba y, en su lugar, el laboratorio mismo estuviese siendo
acelerado uniformemente en la dirección opuesta a la de la acelera­
ción de la partícula. En este segundo caso, cualquier objeto prueba
de cualquier masa o composición parecería acelerar uniformemente
con respecto al laboratorio. Es la universalidad de la gravedad lo que
nos permite reemplazar la fuerza gravitacional por una aceleración
del sistema de referencia.
Quizá, sugiere Einstein, todos los efectos de la gravedad podrían
duplicarse mediante una aceleración semejante del laboratorio. Esto
conduce a la hipótesis de que la gravedad tendrá efectos sobre cosas
diferentes a la materia formada por partículas. Si dirigimos un rayo
de luz a través de un laboratorio en movimiento acelerado espera­
mos que el rayo siga una trayectoria que no es recta en relación al la­
boratorio. ¿No desviaría, entonces, la gravedad los rayos de luz que
pasan cerca de un cuerpo gravitacional?
Quizá más sorprendente es la conclusión de que deberíamos es­
Filosofía de la física

perar que la gravedad afectase las mediciones de los intervalos espa­


ciales y temporales, como revelan los relojes y las reglas de medir
idealizados. El argumento a favor del efecto temporal es el más senci­
llo de construir y de seguir. Imaginaros un laboratorio acelerado con
un reloj en su extremo superior y un reloj idéntico en su extremo
inferior. Se envían señales desde el reloj inferior al superior y se
comparan las velocidades de emisión de las señales, según son de­
terminadas por el reloj inferior, con las de recepción, según son
determinadas por el reloj superior. En el momento en el que una se­
ñal emitida desde la parte inferior alcanza la parte superior, el reloj
superior estará moviéndose respecto al sistema de referencia en mo­
vimiento uniforme en el que se encontraba en reposo el reloj inferior
cuando la señal fue emitida. Arguyendo, bien a partir del efecto de
dilatación temporal de la relatividad especial, bien a partir del deno­
minado efecto Doppler, el cual muestra en un contexto prerrelativis-
ta cómo una señal emitida por una fuente a una frecuencia determi­
nada parecerá tener una frecuencia menor cuando es observada por
alguien en relación al cual la fuente se encuentra en movimiento, es
plausible afirmar que el reloj inferior parecerá atrasar cuando es me­
dido con el reloj superior. Esto es, la frecuencia con que la señal es
recibida por el reloj superior es menor que la frecuencia con que fue
emitida según la medición del reloj inferior. (Véase la figura 2.6.)
Pero, ahora, consideremos el laboratorio no acelerado con todos
sus aparatos en reposo situados en un campo gravitacional. Según el
argumento de Einstein (a menudo llamado el Principio de Equiva­
lencia), deberíamos esperar que el reloj situado más abajo en el cam­
po gravitacional pareciera atrasar al reloj localizado más arriba. O b ­
servemos que esto no tiene nada que ver con la fuerza gravitacional
sentida por cada uno de los relojes sino, antes bien, está determinado
por cuánto más abajo en la «colina» gravitacional se encuentra un re­
loj respecto al otro. Así, deberíamos esperar que la gravedad tuviese
un efecto en nuestra medida de los intervalos temporales. Pueden
darse argumentos similares, aunque mucho más complicados, que
nos hacen esperar que la gravedad afecte también a las mediciones
espaciales.
Considerados conjuntamente, estos argumentos movieron a Eins­
tein a hacer la sorprendente sugerencia de que la forma de tratar con
la gravedad en un contexto relativista era considerarla no como un
campo de fuerzas actuando en el espacio-tiempo sino, en vez de ello,
Espacio, tiempo, m ovimiento 71

como una modificación de la propia estructura geométrica del espa­


cio-tiempo. En presencia de gravedad, argüyó, el espacio-tiempo no
es «plano», sino «curvo». Para saber lo que esto significa, empero,
debemos examinar brevemente la historia de la geometría según ha
sido desarrollada por los matemáticos.

(a) (b)

I
E l corrimiento al rojo gravitacional.
F ig u r a 2.6. (a) Representa un laboratorio acelera­
do con un reloj en el suelo y otro sujeto al techo. Debido a que una señal emitida
desde el reloj del suelo se recibe en el reloj del techo cuando el laboratorio está en
movimiento con una velocidad relativa al sistema de movimiento en el que se emitió
la señal (debido a la aceleración del laboratorio), el reloj del techo registrará que el
reloj del suelo «atrasa» de manera muy parecida a como un observador escucha un
pitido que se aleja con una intensidad menor de la que se escucharía si el pitido estu­
viese estacionario con respecto al observador. La relatividad general postula que un
resultado sim ilar se obtendrá en un laboratorio no acelerado, pero fijo, en un campo
gravitacional — como en (b)— . U n reloj situado más abajo en el campo gravitacional
será registrado como «atrasando» por un reloj situado más arriba en el potencial gra­
vitacional. Esto es el denominado corrimiento al rojo gravitacional. Señala una de las
maneras en que puede considerarse que la gravedad afecta a la estructura métrica del
espacio-tiempo.
72 Filosofía de la física

La geometría no-euclídea
La geometría ordinaria, en la forma en que Euclides la formalizó, de­
riva todas las verdades geométricas de un pequeño conjunto de pos­
tulados básicos, supuestamente autoevidentes. Aunque la axiomatiza-
ción por Euclides de la geometría no es, de hecho, completa (es
decir, suficiente en sí misma para permitir que se lleven a cabo todas
las derivaciones sin presuponer otras premisas subyacentes u ocul­
tas), puede ser completada en esta forma. Durante mucho tiempo
existió un gran desconcierto en torno al denominado postulado de
las paralelas de Euclides. Éste equivale a la afirmación de que por un
punto no situado sobre una recta puede trazarse una, y solo una, rec­
ta que se encuentre en el plano común a la recta y al punto dados y
que no intersecte a la recta dada en ninguna dirección con indepen­
dencia de cuanto se extiendan las rectas. A los geómetras les pareció
que este postulado carecía de la autoevidencia de las otras hipótesis
más simples (tales como «iguales sumados a iguales dan iguales», y
«dos puntos determinan una recta que pasa por ellos»). ¿Podría este
postulado «sospechoso» derivarse de los otros postulados, resultando
superfluo como suposición independiente? Si uno pudiera demostrar
que la negación del postulado de las paralelas era inconsistente con
los otros postulados, podría demostrar que tal derivación era posible
por el método de reductio ad absurdum. Pero, ¿podía demostrarse
esto?
La negación del postulado de las paralelas puede tomar dos di­
recciones. El postulado dice que existe una, y solo una, paralela por
un punto, y para negar esto podría afirmarse que no existe ninguna
paralela o que hay más de una. En 1733 G. Saccheri demostró que el
postulado de las no paralelas era, de hecho, inconsistente con el resto
de los axiomas, al menos si éstos se interpretaban en la forma habi­
tual. Pero no fue capaz de demostrar que la negación de las muchas
paralelas también era inconsistente. Hacia el siglo XIX, J. Bolyai, N. I.
Lobachevsky y K. F. Gauss habían reconocido que se podían cons­
truir geometrías consistentes que adoptaban los postulados de Eucli­
des pero presentaban un postulado de muchas paralelas en lugar del
postulado de las paralelas de Euclides. B. Riemann demostró enton­
ces que, si se modificaba ligeramente la interpretación de los otros
axiomas, podía también construirse una nueva geometría, con un
postulado de no paralelas en lugar del postulado de las paralelas de
Espacio, tiempo, movimiento 73

Euclides, que fuese lógicamente consistente. Las reinterpretaciones


necesarias son que: «Dos puntos determinan una recta» debe enten­
derse de manera que en ocasiones haya más de una línea recta conte­
niendo un par de puntos dados, y «Una línea puede extenderse arbi­
trariamente en las dos direcciones» debe entenderse como afirmando
que una línea no encontrará ningún punto final si se prolonga, pero
no implicando que una línea completamente extendida tenga longi­
tud infinita.
Posteriormente se vio que, si estas nuevas geometrías no-euclí-
deas eran consideradas como geometrías bidimensionales planas, po­
dían ser interpretadas en una forma euclídea como la geometría de
las curvas de distancia más corta (geodésicas) sobre superficies bidi-
mensiondes curvas. En particular, la geometría axiomática riemannia-
na era justamente la geometría de las figuras construidas con arcos
de circunferencias máximas sobre la superficie de una esfera. Pero,
¿qué podía entenderse por geometrías no-euclídeas tridimensionales
lógicamente consistentes, o eran éstas, si bien lógicamente consisten­
tes, absurdas por otras razones?
Gauss llevó la geometría un paso más allá con el desarrollo de
una teoría general de las superficies curvas bidimensionales. Estas se
caracterizan por un número — conocido como la curvatura gaussia-
na— en cada punto. La forma en que esta curvatura varía con la dis­
tancia, medida a lo largo de las curvas dibujadas sobre la superficie,
determina la forma de la superficie curva. Gauss imaginó estas super­
ficies curvas inmersas en el espacio euclídeo ordinario de tres dim en­
siones. Un importante resultado de su trabajo, sin embargo, fue que
se podían caracterizar algunos de los aspectos de la curvatura (curva­
tura «intrínseca») por medio de cantidades que podían ser determi­
nadas por una hipotética criatura bidimensional confinada a la super­
ficie curva y ajena por completo a la existencia de un espacio
tridimensional en derredor. Desde esta nueva perspectiva resultó que
las geometrías descritas por los viejos sistemas de axiomas podían ser
entendidas como casos especiales. La geometría euclídea bidimensio­
nal, la geometría del plano, es la geometría de la superficie cuya cur­
vatura gaussiana es cero en todo lugar. La geometría riemanniana, la
geometría de las superficies bidimensionales esféricas, es sencillamen­
te la geometría de una superficie cuya curvatura gaussiana es cons­
tante y positiva. La geometría de Bolyai-Lobachevsky es la geometría
de una superficie bidimensional cuya curvatura gaussiana es la mis-
74 Filosofía de la física

ma en cada punto y negativa. La curvatura negativa es característica


de un punto como el que hallamos en el centro de un paso de mon­
taña, donde la superficie se curva «en direcciones opuestas» a lo lar­
go de diferentes caminos que pasan por él.
Riemann siguió entonces adelante y generalizó la teoría de Gauss
de las superficies curvas a espacios de un número arbitrario de di­
mensiones. Mientras Gauss daba por sentado que las superficies en
cuestión se hallaban inmersas en un espacio euclídeo plano, Riemann
no hizo tal suposición. Después de todo, un resultado del trabajo de
Gauss era que algunos aspectos de la curvatura serían accesibles a
una criatura bidimensional ajena al espacio circundante. La geome­
tría riemanniana general se ocupa de estos aspectos de la curvatura,
los aspectos intrínsecos. (Esta geometría riemanniana general de los
espacios curvos «-dimensionales no debe ser confundida con la geo­
metría axiomática riemanniana anterior.) La suposición básica de esta
geometría es que el espacio curvo «-dimensional puede ser aproxima­
do en regiones suficientemente pequeñas por un espacio euclídeo,
plano, «-dimensional. En el caso de superficies curvas en el espacio
plano tridimensional, estas superficies aproximativas pueden ser re­
presentadas por planos tangentes a la superficie curva en un punto
dado; los planos también Se encuentran contenidos en el espacio tri­
dimensional circundante. En el caso de un espacio curvo riemannia-
no general «-dimensional, se postula la existencia de estos «planos
tangentes» solamente en el sentido de que, en lo que a las caracterís­
ticas «-dimensionales intrínsecas respecta, el espacio curvo «-dimen­
sional puede ser aproximado en un punto dado por un espacio euclí­
deo, plano, «-dimensional.
¿Cuáles son algunas de las características de los espacios curvos?
¿Cómo podría, por ejemplo, una criatura tridimensional que habitase
en un espacio curvo tridimensional descubrir que su espacio era, en
efecto, curvo? La curvatura intrínseca se pone de manifiesto en la
medida de -las distancias. Una criatura «-dimensional puede realizar
un número suficiente de mediciones de distancias entre puntos para
asegurarse de que no había forma de que estos puntos pudieran estar
localizados en un espacio plano «-dimensional y tener las distancias
mínimas entre ellos a lo largo de curvas que tienen los puntos de las
criaturas. Por ejemplo, un examen de las distancias aéreas más cortas
entre ciudades de la Tierra nos podría decir que la superficie de la
Tierra no era plana, sino que se aproximaba a la de una esfera. En un
Espacio, tiempo, m ovim iento 75

espacio curvo «-dimensional, las curvas de distancia más corta, las


denominadas geodésicas del espacio, ya no son las líneas rectas que
serían si se tratase de un espacio plano. Estas líneas son también las
líneas de «menor curvatura» en el espacio. Intuitivamente, esto signi­
fica que las líneas, pese a no ser rectas debido a la curvatura del es­
pacio, no se desvían de la rectilineidad más de lo que les obliga la
curvatura del espacio mismo.
La curvatura puede manifestarse en otras formas también. Por
ejemplo, si tomamos un segmento dirigido (un vector) y lo movemos
a lo largo de una curva cerrada en un espacio plano, de manera que
permanezca en todo momento tan paralelo como sea posible a sí mis­
mo según lo vamos moviendo, cuando retornemos al punto de parti­
da, el vector apuntará en la misma dirección en ese punto que cuan­
do comenzamos. Pero en un espacio curvo, semejante transporte
paralelo de un vector a lo largo de un lazo cerrado modificará, en ge­
neral, la dirección del vector, de manera que al final del transporte
apuntará en una dirección diferente a la dirección con la que partió
al comienzo del viaje.
Un espacio plano tridimensional tiene una extensión infinita y
tiene un volumen infinito. Un plano euclídeo tiene extensión infinita
y área infinita. Pero la superficie intrínsecamente curva de una esfera,
aunque no tiene límites, tiene un área finita. Una criatura bidimen-
sional que habitase en una superficie esférica podría pintar la superfi­
cie. Nunca encontraría un límite a la superficie. Pero después de un
tiempo finito habría concluido el trabajo, habiendo pintado toda la
superficie. De manera similar, una criatura tridimensional que habite
en el espacio curvo tridimensional que es análogo a la superficie esfé­
rica, que habite en una así denominada tri-esfera, podría llenar la re­
gión de plástico espumoso. Aunque nunca encontrase una pared que
limitase el espacio, terminaría el trabajo en un tiempo finito, habien­
do llenado todo el volumen del espacio tridimensional con una canti­
dad finita de espuma plástica.
Parece claro, pues, que la noción de un espacio curvo «-dimen­
sional, incluyendo la de un espacio curvo tridimensional, no es sólo
lógicamente consistente, sino que no tiene evidentemente nada de
absurda. Siempre y cuando nos ciñamos a las características intrínse­
cas de la curvatura, no estamos haciendo la suposición de que el es­
pacio está inmerso en un espacio plano circundante de un mayor nú­
mero de dimensiones. Y las características de la curvatura intrínsecas
76 Filosofía de la física

al espacio pueden claramente ser averiguadas mediante técnicas di­


rectas por una criatura que viva en el espacio. ¿No podría darse el
caso, pues, de que el espacio tridimensional real de nuestro mundo
fuese curvo, y no el espacio plano caracterizado por los postulados
básicos de la geometría euclídea tridimensional? Tales especulacio­
nes acompañaron naturalmente el descubrimiento de las nuevas geo­
metrías.

El uso de las geometrías no-euclídeas en lafísica


9

En el siglo xix se especuló con la posible realidad del espacio curvo.


W. Clifford, por ejemplo, sugirió que era concebible que la materia
consistiera efectivamente de regiones pequeñas de espacio sumamen­
te curvo en un espacio tridimensional que fuese plano a gran escala.
Era evidente que una curvatura del espacio a gran escala sólo podría
ser detectada a las escalas más grandes, astronómicas, pues la expe­
riencia de generaciones nos había demostrado lo bien que funciona­
ba la geometría euclídea tridimensional plana en nuestras descripcio­
nes del mundo. Efectivamente, funcionaba bien para mediciones del
tipo ordinario e, incluso, en la descripción de cosas tales como la es­
tructura del sistema solar.
No obstante, solamente con la nueva teoría relativista de la gra­
vedad de Einstein, la teoría general de la relatividad, la geometría
curva pasó a formar parte esencial de una teoría física plausible. Ya
hemos visto que uno podía argüir con plausibilidad que la gravedad
afectaría dinámicamente a todos los objetos en la misma forma, con
independencia de su tamaño y constitución. Así, un objeto material
que, en ausencia de gravedad u otras fuerzas, seguiría una trayectoria
con dirección y velocidad uniformes, seguiría una trayectoria diferen­
te c*n presencia de la gravedad. Pero el cambio de trayectoria depen­
dería solamente del campo gravitacional y de la posición y velocidad
iniciales del objeto. No dependería de la masa del objeto o del mate­
rial del que había sido hecho. Esta independencia del efecto de la
gravedad respecto al tamaño y estructura del objeto es lo que hace
posible la «geometrización» del campo gravitacional.
Cuando se la combina con los argumentos a favor de un efecto
gravitacional sobre las características métricas del mundo, según son
determinadas por reglas y relojes, la idea de tratar la gravedad como
77

una curvatura deviene plausible. Pero no es un espacio curvo lo que,


al menos de una manera fundamental, Einstein postula, sino, en su
lugar, un espacio-tiempo curvo. En el espacio-tiempo de Minkowski
de la relatividad especial, las partículas libres describían líneas rectas
de tipo temporal, las geodésicas de tipo temporal del espacio-tiempo.
Ahora, sugiere Einstein, hemos de pensar en las partículas sobre las
que sólo actúa la gravedad como partículas «libres» que se desplazan,
no ya según líneas rectas de tipo temporal, sino según las geodésicas
curvas de tipo temporal de un espacio-tiempo que es curvo. Un re­
sultado fundamental de la geometría de Riemann es que por un p un ­
to en una dirección dada pasa una única trayectoria geodésica. En
los espacios riemannianos, las geodésicas son las trayectorias de cur­
vatura mínima y las de distancia más corta (localmente) al mismo
tiempo. Dada la nueva métrica del espacio-tiempo, es más convenien­
te tomar como fundamental la definición de «menor curvatura» de
las geodésicas. En el espacio-tiempo, si uno especifica una dirección
en un punto, especificará simultáneamente una dirección espacial y
una velocidad en cada dirección. Así, la geodésica de tipo temporal
que pasa por un punto en una dirección dada corresponderá a la es­
pecificación de la posición inicial y de la velocidad inicial de una
partícula. La trayectoria determinada por la geodésica será entonces
única. Y esto es justamente lo que queremos para la gravedad ya que,
dadas una posición y una velocidad iniciales, la trayectoria de cual­
quier partícula en un campo gravitacional es la misma. La luz, que en
la relatividad especial recorre las geodésicas nulas rectilíneas del es-
pacio-tiempo de Minkowski, recorre ahora las geodésicas nulas del
espacio-tiempo curvo, geodésicas que no serán, en general, líneas rec­
tas. (Véase la figura 2.7.)
Uno podría determinar la curvatura de un espacio-tiempo si­
guiendo las trayectorias de las partículas y de los rayos de luz «li­
bres», es decir, partículas y rayos de luz que actúan bajo la sola in­
fluencia de la gravitación, considerada ahora simplemente como la
curvatura del espacio-tiempo. Pero uno podría también, al menos en
principio, determinar la estructura de la curvatura realizando un n ú ­
mero suficiente de mediciones de las separaciones espacial y tempo­
ral de los sucesos y reuniendo estas mediciones en el intervalo de se­
paración, que es la métrica del espacio-tiempo. La relatividad general
postula que el espacio-tiempo así determinado coincidirá con el obte­
nido siguiendo los movimientos geodésicos de las partículas y de los
78 Filosofía de la física

(a) (b)
F ig u r a 2 .7 . Movimiento en un campo gravitacional a lo largo de las geodésicas curvas.
t
E n (a) el espacio-tiempo es visto como «plano». L a linea recta representa la trayecto­
ria que una partícula «libre» seguiría a través del espacio-tiempo y la línea recta la l
trayectoria de un rayo de luz «libre». Bajo la influencia de una fuerza como la grave­
dad, la partícula y el rayo de luz recorrerán trayectorias curvas tales como t'
y /'.
Pero éstas son vistas como desviaciones de las trayectorias más rectas en el espacio-
tiempo. E n (b) las trayectorias rectas han desaparecido. E n su lugar el espacio-tiempo
es visto como «curvo» en la presencia de gravedad, siendo t'
y /' las trayectorias de
partículas y rayos de luz «libres» (es decir, partículas y rayos de luz sobre los que no
actúa ninguna fuerza no gravitacional), ahora consideradas geodésicas, o trayectorias
más rectas posibles en el espacio-tiempo curvo.

rayos de luz, utilizando relojes y reglas para hacer que las mediciones
temporales y espaciales se vean también afectadas por el campo gra­
vitacional, en el sentido de que ellos miden adecuadamente estas
cualidades métricas en el espacio-tiempo curvo.
La teoría gravitacional tradicional presentaba dos partes: una es­
pecificaba la acción de la gravedad sobre objetos prueba; la otra es­
pecificaba la clase de campo gravitacional que sería generado por
una fuente de gravedad. En la vieja teoría, la gravedad era una fuerza
que aceleraba de igual manera a todos los objetos materiales situados
en el mismo lugar de un campo gravitacional. En la nueva teoría, la
gravedad es la estructura del espacio-tiempo curvo. Afecta a las partí­
culas y a los rayos de luz haciendo que ahora describan geodésicas
curvas nulas y de tipo temporal en el espacio-tiempo, y afecta a los
instrumentos de medida espacial y temporal idealizados.
Espacio, tiempo, m ovimiento 79

¿Qué sucede con el segundo aspecto de la teoría, el que especifi­


caba qué tipo de campo gravitacional sería generado por una fuente
de gravedad? En la vieja teoría, cualquier objeto masivo genera un
campo gravitacional. En la nueva teoría relativista, la gravedad está
asociada con la energía de masa del mundo material. Las ecuaciones
de campo de la relatividad general poseen en el miembro de la iz­
quierda una expresión matemática que caracteriza la curvatura del
espacio-tiempo. En el miembro de la derecha presentan una expre­
sión que caracteriza la forma en que la energía de masa se distribuye
en el espacio-tiempo, el denominado tensor de energía-momento.
Esta ecuación es la que relaciona la gravedad, ahora el espacio-tiem­
po curvo, con sus fuentes en ia energía de masa no gravitacional. (El
«no gravitacional» es importante porque el campo gravitacional pro­
piamente dicho, el espacio-tiempo curvo, también posee energía de
masa.) Sería un error pensar en la materia como «causante» del cam­
po gravitacional en un sentido simplista, porque para conocer el
miembro de la derecha de la ecuación, el cual describe cómo la ener­
gía de masa se distribuye en el espacio-tiempo, es preciso postular
una estructura de espacio-tiempo. La ecuación nos dice si un espa­
cio-tiempo dado es compatible con una distribución postulada de
energía de masa en ese espacio-tiempo. Solamente cuando la ecua­
ción es satisfecha, tanto por la estructura espacio-temporal postulada,
como por la distribución de energía de masa postulada en esa estruc­
tura, el m undo postulado es un mundo posible en la nueva teoría.
Es interesante que, dada la ecuación de campo, se siga la ley di­
námica de la gravedad — que las partículas materiales puntuales «li­
bres» recorren geodésicas de tipo temporal. A diferencia de la teoría
de Newton, la ley dinámica de la gravedad no necesita ser postulada
como una ley independiente, sino que puede ser derivada de la ecua­
ción de campo básica.
Si aceptamos esta nueva teoría del espacio-tiempo curvo de la
gravedad, confrontamos entonces la tarea de intentar, como habitan­
tes del mundo, determinar su estructura espacio-temporal actual. La
teoría nos dice que la geometría del espacio-tiempo debe estar corre­
lacionada con la distribución de materia y energía en ese espacio-
tiempo. Y la estructura espacio-temporal en cuestión se hace mani­
fiesta a través de las trayectorias geodésicas curvas de los rayos de luz
no obstaculizados y de las partículas «libres», así como por medio de
intervalos espaciales y temporales determinados por reglas de medir
Filosofía de la física

(o cimas en un m undo curvo) y relojes idealizados. Naturalmente,


si el espacio-tiempo muestra alguna curvatura, lo hará en las escalas
astronómicas, pues nosotros disponemos de una amplia experien­
cia empírica para asegurar que en las mediciones locales, a peque­
ña escala, la geometría plana minkowskiana funciona adecuada­
mente.
Algunos efectos de esta «gravedad», entendida ahora «como cur­
vatura espacio-temporal», se manifiestan en la escala del sistema
solar. Se considera que los planetas describen geodésicas en un espa­
cio-tiempo curvado por la presencia de un sol masivo. Esto introduce
leves modificaciones en el movimiento kepleriano de los planetas ex­
plicable por la teoría newtoniana. Sabemos que la curvatura espacio-
temporal, incluso del sistema solar, es pequeña. Las trayectorias de
los planetas en el espacio-tiempo se desvían ligeramente de las geo­
désicas rectilíneas (que no deben confundirse con las elipses espacia­
les, obviamente curvadas, que describen). Pero el efecto de la curva­
tura es superponer a las familiares trayectorias elípticas de los
planetas pequeños efectos adicionales, tales como un desplazamiento
(respecto a un sistema inercial fijo en el sol) del punto de mayor
aproximación del planeta al sol en su órbita, un desplazamiento que
puede ser detectado en el caso del planeta Mercurio.
Otros efectos métricos de la gravedad pueden también observarse
en una escala relativamente pequeña, en particular, el atraso de un re­
loj respecto a otro, si el primer reloj está situado por debajo del se­
gundo en un potencial gravitacional. Pero es en las grandes escalas
cosmológicas donde se encuentran las nuevas y más interesantes pre­
dicciones de la teoría y donde son posibles las más fascinantes mani­
festaciones de las consecuencias observacionales de la curvatura del
espacio-tiempo. Aquí uno trata con universos modélicos sumamente
idealizados, de los que pueden derivarse conclusiones teóricas. Lo
que se espera, por supuesto, es que al menos algunas de estas imá­
genes idealizadas del mundo a escala cosmológica se aproximen lo
bastante a la realidad para proporcionarnos una idea del mundo que
descubrimos en nuestras observaciones astronómicas del espacio pro­
fundo. Por ejemplo, se supone habitualmente que la materia del uni­
verso puede considerarse distribuida uniformemente y que la distri­
bución es la misma en todas las direcciones del espacio en el mundo
cosmológico. Esta suposición está siendo actualmente sometida a un
intenso escrutinio observacional.
Espacio, tiempo, movimiento 81

Una gran variedad de posibles universos espacio-temporales ha


sido explorada por los teóricos. En muchos de ellos, la estructura de
continuidad del universo difiere de la de los universos de la física re­
lativista especial o newtoniana. En algunos universos, por ejemplo,
pueden existir trayectorias de tipo temporal cerradas, colecciones de
sucesos tales que, cuando un observador los va siguiendo de suceso
en suceso, regresa en algún momento al suceso inicial. Otros espacio-
tiempos, aunque no tan patológicos causalmente, pueden hallarse
próximos a contener en su seno semejantes trayectorias curvas cerra­
das. Otros espacio-tiempos peculiares llevan incorporada una no-
orientabilidad. Se encuentran dados la vuelta, como la conócida ban­
da de Móbius, una superficie bidimensional girada inmersa en el
triespacio. (Véase la figura 2.8.)

2.8,
F ig u r a Un espacio no orientable.L a banda de Mdbius es el ejemplo más sencillo
de espacio no orientable, en este caso de dimensión dos. B y B' representan figuras
orientadas que no podrían ser transformadas la una en la otra si estuviesen dibujadas
sobre una superficie plana normal. Pero si tomamos B y la movemos alrededor de la
banda torcida de Móbius, podemos llevarla de vuelta en algún momento a Q de ma­
nera que coincida con B'. Esto pone de manifiesto la naturaleza no orientable de la
superficie. E n el espacio-tiempo, la no orientabilidad puede ser espacial, temporal o
espacio-temporal.

En un m undo espacio-temporal no-orientable semejante puede


resultar imposible hacer una distinción global entre objetos dextrógi-
ros y levógiros, pudiendo un objeto dextrógiro transformarse en uno
levógiro en el mismo lugar mediante un viaje por el espacio-tiempo.
O bien, puede que se carezca de orientabilidad temporal, lo cual ha­
ce imposible determinar globalmente cuál es la dirección temporal
del «pasado» y cuál la del «futuro» en un suceso puntual.
82 Filosofía de la física

En algunos espacio-tiempos, los observadores pueden dividir el


espacio-tiempo en espacios-en-un-tiempo. Esto significa que en
estos mundos, para un observador en un estado determinado de
movimiento, el espacio-tiempo puede ser seccionado en espacios
tridimensionales de sucesos a los que se puede asignar un tiempo
específico en un orden temporal de validez universal. Para otros
espacio-tiempos, una segmentación semejante del espacio-tiempo
en «secciones simultáneas» de tri-espacios-en-un-tiempo es imposi­
ble. Cuando dicha segmentación del espacio-tiempo en espacios-
en-un-tiempo es posible, los espacios pueden ser espacios curvos
tridimensionales del tipo estudiado por Riemann en su generaliza­
ción de la geometría gaussiana de las superficies curvas. Un univer­
so de esta índole, el modelo de Einstein, posee un tiempo que se
extiende indefinidamente en el pasado y en el futuro. Para un ob­
servador en cada tiempo el m undo espacial existe como una esfera
cerrada tridimensional de tamaño finito y constante. Los universos
de Robertson-Walker están formados por espacios-en-un-tiempo de
curvatura constante, pero la curvatura puede ser positiva, cero o
negativa. El parámetro de tamaño en estos espacios puede variar
con el tiempo, convirtiéndolos en modelos plausibles de universos
big bang que presentan, .como parece ser el caso de nuestro univer­
so según se desprende de los datos observacionales, un punto sin­
gular en el que toda la materia del m undo está comprimida en un
punto espacial.
Es más, la curvatura espacio-temporal ayuda a explicar los datos
posibles de la experiencia en otra área: la descripción de las singulari­
dades generadas por la materia colapsante de estrellas masivas. Éstos
son los famosos agujeros negros, regiones del espacio-tiempo tan cur­
vadas por la presencia de materia sumamente densa que la luz no
puede escapar desde la región de espacio-tiempo interior al espacio-
tiempo exterior en las inmediaciones del punto singular de colapso
de la estrella. Los modelos de dichas regiones del espacio-tiempo,
fuertemente curvadas localmente, correspondientes a estrellas colap-
sadas con una carga eléctrica y/o con rotación, así como la clase ori­
ginal estudiada, aportan casos de estudio fascinantes de los efectos
peculiares que puede tener la gravedad como curvatura espacio-tem­
poral. Aunque la evidencia procedente de la observación todavía no
es concluyente, parece que algunos de los generadores de radiación
fuertemente energética en el cosmos, por ejemplo, los cuásares y los
Espacio, tiempo, m ovimiento 83

núcleos de las denominadas galaxias activas, podrían muy bien ser


agujeros negros semejantes.

El espacio-tiempo curvo y la gravedad newtoniana


Cuando discutimos la transición del espacio y el tiempo al espacio-
tiempo al formularse los fundamentos de la teoría especial de la rela­
tividad, observamos que, una vez construido el espacio-tiempo de
Minkowski como el espacio-tiempo apropiado a la relatividad espe­
cial, los científicos se dieron cuenta de que se podía utilizar la noción
de espacio-tiempo para construir un espacio-tiempo que en algunos
aspectos se adaptase a la física de Newton mejor que su propio espa­
cio y tiempo absolutos. Este fue el espacio-tiempo galileano o neo-
newtoniano. A la luz de la descripción de la gravedad como espacio-
tiempo curvo, la teoría general de la relatividad, se hizo evidente que
también en la imagen prerrelativista uno podía redescribir la grave­
dad por medio de un espacio-tiempo curvo. En este marco prerrelati­
vista, la gravedad no tiene los efectos sobre las mediciones de espa­
cio y tiempo que tiene en la versión relativista, ni se tiene en modo
alguno en cuenta el efecto de la gravedad en la luz. En lugar de ello,
son los familiares efectos dinámicos de la gravedad los que se trans­
forman en la curvatura del espacio-tiempo.
En esta imagen, el tiempo es lo mismo que fue para Newton.
Hay un intervalo de tiempo definido y absoluto entre dos sucesos
cualesquiera. Sucesos que son todos simultáneos forman espacios-en-
un-tiempo. Estos son, como lo eran para Newton, espacios euclídeos
tridimensionales planos. Al igual que en el espacio-tiempo neo-new-
toniano, no existe una noción no-relativa de dos sucesos no-simultá­
neos en un mismo lugar, por lo que este espacio-tiempo carece de la
noción absoluta de igualdad de la posición en el tiempo y de veloci­
dad absoluta de Newton. Pero, así como en la concepción neo-new-
toniana había geodésicas de tipo temporal que correspondían a las
posibles trayectorias de partículas moviéndose libremente, así tam­
bién hay geodésicas de tipo temporal en esta nueva imagen espacio-
temporal. Sin embargo, mientras las geodésicas de tipo temporal de
la imagen neo-newtoniana eran trayectorias rectilíneas de partículas
moviéndose uniformemente (partículas sobre las que no actúan fuer­
zas y se mueven, por la ley de inercia, con velocidad constante), aho­
84 Filosofía-de la física

ra las geodésicas de tipo temporal son líneas curvas. Éstas resultan


ser las trayectorias de partículas «libres» en el nuevo sentido dimana­
do de la teoría de la gravedad de Einstein, esto es, partículas sobre
las que no actúa ninguna otra fuerza más que la gravedad.
Una vez más, la fuerza gravitacional es eliminada de la teoría en
favor de la gravedad como curvatura de las geodésicas de tipo tem­
poral, de manera que las partículas sienten el efecto de la gravedad,
no por verse desviadas de su movimiento geodésico por la fuerza del
objeto gravitatorio, sino, en su lugar, por seguir las trayectorias geo­
désicas «libres» en el espacio-tiempo, trayectorias ahora curvas debi­
do a la presencia del objeto gravitatorio que actúa como «fuente» de
curvatura del espacio-tiempo. Al igual que en la teoría de Einstein, es
únicamente el efecto uniforme de la gravedad sobre un objeto prue­
ba, el hecho de que todos los objetos afectados por la gravedad su­
fren el mismo cambio en su movimiento con independencia de su
masa o de su constitución, lo que permite esta «geometrización» de
la fuerza gravitacional. Este espacio-tiempo curvo de la gravedad
newtoniana no es, como el espacio-tiempo de Minkowski o el espa-
cio-tiempo curvo de la teoría general de la relatividad, un espacio-
tiempo riemanniano (o pseudo-riemanniano); pues, a diferencia de los
espacio-tiempos de la relatividad especial y general, carece de estruc­
tura métrica espacio-temporal. Hay un intervalo temporal definido
entre dos sucesos cualesquiera. En el caso de sucesos simultáneos,
hay una separación espacial definida entre dos sucesos cualesquiera.
En este sentido, este espacio-tiempo posee una métrica del tiempo y
una métrica del espacio. Pero, por contraste con el caso relativista,
no existe ningún intervalo espacio-temporal entre un par de sucesos.
La curvatura se revela solamente en la no rectilineidad de las geodé­
sicas de tipo temporal, y no en alguna característica métrica del espa-
cio-tiempo.

Resumen
El desarrollo de las elegantes teorías de Einstein, que intentan hacer
justicia a los sorprendentes hechos observacionales sobre el compor­
tamiento de la luz, las partículas libres y las reglas y los relojes de
medida, nos proporciona, pues, dos revoluciones en nuestras concep­
ciones del espacio y el tiempo. Primero, el espacio y el tiempo son
85

reemplazados por la noción unificada de espacio-tiempo, en relación


a la cual los aspectos espaciales y temporales del mundo pasan a ser
derivados. Segundo, la noción de curvatura es invocada con el fin de
hallar un lugar natural para los efectos de la gravedad en dicha ima­
gen espacio-temporal del mundo.
Sin duda, tales revoluciones en nuestra perspectiva científica so­
bre lo que son realmente el espacio y el tiempo deberían llevar a un
profundo replanteamiento de las cuestiones típicamente filosóficas
sobre el espacio y el tiempo. ¿Cómo deberíamos considerar el estatus
de nuestras pretensiones de conocimiento sobre la estructura del es­
pacio y el tiempo en este nuevo contexto en el que, por primera vez,
un número de propuestas posibles y diferenciadas sobre la estructura
del espacio y"el tiempo están al alcance de nuestra inspección cientí­
fica? Y ¿qué efecto deberían tener dichas estructuras noveles del es­
pacio y el tiempo en nuestras concepciones sobre la naturaleza meta­
física del espacio y el tiempo? En particular, ¿qué efecto deberían
tener estas revolucionarias concepciones científicas en el debate tra­
dicional entre sustantivistas y relacionistas? Es a estas cuestiones filo­
sóficas a las que vamos a prestar atención a continuación.

¿Cómo conocemos la verdadera geometría del mundo?

Concepciones cambiantes acerca de nuestro conocimiento de la geometría


Ya señalamos anteriormente la actitud cambiante de la com unidad
filosófica y científica ante la cuestión del fundamento ideal para
nuestro conocimiento del mundo que siguió a la revolución científi­
ca del siglo x v ii . Primero se pensó que una proposición podía cono­
cerse con un tipo de certeza que se seguía de la sola razón pura; des­
pués se impuso gradualmente la idea de que nuestro conocimiento
del mundo — las verdades generales y teóricas acerca de la naturale­
za de las cosas— podía sólo ser inferido a partir de verdades funda­
mentales sobre el mundo. Esta inferencia era fiable, pero falible. La
creencia en estas verdades fundamentales descansaba en los datos
suministrados por los sentidos a través de la observación y del expe­
rimento.
Pero la geometría siguió siendo una espina clavada en este enfo­
86 Filosofía de la física

que empirista de la teoría del conocimiento. Supongamos que la geo­


metría nos aporta verdades acerca de la naturaleza del m undo que
reconocemos como tales porque se siguen por cierta inferencia lógica
de verdades fundamentales cuya verdad es evidente en sí misma y
cognoscible para la razón pura. La geometría puede ser reconocida
entonces como verdadera con independencia de la observación y el
experimento. ¿No hay, pues, un campo de conocimiento acerca del
mundo por lo menos que no necesita de la garantía de los datos de
los sentidos, sino que podría afianzarse por el pensamiento puro sola­
mente? Y si la geometría fuese una disciplina de esta índole, ¿no se­
ría posible que en algún momento todo nuestro conocimiento físico
llegara a descansar en dicho fundamento epistémico superior?
El descubrimiento de las geometrías no-euclídeas contribuyó a
menoscabar las pretensiones de este tipo. Si la geometría euclídea no
era la única geometría posible, ¿cómo podía uno afirmar que las ver­
dades de la geometría podían ser conocidas con independencia del
experimento? ¿No se revelaba la estructura del espacio en la geome­
tría, así como cualquier otra estructura física que pudiera ser descrita
por una cualquiera de un número de teorías alternativas incompati­
bles? En tal caso, ¿no deberíamos apoyarnos en la observación, como
hacemos en otras ciencias, para averiguar cuál de las posibles teorías
describe verdaderamente la estructura del mundo?
Los defensores de la concepción según la cual la geometría euclí­
dea describía la naturaleza del mundo intentaron algunas veces cues­
tionar la propia consistencia lógica de las geometrías no-euclídeas.
Esa táctica pronto fracasó, pues no tardaron en crearse pruebas de
consistencia relativa para las geometrías axiomáticas no-euclídeas.
Estas pruebas demostraron que podíamos estar seguros por pura ló­
gica de que si las geometrías no-euclídeas eran inconsistentes, tam­
bién lo era la geometría euclídea. En consecuencia, las geometrías
no-euclídeas eran al menos tan respetables desde un punto de vista
lógico como la euclídea. Los kantianos pudieron continuar defen­
diendo por otras razones que la geometría euclídea era la verdadera
geometría del mundo, manteniendo, como lo hicieron, que la verdad
de la geometría euclídea tenía un tipo de necesidad que transcendía
la necesidad de las verdades cuya verdad se debía solamente a la ló­
gica. Veremos en un momento una réplica a ellos. En general, sin em­
bargo, quienes estaban familiarizados con la existencia de las nuevas
geometrías, estaban convencidos de que la geometría del mundo,
Espacio, tiempo, m ovim iento 87

como su química o su física, era algo sobre lo que sólo el experimen­


to nos podía informar.
Como hemos visto, solamente en el contexto relativista comenza­
ron las geometrías no-relativistas a jugar, de hecho, un papel impor­
tante en la física teórica. La ruta partió del espacio y tiempo newto-
nianos, y continuó a través del espacio-tiempo de la relatividad
especial hasta el espacio-tiempo curvo de la teoría general de la rela­
tividad. En cada fase de transición los hechos empíricos, los resulta­
dos de la observación y del experimento, jugaron un papel decisivo.
La postulación del espacio-tiempo de Minkowski, el espacio-tiempo
de la relatividad especial, descansaba sobre el sorprendente descubri­
miento de que, hasta donde llegaban los experimentos de ida y vuel­
ta, la velocidad de la luz parecía ser la misma en todos los estados
inerciales de movimiento y en todas las direcciones. Por otro lado, el
hecho de que la velocidad de la luz fuese la velocidad máxima de
propagación de las señales causales desempeñó también un papel im­
portante en la fundamentación de la teoría, y esto fue también un he­
cho de experiencia observacional. Además, estaban todos los hechos
predichos en relación a la teoría especial, como los relativos a los
tiempos de vida aparentes de las partículas inestables en movimiento
respecto al observador, al aumento aparente de masa inercial con el
aumento de la velocidad, y otros, que una y otra vez se tomaban
como confirmación experimental de la nueva imagen espacio-tem­
poral.
También en el paso a la relatividad general jugaron un papel cen­
tral los hechos revelados por la observación, primero al sugerir la
nueva teoría, y después al confirmarla. Los hechos observacionales,
conocidos por Galileo, sobre cómo la gravedad actuaba sobre los ob­
jetos con independencia de su tamaño y constitución, sugirieron ini­
cialmente a Einstein la idea de tratar la gravedad como una caracte­
rística geométrica del espacio-tiempo. Las predicciones sobre la
desviación de las trayectorias curvas de los rayos de luz cerca de ob­
jetos gravitacionales y las velocidades relativas de los relojes ideales
en lugares diferentes de un potencial gravitacional se toman como
confirmación de la teoría. Otra confirmación basada en hechos pro­
cede de los sutiles cambios predichos en las órbitas de los planetas
respecto a las trayectorias predichas por la teoría newtoniana. A la
larga se espera poder realizar observaciones a escala astronómica,
pongamos, de agujeros negros, o incluso a escala cosmológica, ponga­
KH Filosofía de la física

mos, di- los clirios observacionales de la estructura globalmente cur­


vada do la geometría del universo, para seguir probando las predic­
ciones de la leona y, si se encuentra que concuerdan con la predic­
ción, para confirmar su verdad.
¿No es evidente, pues, que los empiristas tienen razón? Uno pue­
do imaginar un sinnúmero de teorías sobre la naturaleza del mundo.
Pero sólo la observación y el experimento nos podrán decir cuál teo­
ría es la correcta. Esto es tan cierto para la geometría como lo es para
la física, la química, la biología o la psicología. Es la observación,
pues, la que ha de decidir cómo es realmente la geometría del m un­
do. Cualquier esperanza de conocer la geometría del m undo con cer­
teza e independientemente de la observación y el experimento es fa­
laz. Pero, ¿están las cosas tan predeterminadas?

El convencionalismo de Poincaré
Que no lo están fue lo que el gran matemático Henri Poincaré sugi­
rió en un brillante análisis del estatus del conocimiento geométrico.
Su estudio precedió a las revoluciones de la relatividad, pero iba a
arrojar mucha luz sobre el estatus de la geometría en estas nuevas
teorías. Poincaré comienza presentando en una serie de ensayos una
prueba de consistencia relativa para una geometría no-euclídea, refu­
tando cualquier afirmación de que dichas nuevas geometrías deban
ser desestimadas por ser lógicamente inconsistentes. Después consi­
dera la afirmación kantiana de que la geometría euclídea es la geome­
tría necesariamente correcta del mundo. De acuerdo a dicha vindica­
ción, la necesidad de la geometría se basa en el hecho de que el
espacio es un componente de nuestra percepción del mundo y la
geometría euclídea describe la estructura de lo percibido que es
aportado a la percepción por la mente perceptora. Poincaré arguye
que el espacio de la física, el espacio en el que se dan los aconteci­
mientos materiales, debe ser diferenciado de cualquier «espacio per-
ceptual», tal como el denominado campo visual de la percepción vi­
sual. Arguye, de hecho, que no sabemos de la existencia o naturaleza
del espacio físico por ningún conocimiento perceptual directo, sino,
antes bien, por inferencia de lo que percibimos directamente. Son,
afirma, el orden y la regularidad de las partes de nuestra experiencia
perceptual de los fenómenos, lo que nos lleva a presuponer que esta
89

experiencia tiene un origen causal en los acontecimientos físicos, los


cuales no son de por sí componentes inmediatos de la conciencia
perceptual. Inferimos la existencia del mundo físico, incluido el espa­
cio físico, y su naturaleza como una hipótesis explicatoria para dar
cuenta del orden y de la regularidad que experimentamos en nues­
tras percepciones directas. Dicha inferencia es, pues, inferencia a par­
tir de una hipótesis. Y ninguna de dichas hipótesis puede tener una
necesidad de ser generada a partir de unos supuestos «principios es­
tructurales de lo percibido directamente», porque la hipótesis versa
sobre lo físico y lo inferido, y de ninguna manera sobre el contenido
de la percepción directa. •
En este punto, uno espera que Poincaré proponga que la geome­
tría encuentra su soporte en la inferencia razonable a partir de los
datos de la observación y que uno podría, de hecho, descubrir que
las geometrías no-euclídeas se ajustaban mejor a los datos observacio­
nales que la euclídea. Pero, en lugar de ello, nos sorprende con un
argumento en el sentido de que la geometría euclídea no puede ser
refutada por ningún tipo de experiencia. Arguye, de hecho, que siem­
pre consideraremos a la geometría euclídea como la geometría del
mundo. Esta tiene, pues, un tipo de necesidad, pero la necesidad es
sólo cuestión de determinación convencional por nuestra parte, no
un reflejo de un hecho metafísico acerca del mundo.
El argumento de Poincaré descansa en una famosa parábola.
Imaginemos científicos bidimensionales confinados en un disco pla­
no euclídeo finito. Ellos intentan determinar la geometría de su mun­
do transportando reglas de medir de un lugar a otro. Pero los enga­
ñamos. Les damos instrumentos de medir que se expanden y
contraen con los cambios de temperatura — todos en la misma ra­
zón— y ajustamos la temperatura del disco de manera que las reglas
se contraigan a longitud cero en su periferia. Con un decaimiento
adecuado de la temperatura desde el centro al borde del disco, es fá­
cil inducirles a engaño haciéndoles pensar que están viviendo en una
superficie bidimensional infinita lobachevskiana negativamente cur­
vada. Si intentasen valerse de la luz para averiguar la geometría de su
mundo, pondríamos un medio con un índice de refracción variable
sobre la superficie, curvando las trayectorias de los rayos de luz de
tal forma que se verían de nuevo engañados. Así, son burlados al
pensar erróneamente que su geometría es no-euclídea, cuando no lo
es. (Véase la figura 2.9.)
90 Filosofía de la física

T =0

F i g u r a 2.9. La parábola de Poincaré.


Los habitantes bidimensionales están confinados
en el interior de un disco ordinario en el plano euclídeo. Éstos están equipados con
varas de medir cuya longitud varía con la temperatura en una forma lineal. La tempe­
ratura en el centro del disco es T R 2,
donde R
es el radio del disco y T es una cons­
tante. E n cualquier punto del disco la temperatura es T(R2 — r2) donde re s la distan­
cia del punto en cuestión al centro del disco. E n el borde del disco, pues, la
temperatura se hace cero y las varas de medir se contraen a longitud cero. E s fácil
mostrar que si los habitantes consideran que la longitud de sus varas de medir es
constante, llegarán a la conclusión de que viven en un plano lobachevskiano curvo
que tiene una curvatura negativa constante y se extiende al infinito.

Pensemos ahora en nosotros mismos en nuestro mundo tridi-


mensioríal. Con independencia de las mediciones que hagamos utili­
zando reglas y rayos de luz (o partículas libres o relojes, si es la geo­
metría del espacio-tiempo lo que estamos determinando), ¿no podría
suceder que cualquier apariencia de no-euclidicidad en la geometría
se debiera a campos de dilatación y contracción y a campos que des­
vían los rayos de luz y las partículas de sus trayectorias geodésicas, en
lugar de a una desviación genuina del espacio de su euclidicidad?
Espacio, tiempo, m ovimiento 91

Ahora bien, en el caso de las criaturas bidimensionales, supone­


mos que nosotros tenemos la última palabra sobre lo que realmente
está ocurriendo. Pero en caso de pretender determinar la geometría
de nuestro mundo, ¿qué es lo que debe marcar la diferencia entre
una geometría real no-euclídea y un m undo euclídeo con campos
distorsionantes que afectan incluso a los aparatos de medida idealiza­
dos? La sugerencia de Poincaré es que no hay nada en los hechos
implicados que determine cuál de las hipótesis es la «correcta». Nos
corresponde a nosotros decidir
qué descripción dar al mundo. La
«verdadera» geometría del mundo es una cuestión de decisión o con­
vención por nuestra parte. Como veremos, dicha afirmación admite
interpretaciones muy diferentes.. Poincaré pasa a sugerir que, dado
que la geometría euclídea es más simple que la no-euclídea, siempre
elegiremos la primera como la «verdadera» geometría del mundo,
restaurando la euclidicidad como característica necesaria del mundo,
si bien una que es sólo «convencionalmente necesaria». Por supues­
to, mucha gente ha advertido desde entonces que podría resultar
más sencillo describir el mundo en términos no-euclídeos, si con ello
se lograse simplificar el resto de la teoría, y que ésta es la elección he­
cha (si es que es una elección) en, pongamos, la relatividad general
con su espacio-tiempo curvo.
Pero el argumento principal de Poincaré es claro. La evidencia
que podemos acumular mediante la observación y el experimento re­
quiere una explicación teórica. Pero las hipótesis que ofrecemos para
explicar los hechos observacionales tienen una estructura que encie­
rra un número de elementos. Podemos suscribir una propuesta acer­
ca de la constitución de una parte de esta estructura a la vista de
datos cualesquiera, siempre que estemos dispuestos a postular un
número suficiente de cambios en otra parte de la estructura. Con in­
dependencia de lo que nuestros experimentos muestren, podemos
elegir la geometría euclídea, por ejemplo, siempre que estemos dis­
puestos a postular lo necesario para que un campo físico dilate y
contraiga las reglas, desvíe las ondas luminosas, etcétera. Por consi­
guiente, afirma Poincaré, es una cuestión, no de hecho, sino de con­
vención el que una geometría, y no otra, describa el espacio (o espa­
cio-tiempo) del mundo.
92 Filosofía de la física

Respuestas a Poincaré
Ha habido una variedad muy amplia de respuestas a la vindicación
de Poincaré, una vindicación que cuestionaría no solamente la idea
de que podemos determinar la geometría del m undo por inferencia a
partir de la observación y el experimento, sino también la posibilidad
general de llegar a conclusiones definitivas sobre la estructura del
mundo apartadas de la observación directa. Una clase de respuestas
niega la premisa fundamental del argumento de Poincaré, esto es,
que uno puede aislar un conjunto de supuestos hechos sobre el
mundo como hechos de observación pura y situar luego estos hechos
en algún dominio de «percepciones en la mente», siendo todas las
aserciones físicas cognoscibles, si esto es posible, sólo sobre la base
de algún tipo de inferencia. Algunos negarían que un tal dominio de
lo percibido directamente sea inteligible, arguyendo que el conjunto
de nuestras percepciones no lo son de algunos «datos sensoriales en
la mente», sino del mundo físico. Negarían la existencia de cosas ta­
les como objetos cognoscibles para la percepción con independencia
de una teoría postulada sobre el mundo. ¿Podemos creer seriamente
que el espacio en el que vemos mesas y sillas no es el espacio físico,
sino un «espacio visual» que no pertenece en modo alguno al dom i­
nio de la ciencia física?
Más importante aún, esas personas negarían normalmente la afir­
mación de que hay hechos sobre el m undo inmunes en principio a
ser comprobados por «observación directa» o por «experimentación
directa». Para la tesis de Poincaré es crucial que hechos tales como
que el espacio del mundo sea realmente plano o curvo puedan sólo
conocerse por medio de una inferencia. No pueden ser determinados
por ningún tipo de inspección directa. Esta inmunidad de los hechos
geométricos a la observabilidad hace posible las teorías alternativas,
las cuales «salvan los fenómenos observables». Y esta inmunidad se
encuentra en la raíz del argumento de Poincaré de que nunca podre­
mos afirmar legítimamente que conocemos la geometría del mundo
(excepto, claro está, estipulándolo convencionalmente).
Pero muchos han mostrado su escepticismo a que un tal reino
del ser inmune por siempre a la inspección directa pueda ser postula­
do. Si ya negamos una vez un reino de lo directamente inspecciona­
do «en la mente», considerando que cosas tales como mesas y árbo­
les son visibles para nosotros, ¿no nos convence un resbaladizo
93

argumento de que en principio todas las cosas pueden ser «observa­


das»? ¿No podemos ver bacterias utilizando microscopios, virus utili­
zando microscopios electrónicos y núcleos utilizando aceleradores de
partículas? ¿Cómo puede entonces Poincaré estar seguro de que
nunca podremos simplemente observar que nuestro espacio es plano
o curvo?
No obstante, la presuposición de Poincaré de que no podemos,
de que la estructura geométrica forma parte de un reino del ser per­
manentemente inmune a la observación directa, parece tener poder
persuasivo. ¿Qué sería observar, no rayos de luz o partículas, reglas o
relojes, sino «la estructura del espacio mismo»? Obviamente esto en­
traña una gran cantidad de enigmas. Por ejemplo, ¿no «observamos
directamente» intervalos temporales entre nuestras experiencias?
¿Deben ser descartados como nada más que «intervalos temporales
mentales» que han de distinguirse del tiempo físico, real, en el mun­
do material?
Una línea de argumentación a favor de Poincaré es que la mayo­
ría de la física contemporánea que se ocupa del espacio y del tiempo
parece descansar en el mismo tipo de aserción de inmunidad de al­
gunos hechos acerca del mundo a la observación directa que Poinca­
ré está presuponiendo. Los argumentos de Einstein en la teoría espe­
cial de la relatividad en su crítica, por ejemplo, a la noción de
simultaneidad de sucesos distantes, presuponen que dicha simulta­
neidad debe ser determinada por medio de la luz, por señales causa­
les de algún tipo, o transportando relojes. N o puede tomarse como
algo abierto a la inspección directa. De nuevo, los argumentos para la
«geometrización» de la gravedad en los fundamentos de la relativi­
dad general descansan en la suposición de que el campo gravitacio-
nal puede ser conocido sólo por sus efectos. Lo que observamos es el
comportamiento de los rayos de luz y de las partículas, de las reglas y
de los relojes, y no el campo gravitacional propiamente dicho. En
particular, parece haber dos suposiciones infiltradas en los funda­
mentos de las teorías relativistas: 1) Lo que observamos es el compor­
tamiento de las cosas materiales — rayos de luz, partículas, relojes y
varas de medir— , no la estructura del espacio-tiempo mismo; 2) Sólo
podemos determinar observacionalmente el comportamiento de las
cosas materiales en un momento dado, es decir, cosas tales como que
los extremos de dos reglas rígidas coinciden uno con otro. No pode­
mos considerar como un hecho observacional el que dos reglas rígi­
94 Filosofía de la física

das separadas una cierta distancia entre sí tengan, o no, la misma lon­
gitud, así como no podemos considerar la simultaneidad a distancia
como una característica observable del mundo en el sentido de ob-
servabilidad directa.
Podría suceder que semejantes suposiciones sobre tipos de carac­
terísticas del mundo inmunes por siempre a la determinación obser-
vacional directa estén equivocadas. Pero se presuponen en el análisis
que fundamenta nuestra aceptación de las teorías del espacio-tiempo
contemporáneas. Supongamos, pues, por el momento, que Poincaré
está en lo cierto respecto a que estas estructuras inobservables for­
man parte de nuestras teorías.
Poincaré está afirmando que nuestras estructuras postuladas
deben trascender los hechos observables. Este hecho es el que in­
troduce en las teorías la «dualidad» que permite a numerosas ver­
siones alternativas tener las mismas consecuencias observacionales.
¿Cómo sobrepasan las teorías de Einstein lo observable? E n la teo­
ría especial, mientras la coincidencia de sucesos es observable, la
simultaneidad de sucesos distantes se obtiene postulando la unifor­
midad de la velocidad de la luz en todos los sistemas inerciales y
en todas las direcciones, un «hecho» que no puede comprobarse
observacionalmente. De nuevo, para obtener la estructura espacio-
temporal completa de la relatividad especial hay que añadir el pos­
tulado de linealidad, lo cual equivale a postular que el espacio-
tiempo es plano. Una vez más, éste es un postulado teórico que
sobrepasa la comprobación directa. Sólo formulando estos postula­
dos obtenemos la teoría estándar y no, por ejemplo, la vieja teoría
de un éter absoluto con reglas y relojes compensatorios «reales»,
que se contraen y atrasan respectivamente cuando están en movi­
miento. En la teoría general se postula que los rayos de luz curva­
dos y las partículas «libres» describen, bajo los efectos de la grave­
dad, las geodésicas nulas y las de tipo temporal del espacio-tiempo
respectivamente. Y las reglas y relojes locales son tomados como
indicadores correctos de los intervalos métricos de espacio y tiem­
po donde se encuentran ubicados. Sólo haciendo estas suposicio­
nes conseguimos que las observaciones de los efectos de la grave­
dad nos digan que el espacio-tiempo tiene curvatura. Con otros
postulados podríamos preservar la estructura espacio-temporal pla­
na de la relatividad general, considerando que la gravedad es,
como en la teoría de Newton, un campo de fuerzas superpuesto
Espacio, tiem po, m o vim ie nto 95

que tiene efectos métricos, así como efectos dinámicos, sobre las
partículas en movimiento y sobre la luz.
El modelo de Poincaré parece, pues, describir muy bien el con­
texto en el que las teorías relativistas se construyeron. Se obtienen
nuevos hechos observacionales. Éstos están restringidos a los hechos
locales y materiales sobre nuestros instrumentos de medida. Para jus­
tificar y explicar estos hechos se postula una estructura espacio-tem-
poral. Sin embargo, las estructuras postuladas sobrepasan con su ri­
queza a la totalidad de posibles hechos observacionales que las
soportan. Y, al igual que en la parábola de Poincaré de las criaturas
bidimensionales sobre el disco, también ahora una variedad de posi­
bles estructuras espacio-temporales hará justicia a lo que considera­
mos como la totalidad de hechos observacionales que podríamos en­
contrar. Esto será así, al menos, si estamos preparados para hacer los
cambios necesarios en otras partes de nuestra teoría física.

Opciones realistas
Si nos tomamos entonces seriamente el problema de Poincaré y nos
negamos a descartarlo por descansar en nociones ilegítimas sobre lo
que es, y lo que no es, observable o en nociones ilegítimas acerca de
que el reino de lo teórico sobrepasa, en principio, al reino de lo ob­
servable, ¿cómo deberíamos continuar? Una clase de respuestas
acepta abiertamente el postulado de la estructura espacio-temporal
teórica, suponiendo que las teorías del espacio y el tiempo proponen
verdaderamente estructuras reales, pero inobservables, del mundo.
¿Estamos, pues, como Poincaré afirmó, circunscritos a la convencio-
nalidad para elegir la teoría correcta?
Una respuesta sería adoptar simplemente una actitud de escepti­
cismo. Asumir que una de las múltiples teorías posibles del espacio-
tiempo compatibles con los datos observacionales es la correcta. Ar­
güir que únicamente los hechos observacionales pueden conducirnos
legítimamente a elegir una teoría como preferible frente a las demás.
Argüir, entonces, que debemos simplemente negarnos, si somos razo­
nables, a emitir un juicio sobre cuál de las teorías espacio-temporales
alternativas describe realmente el mundo. ¿No deberíamos, pues, ha­
cer frente a estas limitaciones honestamente y rechazar un supuesto
conocimiento de lo que sencillamente no podemos conocer?
Filosofía de la física

Para eludir esta exhortación al abandono, muchos han sugerido


que deberíamos buscar apoyo en esas características de las teorías
que usamos y, en su opinión, deberíamos usar, a fin de seleccionar la
teoría mejor y más convincente de un conjunto de alternativas entre
las que no puede hacerse una elección sobre la base de una diferen­
cia de compatibilidad con los datos observables. Se arguye que en la
elección de una teoría aplicamos muchas consideraciones que sobre­
pasan la mera comparación de las consecuencias observacionales de
la teoría con los hechos observados. Éstas son consideraciones que
pueden ayudarnos a decidir legítimamente cuál es la teoría más con­
vincente. A menudo se arguye que unas teorías tienen una mayor
plausibilidad intrínseca que otras. En otros casos, la relación que una
teoría presenta con la ciencia de fondo sobre la que se proyecta se
supone que puede servir para discernir entre teorías más fiables y
aquellas en las que no merece la pena confiar.
Como ejemplo del segundo tipo de enfoque podríamos conside­
rar la alegación de que el conservadurismo metodológico puede ju­
gar un papel guía para dar preferencia a una teoría sobre otras indis­
tinguibles observacionalmente de ella. A quí se sostiene que existe
una regla del método científico en el sentido de que al elegir una
nueva teoría seleccionamos, y deberíamos seleccionar, la que se des­
vía menos de las viejas teorías que venían siendo aceptadas, pero que
ahora rechazamos debido a su incompatibilidad con la evidencia.
¿Cómo se aplicaría esta regla en el caso, por ejemplo, de la relati­
vidad general? A quí estamos buscando una nueva teoría de la grave­
dad. La teoría de Newton es incompatible con la relatividad y debe
ser rechazada, pero la teoría que pongamos en su lugar debe ser una
que sea compatible con los nuevos datos observacionales y que se
acerque lo más posible en sus afirmaciones a lo que la vieja teoría
afirmaba. ¿Podría dicha regla metodológica llevarnos a elegir la teoría
de Einstein frente a las teorías alternativas de «dilatación y contrac­
ción más campos de fuerza»? Es sin duda cierto que en la vieja teoría
utilizábamos reglas y relojes para indicar correctamente los intervalos
espaciales y temporales. Esto sigue siendo cierto en la relatividad ge­
neral, pero no en su alternativa espacio-temporal plana. Así, ¿no nos
lleva el conservadurismo metodológico a seleccionar la relatividad
general como la alternativa preferida?
Sin embargo, el espacio-tiempo era plano en la vieja teoría. Esto
sigue siendo así en la alternativa del campo, pero en la relatividad ge­
Espacio, tiempo, movimiento 97

neral se hace la propuesta radical de un espacio-tiempo curvo. Desde


este punto de vista parece que la alternativa de «espacio-tiempo pla­
no más un campo gravitacional» es la elección más conservadora y,
por consiguiente, la que ha de preferirse. El problema es, claro está,
que el precepto de ser conservador respecto a la vieja teoría es ambi­
guo. Hay muchos aspectos de la vieja y las nuevas teorías. El ser con­
servador respecto a algunos de estos aspectos podría conducirnos a
elegir una de las alternativas, y el ser conservador respecto a otros as­
pectos podría llevarnos a una elección muy diferente.
Pero es peor que eso. Aun cuando el conservadurismo nos lleva­
se a una elección en lugar de a otra, ¿no podría suceder que la vieja
teoría mismamente pudiera ser reemplazada retrospectivamente por
una alternativa a ella? Tomemos la teoría gravitacional de Newton,
por ejemplo. Supongamos que consideramos que la alternativa de
«espacio-tiempo plano más fuerzas» es la teoría relativista más con­
servadora respecto a la de Newton y, por tanto, la que ha de preferir­
se. Pero, según hemos observado, es posible sustituir la teoría de
Newton por una teoría de la gravedad como espacio-tiempo curvo
que tendría las mismas predicciones observacionales que la teoría de
Newton. ¿No sería entonces la teoría del espacio-tiempo curvo, la re­
latividad general, el cambio más conservador de esa versión revisada
de la física de Newton? ¿No es entonces la regla del conservaduris­
mo sobre cómo se desarrollan realmente las teorías completamente
arbitraria? ¿No nos dice simplemente que proyectemos viejas deci­
siones arbitrarias, accidentes de la historia, en el futuro? ¿Cómo pue­
de ser eso una guía a la verdad?
Como ejemplo de la otra sugerencia, que nos apoyemos en carac­
terísticas intrínsecas de las teorías para hacer una elección entre las
alternativas, podríamos considerar la noción de simplicidad teórica.
Algo que se afirma habitualmente es que los científicos, dadas dos al­
ternativas teóricas entre las que los datos observacionales no son de­
cisivos, elegirán la más simple de las dos, revelando su intuición de
que la hipótesis más simple es más probable que sea la hipótesis más
verdadera.
La noción de simplicidad está, no obstante, plagada de enigmas.
En algunas versiones depende de la manera en que se formula la teo­
ría. En un lenguaje o representación, una teoría podría parecer más
simple que otra, pero el orden de simplicidad podría verse trastroca­
do si las teorías se expresasen de otra manera. Otras nociones de
Filosofía de la física

simplicidad, que dependen de las características estructurales de la


teoría, la forma lógica de sus premisas básicas, podrían evitar en par­
te esta aparente relatividad de la simplicidad respecto a la forma de
expresión. Hay, de hecho, significados intuitivos de simplicidad en
función de los cuales la teoría de la relatividad especial es más sim­
ple que las teorías alternativas del éter o las teorías alternativas que
no suponen plano el espacio-tiempo. Intuiciones similares sobre la
simplicidad hacen que la relatividad general parezca más simple que
las teorías de «espacio-tiempo plano más campos impuestos» alterna­
tivas a ella. En ambos casos, la idea es que la teoría einsteiniana no
posee la estructura problemática e innecesaria que contamina a sus
alternativas.
Para ver esto, comparemos primero el espacio-tiempo relativista
de la teoría especial de Einstein con una de las teorías del éter. Eins­
tein considera que la velocidad de la luz es la misma en todas las di­
recciones en cualquier sistema de referencia inercial. Las teorías del
éter lo niegan. Estas defienden que la luz tendrá una velocidad uni­
forme en todas las direcciones solamente en el sistema que esté en
reposo en el éter. En los otros sistemas de referencia, la luz parece te­
ner la misma velocidad en cada dirección sólo debido al efecto del
movimiento del laboratorio con respecto al éter sobre instrumentos
de medida tales como reglas y relojes. Así, mientras Einstein atribuye
los resultados nulos de los experimentos de ida y vuelta a la unifor­
midad de la velocidad de la luz en todas las direcciones a lo largo de
las trayectorias, la teoría del éter los explica introduciendo, primero,
un cambio de la velocidad de la luz en direcciones diferentes y, lue­
go, un cambio compensatorio en los instrumentos del laboratorio, de­
pendiendo cada variación de la velocidad del laboratorio a través del
éter. Los efectos de estos cambios se cancelan exactamente. Sin duda,
la explicación según la teoría del éter de los resultados observados es
innecesariamente complicada. Para obtener los resultados observa­
cionales necesitamos especificar un parámetro de la teoría, esto es, la
velocidad del laboratorio con respecto al éter. Sin embargo, sea cual
sea el valor que especifiquemos para esta cantidad, obtenemos exac­
tamente las mismas predicciones experimentales, porque los efectos
de la velocidad se cancelan mutuamente. Por esta razón, ningún ex­
perimento que podamos realizar podrá determinar la velocidad del
laboratorio con respecto al éter. Sin duda, la teoría de Einstein, la
cual niega simplemente la existencia de semejante sistema del éter o
Espacio, tiempo, m ovimiento 99

de semejante velocidad indetectable, es más simple como hipótesis


explicativa y, por tanto, debe ser preferida.
Una situación similar se da en el caso de la relatividad general.
Einstein explica las trayectorias curvas de la luz y de las partículas
afirmando que éstas siguen las geodésicas de un espacio-tiempo cur­
vo. La postulación de un «espacio-tiempo plano más fuerzas» alterna­
tivo interpretaría esta curvatura como el resultado de fuerzas que
desvían a las partículas de las verdaderas geodésicas rectilíneas del
espacio-tiempo plano real. Un examen detenido de las teorías mues­
tra que a cada mundo descrito por la teoría del espacio-tiempo curvo
corresponden un número infinito de mundos con «espacio-tiempos
planos más campos», así como un número infinito de mundos con
«sistemas de éter más compensación» corresponden a un único mun­
do con un «espacio-tiempo minkowskiano relativista especial». Y así
como cada mundo con un sistema de éter es indistinguible de los
otros por observación, así cada uno de los nuevos mundos «espacio-
tiempo planos más campos» es indistinguible de todos los otros mun­
dos semejantes. Esto es una generalización de algo que J. Maxwell y
otros ya observaron en relación a la teoría prerrelativista de la gravi­
tación. Supongamos que existiese en el universo un campo gravita-
cional que fuese constante en todo lugar (es decir, la fuerza gravita-
cional tendría en cada punto la misma intensidad y apuntaría en la
misma dirección). Todo el universo material estaría, entonces, cayen­
do con aceleración constante en este mundo. Aunque todo objeto
estaría siendo acelerado, esta aceleración no podría, al contrario que
la aceleración normal, ser detectada. Esto es debido a que todos los
aparatos de medida sufrirían la misma aceleración que el m undo mis­
mo. La existencia de un campo gravitacional constante, pues, en caso
de existir, es un hecho indetectable sobre el mundo.
Pero en la relatividad general no hay ningún campo gravitacional,
y todos los mundos observacionalmente indistinguibles de la teoría
anterior pasan a ser asimilados a un único mundo con un espacio-
tiempo curvo. Esto se corresponde exactamente con la forma en que
la relatividad especial reemplaza a un número infinito de posibles sis­
temas de éter por un único espacio-tiempo minkowskiano. Entonces,
en un sentido importante, las teorías estándar, einsteinianas, son más
simples que sus alternativas observacionalmente indistinguibles. Al­
gunas teorías de confirmación teórica han utilizado hechos como éste
para generar nuevas nociones de datos que confirmen una teoría. Las
100 Filosofía de la física

viejas nociones de confirmación denden a confirmar de igual manera


tíos teorías cualesquiera que sean observacionalmente indistinguibles,
a no ser que se les haya dotado previamente de alguna plausibilidad
intrínseca que las distinga. Las nuevas nociones de confirmación ha­
cen posible que teorías como la relatividad especial o general sean
confirmadas por los datos, pero dan una confirmación cero a teorías
como las teorías del éter o las teorías del espacio-tiempo gravitacio­
nal plano que contienen parámetros no determinables mediante la
observación.
Pero, por supuesto, hay quienes se oponen a esta solución al
enigma de Poincaré. ¿Porqué deberíamos creer que la teoría más
simple, aun cuando la noción de simplicidad pueda resultar coheren­
te, es la que deberíamos aceptar como verdadera para el mundo?
¿Qué nos asegura que la simplicidad, no importa cómo se interprete,
debe ser tomada como una señal de la verdad de una teoría? Por su­
puesto, podríamos preferir la teoría más simple por su atractivo esté­
tico, pero ¿porqué debería tomarse la complejidad como una señal
de falsedad, equiparable a la incapacidad de la teoría para ajustarse a
los datos observacionales? ¿Deberían tales consideraciones como la
simplicidad de una teoría contribuir a su credibilidad para alguien
que adopta la postura realista de que hay un m undo independiente
de nuestras teorías sobre él y de que las teorías describen o no genui-
namente este mundo?

Opciones reduccionistas
Opuestos a todos estos enfoques del problema de Poincaré se en­
cuentran los enfoques que intentan socavar el desafío escéptico ne­
gando que realmente haya teorías alternativas entre las que debamos
elegir. Si consideramos que la propia identidad de una teoría debe
ser determinada por sus consecuencias observacionales, entonces ¿no
llegamos a la conclusión de que todas las supuestas teorías alternati­
vas son realmente una y la misma teoría y que parecen diferir entre sí
solamente porque han elegido expresar las mismas vindicaciones so­
bre el mundo en un lenguajediferente?
La idea subyacente es clara. Seguramente, se dice, podemos en­
tender casos en los que dos expresiones de la teoría entran aparente­
mente en conflicto entre sí, de forma que parece que las dos no pue­
Espacio, tiempo, movim iento 101

den ser correctas, pero donde el conflicto es sólo aparente: es el re­


sultado de utilizar los mismos términos con significados diferentes en
las dos expresiones de la teoría. Si, por ejemplo, alguien propusiera
una teoría de la electricidad que fuese exactamente igual a nuestra
teoría ordinaria, pero donde se intercambiasen las palabras «positiva»
y «negativa» concernientes a las cargas, nos daríamos inmediatamente
cuenta de que no se había propuesto ninguna teoría nueva. En lugar
de ello, se había repetido la misma vieja teoría con los significados de
dos palabras clave intercambiados. Supongamos, entonces, que pos­
tulamos que todo el contenido real de una teoría está implícito en
sus consecuencias observacionales y que dos teorías cualesquiera con
las mismas consecuencias observacionales equivalen a una sola teo­
ría. Las diferencias aparentes entre las dos expresiones de la teoría se
deberían realmente a meras diferencias en los significados de algunos
de los términos involucrados.
Se ha propuesto una enorme variedad de explicaciones «positi­
vistas» semejantes de la teoría y del significado teórico. Algunas veces
se ha sugerido que los términos de una teoría, para tener un significa­
do auténtico, deben recibir una definición individual acuñada entera­
mente en el vocabulario que hace referencia a los observables. Si te­
nemos dos teorías aparentemente incompatibles con las mismas
consecuencias observacionales, podríamos determinar qué términos
en las dos formulaciones de la teoría difieren en el significado. Por
ejemplo, podría argüirse que el hecho de que los rayos de luz reco­
rran geodésicas nulas en la relatividad general equivale a definir la
«geodésica nula» en esta teoría como la trayectoria de un rayo de luz.
En la teoría del «espacio-tiempo plano más fuerzas» los rayos de luz
no recorren geodésicas nulas. Así pues, se arguye, «las geodésicas n u­
las» deben significar algo diferente en esta nueva formulación de la
teoría. Algunas otras versiones del caso requieren que cualquier pro­
posición de la teoría pueda ser traducida a una expresada solamente
en términos observacionales. Hay todavía otros que encuentran estas
demandas de estricta definibilidad de los términos o de traducibili-
dad frase por frase demasiado severas. Para estos teóricos es la teoría
como un todo lo que tiene significado y este significado se agota en
la totalidad de sus consecuencias observacionales. Así, en el caso de
las teorías gravitacionales con espacio-tiempos curvo versus plano, ar­
güirían que carece de sentido preguntar por los términos que han
cambiado de significado de una teoría a otra. Alternativamente, argu­
102 Filosofía de la física

yen, podrías decir que todos lo han hecho, salvo aquellos que se re­
fieren a los fenómenos observables. Lo que uno puede decir, empero,
es que, como las dos teorías tienen las mismas consecuencias obser­
vacionales, consideradas como un todo «dicen la misma cosa».
Los enfoques reduccionistas de este tipo menoscaban claramente
el problema escéptico de la teoría sobrepasando los datos. Desde
este punto de vista, el rebasamiento de lo observable es sólo ilusorio.
Algunas veces se dice que el dar a una teoría preferencia frente a
otra que es observacionalmente equivalente a ella es, en realidad, ele­
gir solamente una manera de expresar una teoría. Algunas veces se
alega que es como elegir un sistema de coordenadas para describir la
localización de los sucesos, en lugar de otro. Al realista, para quien
las teorías pueden diferir en simplicidad y, por lo tanto, en lo que di­
cen y, quizá, en su grado de credibilidad intrínseca, esta gente le res­
pondería que una tal diferencia en simplicidad es solamente una di­
ferencia en la simplicidad de la forma de expresión. N o es una
diferencia real de simplicidad como, por ejemplo, la que se da entre
una función lineal y una cuadrática relacionando lo observable a lo
observable. El elegir una de las alternativas observacionalmente equi­
valentes sobre las demás es entonces una mera elección de cómo ex­
presar las propias creencias teóricas. Según esta concepción, las
creencias teóricas no son en realidad más que compendios lingüísti­
camente pertinentes de la totalidad de sus consecuencias observacio­
nales. Aunque no está del todo claro lo que Poincaré pretendía decir
al afirmar que la elección de la geometría es convencional, quizá fue­
ra esto lo que tenía en mente.
La objeción más seria a este enfoque de las teorías es adonde nos
conduce cuando se lleva a su — casi inevitable— extremo. Cuando
dos teorías que aparentemente dicen cosas bastante incompatibles
acerca de la estructura de lo inobservable se considera que son, de
hecho, completamente equivalentes entre sí, es evidente que uno no
debería tomar lo que dicen sobre los inobservables de un modo cla­
ramente referencial. Si una teoría que afirma que el espacio-tiempo
es curvo se considera que es completamente equivalente a una que
afirma que el espacio-tiempo es plano, entonces claramente ambas
teorías están utilizando solamente la referencia al espacio-tiempo
como medio instrumental para generar su contenido real, el orden le­
gal entre los observables que predicen. Uno no debería entonces
tomar dicha conversación sobre el espacio-tiempo como referida real­
Espacio, tiempo, m ovim iento 103

mente a un objeto al que se atribuye alguna característica. Para ver


esto, uno sólo tiene que considerar el hecho de que si dos expresio­
nes cualesquiera de teorías con un mismo contenido observacional
son enteramente equivalentes, entonces el simple compendio de las
consecuencias observacionales comunes a las dos teorías es equiva­
lente a las dos. Y esta tercera «teoría» no se refiere en absoluto a las
entidades y estructuras teóricas (como el espacio-tiempo y su curva­
tura). El hecho de que dicho compendio de consecuencias observa­
cionales pudiera ser una colección infinita de afirmaciones no parece
ser, desde esta perspectiva positivista radical, relevante para la de­
manda irrealista.
Pero, entonces, el considerar suficiente la equivalencia observa­
cional para la equivalencia total parece entrañar un irrealismo radical
sobre lo inobservable. Toda referencia, excepto a lo que es directa­
mente accesible a la inspección observacional, es pseudorreferencia,
y toda descripción de la estructura de lo inobservable se convierte en
una mera forma de hablar y no en una descripción cabal de una su­
puesta parte real del universo. Si dicha referencia al espacio-tiempo y
a su estructura es completamente ficticia, ¿es igualmente ficticia la re­
ferencia a los electrones? Y, si seguimos la familiar vía filosófica de
considerar como directamente observable sólo lo que consiste en
datos sensoriales de la percepción directa y no de características físi­
cas de las cosas físicas, ¿no nos vemos conducidos a la concepción de
que todo el m undo físico es una ficción? Sin duda, un irrealismo tan
radical sobre lo físico es un precio demasiado alto para evitar el desa­
fío escéptico a nuestro conocimiento de la estructura geométrica ac­
tual del mundo.

Otras respuestas realistas


Muchos realistas, en respuesta a estas consecuencias del enfoque po­
sitivista que acabo de esbozar, han argüido que el error fundamental
del positivismo es su idea de que la equivalencia observacional de las
teorías es suficiente para su equivalencia total. A estos realistas les
gustaría admitir que, en ocasiones, teorías aparentemente incompati­
bles «dicen la misma cosa» en realidad. Pero negarán que el tener
consecuencias observacionales comunes sea suficiente para la equiva­
lencia total. Si, dicen, las teorías tienen la misma estructura a nivel
Filosofía de la física

tcorico, de forma que una teoría puede ser obtenida a partir de la


otra por un intercambio término a término (como el intercambio en­
tre «positivo» y «negativo» en la teoría de la electricidad mencionado
más arriba), entonces es correcto decir que las teorías son equivalen­
tes. Sin embargo, cuando tienen las mismas consecuencias observa­
cionales pero difieren en su estructura a nivel teórico, no deberían
ser consideradas como equivalentes. Esto es lo que sucede, se alega,
en nuestros familiares casos espacio-temporales. La relatividad espe­
cial no es igual estructuralmente a las teorías compensatorias del éter,
según revela el hecho de que un número infinito de teorías del éter
diferentes corresponden al único espacio-tiempo de Minkowski. Y la
relatividad general no es igual estructuralmente a las alternativas de
«espacio-tiempo plano más fuerzas» porque, de nuevo, el único espa­
cio-tiempo relativista general se corresponde con un número infinito
de posibles alternativas al mismo. Esto solamente reitera la afirma­
ción de que las teorías relativistas son preferibles a sus alternativas en
razón de una simplicidad de tipo estructural. N o necesitamos, pues,
suponer que las teorías relativistas son simplemente equivalentes a
sus alternativas, porque no necesitamos aceptar la demanda de los
positivistas de que la equivalencia observacional implica equivalencia
total.
El regreso a esta perspectiva realista nos lleva claramente de
vuelta a las cuestiones planteadas anteriormente sobre cómo pode­
mos elegir de manera razonable entre las teorías ahora equivalentes,
pero indistinguibles observacionalmente. También nos conduce a la
cuestión de cómo, para el realista, obtienen su significado los térmi­
nos teóricos de una teoría. La mayoría de los realistas suscriben la
idea de que primero adquieren significado los términos de nuestro
discurso asociados con los elementos de la experiencia observacio­
nal, y que los otros términos de la teoría reciben su significado por
alguna relación que presentan con los términos observacionales (aun­
que otros negarían incluso tan limitado «precedente semántico» al
vocabulario observacional). U n enfoque realista familiar consiste en
argüir que los términos teóricos obtienen cualquier significado que
presenten simplemente por el papel que desempeñan en el entrama­
do de leyes en la teoría que finalmente conduce a consecuencias ob­
servacionales. La idea ahora es que mientras los términos observacio­
nales adquieren su significado con independencia del papel que
estén desempeñando en la teoría, los términos teóricos ganan cual­
Espacio, tiempo, movimiento 105

quier significado que tengan de su papel como ocupantes de una po­


sición en la estructura teórica. Así, el significado de «geodésica nula»
está determinado enteramente por el lugar que ese término ocupa en
las leyes de, pongamos, la relatividad general.
A menudo se defiende que dicha teoría sobre el significado de
los términos teóricos no es incompatible con el realismo acerca de
las entidades y propiedades teóricas. El significado de «geodésica nu­
la», por ejemplo, está determinado por el papel desempeñado por
este término en la teoría del espacio-tiempo. Pero eso no significa
que no existan geodésicas nulas. Si la teoría es correcta, existirán. Se­
rán cualquier cosa a la que haga referencia el término «geodésica nu­
la». El problema es que es muy fácil inventar referencias sustitutas de
los térmihos para que las teorías sigan siendo correctas, aun cuando
los términos ya no hagan referencia a lo que considerábamos que
eran las entidades y características teóricas reales. U no podría, por
ejemplo, interpretar todos los términos teóricos de la teoría del espa-
cio-tiempo, no ya referidos a lo que visualizaríamos intuitivamente
como figuras espacio-temporales, sino referidos más bien a objetos
abstractos tales como números. La teoría sería entonces reinterpreta-
da en el sentido de afirmar que es posible asignar números a las enti­
dades y características observables de manera tal que, siguiendo las
reglas de las matemáticas, se podría inferir la validez de ciertas regu­
laridades legales entre los observables, pero sólo de esas regularida­
des que se siguen de la teoría del espacio-tiempo original como com­
prendidas de una manera realista. El discurso sobre entidades y
características teóricas se convierte entonces en un discurso sobre có­
mo podemos integrar un comportamiento observable en una estruc­
tura abstracta que tiene consecuencias para el orden y la regularidad
entre los observables. Siempre que uno adopte una concepción de
los términos teóricos del tipo «su significado es dado solamente por
su papel en la teoría», dichas reconstrucciones «representacionistas»
de la teoría incomodarán al realista.
Por esta razón, algunos realistas quisieran argüir que los términos
teóricos, incluyendo los que hacen referencia a estructuras espacio-
temporales, adquieren significado de algún otro modo. E n este punto
se recurre con frecuencia a las analogías de significado con términos
observables. Las moléculas, se dice, son descritas como partículas, y
sabemos lo que significa «partícula» por las partículas observables.
Así pues, sabemos algo acerca del significado de «molécula» que nos
106 Filosofía de la física

asegura que, sea lo que sean las moléculas, no son objetos abstractos
como los números. Quizá la analogía de una trayectoria como estruc­
tura espacio-temporal con una trayectoria constituida por algún tipo
de sustancia material nos permita acceder al significado de términos
espacio-temporales más allá de su papel en la predicción del compor­
tamiento local de los objetos materiales.

Concepciones pragmáticas
Las opciones que hemos explorado no agotan todas las posibles reac­
ciones que uno podría tener ante enigmas del tipo que Poincaré nos
ha planteado. Algunos filósofos han intentado argumentar que los de­
bates entre realistas y antirrealistas descansan todos en confusiones.
Algunos de estos argumentos regresan al escepticismo que comenta­
mos anteriormente acerca de la posibilidad de hacer de las conse­
cuencias observables una clase distinguida de las consecuencias de
una teoría. Otros se apoyan en una afirmación en el sentido de que
preocupándose por cuál de las posibles teorías alternativas es la ver­
dadera uno anda desorientado. Quizá existan varias descripciones al­
ternativas que merezcan todas, en función de algún conjunto de posi­
bles datos observacionales, ser denominadas «razonables de creer».
Supongamos que consideramos estas descripciones verdaderamente
incompatibles, no sólo reduciéndolas a simples variantes lingüísticas,
como los positivistas nos harían hacer. Si elegimos una de estas teo­
rías, declararemos verdaderas sus consecuencias y falsas las conse­
cuencias de las teorías rivales incompatibles con ella. Si hubiésemos
elegido alguna de las otras alternativas, habríamos, claro está, cambia­
do nuestra valoración de cuáles aserciones eran verdaderas y cuáles
falsas, pero habríamos sido igual de razonables. Pero, ¿qué es de
todos modos la verdad? ¿No es simplemente una forma de caracteri­
zar, al nivel de conversación sobre proposiciones, eso mismo que ex­
presaríamos utilizando las propias proposiciones, en el sentido de
que declararemos verdaderas todas y sólo aquellas proposiciones que
estamos dispuestos a afirmar? Quizá Poincaré estuviera en lo cierto
al afirmar que la geometría del m undo era una cuestión de conven­
ción en el sentido de que nos corresponde a nosotros elegir una de
las opciones razonables a nuestra disposición y, una vez hecho esto,
declarar «verdaderas» sus consecuencias.
Espacio, tiempo, m ovimiento 107

Pero ¿qué sucederá si la opción que elegimos no se conforma


realmente con la manera de ser del mundo? En este punto, algunos
se vuelven escépticos ante la sola idea de un mundo independiente
de la teoría al que las teorías corresponden, o no. El que dicha con­
cepción, unas veces asociada con el pragmatismo, otras denominada
«realismo interno», constituya realmente una opción firme, una que
no se reduzca al escepticismo o a alguna clase de reduccionismo po­
sitivista, sigue siendo una cuestión abierta.

Resumen
En cualquier caso podemos ahora ver cómo los desarrollos en las
matemáticas puras y en la física teórica han cambiado radicalmente
nuestras posturas, tanto ante la geometría, como ante el lugar que
ésta ocupa en nuestro cuerpo de conocimientos. Durante siglos la
geometría fue vista como el prototipo de una teoría que parecía
aportarnos hechos significativos sobre el mundo en el que vivíamos;
podíamos conocer las verdades geométricas, y conocerlas con certe­
za, pues eran derivables por medio de una cierta inferencia lógica de
primeros principios cuya verdad era autoevidente. La geometría era
el paradigma del conocimiento en general. Sólo con ser lo suficiente­
mente inteligentes, podríamos conocer todas las verdades acerca del
mundo, así como conocíamos las geométricas. Más tarde, como he­
mos visto, cuando la corriente empirista llevó a la mayoría de los filó­
sofos a afirmar que sólo podíamos conocer el mundo por medio de
la generalización e inferencia de los datos fundamentales de la obser­
vación y el experimento, la geometría pareció seguir siendo la excep­
ción a esta regla general, una excepción cuya naturaleza especial re­
quería una explicación tal como la que Kant apuntó.
Con el descubrimiento de una multiplicidad de geometrías axio­
máticas lógicamente consistentes, y la posterior generalización allen­
de éstas a las geometrías curvas multidimensionales de Riemann, y
allende éstas a las geometrías imaginadas en el estudio de la topolo­
gía y de la estructura diferencial de los espacios (en las que no hemos
entrado), el estatus de la geometría como cognoscible sin el apoyo de
la observación o del experimento fue seriamente cuestionado. Este
cuestionamiento se hizo mucho más significativo con el descubri­
miento en el siglo xxde, primero, los nuevos espacio-tiempos esen­
108 Filosofía de la física

ciales para el tratamiento relativista del comportamiento de la mate­


ria y de la luz y, después, de la capacidad de invocar el espacio-tiem­
po curvo como una teoría de la gravedad en la teoría general de la
relatividad. ¿No parecía, pues, que el conocimiento de la geometría,
como el de todas las otras teorías del mundo, descansaba en la obser­
vación y el experimento?
Pero, según hemos visto, esto es demasiado simple. Ciertamente
parece que, bajo la perspectiva moderna, la geometría deviene muy
similar a las otras teorías físicas fundamentales, generales, pero funda­
das observacionalmente, del mundo. Según hemos visto, sin embargo,
justamente la reflexión acerca del modo en que los resultados obser­
vacionales pueden o no determinar por nosotros qué geometría del
mundo deberíamos razonablemente creer, nos revela el grado al que
la geometría, como toda teoría física fundamental, sobrepasa la sim­
ple generalización de los datos que un crudo empirismo tomaría
como modelo de inferencia a teorías.
Cómo responder a la posibilidad de reconciliar una diversidad
de geometrías con cualesquiera datos observacionales posibles es,
como hemos visto, una cuestión muy problemática. Podríamos adop­
tar una postura realista y mostrarnos simplemente escépticos sobre
qué geometría describe realmente el mundo. O podríamos intentar
encontrar reglas metodológicas para una creencia razonable, reglas
que nos llevasen a elegir una de las muchas geometrías alternativas
como la única razonablemente más creíble. O podríamos intentar
evitar el desafío escéptico e invocar un argumento reduccionista en
el sentido de que todas las geometrías alternativas, cuando se las
complementa con las teorías físicas necesarias para hacerlas — cada
una a su manera— compatibles con los datos observacionales, son
realmente equivalentes entre sí. Finalmente, podríamos intentar me­
noscabar la pulla del problema de la «infradeterminación de la geo­
metría por cualesquiera datos posibles» negando algunas de sus pre­
misas sobre la distinción entre lo «en principio observable» y lo «en
principio inobservable», o desafiando la suposición implícita de una
única teoría verdadera que se corresponde con un m undo real inde­
pendiente de la teoría.
La geometría ha planteado una vez más problemas a nuestra teo­
ría del conocimiento en general. Estos problemas de infradetermina­
ción teórica son problemas generales que deben ser afrontados por
todo el que quiera entender cómo se puede fundar racionalmente
Espacio, tiempo, movimiento 109

una teoría del mundo en toda su generalidad, incluyendo su referen­


cia a entidades y estructuras consideradas inmunes a la observación
directa, sobre los limitados datos obtenibles a partir de la experiencia
observacional.

¿Qué clase de entidad tiene el espacio-tiempo?

Como hemos visto, es imposible explorar problemas acerca de nues­


tro conocimiento del espacio y el tiempo sin entrar en cuestiones del
ser, asuntos denominados metafísicos. Un enfoque positivista1del sig­
nificado de las teorías, diseñado para combatir el problema de infra-
determinación identificando el contenido de una teoría con el conte­
nido de sus consecuencias observacionales, demandará una actitud
irrealista hacia las entidades y características postuladas aparente­
mente por la teoría al nivel no-observable. Pero hay muchas otras
cuestiones de índole metafísica que, si bien en algún momento pue­
den plantear problemas epistemológicos, no están fundadas inicial­
mente en cuestiones sobre el conocimiento. Muchas de estas cuestio­
nes son muy específicas del estudio del espacio y el tiempo, aunque,
como veremos, su consideración sacará a menudo a la luz cuestiones
más amplias de la metafísica.

Tiempo y ser
Consideremos, por ejemplo, las doctrinas tradicionales que conectan
el tiempo y el ser. Para algunas, parecía intuitivamente obvio que
sólo lo que existía ahora, existía realmente. El futuro todavía no ha­
bía llegado a existir y el pasado había cesado de existir. Solamente de
las entidades que existían en el presente se podía decir, propiamente
hablando, que existían realmente. Para otras, era el pasado y el pre­
sente los que eran reales, y el futuro irreal. A quí la idea intuitiva era
que el pasado y el presente, habiendo ya llegado a ser o sucedido, te­
nían una realidad determinada. Lo que eran, era un hecho incuestio­
nable. De acuerdo a esa idea, el futuro era el reino de lo que todavía
no había llegado a ser. No tenía ninguna realidad determinada. Des­
pués de todo, siguiendo el curso del pensamiento, si era un hecho
determinado ahora que algún suceso futuro tuviera una realidad, en­
110 Filosofía de la física

tonces ¿cómo podría haber un espacio para decidir cuáles serían


nuestras acciones futuras, por ejemplo, si ya era el caso ahora, y ha­
bía sido siempre el caso, que lo que haremos mañana es ya un hecho
determinado hoy? Lo que aquí se discute no es la cuestión del deter­
minismo, de si los sucesos pasados y presentes fijan o no, mediante
sus conexiones legales con otros sucesos, qué sucesos futuros de he­
cho ocurrirán. La cuestión es, más bien, la afirmación de que si los
acontecimientos futuros tienen una realidad pasada y presente (si fue­
ra un hecho ahora que yo compraré un helado mañana), entonces el
futuro no podría estar abierto en ningún sentido a la posibilidad.
A tales intuiciones se oponían las concepciones en el sentido de
que cualesquiera de dichas supuestas conexiones del tiempo al ser
eran meras ilusiones del lenguaje. Pasado, presente y futuro, se ar­
güía, eran igualmente reales.
No consideramos que sea motivo para negar realidad a las cosas
el que no estén aquí, donde nos encontramos nosotros, así que ¿por­
qué deberíamos considerar como motivo para negar su realidad el
que no estén existiendo en el momento en que hablamos o pensa­
mos sobre ellas? Pensaríamos, por ejemplo, que es absurdo defender
que las cosas situadas detrás de nosotros o en el lugar que ocupamos
son reales, mientras las cosas situadas frente a nosotros carecen de
una verdadera realidad, así que ¿porqué no habríamos de considerar
igualmente absurdo postular realidad al pasado y al presente, pero
negársela a las realidades futuras?
Vinculadas a estas cuestiones se encuentran varias otras sobre las
que sólo podremos hacer observaciones muy breves. A veces se alega
que el tiempo es radicalmente diferente del espacio: mientras el espa­
cio puede ser concebido correctamente desde un punto de vista
«aperspectivo», un entendimiento adecuado de la temporalidad de
las cosas requiere un punto de vista perspectivo. Podríamos, se argu­
ye, describir todos los fenómenos espaciales de dos maneras igual­
mente apropiadas. Podríamos asignar a cada una de las localizaciones
espaciales un nombre coordenado y decir dónde ocurrieron las cosas
especificando su localización mediante esta nominación perspectiva.
O podríamos especificar el lugar en el que algo ocurrió en relación a
«aquí», el lugar en el que nos encontramos ubicados.
Si intentamos el mismo truco con el tiempo, nos vemos descon­
certados. La información aportada al decir cuándo ocurrieron las
cosas, incluso en relación unas a otras, ¿suministra completamente
Espacio, tiempo, m ovimiento 111

todos los aspectos temporales de lo que ocurrió? Algunos dicen que


no. Supongamos que damos la fecha en la que Julio César murió y la
fecha del día de hoy. Supongamos que añadimos el hecho de que la
fecha de la muerte de César es anterior a la actual, entendiendo «es
anterior a» como una relación primitiva entre tiempos. Cuando haya­
mos dicho todo eso, ¿hemos dicho todo lo que hay que decir, tempo­
ralmente, sobre la muerte de César? La afirmación de que no lo he­
mos dicho descansa en la idea de que cuando decimos que «César
murió», o cuando especificamos en alguna otra forma que la muerte
de César pertenece al pasado, estamos haciendo más que especificar
que ocurrió, pongamos, antes de 1989. Ese último hecho es «atem-
poralmente verdadero», pero-el hecho de que César murió no fue
verdad hasta que lo hizo, aun cuando el hecho de que la muerte de
César es (atemporalmente) anterior a 1989 sea, en cierto sentido,
siempre verdad.
¿No podríamos, sin embargo, captar la «preteridad» de la muer­
te de César diciendo que ocurrió antes que ahora? Por supuesto, se
responde; pero «ahora» es el nombre del presente y, al plantear las
cosas de esta forma, hemos reintroducido una tensión esencial en
nuestra descripción temporal de las cosas. Aquellos que niegan que
haya algo esencialmente diferente entre el tiempo y el espacio en
este sentido responden que «ahora» es una palabra igual que
«aquí». La referencia de dichas palabras, algunas veces llamadas
símbolos reflexivos o coordinativos, varía con su uso. Cada uso de
«aquí» se refiere al lugar en el que se ubica el locutor. De manera
similar, cada uso de «ahora» se refiere al momento en el que se ha­
ce la alocución. ¿Hay algo más misterioso en torno a «César murió»,
aparte del hecho de que la muerte de César es (atemporalmente)
anterior a 1989 y que ahora
es 1989, que en torno al hecho de que
una supernova tuvo lugar a alguna distancia de la tierra y aquí es en
la tierra?
Sí, responde el proponente de la concepción de que hay algo ra­
dicalmente diferente sobre el tiempo que lo distingue del espacio.
Mientras las cosas que existen en el espacio en otros lugares que
aquí existen, las cosas que no existen ahora no existen en absoluto.
«Ahora» no es un mero indicativo, insisten; es el término que selec­
ciona (en cualquier momento) ese instante de tiempo que es el ins­
tante en el que las cosas existen, el cual es, claro está, ¡el momento
presente! Así, este debate en torno a la tensión esencial del tiempo
Filosofía de la física

revierte, una vez más, en la idea agustiniana de que solamente lo que


existe ahora existe realmente, hablando con propiedad.

Consideraciones relativistas
Es obvio que la reestructuración radical del espacio y el tiempo en el
espacio-tiempo postulado por la teoría especial de la relatividad ha
de tener un fuerte impacto en este debate. ¿Qué sucede con la afir­
mación de que «sólo lo que existe ahora existe verdaderamente», si
los sucesos que son simultáneos para un observador ocurren en tiem­
pos diferentes para un observador en movimiento con respecto al
primero, aun cuando los dos observadores coincidan momentánea­
mente? El propio significado de «ahora» se ha vuelto problemático.
Al menos ha pasado a ser una cuestión relativa a exactamente qué
sucesos están ocurriendo «ahora».
Supongamos que dos observadores coinciden en el suceso e,
pero se encuentran en movimiento uno respecto al otro. Habrá suce­
a e
sos como el suceso que son posteriores a para el primer observa­
dor pero simultáneos con e
para el segundo. Pero entonces, ¿cómo
a
podríamos decir que es irreal para el primer observador si es real a
para el segundo observador en el instante considerado (siendo simul­
e
táneo con para este segundo observador) y si el segundo observa­
e
dor es sin duda real en el suceso para el primero? La situación es
todavía peor que esto. Un suceso en relatividad puede ser posterior
al suceso e
o «absolutamente posterior» al suceso e.
Hablamos de
«absolutamente posterior» cuando el suceso, b,
es posterior a y pue­ e
de conectarse causalmente a él por alguna señal viajando a igual, o a
menor, velocidad que la de la luz. Para sucesos como que no sona,
conectables causalmente con e, a
será posterior a e, simultáneo con e,
e
o anterior a para diferentes observadores. Pero todos los observa­
dores coincidirán en que b,
que es absolutamente posterior a , es e
posterior a e.
Sin embargo, todavía puede darse el caso de que haya
un observador para quien el suceso e'
de su propia vida sea simultá­
neo con b, pero tal que e e
sea simultáneo con para el primer obser­
vador. Así, el primer observador declarará la vida del segundo obser­
vador en e real en e,
y el segundo observador declarará real en b e.
¿Cómo podría, pues, el primer observador pensar que b,
en su futuro
absoluto, es irreal en e?
Espacio, tiempo, movimiento 113

Los argumentos aquí están diseñados para convencer al lector de


que la aceptación del espacio-tiempo de la relatividad hace irrisoria
la concepción tradicional de que «solamente lo que está presente
ahora es real». Se arguye que la relatividad es claramente compatible
sólo con la concepción alternativa que considera todos los sucesos,
pasados, presentes y futuros, como igualmente reales, al igual que tra­
dicionalmente consideramos todo lo que sucede en el espacio, don­
dequiera que suceda, como igualmente merecedor de ser llamado
real. Si pasado, presente y futuro son tan relativos a los estados de
movimiento como la teoría especial de la relatividad considera que
son, ¿cómo podríamos pensar que la realidad varía con el lugjr tem­
poral de un suceso en relación con un suceso actual en la vida del
agente en cuestión?
Pero, por supuesto, esto no es tan sencillo. La tentativa de ex­
traer una conclusión metafísica de una teoría científica requiere m u­
cho más cuidado del que nosotros hemos puesto hasta ahora. Uno
podría, formalmente, defender las viejas doctrinas de la irrealidad de
todo menos el presente, pese a aceptar la relatividad, negando sim­
plemente que «es real» es una noción enteramente transitiva. Si «es
simultáneo» tiene la característica en relatividad de que e
puede ser
e b
simultáneo con para el observador uno, simultáneo con e
para el
observador dos, pero b no e
simultáneo con para ninguno de los ob­
servadores (característica que ciertamente posee), entonces ¿porqué
no deberíamos relativizar «es real a» en la misma forma, de manera
que aunque e e b
es real a para el observador uno y real a e
para el
observador dos, b e
no es real a para ninguno? De manera que nin­
e
gún observador en el suceso declarará nunca que bes un suceso
real con independencia de cuál sea su estado de movimiento cuando
se encuentre coincidiendo con e.
Una respuesta más interesante procede en principio buscando las
fuentes de la intuición de que el pasado y el futuro son irreales. Uno
de los motivos de esa concepción, aunque ni mucho menos el único,
es el alejamiento epistémico del pasado y del futuro respecto al pre­
sente. Es una idea común que el presente se nos «presenta» directa­
mente en la experiencia, pero que lo que sucedió en el pasado y en
el futuro sólo puede ser conocido por inferencia a partir de la expe­
riencia presente (incluyendo tales experiencias como «tener el recuer­
do de que tal y tal suceso ocurrió»). Tal como vimos en «¿Cómo co­
nocemos la verdadera geometría del mundo?» el estatus ontológico
114 Filosofía de la física

de lo inferido se pone frecuentemente en duda. Hay argumentos d i­


señados para arrojar una duda escéptica sobre la adecuación de cual­
quier pretensión de conocer la verdad de una proposición cuya ver­
dad sólo puede conocerse indirectamente y por medio de un proceso
inferencial.Si uno basa la afirmación de irrealidad del pasado y del
futuro en su alejamiento del tipo de cognoscibilidad que el presente
tiene para nosotros, entonces una forma de preservar la intuición de
que el pasado y el futuro son irreales en el contexto relativista se ha­
ce evidente.
Cuando examinamos los fundamentos de la teoría de la relativi­
dad, vimos que está fundada en un examen crítico de nuestro conoci­
miento sobre sucesos distantes de nosotros en el espacio. En ese argu­
mento crítico descansaba la original crítica de Einstein a la noción
intuitiva de simultaneidad para sucesos distantes. El desarrollo de lo
que se ha sugerido en las observaciones anteriores sugiere una lectura
metafísica apropiada a la relatividad a alguien que quiera defender la
concepción de que el pasado y el futuro son irreales. Es negar la reali­
dad del otro lugar
tanto como la del otro tiempo, considerando que
sólo tiene realidad auténtica lo que coincide con el lugar-tiempo de
uno como observador. Ahora bien, dicha reducción de lo real a un
punto del espacio-tiempo es incluso peor que retener la realidad sólo
para el momento ínfimo de tiempo que es el ahora. Huelga decir que
no estoy defendiendo semejante disminución radical de lo que vemos
como real. Lo que se está afirmando, no obstante, es que el ímpetu y
las intuiciones que subyacen a la anterior actitud irrealista hacia el pa­
sado y el futuro no pueden ser descartados simplemente señalando la
relatividad de las nociones de pasado y futuro respecto al estado de
movimiento del observador en un espacio-tiempo relativista. El lector
interesado en las cuestiones de porqué alguien defendería semejante
dramático irrealismo sobre el pasado y el futuro en primer lugar, y
porqué, en el contexto relativista, personas aparentemente sanas po­
drían verse tentadas al irrealismo aun más radical sobre el otro lugar
deberá dirigirse a las obras más detalladas acerca de estas cuestiones.

Sustantivismo versus relacionismo


Un tópico con posibilidades bastante más sustanciales es el impacto
de las teorías relativistas en el debate entre los sustantivistas y los re-
Espacio, tiempo, m ovim iento 115

lacionistas que ya introduje anteriormente. Como veremos, las cues­


tiones aquí son diversas, sutiles y complejas. Pero como también ve­
remos, resulta, una vez más, que uno debe tener cuidado con la ten­
dencia a inferir prematuramente una concepción metafísica de los
resultados de la ciencia. El tratar de llegar a alguna conclusión filosó­
fica acerca de la existencia y naturaleza del espacio y del tiempo exa­
minando lo que nos dicen las mejores teorías científicas disponibles
sobre el espacio y el tiempo es una tarea digna de consideración.
Pero es algo que requiere una dosis notable de cautela y prudencia
filosófica.
Los relacionistas negaban que uno debiera postular el espacio y
el tiempo como entidades por derecho propio, arguyendo que lo más
que podía postularse eran las relaciones espaciales que los objetos
materiales presentan entre sí y las relaciones temporales que los suce­
sos materiales presentan entre sí. Tras el desarrollo de la teoría espe­
cial de la relatividad, se aseguraba normalmente que Einstein había
completado finalmente el programa relacionista leibniziano. Pero
estas vindicaciones llamaban a engaño. Aunque la teoría especial nos
dice que algunas de las características del mundo que una vez
tomamos por absolutas son realmente relativas, esto no es en absolu­
to lo mismo que decir que el relacionismo es correcto. En la descrip­
ción del espacio y el tiempo por Newton, hay una separación defini­
da, no relativa, espacial y temporal entre dos sucesos cualesquiera.
En la teoría de la relatividad, dichas separaciones son solamente rela­
tivas a una elección de sistema de referencia inercial y difieren en
función del sistema elegido. Pero dicha relatividad no tiene nada que
ver con que, a fin de dar cuenta de los fenómenos observables, deba­
mos postular el espacio y el tiempo o, ahora, el espacio-tiempo, como
estructuras sobre y por encima de las cosas y características materia­
les del mundo. También debería indicarse de paso aquí que aunque
la relatividad especial convierte en relativas algunas nociones previa­
mente no relativas, introduce nuevas características, no relativas, de
su propia cosecha. El intervalo espacio-temporal de separación entre
los sucesos es, en la teoría especial, una relación absoluta entre los
sucesos y es independiente de cualquier observador, como lo es el
tiempo propio transcurrido a lo largo de una trayectoria específica en
el espacio-tiempo de un suceso a otro.
Si el argumento de Newton a favor de una concepción sustanti-
vista del espacio-tiempo, que él utilizó con gran acierto contra Leib-
Filosofía de la física

niz, luese correcto, entonces la relatividad especial parecería ser una


teoría que postula asimismo un espacio-tiempo sustantivista. Como
hemos señalado, la distinción, tan importante en el argumento new-
toniano, entre sistemas inerciales con movimiento verdaderamente
uniforme y sistemas absolutamente acelerados se conserva en la teo­
ría especial de la relatividad. En la nueva teoría, los sistemas inercia­
les son, como lo eran en la teoría newtoniana, aquellos en los que no
se experimentan fuerzas inerciales. Pero ahora también se distinguen
por ser los estados de movimiento en los que los experimentos ópti­
cos de ida y vuelta dan sus famosos resultados nulos. La distinción
entre estar realmente en movimiento acelerado o no, central al argu­
mento de Newton contra el relacionismo, se conserva en la teoría es­
pecial de la relatividad.
¿Significa esto que si aceptamos la teoría especial, debemos
aceptar la postura metafísica del antirrelacionista newtoniano (con,
claro está, el espacio-tiempo minkowskiano, en lugar del espacio ab­
soluto de Newton, como la estructura del espacio-tiempo sustanti­
vista)? ¿Necesitamos todavía un «espacio-tiempo mismo» en rela­
ción al cual la aceleración absoluta es aceleración y cuya existencia
se presupone como parte de la explicación de la existencia de fuer­
zas inerciales y de los efectos ópticos que ponen de manifiesto la
aceleración absoluta? Quizá, pero de nuevo sería precipitado pasar
sin una reflexión ulterior de una teoría científica a una conclusión
metafísica. ¿No podríamos encontrar alguna forma de reconciliar la
relatividad especial con una descripción relacionista del espacio-
tiempo?
Quizá. Pero las cuestiones filosóficas involucradas son complejas,
sutiles y problemáticas. Hay argumentos diseñados para mostrar que
el programa sustantivista de postular el espacio-tiempo como una en­
tidad necesaria para explicar la distinción entre movimientos absolu­
tamente acelerados y los no acelerados en absoluto falla y que las ex­
plicaciones ofrecidas son espurias. Las fuerzas inerciales y los efectos
ópticos de la aceleración se explican por referencia a la aceleración
del laboratorio respecto a «sistemas de referencia inerciales» del es­
pacio-tiempo mismo, los cuales ocupan en la relatividad especial el
lugar del «espacio mismo» de Newton. Pero las mismas estructuras
del espacio-tiempo permanecen, en algún sentido, inmunes a la ob-
servabilidad directa, manifestándose sólo indirectamente en términos
ile los efectos causales del movimiento con respecto a ellas. ¿No po­
Espacio, tiempo, movimiento 117

demos explicar todo lo que hay que explicar sin presuponer el espa­
cio-tiempo mismo?
Ahora podemos explicar las diferencias entre los efectos inercia-
les percibidos en dos laboratorios por referencia a sus aceleraciones
relativas entre sí. «Pero», dice el sustantivista, «no puedes explicar
porqué en un conjunto de estos sistemas no se siente ningún efecto
inercial en absoluto, siendo estos efectos sentidos solamente en los
laboratorios en aceleración con respecto a estos laboratorios preferi­
dos. Yo», dice él, «puedo explicar porqué estos sistemas son preferi­
dos. Son los que no están acelerados con respecto al espacio-tiempo
mismo». El relacionista puede contraargurrientar afirmando que, si
bien no puegle explicar porqué un conjunto de estos sistemas es pre-
ferencialmente inercial, puede simplemente tomar esto como un «he­
cho incuestionable básico de la naturaleza» que sencillamente nunca
podrá explicarse. Después de todo, puede decir, debe haber algunos
hechos incuestionables fundamentales, así que ¿porqué no éstos?; y
pasa a argüir que el sustantivista requiere hechos incuestionables en
cualquier caso. Para el sustantivista es un hecho incuestionable de la
naturaleza que la aceleración con respecto a las geodésicas inerciales
del espacio-tiempo induce los efectos inerciales. Así pues, defiende el
relacionista, el sustantivista no está mejor provisto de términos ex­
plicativos que el relacionista, pero el primero debe postular la miste­
riosa entidad del «espacio-tiempo mismo», que no ejerce ninguna
función explicativa real. Y una vez más, siguiendo a Leibniz, el rela­
cionista producirá una serie de argumentos en el sentido de que la
concepción sustantivista postula otros hechos, como el que hace refe­
rencia a la posición del espacio-tiempo en la que ocurre un suceso
particular, que no tienen ninguna consecuencia observable. Así pues,
continúa el relacionista, la postulación del espacio-tiempo mismo in­
troduce «diferencias en la teoría sin una diferencia observacional».
Tales diferencias en la teoría fueron una de las características proble­
máticas del espacio mismo de Newton.
Hay muchas otras características problemáticas a ambos lados
del argumento. De hecho, como en cualquier debate metafísico en fi­
losofía, los mismos términos en los que el debate se plantea son su­
mamente problemáticos. ¿Comprendemos realmente lo que el sustan­
tivista está afirmando que debemos postular a fin de explicar los
fenómenos observables? ¿Entendemos realmente lo que el relacionis­
ta está negando y lo que está poniendo en su lugar? En particular,
118 Filosofía de la física

¿podemos realmente comprender completamente en qué difieren los


dos enfoques? Comentaré sólo brevemente estas cuestiones más ade­
lante.

La propuesta de Mach y la relatividad general


Por el momento, sin embargo, volvamos a la propuesta de Mach por
la que una explicación alternativa de los famosos efectos inerciales,
aceptable desde un punto de vista relacionista, podría ser posible
después de todo. ¿No podríamos suponer que las fuerzas inerciales, y
ahora también los efectos ópticos inerciales, no eran el resultado de
la aceleración de los aparatos prueba respecto al espacio mismo o, en
el caso relativista, respecto a la estructura geodésica inercial del espa­
cio-tiempo de Minkowski, sino, más bien, respecto a la materia cós­
mica del universo? Después de todo, en la teoría del electromagnetis­
mo estamos familiarizados con fuerzas magnéticas que dependen de
las velocidades que las partículas cargadas tienen unas respecto a
otras. ¿No podría haber igualmente fuerzas dependientes de la acele­
ración entre trozos de materia ordinaria? Si estas fuerzas dependieran
muy poco de la separación de las cosas entre sí, pero fueran suma­
mente dependientes de las cantidades de materia involucradas, ¿no
sería posible explicar los efectos inerciales como el resultado de la
aceleración del objeto prueba respecto a lo que Mach llamó las «es­
trellas fijas», y lo que nosotros ahora denominaríamos la materia dis­
tante de los supercúmulos de galaxias que constituyen la materia cós­
mica del universo?
Aunque la relatividad especial no proporciona un contexto apro­
piado para las ideas machianas, quizá la relatividad general sea más
prometedora en esta dirección. Después de todo, ésta se ocupa de la
gravedad, una fuerza de largo alcance. La gravedad newtoniana evi­
dentemente no podría proporcionar el tipo de interacción de largo
alcance, dependiente de la aceleración, que Mach postuló como res­
ponsable de los efectos inerciales, pero quizá, si la gravedad se recon­
ciliase con la relatividad al modo de la nueva teoría del espacio-tiem­
po curvo de la gravedad, se obtendría una teoría de índole machiana.
De hecho, Einstein se vio sin duda motivado por semejantes expecta­
tivas cuando comenzó la investigación que condujo a la teoría gene­
ral de la relatividad.
Espacio, tiempo, movim iento 119

Si Mach tuviera razón al postular que los efectos inerciales son el


resultado de la interacción del sistema prueba con la materia restante
del universo, ¿cuáles serían algunas de las consecuencias de ello? Pri­
mero, consideremos las primeras observaciones de Newton sobre lo
que sucedería en un universo vacío. Desde el punto de vista newto­
niano, debería existir una distinción entre un objeto que está girando
y uno que no está girando, aun cuando el objeto prueba fuese el ún i­
co objeto en el universo. El giro se pondría de manifiesto por los
efectos inerciales sobre el objeto prueba generados por el movimien­
to absoluto. Mach duda de que debiéramos pensar siquiera en uni­
versos vacíos. El universo, dice, nos es dado solamente una vez,
«completo con las estrellas fijas-intactas». Esto podría significar que
no tenemos forma de inferir a partir de lo que observamos lo que su­
cedería en el caso de un universo radicalmente diferente, o podría
implicar la afirmación más fuerte de que, dado que las leyes de la na­
turaleza son meramente compendios de lo que de hecho ocurre en el
m undo tal como es, no tiene ningún sentido hablar sobre lo que su­
cedería en un universo radicalmente diferente al actual. Sea como
fuere, podríamos sin duda preguntar a una teoría como la relatividad
general, capaz de describir la gravedad en muchas clases diferentes
de mundos posibles, si sus predicciones para un universo vacío se­
guirían marcando, como las de Newton, una distinción entre objetos
absolutamente giratorios y objetos no giratorios, o si esa distinción
desaparecería en este mundo — sin la materia cósmica de Mach
como sistema de referencia para el movimiento absoluto.
Esperaríamos que, en un mundo machiano, los efectos inerciales
generados sobre un objeto prueba variarían cuando la materia del
universo en torno al objeto se modificase radicalmente, ya que los
efectos inerciales son el resultado de la interacción entre los sistemas
prueba y la materia circundante. ¿Predice esto la teoría general de la
relatividad? N o debería existir diferencia alguna entre hablar de un
objeto en un m undo machiano en rotación junto a una materia cir­
cundante no rotatoria, y hablar, en su lugar, de la materia rotatoria al­
rededor del laboratorio prueba, pues, según Mach, es sólo la acelera­
ción relativa entre el sistema prueba y la materia lo que determina las
fuerzas inerciales detectadas. ¿Es esto lo que predice la teoría de la
relatividad? Por último, si Mach tiene razón, sería absurdo hablar de
la materia del universo como, de por sí, en rotación absoluta. Si los
efectos de la rotación en el sistema prueba son debidos a su movi­
120 Filosofía de la física

miento respecto a la materia cósmica, entonces sería imposible que


hubiera efectos debido a que la materia cósmica estuviese, de por sí,
en rotación absoluta, pues eso significaría una rotación de esta mate­
ria respecto a sí misma, lo cual es absurdo. ¿Qué tiene la teoría de la
relatividad que decir sobre esto?
Algunos de los primeros trabajos con la relatividad general mos­
traron aspectos machianos de la teoría. Es sin duda cierto que lo que
un objeto prueba en movimiento acelerado experimenta dependerá
de la distribución general de materia en el universo, pues, en la relati­
vidad general, la aceleración absoluta es la desviación del movimiento
de las geodésicas curvas, de tipo temporal, locales del espacio-tiempo.
Y como la curvatura global del espacio-tiempo está correlacionada
con la distribución de materia en el espacio-tiempo, un cambio radi­
cal de la cantidad o distribución de la materia cósmica tendrá un
efecto en las fuerzas inerciales generadas por el movimiento local. De
nuevo, en la relatividad general puede mostrarse que un objeto que
está de suyo en reposo, pero se encuentra circundado por materia en
alta rotación, experimentará fuerzas similares a aquellas que habría
experimentado el objeto prueba si hubiera sido puesto en rotación y
la materia circundante hubiera permanecido en reposo.
Pero si uno mira más allá, la teoría parece distanciarse cada vez
más de lo que Mach hubiera deseado. Aunque los efectos inerciales
se ven modificados por la distribución cambiante de la materia exte­
rior en el mundo, es como si hubiera un efecto inercial básico debi­
do a la rotación absoluta al que los nuevos efectos modificadores se
fueran añadiendo. En otras palabras, incluso en un universo exento
de materia exterior, la relatividad general predice una distinción en­
tre estar en rotación absoluta y no estarlo. Determinar a qué se ase­
meja el espacio-tiempo en un mundo relativista general requiere la
especificación de condiciones de contorno para el espacio-tiempo,
del mismo modo que encontrar a qué se asemeja un campo eléctrico
requiere más que conocer las cargas que están presentes. La suposi­
ción habitual que se hace en relatividad general, al menos en univer­
sos abiertos, es que el espacio-tiempo distante de la materia es plano,
el espacio-tiempo de Minkowski. Un espacio-tiempo razonable para
un universo vacío, pues, sería justamente este espacio-tiempo plano
de Minkowski de la relatividad especial. Pero, entonces, en un tal
mundo, la vieja distinción newtoniana entre rotación absoluta y au­
sencia de rotación seguiría conservando su valor. De hecho, la relati­
Espacio, tiempo, movimiento 121

vidad general permite espacio-tiempos vacíos todavía más extraños.


La curvatura del espacio-tiempo tiene su propia auto-energía gravita­
cional. Es posible, pues, tener una curvatura distinta de cero en un
universo vacío, o que haya regiones de espacio-tiempo curvo cuya
desviación de la planaridad no esté sustentada por ninguna materia,
sino simplemente por la auto-energía de la región de espacio-tiempo
curvo. Por lo tanto, la idea de Mach de que en un m undo vacío no
habría efectos inerciales no es válida en la relatividad general.
De nuevo, si bien la materia en rotación en torno a un objeto ge­
nera efectos inerciales, puede verse que la situación se desvía de lo
que Mach esperaría. Si un objeto prueba está circundado por dos ci­
lindros girando uno respecto al otro y respecto al objeto prueba, lo
que uno experimenta en el laboratorio dependerá, no solamente de
las rotaciones relativas implicadas, sino también de aquello en torno
a lo que el cilindro está «realmente girando», contrariamente a las ex­
pectativas machianas. Lo más dramático de todo fue el descubrimien­
to por K. Gódel de que hay mundos posibles consistentes con la rela­
tividad general en los que toda la materia del universo está en
rotación. N o es como si esa materia fuese alguna gigantesca esfera
cósmica, rígida, en rotación. Eso sería relativistamente imposible.
Pero en este mundo, un observador en cualquier lugar, cuyo labora­
torio estuviese en reposo con respecto a la materia cósmica, podría
realizar un experimento para probarse a sí mismo que estaba rotando
junto con toda la materia. Para cada observador hay un plano espe­
cial. Si el observador lanza partículas libres o rayos de luz a lo largo
de ese plano, éstas siguen trayectorias espirales en el sistema de refe­
rencia fijo en la materia cósmica. Esto indica que esta materia está en
rotación, así como la trayectoria de una partícula que se mueve en lí­
nea recta a partir del centro sobre un disco de fonógrafo que gira so­
bre un tocadiscos trazará una raya espiral sobre el disco. Así que es
como si cada observador pudiera considerarse a sí mismo fundamen­
tal para la rotación de la materia cósmica. Para un machiano esto pa­
rece absurdo, pero es una posibilidad consistente con la relatividad
general, revelando una vez más los aspectos no machianos de esa teo­
ría. (Véase la figura 2.10.)
Existen tentativas de hacer la relatividad general más machiana.
Algunas de las objeciones a una interpretación machiana de la relati­
vidad general descansan en el hecho de que la distribución de mate­
ria no siempre es suficiente para determinar completamente la es-
122 Filosofía de la física

2.10.
F ig u r a La rotación absoluta de la materia en el universo de Gódel.
E n una solución
a las ecuaciones de la relatividad general hallada por K. G ódel es plausible decir de
la materia informe del universo que está en «rotación absoluta». ¿Q ué significa esto?
E n cualquier punto hay un plano con la siguiente característica: Fijem os las coorde­
x y
nadas e en el plano de manera que esté en reposo en relación a la materia infor­
me del universo. Ahora emitamos desde el punto o
una partícula o rayo de luz libre,
a. E n las coordenadas en reposo en la materia, la partícula o rayo de luz describirá
una trayectoria espiral a medida que la partícula o rayo de luz se aleje de o. Si consi­
deramos a las partículas y rayos de luz libres en movimiento rectilíneo en relación a
algún marco de referencia «absoluto», es «como si» la materia informe estuviera
rotando en relación a ese marco.

tructura del espacio-tiempo, y por lo tanto, no es adecuada para de­


terminar completamente qué efectos inerciales del movimiento existi­
rán. En universos que son siempre espacialmente cerrados, sin em­
bargo, hay un nexo más estrecho entre la distribución de materia y la
estructura espacio-temporal, de manera que sólo una estructura espa­
cio-temporal es compatible con la distribución completa de materia.
Así, se ha propuesto, la versión machiana de la relatividad general es
una donde el espacio-tiempo tiene el cierre apropiado. Pero esto está
muy lejos del relacionismo duro de Mach.
Espacio, tiempo, m ovim iento 123

Más sobre la relatividad general y el debate


entre sustantivistas y relacionistas
De hecho hay aspectos de la teoría del espacio-tiempo en la relativi­
dad general que hacen que comencemos a preguntarnos si la distin­
ción entre el relativismo y el sustantivismo, tal como se entendían
tradicionalmente, es coherente. Hemos observado que, en la relativi­
dad general, el espacio-tiempo mismo tiene energía-masa. Pero la
energía-masa es el aspecto característico fundamental de la materia
tal como se entiende normalmente. ¿Podemos entonces hablar acerca
de «relaciones entre la materia» versus
«el espacio-tiempo mismo», si
la distinción entre materia y espacio-tiempo es en sí misma problemá­
tica?
Antes incluso de que la teoría general de la relatividad plantease
las cuestiones que acabamos de discutir, era evidente que la distin­
ción entre sustantivismo y relacionismo según la interpretación tradi­
cional estaba sometida a una cierta tensión. A finales del siglo XIX, el
concepto de «campo» pasó a ser esencial en la física. A fin de poder
tratar los hechos de la electricidad y el magnetismo, por ejemplo, se
hizo necesario añadir a los elementos de la naturaleza productos bas­
tante diferentes de las partículas materiales familiares de la física an­
terior. Entidades como el campo eléctrico se conciben como extendi­
das por todo el espacio, con intensidades diferentes en diferentes
puntos espaciales. Éstas tienen una evolución dinámica en el tiempo.
«Objetos» físicos tales como los campos son esenciales para la teoría
física estándar. Pero, claramente, son algo muy diferente de los obje­
tos materiales localizados presupuestos por el relacionista. En m u­
chos sentidos se parecen más al «espacio mismo» del sustantivista
que a las partículas materiales ordinarias. Cuando uno considera lo
mucho que debe modificarse la propia concepción que uno tiene so­
bre lo que existe cuando se admiten los campos en la imagen física
del mundo, parece claro que el fracaso en los términos del debate
sustantivista-relacionista había ya comenzado con la introducción de
las cantidades tipo campo en la física.
Si dirigimos la atención a un aspecto diferente de la relatividad
general, vemos otra forma en que la existencia de nuestra teoría fun­
damental del espacio-tiempo afecta al debate tradicional entre sustan­
tivistas y relacionistas. El problema del determinismo en la física es
enormemente complejo. El científico del siglo xvm P. S. de Laplace
124 Filosofía de la física

es famoso, por haber afirmado que, dada la verdad de la imagen me­


cánica newtoniána del mundo, la especificación del estado del m un­
do en un tiempo dado determinaba su estado en todos los tiempos
futuros, porque las leyes de la naturaleza generaban a partir de ese
estado todos los estados que se seguían necesariamente en tiempos
posteriores. Pero todo lo que tiene que ver con la cuestión de si
estaba en lo cierto, de si el mundo es realmente determinista, se vuel­
ve complejo y problemático.
Para empezar, hay algunos problemas filosóficos. Como B. Rus-
sell señaló, si dejamos que la noción de «estado del mundo» sea lo
bastante amplia y la noción de «ley de la naturaleza» lo bastante fle­
xible, el determinismo se convierte en una doctrina trivial, pues, no
importa cómo fuese el mundo, podríamos simplemente tomar como
leyes las proposiciones que dicen cuáles estados siguen de hecho a
cuáles otros. Supongamos que contamos con alguna forma de evitar
estas trivializaciones exigiendo que las leyes verdaderas satisfagan
condiciones más estrictas. Muchos problemas científicos se siguen de
ello. Incluso en la mecánica newtoniana, hay problemas con el deter­
minismo. Si nos ocupamos de partículas puntuales con una intensi­
dad de interacción que se hace infinita cuando las partículas se apro­
ximan a una distancia cero, resulta imposible seguir los estados
deterministamente a través de las colisiones de las partículas. De
nuevo, si especificamos el mundo en un tiempo dado, puede que el
futuro esté influido por una partícula que «llega del infinito» después
de ese instante, obstaculizando la determinación del futuro por el
estado total en el tiempo en cuestión.
Cuando pasamos primero a la relatividad especial y luego a la ge­
neral con sus nuevos espacio-tiempos, surgen muchas cuestiones aún
más complejas. Los estados del m undo «en un instante» son una
cuestión relativa en la relatividad especial. En la relatividad general,
puede que ni siquiera sea posible seccionar el espacio-tiempo del
mundo en «espacios en un instante», por lo que la misma noción de
estado del mundo en todo lugar en un tiempo dado podría dejar de
tener sentido. El modelo de una posible influencia causal en estas
teorías es, por supuesto, más complejo de lo que lo era en las teorías
newtonianas, y la complejidad de la estructura causal conduce a im ­
portantes e interesantes problemas matemáticos sobre cómo caracte­
rizar qué mundos son deterministas en los sentidos que uno puede
dar al término. En la relatividad general surge otro problema debido
Espacio, tiempo, movim iento 125

a la posibilidad (y, a menudo, la inevit íjj^des en


el espacio-tiempo. El big bang
en el que COT;^feé-»««Strjd^ir^erso es-
pacio-temporal (si es que existe) es una ae~^ o w gff^mfejlaridades,
como lo serían las que se encuentran en el centro de los~«enomina-
dos agujeros negros. Estas singularidades son puntos de espacio-tiem­
po donde la curvatura se hace infinita. Su presencia en el espacio-
tiempo bloquea la capacidad de predecir a su través los estados
posteriores del mundo a partir de los anteriores. Introducen, pues,
una forma de indeterminismo en la imagen.
La misma conexión entre determinismo y predictibilidad que, se­
gún Laplace suponía, significaba más o menos lo mismo, es también
problemática. ¿Implica el decir que el mundo es determinista <}ue es
predecible, al menos en principio? Muchos han argüido que semejan­
te implicación no es válida. Después de todo, el determinismo dice
que el estado del mundo en un tiempo dado fija, por las leyes de la
naturaleza, los estados en otros tiempos. Pero si no podemos conocer
el estado completo del mundo en un tiempo dado, como una cues­
tión de principio fundamental, el m undo podría ser determinista,
pero no predecible. El espacio-tiempo de Minkowski tiene esta natu­
raleza. El estado completo del m undo en un espacio (respecto a un
sistema inercial) puede muy bien fijar el estado del mundo en espa­
cios posteriores. Pero para cualquier observador dado, puede darse
el caso de que nunca pueda acumular la información sobre el estado
del mundo en todo un «espacio en un tiempo», porque la informa­
ción que recibe es la que puede alcanzarle causalmente desde el pa­
sado, y ésta está restringida a la que se encuentra dentro de su cono
pretérito de luz. Esto es, sólo puede obtener información sobre suce­
sos en el pasado que puedan ser conectados con él en el presente
por señales causales desde el pasado. Por esta razón y, como vere­
mos, por otras también, la identificación demasiado precipitada del
determinismo con la predictibilidad es ingenua. No obstante, si el de­
terminismo y la predictibilidad están enteramente desligados, resulta
muy difícil resolver el problema planteado por Russell de encontrar
una forma de restringir lo que puede considerarse como estado y
como ley de manera que la cuestión del determinismo no se reduzca
a una trivialidad.
En el capítulo 3 volveremos al tema del determinismo. En él exa­
minaremos cómo la sensibilidad del desarrollo de un sistema a sus
condiciones iniciales exactas ha llevado a algunos a negar el determi-
126 Filosofía de la física

nismo en el mundo. ¿Qué tipo de mundo determinista puede darse


si incluso un cambio infinitesimal en el estado inicial de un sistema
puede conducir a cambios enormes en su desarrollo futuro? En el
capítulo 4 exploraremos algunas de las cuestiones del determinismo
y el indeterminismo que surgen en el contexto aun más radical de la
mecánica cuántica. Ahí veremos porqué algunos han alegado que si
la mecánica cuántica describe verdaderamente el mundo, el determi­
nismo debe ser radicalmente falso.
Pero por el momento quiero centrarme en un argumento concer­
niente al determinismo en la teoría general de la relatividad, un argu­
mento diseñado para defender una clase de relacionismo leibniziano
defendiendo que si interpretamos la relatividad general en una forma
enteramente sustantivista, debemos considerarla como una teoría in­
determinista — cuyo indeterminismo es sorprendentemente peculiar.
Algunos de los argumentos más eficaces de Leibniz contra el sustan­
tivismo descansaban en la suposición de que cada punto del espacio
era exactamente igual a cualquier otro y cada dirección en el espacio
igual a cualquier otra. Así pues, el m undo material desplazado del lu­
gar en el espacio en el que realmente estaba sería cualitativamente
idéntico al m undo tal como es. N o habría una razón suficiente para
que estuviera en un lugar del espacio y no en otro. Y el m undo apa­
recería exactamente igual a cualquier observador, sin importar dónde
se encontrase el m undo material en el espacio.
Esto deja de ser cierto en la relatividad general, pues el espacio-
tiempo puede ahora tener una estructura que varía de un lugar y
tiempo a otro lugar y tiempo. El desplazamiento de la materia ordi­
naria a través del espacio-tiempo sería muy diferente en un mundo
en el que la curvatura (el campo gravitacional) varía de una posición
espacio-temporal a otra. Pero puede reconstruirse algo parecido al ar­
gumento leibniziano donde el desplazamiento de la materia a través
del espacio se acompaña de un desplazamiento compensatorio en la
propia estructura espacio-temporal.
Una consecuencia de esto es un problema indicado por Einstein
y llamado el problema del «agujero». Tomemos una pequeña región
del espacio-tiempo desprovista de materia. Supongamos que la distri­
bución de materia y la estructura del espacio-tiempo fuera de la re­
gión es cualquier cosa que queramos. Entonces, estructuras espacio-
temporales que parecen diferentes unas de otras en ?1 agujero son
igualmente compatibles, según las leyes de la relatividad general, con
Espacio, tiempo, m ovim iento 127

la inexistencia de materia en el agujero y la distribución de materia y


espacio-tiempo fuera del mismo. Hay una forma de leer este resulta­
do que intenta rebatirlo afirmando que sólo dice que la estructura en
el agujero puede ser descrita por medio de sistemas coordenados al­
ternativos. Pero si tomamos seriamente las posiciones puntuales del
espacio-tiempo, seguramente parte de la lectura sustantivista de la
teoría, hay una manera de entender este resultado que dice que, no
importa cuán pequeño sea el agujero, hay estructuras de espacio-
tiempo genuinamente diferentes en él compatibles con la estructura
de espacio-tiempo y materia circundante. Este es el nuevo tipo de in­
determinismo que, se alega, se impone a uno cuando uno se aferra a
la lectura sustantivista de la nueva teoría del espacio-tiempo.
Evidentemente, la discusión se termina aquí. Queda un largo ca­
mino por recorrer antes de haber seleccionado cuáles son las innu­
merables cuestiones diversas entre relacionistas y sustantivistas de va­
rios tipos. Y hay muchos aspectos de las teorías físicas ordinarias del
espacio-tiempo que también deben ser mejor entendidas. Hasta que
los dos aspectos, el filosófico y el físico, de las cuestiones no se hagan
más claros y más precisos, será imposible decir qué lectura metafísica
se adapta mejor a lo que la física ordinaria nos dice sobre el espacio
y el tiempo del mundo. Las cuestiones aquí son importantes, pues los
argumentos teóricos que subyacen a la crítica del sustantivismo y a la
defensa del relacionismo, y la oposición a estos argumentos por parte
de los sustantivistas, son utilizados de manera similar en otros deba­
tes filosóficos.

Relaciones espacio-temporales y relaciones causales


Hemos venido explorando el debate entre aquellos que consideran
el espacio-tiempo como la entidad fundamental del mundo y aque­
llos que toman solamente las relaciones espacio-temporales entre las
cosas y los sucesos materiales como constitutivos de la realidad espa-
cio-temporal del mundo. Otro grupo de cuestiones importantes con­
cernientes a la naturaleza de la realidad espacio-temporal gira en tor­
no a la relación entre las características espacio-temporales y causales
del mundo. Existe una estructura causal entre los sucesos del m un­
do. Algunos sucesos causan a otros o, al menos, son causa parcial de
otros, necesitando a otros sucesos que junto con ellos sean suficiente
12H Filosofía de la física

para causar el suceso efecto. Hay profundas e importantes relaciones


entre lo que tomamos como estructura espacio-temporal del mundo
y lo que tomamos como estructura causal entre los sucesos. Estas re­
laciones fueron percibidas mucho antes del descubrimiento de las
teorías relativistas, pero adquirieron una gran importancia cuando la
atención de los filósofos se dirigió hacia las cuestiones concernientes
a lo que las teorías relativistas nos dicen sobre la naturaleza de nues­
tro mundo. Particularmente importantes son un grupo de afirmacio­
nes en el sentido de que la estructura causal entre los sucesos es la
estructura real entre ellos, la estructura física más fundamental cons­
titutiva de la realidad. Desde la perspectiva de estas afirmaciones,
las relaciones espacio-temporales son reales solamente en la medida
en que pueden ser reducidas a, o definidas en términos de, relacio­
nes causales. Pero dichas afirmaciones resultan ser complejas y su­
tiles.
Quizá la primera conexión entre nociones causales y espacio-tem-
porales de este tipo fue hecha por Leibniz. Supongamos que unos su­
cesos son causa de otros sucesos por medio de señales enviadas a lo
largo de una trayectoria espacio-temporal continua desde un suceso
anterior a otro posterior. Supongamos, como hacíamos antes de la re­
latividad, que estas señales pueden viajar a cualquier velocidad que
queramos, siempre y cuando la velocidad sea finita. Entonces, cual­
quier suceso podrá conectarse a cualquier otro suceso por alguna se­
ñal causal, a no ser que los dos sucesos ocurran exactamente al mis­
mo tiempo. ¿No podríamos «definir» entonces la noción «x es
simultáneo con y» «x
por la noción no es causalmente conectable a
y»? De hecho, ¿no podríamos decir que lo que significa para un suce­
so ser simultáneo con otro significa para los sucesos no ser causal­
mente conectables entre sí?
Ahora examinemos lo que sucede en la teoría de la relatividad.
Dado que hay una velocidad máxima de propagación de una señal
causal, la velocidad de la luz en el vacío, habrá muchos sucesos que
son causalmente conectables entre sí (y, por consiguiente, claramente
no simultáneos entre sí), todos los cuales se encuentran en el domi­
nio de no ser causalmente conectable a un suceso dado. Parece,
pues, que en este caso no podríamos definir «x es simultáneo con y»
como «x no es causalmente conectable a y» y deberíamos usar algún
otro método como, por ejemplo, el elegido por Einstein, usando se­
ñales de luz reflejadas y relojes. De aquí hay solamente un paso a
Espacio, tiempo, movimiento 129

afirmar que como la simultaneidad no puede definirse causalmente


como «no siendo causalmente conectable», la simultaneidad no es
una relación real en la relatividad, sino una cuestión de mera conven­
ción o estipulación.
Para ver cuán problemática podría ser dicha afirmación, debe­
mos examinar algunos descubrimientos hechos por el matemático
A. Robb poco después del descubrimiento de la relatividad por Eins­
tein. Robb fue capaz de mostrar que hay una relación, definible usan­
do solamente la noción de conectabilidad causal, que es válida entre
sucesos en el espacio-tiempo de la relatividad especial si, y solo si,
esos sucesos son simultáneos de acuerdo a la definición de simulta­
neidad dada por Einstein. Así, «al mismo tiempo» es causalmente de­
finible, auncfue la relación causal que define la simultaneidad sea una
relación más compleja, no la simple noción intuitiva de no ser causal­
mente conectable utilizada por Leibniz. En realidad, Robb fue capaz
de ir mucho más lejos y mostrar que nociones tales como separación
espacial y separación temporal (relativas a un observador) pueden
también ser definidas en términos de la sola noción de conectabili­
dad causal. (A decir verdad, Robb utilizó la noción de «después» en
su definición, donde esto significaba «absolutamente después» en el
sentido relativista, pero su trabajo puede ser reconstruido utilizando
la noción temporal-simétrica de conectabilidad causal.)
¿Significa esto que la simultaneidad y las otras nociones métricas
de la relatividad son reales y aconvencionales porque son reducibles
a nociones causales? Una vez más, las cosas no son tan simples. Su­
pongamos que pasamos al contexto de la relatividad general, donde
son posibles una variedad de diferentes espacio-tiempos — no sólo el
espacio-tiempo de la relatividad especial. En algunos de estos m un­
dos, varios de los postulados acerca de la estructura de las relaciones
causales entre los sucesos que Robb utilizó, dejan de ser válidos. En
tales mundos, es evidente que las definiciones dadas por Robb de las
relaciones espacio-temporales métricas en términos de las relaciones
causales no se pueden satisfacer. Incluso si los postulados de Robb
se satisfacen, es posible que sus definiciones fallen. Hay espacio-tiem­
pos permitidos por la relatividad general en los que todos los postu­
lados de Robb sobre la conectabilidad causal se satisfacen, pero son
tales que si uno utilizase las definiciones de Robb para las cantidades
métricas (como la simultaneidad y la separación espacial y temporal),
se asignarían valores a estas cantidades que diferirían de los que se
130 Filosofía de la física

les asignan por la teoría de la relatividad general. Los valores asigna­


dos utilizando las definiciones de Robb diferirían de los valores que
uno obtendría utilizando, pongamos, cintas de medir, relojes, y seña­
les de luz reflejadas, al modo relativista habitual.
Parece que lo que en realidad está sucediendo aquí es lo siguien­
te: es verdad que, en el espacio-tiempo de la teoría de la relatividad
especial, varias nociones métricas coinciden con nociones que pue­
den ser definidas utilizando solamente la conectabilidad causal. Pero
parece mucho más dudoso afirmar que este hecho demuestra que las
nociones métricas espacio-temporales en ningún sentido, forma o ma­
nera se reducen a, o son definibles mediante, las nociones causales.
Un símil puede aclarar esto aun más. Imaginemos un m undo en el
que encontramos que (quizá por accidente, quizá como resultado de
una ley de la naturaleza) todas las cosas azules son cuadradas y todas
las cosas cuadradas son azules. Esto, por sí mismo, no implica que lo
azul se reduce a lo cuadrado, o que es definible en sus términos, o a
la inversa.
Sin embargo, parece que hay algo de cierto en la afirmación se­
gún la cual mientras el que los sucesos sean, o no, causalmente co-
nectables es un hecho fuerte de la naturaleza, la elección de qué
sucesos serán simultáneos unos con otros en la teoría de la relativi­
dad parece entrañar un elemento de arbitrariedad o convencionali-
dad. ¿Podemos lograr una mayor comprensión de las ideas subya­
centes?
Lo que tenemos hasta el momento es esto: en la física prerrelati-
vista, hay una asociación natural entre una noción causal (conectabili­
dad acausal mutua) y la noción espacio-temporal de simultaneidad.
Algunos se ven inducidos a defender que la relación real en el m un­
do es la relación causal, y que la simultaneidad es reducible a, o defi­
nible en términos de, la relación causal. Cuando pasamos a la teoría
especial de la relatividad, esta asociación natural de relaciones causa­
les y espacio-temporales se quiebra, llevando a algunos a afirmar que
la relatividad muestra cómo la simultaneidad es meramente conven­
cional o estipulativa. Los resultados de Robb muestran que no sola­
mente la simultaneidad, sino también todas las nociones espacio-tem­
porales métricas de la relatividad especial, pueden ser definidas en
términos causales. Esto induce a algunos a afirmar que son aconven-
cionales. Pero una reflexión ulterior muestra que las definiciones
causales de Robb no dejan de ser peculiares. Las asociaciones que
Espacio, tiempo, m ovim iento 131

utilizan no son tan naturales como las del tipo leibniziano y, en el


contexto relativista general, estas asociaciones generalmente pierden
validez. Los axiomas de Robb dejan normalmente de satisfacerse, y
aun cuando se satisfagan, las relaciones métricas, en la forma en que
Robb las define, difieren a menudo de las relaciones métricas están­
dar. ¿Qué podemos inferir de todo esto?

Topología y estructura causal


Antes de responder a esta cuestión, exploremos cómo en el contexto
de la relatividad general encontramos una serie muy similar de argu­
mentos; la serie, una vez más, trata de en qué medida puede darse
una definición causal a una relación espacio-temporal y de las su­
puestas consecuencias filosóficas de la existencia o inexistencia de ta­
les definiciones causales. Cuando se comenzó a estudiar la relativi­
dad general se observó que dos espacio-tiempos relativistas generales,
métricamente diferentes, podían tener la misma estructura causal.
Esto es, aunque las relaciones espacio-temporales métricas entre los
sucesos en los mundos tuviesen una estructura bastante diferente, la
estructura de las relaciones causales entre los sucesos podía ser la
misma. Así, toda esperanza de una definición causal de la métrica se
vio frustrada. Para determinar completamente la estructura métrica
de un espacio-tiempo, uno debe añadir algo a la estructura causal.
Esto podría ser una estructura métrica espacial determinada por cin­
tas de medir o una estructura métrica temporal determinada por re­
lojes ideales. Más tarde, se vio que la especificación conjunta de la
estructura causal y de las trayectorias recorridas por las partículas
materiales, ideales, libres (esto es, partículas sobre las que sólo actúa
la gravedad) determinaba completamente la estructura métrica. Pero
las relaciones causales por sí solas no lo hacían.
Ahora bien, la topología
de un espacio-tiempo constituye una es­
tructura mucho más débil que su métrica. Dos espacio-tiempos pue­
den ser topológicamente semejantes, es decir, semejantes en lo que
concierne a todas las cuestiones de continuidad en el espacio-tiempo
y, pese a ello, ser métricamente muy diferentes. Podemos imaginar­
nos intuitivamente las características topológicas de un espacio como
esas características preservadas bajo cualquier deformación del espa­
cio que conserve intactas las propiedades de continuidad. El espacio
132 Filosofía de la física

Espacio-tiempos causalmente patológicos.


F ig u r a 2.11. E n eí espacio-tiempo con bucles
causales cerrados — ilustrado en (a)— una señal causal puede dejar un suceso oy
avanzar hacia el futuro. Siguiendo la señal, siempre hacia el «futuro local», trazamos
una trayectoria que regresa al suceso causante o.A un cuando no posea un tal bucle
cerrado, un espacio-tiempo puede ser bastante «patológico» desde un punto de vista
o
causal. Esto se ilustra en (b). Aunque ninguna señal desde puede «regresar» a mis­o
mamente, todavía puede suceder, para cada región espacio-temporal en torno a con o
independencia de lo pequeña que sea, que una señal que parte de o y abandona una
región,e, pueda en algún momento regresar a ésta y así retornar «arbitrariamente cer­
ca» del suceso causante o.

puede ser deformado de cualquier manera y su topología seguirá


siendo la misma siempre que ningún «corte» separe puntos situados
originalmente «uno al lado del otro» y ningún «pegado» una puntos
previamente separados. ¿Podrían las primitivas estructuras de conti­
nuidad del espacio-tiempo, aquéllas descritas por la topología, ser
quizá causalmente definibles, aun cuando la estructura métrica total
no lo fuera? La respuesta es fascinante, si bien algo compleja. Si
tomamos como nuestra noción causal fundamental «el suceso es x
causalmente conectable al suceso y»,
resulta que la topología puede a
veces definirse mediante la conectabilidad causal, pero sólo en espa-
cio-tiempos «con un buen comportamiento causal». En espacio-tiem­
pos «causalmente patológicos» no es así. ¿Qué es un espacio-tiempo
causalmente patológico? Básicamente, es cualquier espacio-tiempo
donde hay una curva causal cerrada, o donde un cambio infinitesi­
mal en el espacio-tiempo podría generar una curva semejante. Dichas
trayectorias constituyen secuencias de sucesos causalmente conecta-
Espacio, tiempo, movimiento 133

t0 = t0 +At = t0 + 2At...

F ig u r a 2 .12. Un universo «cerrado en el tiempo».


Toma el espacio-tiempo ordinario de
Minkowski 3e la relatividad especial y «secciónalo» por dos lineas de simultaneidad
en relación a algún observador, una de dichas líneas en el tiempo t0
y la otra en el
tiempo t0+At. t
E n el diagrama representa la dirección del tiempo y x
la del espacio.
Entonces «identifica» los dos bordes del trozo seccionado del espacio-tiempo de
Minkowski y forma así un cilindro con esa pieza. E l resultado es un espacio-tjempo
«cerrado en el tiempo» pero extendiéndose al infinito espacial. Naturalmente, dicho
espacio-tiempo es sumamente artificial. N adie considera que sea un modelo posible
del espacio-tiempo real del mundo. Pero la consistencia que presenta con las ecuacio­
nes definidoras de la teoría del espacio-tiempo sugiere que modelos más realistas del
universo podrían muy bien contener bucles causales cerrados, como sucede en este
espacio-tiempo patológico.

dos que «se rizan en el tiempo» para regresar, o casi, al suceso inicial,
del que se había partido. Solamente en mundos con un grado especí­
fico de buen comportamiento causal puede ser suficiente la conecta-
bilidad causal para especificar la topología. Esto se pone de manifies­
to de forma muy drástica en ciertos espacio-tiempos topológicos con
una topología no trivial (algunos sucesos están «cerca» de otros suce­
sos y algunos no lo están), pero donde todo suceso es causalmente
conectable con todo otro suceso. (Véase las figuras 2.11 y 2.12.)
Así pues, la situación no es muy diferente de la que examinamos
anteriormente. Solamente en ciertos casos, la noción causal indicada
será adecuada para definir las relaciones espacio-temporales desea­
das. En otros casos, la definición no puede ser encontrada. Pero la si­
tuación es todavía más complicada. Hemos venido tomando como
nuestra noción causal — a la que las nociones espacio-temporales han
de reducirse— la relación que un suceso tiene con otro cuando son
causalmente conectables. Una noción causal más rica es la de una
134 Filosofía de la tísica

trayectoria en el espacio-tiempo que es una trayectoria causal conti­


nua. Si imaginamos una partícula puntual (o partícula de luz) viajan­
do desde un punto del espacio-tiempo a otro, la trayectoria seguida
es una de dichas trayectorias causales continuas. El resultado es im ­
portante y puede ser establecido como sigue: Si dos espacio-tiempos
son exactamente iguales en sus estructuras de trayectorias causales
continuas, son exactamente iguales en su topología, al menos cuando
sólo se consideran los tipos estándar de topologías (las denominadas
topologías de variedades). La noción de conectabilidad causal dice
solamente que dos sucesos son conectables por una u otra trayecto­
ria causal continua. Esta nueva noción causal requiere especificar cla­
ramente qué fragmentos de trayectoria en el espacio-tiempo son ver­
daderamente las trayectorias continuas causales. Lo que el resultado
dice es que todos los hechos topológicos sobre el espacio-tiempo es­
tán completamente determinados una vez que se ha determinado
qué colecciones de sucesos en el espacio-tiempo constituyen trayec­
torias continuas de propagación causal o, mejor dicho, que esto es
cierto cuando sólo se consideran las topologías estándar. A quí tene­
mos, pues, un resultado positivo en la relatividad general sobre la de-
finibilidad de al menos la topología por hechos causales solamente.

¿Son las características espacio-temporales reducibles


a características causales?
Pero, ¿cuál es la relevancia de todos estos resultados para nuestra
idea inicial de que los hechos causales que relacionan unos sucesos
con otros son los hechos reales o incuestionables sobre la estructura
del mundo? Recordemos que lo que el teórico causal quería defen­
der era que en la medida en que los hechos del espacio-tiempo fue­
ran hechos incuestionables, serían reducibles a hechos causales, y en
la medida ?n que los hechos del espacio-tiempo no fueran reducibles
en esta forma, no serían de ningún modo hechos reales, sino mera­
mente el resultado de una elección o estipulación convencional por
nuestra parte.
Las cuestiones aquí son controvertidas, pero permitidme esbozar
una respuesta a estas afirmaciones. Una forma de abordar cuál es la
motivación intuitiva tras las teorías causales de las características del
espacio-tiempo se centra en la cuestión epistemológica de cómo lie-
Espacio, tiempo, movim iento 135

gamos a conocer el espacio-tiempo del mundo. Aquí, como discuti­


mos anteriormente, se arguye algunas veces que son aquellas caracte­
rísticas que nos son accesibles por algún proceso directo de inspec­
ción las que debemos tomar como hechos verdaderos sobre el mun­
do espacio-temporal. Otras características, atribuibles al espacio-tiem-
po sólo eligiendo algunas hipótesis no testables directamente sobre la
estructura del espacio-tiempo, son consideradas bajo esta concepción
como una cuestión de convención, ya que ningún hecho observacio­
nal, directamente inspeccionable, selecciona la correcta hipótesis por
nosotros. Tanto en la anterior versión leibniziana, como en las versio­
nes relativistas modernas de las teorías causales del espacio-tiempo,
se supone que la influencia causal se propaga a lo largo de trayecto­
rias continuas en el espacio-tiempo, que pueden ser recorridas por al­
guna cosa material como una partícula. En Leibniz, por supuesto,
cualquier trayectoria espacio-temporal dirigida al futuro puede ser re­
corrida en esta forma; en las versiones relativistas, sin embargo, sólo
aquellas trayectorias que representan una velocidad menor o igual a
la de la luz pueden ser recorridas así. Pero si una partícula puede re­
correr dicha trayectoria, también puede hacerlo, en principio, un ob­
servador.
Alguien podría, pues, argumentar como sigue: Las características
del espacio-tiempo determinables en un solo punto del espacio-tiem­
po, como la simultaneidad de sucesos en un mismo lugar, son deter­
minables por observación directa por nosotros. Por consiguiente,
éstas constituyen hechos incuestionables sobre el espacio-tiempo.
También nos son accesibles observacionalmente, en principio, he­
chos sobre la continuidad de las trayectorias que son causales, esto
es, que son tales que un observador puede moverse a lo largo de la
trayectoria y comprobar directamente sus propiedades de continui­
dad. Es por esto por lo que en la relatividad especial deberíamos
considerar la simultaneidad en un punto como un hecho incuestiona­
ble, pero la simultaneidad de sucesos separados y otras características
métricas de tipo no puntual como cuestiones de convención. De nue­
vo, la continuidad a lo largo de trayectorias causales debería ser con­
siderada como una cuestión de hechos incuestionables. Cualquier
otro hecho topológico debe, bien reducirse a estos hechos, bien ser
considerado como convencional. Es por ello que es importante mos­
trar que la continuidad de las trayectorias causales determina com­
pletamente la topología en la relatividad general. Sólo entonces pode­
136 Filosofía de la física

mos estar seguros de que los hechos topológicos son todos (al estar
determinados enteramente por hechos topológicos directamente ac­
cesibles) hechos incuestionables.
Si las teorías causales de las características espacio-temporales se
interpretan en esta forma, vemos que el llamar teorías causales a
estas teorías puede inducir a error. Para Robb, la conectabilidad cau­
sal (en la forma de la relación «después») era la única relación legíti­
ma sobre la que cimentar las características métricas de un espacio-
tiempo relativista especial. Para los teóricos causales de la topología
del espacio-tiempo, la continuidad a lo largo de trayectorias causales
es la única característica legítima del espacio-tiempo sobre la que ci­
mentar todos los hechos topológicos. Pero estas características causa­
les fundamentales son privilegiadas en esta forma no por ser hechos
sobre relaciones causales, es decir, sobre cómo los sucesos en el
mundo determinan, producen o provocan otros sucesos en el m un­
do. Antes bien, son privilegiadas porque son las características del es­
pacio-tiempo que podemos determinar como tales sin apoyarnos en
hipótesis que, al no poder ser comprobadas por ningún procedimien­
to de inspección directa, están afectadas de una arbitrariedad que
sólo puede resolverse tomando una decisión arbitraria o conven­
cional.
Desde esta perspectiva, no son los hechos causales los que son
fundamentales, sino un subconjunto limitado de los hechos espacio-
temporales. El orden espacio-temporal no puede ser reducido al or­
den causal o definido por medio del orden causal. En lugar de ello,
toda la estructura espacio-temporal ha de reducirse a, o definirse por
medio de, el subconjunto limitado de hechos espacio-temporales que
están verdaderamente abiertos a nuestro acceso epistémico. De he­
cho, en este punto, es probable que uno piense en las tentativas de
analizar la noción de causalidad que nos son familiares de la filosofía.
Habitualmente, se piensa en la causalidad como dotada de un aspec­
to espacio-temporal. Hume, por ejemplo, al intentar decir a qué equi­
valía la causalidad, insistió en que la continuidad espacio-temporal
era un elemento necesario para definir el proceso causal. Causa y
efecto tienen que ser, decía, «contiguos en el espacio y en el tiempo».
Naturalmente, debe haber algo más que la relación causal. Debe ha­
ber lo que sea que constituye la determinación del efecto por la cau­
sa. Pero, desde esta perspectiva, las características espacio-tempora­
les, al menos algunas de ellas, son primitivas e irreducibles a la
Espacio, tiem po, m ovimiento 137

causalidad propiamente dicha. En su lugar, la causalidad tiene como


parte de su análisis una relación espacio-temporal fundamental entre
sucesos.
El problema de las interconexiones entre causalidad y caracterís­
ticas espacio-temporales del m undo difícilmente puede resolverse
mediante las breves observaciones realizadas más arriba. Nuestra
concepción del mundo como existiendo en el espacio y el tiempo y
nuestra concepción del mundo como gobernado por un proceso de
sucesos determinando otros sucesos, es decir, por causalidad, son dos
de las conceptualizaciones más profundas y amplias del mundo que
poseemos. Cómo se relacionan estos dos aspectos fundamentales del
mundo, y cuál es la dependencia entre uno y otro para su significado
e inteligibilidad, son temas actuales para una exploración filosófica
profunda.
En el capítulo 3 tocaremos una cuestión relacionada con las que
acabamos de discutir. Veremos cómo una característica especial del
tiempo, su asimetría, en el sentido de que el pasado y el futuro pare­
cen radicalmente diferentes uno del otro de muchas maneras, es rela­
cionada por muchos científicos y filósofos con otra asimetría funda­
mental del mundo, la tendencia de los sistemas físicos a pasar de
estados ordenados a estados desordenados. La concepción de que el
desorden creciente del mundo es esencial a nuestras ideas sobre la
asimetría del tiempo y de los sistemas en el tiempo se coloca también
algunas veces, equivocadamente, en la categoría general de «teorías
causales de la estructura espacio-temporal». En realidad, la teoría en
cuestión no es en absoluto una teoría causal; es una afirmación adi­
cional en el sentido de que una estructura espacio-temporal puede
ser reducida a una clase diferente de estructura, afirmación que exa­
minaremos detenidamente en el capítulo 3.

Resumen
Hemos visto ahora que el problema del tipo de «ser» que se ha de
atribuir al espacio y al tiempo tiene una rica historia y un futuro pro­
metedor. Las cuestiones metafísicas fundamentales mismamente tie­
nen una estructura compleja y de largo desarrollo. El que hayamos
de concebir el espacio, por ejemplo, como una sustancia que existe
separada de los contenidos materiales del mundo, como un conjunto
138 Filosofía de la física

de relaciones entre los objetos materiales del mundo, o como algo


completamente distinto, sigue siendo una cuestión abierta. También
hemos visto que la cuestión de si la espacialidad o la temporalidad
son reducibles de algún modo a algún otro aspecto del mundo, pon­
gamos, a un aspecto causal, está asimismo por responder. Más impor­
tóte aún, hemos visto que cada avance científico revolucionario en
nuestra comprensión del espacio y el tiempo lleva aparejado un nue­
vo contexto en el que los debates filosóficos tienen lugar. Aunque los
l°§ros científicos por sí mismos no pueden resolver enteramente las
cuestiones metafísicas, cualquier tratamiento filosófico adecuado de
la naturaleza del espacio y el tiempo debe hacer plena justicia a estas
realizaciones científicas. *

Lecturas adicionales

Algunos libros que cubren los tópicos tratados en este capítulo con
mayor detalle y profundidad son Reichenbach (1956), el cual es muy
'Aportante históricamente, y Grünbaum (1973), el cual presenta una
cobertura enciclopédica. Van Fraassen (1970) es muy útil al presentar
el trasfondo histórico de muchas de las cuestiones importantes. Sklar
(1574) es una introducción sistemática a las cuestiones principales, y
Sklar (1985) se ocupa más ampliamente de algunos de los problemas.
Ffiedman (1983) introduce al lector al vocabulario técnico de la física
matemática moderna del espacio y el tiempo y ahonda en profundi­
dad, asimismo, en la controversia filosófica.
Smart (1964) contiene importantes y breves extractos de los prin­
cipales textos históricos. Jammer (1954) es un breve estudio histórico
de concepciones filosóficas sobre el espacio. Alexander (1956) contie­
ne el debate original entre Leibniz y el newtoniano Clarke sobre la
naturaleza del espacio y el tiempo. Barbour (1989) es un estudio con­
ciso de la historia de las ideas sobre el espacio, el tiempo y el movi­
miento desde los griegos antiguos, pasando por Galileo, Huyghens,
Descartes, Leibniz y Newton. La teoría del espacio por Kant puede
hallarse en la primera parte de Kant (1950) y en la Estética Trascen­
dental de Kant (1929).
Las introducciones a la teoría especial de la relatividad y su espa-
cio-tiempo abundan. Taylor y Wheeler (1963) es excelente, al igual
que Bohm (1989). Moller (1952), Synge (1956), y Rindler (1977) son
Espacio, tiempo, movim iento 159

todos de utilidad. Toretti (1983) y Lucas y Hodgson (1990) tienen


una orientación filosófica e histórica, al igual que Anderson (1967).
También hay numerosas introducciones a la teoría general de la
relatividad. Geroch (1978) aporta lo fundamental. Meller (1952),
Rindler (1977), Anderson (1967), y W ald (1984) son todos clásicos en
la materia. Misner, Thorne y Wheeler (1973) es enciclopédico. Toretti
(1983) es histórico y filosófico. Einstein et al.
(1923) contiene la tra­
ducción al inglés de los artículos originales en la materia.
Para la historia de la epistemología de la geometría, véase Toretti
(1978). Los artículos originales de Poincaré se encuentran en Poinca­
ré (1952). Eddington (1920) presenta una temprana y estimulante dis­
cusión. Reichenbach (1956) es un clásico del convencionalismo. Dis­
cusiones generales recientes pueden encontrarse en Sklar (1974) y
Friedman (1983).
Un útil estudio de cuestiones filosóficas sobre el tiempo se en­
cuentra en Newton-Smith (1980). Una buena introducción a las cues­
tiones del tiempo y sus estadios es Mellor (1981). Para una discusión
de los estadios del tiempo en el contexto de la relatividad especial
véase Rietdijk (1966), Putnam (1967), el capítulo 11 de Sklar (1985), y
Stein (1991).
La cuestión del sustantivismo versus relacionismo en las teorías
del espacio-tiempo se examina exhaustivamente en Earman (1989).
La historia de este tema es tratada con gran detalle en Barbour
(1989). Friedman (1983) y Nerlich (1976) ofrecen argumentos a favor
del sustantivismo. Una discusión general de las cuestiones se presen­
ta en el capítulo 3 de Sklar (1974). La «geometrodinámica» se discute
ampliamente desde una perspectiva filosófica en Graves (1971).
Una discusión completa del determinismo se encuentra en Ear­
man (1986). El papel del determinismo en el argumento del «aguje­
ro» en la relatividad general se trata en Earman (1989). La estructura
de la causalidad en la relatividad general es estudiada (desde un pun­
to de vista muy avanzado) en Hawking y Ellis (1973). Algunas refle­
xiones filosóficas sobre teorías causales del espacio-tiempo se en­
cuentran en van Fraassen (1970) y en los capítulos 9 y 10 de Sklar
(1985). Respecto a la teoría causal del espacio-tiempo de Robb, véase
Winnie (1977) para una exposición y el capítulo 3 de Sklar (1985)
para una crítica.
Capítulo 3
LA INTRODUCCIÓN DE LA PROBABILIDAD
EN LA FÍSICA

Los filósofos acerca de la probabilidad y la explicación estadística

Probabilidad: la teoría formal


Es muy ventajoso para nosotros ser capaces de predecir con confian­
za lo que sucederá en el futuro. En ciertos casos, muy excepcionales,
podemos predecir que el futuro tendrá un, y solo un, resultado, pon­
gamos, cuando predecimos la posición futura de uno de los planetas
a partir de su estado actual y de las leyes dinámicas del movimiento.
En muchos otros casos, sólo contamos con una idea muy vaga de lo
que el futuro deparará. Hay un conjunto especial de casos, sin em­
bargo, donde no podemos decir con seguridad cuál entre un número
de sucesos posibles ocurrirá, pero donde podemos tener un conoci­
miento fiable de la proporción en la que ocurrirán los sucesos en la
repetición de un gran número de pruebas de tipo similar. El tirador
de dados no sabe lo que obtendrá en la siguiente tirada del dado,
pero sabe que en una larga serie de tiradas aparecerá un siete sobre
el dado aproximadamente un sexto del total de las veces. La explora­
ción de dichas situaciones, comenzando con la típica situación de
azar, condujo al desarrollo de la teoría de la probabilidad. La proba­
bilidad de un suceso fue considerada como algo estrechamente rela­
cionado con la frecuencia con que se esperaría que dicho suceso ocu­
141
N2 Filosofía de la física

rriera en la repetición de un gran número de pruebas idénticas de un


tipo determinado.
Se ha construido una teoría matemática formal de la probabili­
dad de una simplicidad y elegancia sin par. Sorprendentemente, no
se formalizó hasta los años treinta del siglo XX, a pesar del hecho de
que las ideas básicas se conocían desde hacía cientos de años. Sea da­
da una colección de sucesos básicos como el número que aparece en
la cara de un dado. Números del cero al uno son asignados a las sub-
colecciones de la colección de sucesos básicos. Así, asignamos a la
colección formada simplemente por «aparece el número uno» el nú­
mero — esto es, la probabilidad de— un sexto. A la colección carac­
terizada por «aparece un número par» le asignamos el número un
medio. Al resultado vacío (ninguno de los posibles sucesos ocurre) se
le da la probabilidad cero, y al resultado trivial (alguno de los posi­
bles sucesos ocurre) la probabilidad uno. El postulado más importan­
te es el de aditividad. Supongamos que si un suceso está en la co­
lección A, no puede estar en la colección B, y viceversa. La
probabilidad asignada al resultado «A o B» se considera entonces
que es la suma de las probabilidades asignadas a A y B.a Así, si uno
no puede ser ciudadano de Nueva York y de California al mismo
tiempo, la probabilidad de que uno sea ciudadano de uno de los dos
estados es la suma de las probabilidades de que sea neoyorquino y
de que sea californiano.
En circunstancias ordinarias, nos es bien conocida la situación
donde el número de posibles sucesos básicos es finito: el dado con
seis caras, la ruleta con treinta y siete ranuras, etcétera. Sin embargo,
el matemático y, como veremos, el físico deben tratar con casos don­
de el número de sucesos básicos es infinito. Por ejemplo, un suceso
básico podría ser una partícula puntual ocupando una cualquiera del
número infinito de posiciones posibles en una caja. Habitualmente,
se adopta una generalización del postulado de aditividad. Ésta es de­
nominada aditividad contable. Se trata de una suposición natural, si
bien tiene algunas consecuencias peculiares. Una de ellas es que la
probabilidad cero ya no se asigna solamente al conjunto vacío obte­
nido cuando no se da ningún resultado básico, sino que también se
asigna a conjuntos no vacíos. Por ejemplo, si uno anda ocupado en la
tarea de elegir un número entre todos los números reales entre cero
y uno, la aditividad contable implica que la probabilidad de obtener
un número que sea racional, esto es, que pueda ser representado por
La introducción de la probabilidad en la física 141

una fracción de dos enteros, es cero. Pero, claro está, hay un número
infinito de tales números racionales en la colección. La idea es que
hay «muchos más» números reales no fraccionarios que fraccionarios.
En estos contextos, pues, el suceso imposible tiene probabilidad
cero, pero no todos los sucesos con probabilidad cero son imposi­
bles. Y el tener probabilidad uno no significa que un suceso deba ne­
cesariamente ocurrir.
Una noción importante en la teoría de la probabilidad es la de
probabilidad condicionada. Supongamos que sabemos que se ha ob­
tenido un siete en el lanzamiento de dos dados. ¿Cuál es la probabili­
dad, dado dicho suceso, de que uno de los dados muestre un uno en
su cara? Veamos, el siete puede aparecer en seis formas, y en sólo
dos de los casos se tendrá un uno en uno de los dados. Así pues, la
probabilidad es un tercio. En suma, la frecuencia esperada de un tipo
de suceso, B,una vez que ha ocurrido un tipo de suceso, A,
es la
probabilidad de Bcondicionada a A
o la probabilidad de B
bajo la
condición A. Si la probabilidad de B
bajo la condición A
es simple­
mente la probabilidad no condicionada de B
(y la probabilidad de A
bajo la condición B
simplemente la probabilidad de A), se dice que
AyB son sucesos probabilísticamente independientes entre sí. Dos
lanzamientos sucesivos de una moneda se toman habitualmente
como independientes en este sentido. La probabilidad de obtener
una cara en el segundo lanzamiento sigue siendo un medio, siendo el
resultado del primer lanzamiento irrelevante para esta probabilidad.
Sin embargo, ser californiano y ser del oeste no son evidentemente
independientes. La probabilidad de que alguien provenga de Califor­
nia suponiendo que proviene del oeste es obviamente mayor que la
probabilidad de que sea californiano suponiendo sólo que vive en al­
gún lugar de Estados Unidos.
A partir de los postulados básicos de la teoría de la probabilidad
se puede probar un grupo de importantes teoremas denominados Le­
yes de los Grandes Números. ¿Esperamos que aparezcan caras la m i­
tad de las veces en un número pequeño de lanzamientos de una mo­
neda? Si el número de lanzamientos es impar, no podrá ser. Aun
cuando el número de lanzamientos sea par, esperamos que el suceso
real se desvíe de la proporción exacta de un medio en cualquier serie
dada de lanzamientos. A medida que aumente el número de lanza­
mientos, sin embargo, esperamos que haya algún tipo de convergen­
cia de la frecuencia de caras observadas a la probabilidad postulada
Filosofía de la física

ili- im medio. Lo que las Leyes de los Grandes Números nos dicen es
que la probabilidad de dicha convergencia (entendida en varios senti­
dos, pues puede ser de diferentes intensidades) tiende a uno («certe­
za probabilística») cuando el número de pruebas tiende a infinito.
Esto es válido si las pruebas son probabilísticamente independientes
entre sí. Así pues, si bien no podríamos ciertamente probar que en
cualquier serie de pruebas tendiendo al infinito, la frecuencia conver­
gería a la probabilidad, podemos probar, dada la independencia de
las pruebas, que un resultado semejante es cierto probabilística­
mente.

Interpretaciones objetivistas de la probabilidad


Una cosa es tener un conjunto de axiomas formales de probabilidad.
Hay algunas variaciones en éstos, pero se comprenden bien. Otra
muy diferente es lograr un acuerdo sobre lo que la probabilidad es
sencillamente. ¿De qué estamos hablando cuando hablamos de pro­
babilidades? Dada la estrecha relación entre frecuencias de sucesos
en el m undo y atribuciones de probabilidad, ¿no sería más sencillo
identificar las probabilidades con las frecuencias relativas reales de
los sucesos? Con el fin de abarcar los casos en los que el número de
sucesos básicos es infinito en lugar de finito, podríamos querer gene­
ralizar y hablar de proporciones reales en lugar de frecuencias reales,
pero la idea básica sería la misma. Esta sencilla concepción, sin em­
bargo, tropieza con la objeción familiar de que en cualquier clase real
de experimentos no esperamos que las frecuencias o proporciones
reales sean las probabilidades exactas. Esperamos un tipo de «con­
centración» de los sucesos reales en torno a los valores de la probabi­
lidad, pero no su identidad.
Para evitar esto, se sugiere a menudo que deberíamos identificar
las probabilidades con las frecuencias o proporciones relevantes «a la
larga», esto es, cuando el número de pruebas tiende a infinito. Un
problema al respecto es, por supuesto, que el número real de prue­
bas es siempre finito. ¿Qué es esta peculiar «serie de pruebas ten­
diendo a infinito» idealizada en la que han de determinarse las fre­
cuencias? ¿Se supone que es algo real o, más bien, algún tipo de
idealización? Y si es esto último, ¿qué ha sucedido con la concepción
original de las probabilidades como frecuencias o proporciones rea­
La introducción de la probabilidad en la física 145

les? Otro problema con esta concepción es que, incluso ¡i la larga, el


nexo entre probabilidades y frecuencias es solamente un nexo proba-
bilístico. Las Leyes de los Grandes Números son válidas sólo cuando
las pruebas son independientes entre sí, y esto es una noción proba­
bilística. Peor aún, la identidad entre frecuencia y probabilidad, in­
cluso a la larga, sólo se asegura con «probabilidad uno» y, como he­
mos indicado, esto no significa que, en cualquier serie infinita de
ensayos, el límite de la frecuencia relativa y la probabilidad deban
coincidir.
A menudo se sugiere una conexión más laxa entre probabilida­
des y frecuencias o proporciones reales. Tomad la «probabilidad»
como un término no definido y las probabilidades como una caracte­
rística primitiva atribuida a los sistemas físicos. De qué característica
se trata viene determinado por el papel que la probabilidad juega en
nuestro esquematismo para predecir, controlar y explicar los sucesos.
Contamos, por ejemplo, con reglas «ascendentes» que nos dicen có­
mo inferir de las frecuencias y proporciones observadas las probabili­
dades asignadas, y de reglas «descendentes» que nos dicen, una vez
asignada una probabilidad a un fenómeno, qué tipos de frecuencias y
proporciones esperar en pruebas finitas. Así pues, en lugar de identi­
ficar la probabilidad con alguna proporción o frecuencia real, quizá
deberíamos considerar que dichas frecuencias y proporciones reales
especifican lo que la probabilidad es por medio solamente de su co­
nexión con las probabilidades a través de estas reglas ascendentes y
descendentes de inferencia, reglas que conectan las frecuencias y pro­
porciones reales a las probabilidades asignadas.
Otras sugerencias contemplan el examinar todo el esquema de
atribuciones estadísticas y legales que hacemos al mundo. Contamos
con una amplia y profunda estructura jerárquica de generalizaciones,
algunas legales y sin excepción, otras estadísticas y basadas en atribu­
ciones de probabilidad. Todas estas generalizaciones se refieren al
orden de las conexiones entre los fenómenos en el mundo. Q uizá
deberíamos figurarnos las probabilidades como esas atribuciones
idealizadas de frecuencia y proporción que aparecen en los postula­
dos que juegan un papel fundamental en esta estructura de generali­
zaciones. Sería entonces un error concebir la probabilidad como una
frecuencia en un sentido ingenuo: la probabilidad es un tipo de pro­
porción simple idealizada que se considera representativa de la es­
tructura general del mundo al nivel de las generalizaciones funda­
146 Filosofía de la física

mentales. Pueden proponerse varios esquemas diferentes para inten­


tar que esta noción de «proporción idealizada» sea menos vaga.
El objetivo de todas estas interpretaciones es asignar una proba­
bilidad a un suceso en una serie de pruebas, ya sea la frecuencia o
proporción de ese suceso, o alguna proyección o idealización de la
misma. Otra interpretación objetivista de la probabilidad examina,
antes bien, el proceso por el que se generarían las frecuencias requeri­
das. La probabilidad, según esta concepción, es una característica del
objeto, o bien del proceso que involucra un objeto, por la que un su­
ceso puede o no producirse. Así como una ventana puede ser frágil
aunque no se haya roto, así, una moneda lanzada tiene, bajo esta con­
cepción, una disposición o tendencia a producir caras o cruces, aun
cuando esta tendencia no se actualice en ciertos casos. El describir la
probabilidad de obtener caras en el'lanzamiento de una m o n jía
como un medio es atribuir al sistema o situación de lanzamiento una
«propensión» a producir caras la mitad de las veces que se lleva a ca­
bo un gran número de pruebas. Así pues, la probabilidad es, bajo
esta concepción, el atributo de un solo lanzamiento, la magnitud de
su disposición a producir un suceso de un tipo específico.
Como veremos más tarde en este capítulo y en el capítulo 4, de­
terminar en qué medida la probabilidad es inherente a un solo suce­
so, en lugar de ser una medición meramente de una clase de resulta­
dos sobre una clase de sucesos, requerirá algo más que cuestiones
puramente filosóficas. Por tales entiendo cuestiones del tipo de si la
concepción disposicional presupone un soporte frecuentista y si esa
concepción puede resolver las dificultades encontradas en las con­
cepciones anteriores. También surgirán cuestiones de física. Pues la
cuestión de si las proporciones que observamos en el mundo son in­
herentes en un sentido irreducible a sucesos simples, está íntimamen­
te relacionada a la cuestión de si hay condiciones suficientes en cada
suceso para determinar completamente que sólo uno de los posibles
sucesos efectivamente ocurrirá. ¿Pueden darse casos en los que que­
de una multiplicidad de resultados, aun cuando se hayan especifica­
do todas las condiciones (conocidas, desconocidas, o incluso incog­
noscibles) que gobiernan el suceso? Ésta es una cuestión importante
en mecánica cuántica, como veremos, donde la cuestión de los pará­
metros deterministas «ocultos» es importante.
Hay otra área de problemas que debe ser explorada por todo
aquel que pretenda entender la probabilidad como una característica
La introducción de la probabilidad en la física N7

objetiva del mundo. Se trata del problema de la aleatoriedad. Supon­


gamos una serie de lanzamientos de moneda como la siguiente:
C,X,C,X,C,X,..., etc. ¿Deberíamos decir que en dicha serie la probabi­
lidad de obtener cara en un lanzamiento dado es un medio? Ésta es,
en definitiva, la frecuencia límite con que ocurren las caras. Sin em­
bargo, la ordenación de la serie, una ordenación que nos permite de­
cir, dado el resultado de nuestro último lanzamiento, si ocurrirá cara
o cruz en el lanzamiento siguiente, lleva a muchos a afirmar que el
considerar la probabilidad de obtener cara en un lanzamiento dado
como un medio induciría a error. Si se ha de asignar alguna probabi­
lidad, ¿no deberíamos asignar al suceso obtener cara la probabilidad
uno en los lanzamientos impares y la probabilidad cero en los lanza­
mientos pares? Sólo en una serie aleatoria
, dicen, la probabilidad
¡guala a la frecuencia relativa límite. Pero, ¿qué es exactamente una
serie aleatoria?
El estudio de la aleatoriedad desde el punto de vista objetivista
ha conducido a resultados interesantes, cuando no absolutamente
concluyentes. Investigadores como L. von Mises y A. Church han in­
tentado definir la aleatoriedad como una propiedad que se satisface
cuando las frecuencias de los sucesos en la serie son las mismas en
cualquier subserie derivada de la original por cualquier proceso «me­
cánico». Así pues, la serie de más arriba no es aleatoria, pues la sub­
serie de lanzamientos impares puede ser seleccionada mecánicamen­
te por un ordenador automático convenientemente programado. Y la
frecuencia de caras en esa serie es uno, no un medio. El concepto de
una subserie seleccionable mecánicamente puede hacerse matemáti­
camente preciso. Sin embargo, hay series que son aleatorias en este
sentido pero que son, intuitivamente, no aleatorias en el sentido de
que pueden adoptarse algunas estrategias de juego contra ellas que
son «sucias».
Una propuesta diferente para dar una explicación de la aleatorie­
dad objetiva descansa en la intuición de que «casi todas» las series
deberían ser aleatorias. Las series ordenadas deberían ser escasas en
la colección de todas las series, una noción que podríamos formalizar
exigiendo que una serie sea aleatoria «con probabilidad uno». Así
pues, uno busca definiciones de no aleatoriedad que seleccionarán
de entre todas las series una colección con una probabilidad de ta­
maño cero. El principal problema que surge con las definiciones
cuando se desarrolla esta idea es que se pierde su estrecho vínculo
Filosofía de la física

( mi la noción intuitiva de aleatoriedad de la que uno partió. Hay


todavía otra definición de aleatoriedad que imagina un efectivo pro­
cedimiento «universal» para probar la no aleatoriedad y declara a
una serie aleatoria si supera esta prueba.
Una cuarta alternativa adopta una estrategia sumamente intuitiva.
Consideremos una computadora programada para producir como sa­
lida la serie de resultados experimentales que ocurren efectivamente.
¿Cómo de largo será el programa más corto que haga este trabajo?
Obviamente un programa siempre funcionará, la instrucción que di­
ce sencillamente «Imprime ...», donde la «...» es la serie en cuestión.
Pero las series «no aleatorias» poseen, intuitivamente, programas más
cortos. Por ejemplo, la serie C,X,C,X, ...
puede venir dada sencilla­
mente por «Imprime C y X alternativamente». Así, una serie es tanto
menos aleatoria cuanto más corto pueda ser su programa generador.
Todo esto puede hacerse formalmente decente. Pero apenas se consi­
gue lo que el objetivista quería, pues resulta que una definición satis­
factoria parece dar por sentado nuevamente que la serie se ha presu­
puesto como generada por un proceso probabilístico. Esto hace
difícil usar una noción de aleatoriedad objetiva definida en una for­
ma que, junto a la noción de frecuencia relativa límite, sirva para de­
cir lo que la probabilidad es ante todo.

Interpretaciones subjetivistas de la probabilidad


Un entendimiento de la naturaleza de la probabilidad radicalmente
diferente al de las explicaciones objetivistas que hemos venido exa­
minando hasta el momento no se centra en lo que hay en el mundo
sino, en su lugar, en lo que hay en nosotros. Nosotros utilizamos la
probabilidad como guía para actuar frente al riesgo, apostando por
un resultado dado sólo si consideramos que la probabilidad de acer­
tar es lo bastante alta como para superar nuestras dudas de que el re­
sultado se dé efectivamente. Quizá deberíamos concebir entonces la
probabilidad como una medida de nuestro
grado de confianza en la
ocurrencia de un suceso, una medida de la «creencia parcial» por
nuestra parte, si se quiere.
Supongamos que las probabilidades son medidas de la creencia
parcial, en el sentido de que son indicadoras de las mínimas diferen­
cias en razón de las que apostaremos por un resultado. ¿Por qué en­
La introducción de la probabilidad en la física 149

tonces habrían nuestras probabilidades de obedecer las leyes están­


dar de la teoría de la probabilidad? Q ué deberían obedecer estas le­
yes es un resultado bastante trivial desde el punto de vista frecuentis-
ta, pero el subjetivista necesita un argumento por el que deberían.
Algunos argumentos están diseñados para mostrar que sólo en el
caso de que nuestras probabilidades obedezcan las reglas estándar
nos veremos libres de caer en una situación donde un corredor de
apuestas nos ofrece apuestas que aceptamos, pese a garantizar una
pérdida por nuestra parte con independencia de cómo resulten las
cosas. Otro enfoque intenta mostrar que si las preferencias de alguien
por «billetes de lotería» (obtienes siA x
ocurre yB x
si no ocurre),
como revela la elección de un billete antes que otro, son racionales
en el sentido de que si el billete 1 se prefiere al billete 2 y el 2 al 3,
entonces el uno se prefiere al 3, siempre habrá una forma de repre­
sentar nuestras creencias parciales en los resultados que obedecerá
entonces los axiomas estándar de probabilidad.
Por consiguiente, para el objetivista, las probabilidades son carac­
terísticas del mundo esperando a ser descubiertas. Para el «subjetivis­
ta», son grados de la creencia parcial de un agente que guían sus ac­
ciones y creencias en un m undo incierto. Pero, ¿qué probabilidades
debería el agente racional atribuir a los sucesos? Los argumentos que
acabamos de esbozar están diseñados para demostrar que con inde­
pendencia de las probabilidades que se elijan, éstas deben satisfacer
conjuntamente los axiomas estándar de la probabilidad. Pero ¿hay al­
guna otra restricción sobre la racionalidad probabilística?
Un conjunto de argumentos está diseñado para describir y justifi­
car un procedimiento capaz de modificar las propias probabilidades
subjetivas a la luz de nueva evidencia. U n teorema fundamental de la
teoría de la probabilidad, el Teorema de Bayes, relaciona la probabi­
lidad de una hipótesis sobre la base de evidencia (una probabilidad
condicionada) con la probabilidad condicionada de la evidencia, su­
puesta la verdad de la hipótesis y la probabilidad inicial de que la h i­
pótesis sea verdadera. Supongamos que consideramos que, después
de presentada la evidencia, deberíamos adoptar como nuestra nueva
probabilidad para la verdad de la hipótesis su vieja probabilidad con­
dicionada a la evidencia. Tenemos entonces una forma de cambiar
nuestras probabilidades a la luz de nueva evidencia que es «conser­
vadora». Comporta los mínimos cambios concebibles en nuestras
probabilidades anteriores. Y las nuevas probabilidades se ajustarán,
150 Filosofía de la física

como las viejas, a los axiomas de la teoría de la probabilidad. Este


proceso de modificación de la probabilidad a la luz de la evidencia
se conoce como condicionamiento. Puede ser generalizado para en­
globar casos en los que la nueva evidencia no se conoce como cierta,
sino que lleva asignada solamente una probabilidad. Alguien que si­
guiera este procedimiento podría, por ejemplo, partir de la suposi­
ción de que una moneda, que podría estar sesgada, tiene probabili­
dad un medio de dar cara. A medida que se sumen nuevos
lanzamientos de moneda, el agente modificará la probabilidad a la
luz de los resultados observados. Una partida dominada por las
caras, por ejemplo, inducirá al agente a aumentar su estimación de la
probabilidad que tiene la moneda de dar caras. De nuevo, pueden
darse argumentos a favor de que lo razonable es la modificación de
las probabilidades de uno por condicionamiento. Algunos de estqf
argumentos son del tipo de los que se utilizaban para intentar con­
vencernos de que era razonable que nuestras probabilidades se con­
formasen a los axiomas usuales.
Más arriba indiqué que al obtener nuevas probabilidades para las
hipótesis a la luz de la evidencia, uno se apoyaba en las probabilida­
des iniciales de la verdad para las hipótesis en cuestión. Así pues, ¿no
se debería comenzar con alguna plausibilidad «intrínseca» para las
hipótesis, sus así denominadas probabilidades a priori? ¿De dónde
podrían éstas proceder? Algunos han defendido que deberíamos dar
cabida a hipótesis probabilísticas en nuestro cuerpo de creencias
aceptadas sólo sobre la base de frecuencias observadas como eviden­
cia. Más frecuentemente se alega que las hipótesis pueden tener pro­
babilidades intrínsecas generadas con independencia de las frecuen­
cias observadas. De hecho, dichas probabilidades a priori fueron el
objeto de estudio de los primeros trabajos en teoría de la probabili­
dad en los siglos x v ii y xvm. En el lanzamiento de una moneda hay
dos sucesos posibles «simétricos», cara y cruz. ¿No parece entonces
razonable suponer inicialmente que la probabilidad de cada uno de
ellos es un medio? En el lanzamiento de un dado hay seis caras simé­
tricas. ¿No deberíamos entonces, si no hay evidencia de sesgos, atri­
buir la probabilidad de un sexto a cada suceso consistente en apare­
cer una cara específica en la parte superior del dado? Podemos, pues,
intentar obtener las probabilidades a priori dividiendo los sucesos en
casos simétricos y atribuyendo la misma probabilidad a cada uno.
Éste es el famoso Principio de Indiferencia.
La introducción de la probabilidad en la física 151

Los filósofos posteriores formalizaron estas nociones y las genera­


lizaron. Si elegimos un lenguaje en el que describir el mundo, pode­
mos encontrar varias formas de clasificar las posibilidades del mun­
do, según su descripción en este lenguaje, en posibilidades simétricas.
La probabilidad inicial se distribuye entonces sobre las posibilidades
de un modo intuitivo y simétrico. Así, una vez obtenidas en esta for­
ma las propias probabilidades a priori
«racionales», uno podría modi­
ficarlas a la vista de la evidencia experimental (especialmente de la
evidencia sobre las frecuencias efectivamente observadas de los suce­
sos) usando el proceso de condicionamiento descrito más arriba. Los
métodos inventados fueron vistos por algunos como una generaliza­
ción de la teoría formal de \x
deducción, porque tenían en cuenta la
definición de un tipo de «nexo lógico parcial» entre las proposicio­
nes, esto es, la idea de que una proposición puede sustentar lógica­
mente a otra hasta cierto grado. Así, los sistemas formales recibieron
el nombre de lógicas inductivas.
Hace tiempo que se advirtió que estas técnicas se ven afectadas
por dificultades cuando el Principio de Indiferencia es sometido a
análisis y crítica. Todas ellas descansan en una división de los sucesos
posibles en casos simétricos. Pero la idea tras dicha división no siem­
pre está clara. Podemos decir, claro está, que el dado puede dar un
uno, un dos, etc., sumando un total de seis casos. Pero también pode­
mos decir que el dado puede dar un uno o ningún uno en su cara
superior, lo cual hace dos casos. Entonces, ¿por qué no asignar a
«aparecer un uno» una probabilidad de un medio? En otros casos, la
necesidad de alguna forma basada en principios para elegir cómo ser
«indiferente» se hace más clara. Imaginemos un vaso construido de
forma tal que el volumen ocupado no sea proporcional al área de la
superficie humedecida del interior del vaso (fácil de hacer si se
toman curvos los lados del vaso). Sin tener idea de cuán lleno está el
vaso ¿supondríamos, usando el Principio de Indiferencia, que está
medio lleno? O ¿supondríamos, con igual justificación, que la mitad
de su interior está húmeda? Las dos suposiciones son incompatibles
entre sí, pero ambas parecen igualmente justificadas, a priori, por
puras consideraciones de simetría.
Más adelante en este capítulo exploraremos cómo se utiliza la
probabilidad en mecánica estadística, el primer dominio de la física
en el que jugó un papel fundamental. Veremos que las controversias
entre los filósofos acerca de la naturaleza de la probabilidad y las
112 Filosofía de la física

controversias sobre el origen y la justificación de las asignaciones de


probabilidad inicial son cruciales cuando uno está intentando enten­
der sencillamente cómo debería introducirse la probabilidad en la fí­
sica. Como veremos, varios descubrimientos físicos no sólo arrojan
luz sobre las cuestiones filosóficas, sino también revelan cuestiones
adicionales que complican aun más la situación del problema filosó­
fico.

Explicación estadística: explicación, ley y causa


Deseamos no sólo describir el mundo tal como lo encontramos, sino
explicar también lo que acontece en el mundo. Explicar, creemos, es
responder a la cuestión de por quéocurre lo que ocurre, y no sólo
describir qué es lo que de hecho ocurre. Pero ¿qué significa respon­
der a un por qué? Y ¿qué significa dar una explicación de un fenó­
meno?
La noción intuitiva de una causa ha jugado un papel en las tenta­
tivas de analizar el concepto de explicaciones en la ciencia desde el
momento mismo en que la idea de aportar un tal análisis se le ocu­
rrió por vez primera a un filósofo. Explicar un suceso es indicar su
causa y explicar una clase de sucesos es suministrar la clase o tipo de
causa que los produce.
En un temprano análisis de la causalidad, Aristóteles distinguió
entre la materia en la que ocurría un cambio, la naturaleza del cam­
bio, la finalidad o propósito del cambio, y el generador directo del
cambio, como cuatro clases diferentes de causas. Las designó con los
calificativos de causas materiales, formales, finales y eficientes. El ma­
terial y las propiedades implicadas no se consideran aquí como cau­
sas de un proceso, sino como constituyentes del cambio que se pre­
tende explicar. La cuestión de las causas finales — metas, o
propósitos— sigue todavía suscitando mucha discusión. En la activi­
dad intencional de un agente, quizá en biología (en la forma de expli­
caciones funcionales de un órgano, por ejemplo), y en las ciencias so­
ciales, algo como la idea aristotélica de que indicar un objetivo, o
propósito, es explicativo, sigue pareciendo atractivo. N i siquiera en la
física está claro que no haya espacio en absoluto para las «causas
finales». Explicaciones de la trayectoria de la luz como aquella que
toma el menor tiempo se alega algunas veces que son finales por na­
La introducción de la probabilidad en la física 153

turaleza. Y en la termodinámica (que expondremos más adelante en


este capítulo), el explicar un proceso en términos de un sistema que
tiende a un estado de equilibrio como un «objetivo» se ha alegado
que es una explicación que utiliza la noción de «causa final».
Pero cuando un científico contemporáneo piensa en causas, él o
ella piensa normalmente en causas eficientes, los sucesos que «oca­
sionan» la ocurrencia del suceso a explicar. Pero ¿qué significa expli­
car un suceso demostrando su causa eficiente? La idea intuitiva pare­
ce ser que un suceso es explicado cuando se descubre un suceso
anterior que «hace necesaria» la ocurrencia del suceso en cuestión.
Cerrar el interruptor hace que la luz se encienda, empujar el objeto
hace que se acelere, etcétera. Pero ¿cuál es la naturaleza de esta de­
terminación o «hacer», por la que es apropiado describir la causa
como lo que hace suceder el efecto o suceso explicado?
En un merecidamente famoso examen crítico de la noción de
causalidad, David Hum e argüyó que sería un error concebir las rela­
ciones causales como fundadas en algún «nexo causal» especial o
«conexión necesaria» entre los sucesos en el mundo. Antes bien, ar­
güyó, lo que encontramos en el m undo cuando examinamos sucesos
relacionados como causa y efecto es, ante todo, una relación espacio-
temporal entre los sucesos, en la que los sucesos están en contacto
espacio-temporal, pero de forma que el suceso causa precede al suce­
so efecto en el tiempo. También encontramos a los sucesos conteni­
dos en una clase de pares de sucesos del mismo tipo que siempre es­
tán acompañados uno por el otro. Esto es, el suceso 1 causa el
suceso 2 si, y sólo si, tienen la correcta relación espacio-temporal y si,
y sólo si, los sucesos de tipo 1 son siempre seguidos por los de tipo 2
y los de tipo 2 están siempre precedidos por los de tipo 1. Mientras
creemos poder explicar esta «conjunción constante» de los tipos de
sucesos diciendo que los sucesos de tipo 1 «causan» los sucesos de
tipo 2, en realidad, cuando hablamos de causalidad, estamos sólo re-
describiendo esa conjunción constante según Hume.
La cuestión no es tan simple para Hume, puesto que pregunta de
dónde sacamos la idea de que el suceso causa «hace necesario» el su­
ceso efecto. Su comprensión de esto es que la necesidad no es reflejo
de una relación real entre los sucesos en el m undo sino, antes bien,
una proyección sobre el m undo de un fenómeno psicológico. Al ver
sucesos de tipo 1 acompañados siempre por sucesos de tipo 2, nos
acostumbramos a que los sucesos del primer tipo sean siempre segui­
154 Filosofía de la física

dos por sucesos del segundo tipo. Así, cuando experimentamos un


suceso del primer tipo, nuestra mente inmediatamente salta a la ex­
pectativa de que un suceso del segundo tipo ocurrirá. Esta expecta­
ción, fundada en «la costumbre o el hábito», constituye el origen de
nuestra idea de que el primer tipo de sucesos hace necesario el se­
gundo tipo de sucesos. Pero, afirma Hume, esto es cuestión de nues­
tra psicología. Todo lo que hay en el mundo de los sucesos mismos
son las relaciones espacio-temporales de «contigüidad y precedencia»
y la conjunción constante de los sucesos de los tipos en cuestión.
Intimamente asociado a este análisis humeano de la causalidad
se encuentra un modelo de explicación científica denominado el
modelo deductivo-nomológico (aunque uno podría adoptar este
modelo sin ser un humeano). En él se arguye que explicar un suce­
so es demostrar que el enunciado de la ocurrencia del suceso en
cuestión podría deducirse lógicamente de los enunciados de la ocu­
rrencia de otros sucesos normalmente anteriores, si, además de la
descripción de esos sucesos explicativos, uno utilizase proposicio­
nes de las «leyes de la naturaleza» conectando los distintos tipos de
sucesos. Para un humeano, estas leyes son solamente los enunciados
generales de las conjunciones constantes de los tipos relevantes de
sucesos.
Los proponentes de este modelo de explicación científica diri­
gen nuestra atención a la íntima relación que existe entre la explica­
ción que ellos han elaborado y los objetivos de predicción y control
compartidos por la mayoría de los agentes humanos. Si somos
capaces de explicar un cierto tipo de sucesos, entonces tenemos a
nuestra disposición las generalizaciones legales que conectan sucesos
de un tipo con otros tipos de sucesos utilizados en la explicación. Si
en otras circunstancias, pues, sabemos qué tipos de sucesos «causa»
han ocurrido, podemos, utilizando las generalizaciones descubiertas
en nuestra búsqueda de explicaciones deductivo-nomológicas, pre­
decir qué sucesos ocurrirán. O podríamos, manipulando la ocurren­
cia del tipo correcto de sucesos «causantes», controlar el mundo de­
terminando qué tipos de sucesos manipulables ocasionarán (o
impedirán) sucesos del tipo que queremos que ocurran. Una vez
más, las conexiones entre los tipos apropiados de sucesos se revelan
en los enunciados de las leyes generales descubiertas en la búsqueda
de explicaciones.
Como veremos, algunas personas objetan que el modelo consis­
La introducción de la probabilidad en la física 155

tente en deducir una descripción de un suceso a partir de las des­


cripciones de otros sucesos y de enunciados generales de leyes, exige
demasiado de una explicación. Otrqs dicen que exige demasiado
poco. Un problema importante está conectado de nuevo a la noción
de causalidad. Si los sucesos explicativos y explicados no tienen la re­
lación causal correcta, se arguye, las conexiones entre sus descripcio­
nes no constituyen explicaciones, aun cuando se satisfagan las condi­
ciones del modelo deductivo de explicación. Podríamos deducir la
posición de un planeta ayer a partir de las leyes de la dinámica y de
su posición y velocidad hoy, pero eso no explica por qué tenía la posi­
ción que tenía ayer, se dice, ya que el pasado explica el futuro pero
no al contrario. Y esto es así,, se dice, porque la causalidad va en la
dirección del pasado al futuro. Explicar, se afirma, es desvelar las
causas. De nuevo, dos sucesos podrían estar correlacionados median­
te una ley porque son el efecto común de un tercer suceso que es su
causa común. Los dos sucesos no se explican, pues, uno al otro, aun­
que ambos son explicados por la causa común. Si una infección bac­
terial provoca a la vez un sarpullido y una hinchazón, se dice, ni el
sarpullido explica la hinchazón, ni la hinchazón el sarpullido. Antes
bien, ambos son explicados por su causa, la infección bacteriana. Pero,
¿qué otro elemento adicional se necesita para la explicación además
de la conjunción constante?

Explicaciones que invocan la probabilidad


Muchos de los que piensan que el modelo deductivo de explicación
exige demasiado aluden a explicaciones históricas. Aquí parecemos
aceptar descripciones explicativas que no hacen uso alguno de gene­
ralizaciones legales. Después de todo, ¿cuáles son las leyes que go­
biernan los sucesos históricos? Más interesantes para nosotros son
esas explicaciones en las que los sucesos están conectados por gene­
ralizaciones, pero donde las generalizaciones no son leyes de la natu­
raleza de pleno derecho, sino conexiones probabilísticas o estadísti­
cas entre los sucesos. El fumar no siempre causa cáncer de pulmón,
pero ciertamente aumenta su probabilidad. ¿No damos, entonces,
una explicación al menos del cáncer de pulmón de alguien, si señala­
mos su vicio de fumar, aun cuando el fumar no comporte la necesi­
dad de contraer la enfermedad? ¿Qué clase de relación probabilística
156 Filosofía de la física

entre suceso explicativo y explicado es suficiente para poder decir


que el primero explica el segundo?
Un primer pensamiento natural es que un suceso es explicado si
podemos encontrar otros sucesos tales que la ocurrencia del suceso
en cuestión se siga con alta probabilidad de la ocurrencia de los su­
cesos explicativos. El «seguirse de» es mediado por la existencia de
generalizaciones estadísticas legales que ocupan el lugar de las leyes
sin excepción utilizadas en las explicaciones deductivo-nomológicas.
Nos percatamos de inmediato de que tal «explicación estadística»
de un suceso será muy diferente de la explicación que se obtiene
cuando se utilizan leyes puras. Por ejemplo, en el caso deductivo, si
podemos explicar el suceso 1 y podemos explicar el suceso 2, pode­
mos generar automáticamente una explicación del «suceso 1 ocurrió
y el suceso 2 ocurrió» juntando simplemente los recursos explicati­
vos utilizados para explicar cada suceso individual. Pero si el suceso
1 se sigue de alguna base explicativa con «alta probabilidad», es de­
cir, con una probabilidad mayor que alguna cantidad especificada, y
el suceso 2 se sigue de su base explicativa con parecida probabili­
dad, eso no garantiza que «el suceso 1 y el suceso 2» se sigan de las
bases explicativas conjuntas con una probabilidad superior al valor
mínimo.
Es más, un suceso que tenga una probabilidad alta respecto a su
base explicativa, podría tener una probabilidad baja respecto a esa
base complementada con información adicional. Aunque podamos
decir que es altamente probable que alguien criado en un entorno
horrible tenga tendencias criminales, cuando nos digan, además, que
es el hijo de una familia rica, etcétera, reduciremos la probabilidad
estimada. Esto no puede suceder con sucesos explicados deductiva-
nomológicamente.
Pronto pensamos en casos donde presentimos que un suceso
puede ser explicado probabilísticamente aun cuando no tenga una
alta probabilidad en relación a lo que se propone como explicación.
La combustión de algo que arde espontáneamente se explica dicien­
do que algunas veces, aunque muy raramente, dicho fenómeno tiene
lugar en la situación pertinente. ¿Cómo podemos explicar un suceso
haciendo referencia a hechos respecto a los que presenta una proba­
bilidad baja? Se señala que sin los hechos explicativos, el suceso en
cuestión tendría una probabilidad aún más baja. Así podemos expli­
car porqué algo sucede aludiendo a hechos que lo hacen másproba­
La introducción de la probabilidad en la física 157

ble de lo que sería de otra forma, aun cuando después de añadir los
hechos explicativos, su probabilidad siga siendo baja.
Después se observa que hay muchos casos en los que explicamos
un suceso haciendo referencia a otro suceso, aun cuando aportando
la nueva información disminuyamos
la probabilidad del suceso en re­
lación a nuestro conocimiento de fondo. Un médico explica la muer­
te de un paciente del que se sabe que padece una terrible enferme­
dad señalando que, en este caso particular, fue el efecto secundario,
muy improbable, de un medicamento lo que mató al paciente, no la
enfermedad. La causa de la muerte puede ser el medicamento, aun­
que la muerte por enfermedad, tratada o no tratada, sea mucho más
probable que la muerte producida por el efecto secundario del1medi­
camento.
Podemos combinar estas observaciones con otras similares a las
aducidas cuando quienes discuten una explicación deductivo-nomo-
lógica arguyen que, en la teoría de la explicación que entiende como
tal la inclusión bajo una generalidad, falta el elemento causal. Obte­
nemos así una teoría que dice que explicar, tanto probabilísticamente
como por medio de leyes sin excepción, es indicar el origen causal
de un suceso. Pero ahora la causalidad se entiende como una rela­
ción que admite una conexión probabilística. A quí la idea es que un
suceso podría causar un número de sucesos diferentes, cada uno con
una probabilidad determinada de ser causado. Aunque una causa
pueda generar una multiplicidad de efectos, es todavía una relación
causal lo que produce el suceso efecto como consecuencia del suce­
so causa. Mirando las cosas de esta manera, puede que se haga justi­
cia a los casos arriba mencionados. También servirá para distinguir
las correlaciones que no son explicativas, siendo no causales, de
aquellas que son explicativas, siendo verdaderamente causales aun­
que probabilísticas.
Pero aquí surgen otras cuestiones interesantes. Si damos una ex­
plicación probabilística que es causal, ¿estamos obligados entonces a
mantener que hay relaciones causales irreduciblemente probabilísti­
cas en el mundo? ¿Debemos afirmar que el m undo tiene, en su base,
una naturaleza genuinamente «tiquista», o azarosa, no sostenida por
relaciones causales completamente deterministas? No necesariamen­
te. Algunos han argüido que puede haber explicaciones probabilísti-
co-causales que expliquen un suceso como el resultado «por puro
azar» (aunque un resultado causal) de algunos sucesos anteriores que
158 Filosofía de la física

presentan una disposición causal a generar sucesos del tipo que ha


de explicarse. En otros casos, la explicación probabilística, relevando
una vez más una estructura causal, puede ser explicativa al estar la
relación causal probabilística fundada en algunas relaciones causales
subyacentes enteramente deterministas. Veremos una defensa de este
punto de vista más adelante en este capítulo. En esta segunda clase
de explicación, el estado posterior de un sistema está completamente
determinado por su estado dinámico anterior. Pero, se arguye, m u­
chos estados dinámicos iniciales son posibles candidatos consistentes
con la descripción inicial del sistema. Cada uno de dichos estados
iniciales conduce a un resultado futuro diferente. Cada evolución es
totalmente determinista. En este caso, la probabilidad se introduce
en la imagen explicativa cuando comenzamos a hablar sobre la «pro­
babilidad de un estado dinámico inicial dado» consistente con la
descripción inicial del sistema. Así pues, tendremos elementos proba-
bilísticos en nuestra estructura explicativa. La estructura explicativa
descansará en el desvelamiento de los procesos causales subyacentes
que generan los sucesos que han de explicarse. Pero la probabilidad
se introducirá, no porque la relación causal sea «intrínsecamente
aleatoria», sino porque se están explorando simultáneamente muchas
posibles evoluciones causales diferentes. Más tarde, cuando discuta­
mos la mecánica cuántica en el capítulo 4, veremos porqué tiene al­
guna plausibilidad la afirmación de que en ese contexto se debe pos­
tular una causalidad verdaderamente «incierta».
Desde esta perspectiva, pues, las demandas de una probabilidad
alta o aumentada parecen descaminadas. Lo que estamos intentando
hacer cuando explicamos probabilísticamente un suceso es ubicar d i­
cho suceso en una estructura de relaciones causales, donde la estruc­
tura revelada es probabilística, bien porque las relaciones causales
son intrínsecamente indeterministas, bien porque se están conside­
rando simultáneamente un número de evoluciones causales alternati­
vas. Aun cuando el suceso considerado tenga una probabilidad baja,
o una probabilidad reducida, en la cadena de causalidad que condu­
ce hasta él, podemos todavía dar una explicación del mismo. Por su­
puesto,'esto no significa negar valor a la aliviadora sorpresa de mos­
trar que un suceso es altamente probable, o de mostrar que es más
probable de lo que habríamos esperado de otro modo. Hacemos
estas cosas y las consideramos, en algún sentido, como suministrando
explicaciones.
La introducción de la probabilidad en la física 159

¿Significa toda la importancia concedida a la revelación de una


relación causal en la explicación que estamos dando la espalda a una
teoría humeana de lo que es para una cosa ser la causa de otra? No
necesariamente. Algunos afirmarían que como las explicaciones exi­
gen que se haga referencia a relaciones causales entre los sucesos,
debemos presuponer la noción de una relación causal como un ele­
mento primitivo en nuestro entendimiento de la naturaleza del mun­
do. Otros buscan un entendimiento de lo que es la relación causal en
términos de otras relaciones que los sucesos presentan entre sí. Un
enfoque, ya presente en Hum e en algunos lugares, es intentar enten­
der la causalidad en términos de «lo que ocurriría» en el mundo si
las cosas fuesen diferentes a como son. Así, podría concebirse como
causa un suceso tal que, de no haber ocurrido, no habría ocurrido el
suceso efecto. En realidad, no es tan simple. Fenómenos tales como
la sobredeterminación (un efecto es múltiplemente causado) y la ante­
posición (una cosa es causada por un suceso que, de no haber ocurri­
do, habría dado pie a que un segundo suceso hubiera provocado el
efecto; siendo el primer suceso tal que obstaculizó la ocurrencia del
segundo suceso) requieren un análisis más sofisticado de la relación
entre «lo que hubiese ocurrido si» y lo que significa que un suceso
cause otro. Otros problemas adicionales surgen debido a conexiones
no causales que también están asociadas con dicho «lo que habría su­
cedido». Por si fuera poco buscamos además un entendimiento de lo
que significa justamente ese discurso sobre lo que habría sucedido si
las cosas hubieran sido de otro modo, un entendimiento que de suyo
no descansa en la presuposición de una relación causal implícita.
Otros enfoques que analizan la causalidad recurren a la combina­
ción de la conjunción constante de Hum e con otros elementos reales
en el mundo. A menudo se recalca, por ejemplo, que la estructura
del mundo es tal que identificamos una conjunción constante como
una relación causal sólo cuando los sucesos bajo consideración están
unidos uno a otro por caminos adecuadamente continuos de sucesos
en conjunción constante. Debe haber, entonces, caminos de «influen­
cia causal» o «propagación causal».
Finalmente, es muy importante reflexionar sobre el hecho de que
las regularidades totalmente legales o sólo probabilísticas que utiliza­
mos en nuestras explicaciones científicas forman una jerarquía unifi­
cada de proposiciones en una estructura teórica. Algunas generaliza­
ciones son mucho más amplias, más profundas, y más fundamentales
160 Filosofía de la física

que otras. Puede argüirse que la diferencia entre meras correlaciones


y correlaciones causales aptas como explicación es que las últimas in­
sertan la correlación de los sucesos en cuestión en los niveles más
profundos de correlación de las teorías más fundamentales. Así, se
arguye, la referencia al hecho de que tenemos causalidad, y por con­
siguiente explicación, sólo cuando se pone al descubierto el mecanis­
mo de la correlación de los sucesos, puede tomarse como indicativo,
no ya de que pueda producirse alguna relación causal misteriosa ade­
más de la correlación, sino de que una correlación es explicativa sólo
cuando inserta la relación entre los sucesos bajo consideración en las
correlaciones fundamentales de nuestra teoría básica apropiada. ¿No
podría algo como esto hacer comprensible el debate entre quienes
piensan que las correlaciones conocidas entre el fumar y el contraer
cáncer son suficientes para afirmar que el fumar causa cáncer, y quie­
nes lo niegan? ¿No están los últimos exigiendo causalidad como ex­
plicación en el sentido de insertar la correlación entre el fumar y la
enfermedad en un contexto mucho más amplio y profundo? Tanto la
biología, como la química y la física son utilizadas para complemen­
tar la manifiesta correlación con correlaciones mucho más finas fun­
dadas en las leyes, mucho más profundas, de la ciencia. Detalles tales
como las correlaciones entre la inhalación de productos químicos,
estando la presencia de estos productos correlacionada a los cambios
genéticos, y siendo estos cambios seguidos en sus pormenores por
medio de las correlaciones más profundas de toda la física — que
muestran lo que sucede en el nivel molecular— son dados por estas
ciencias. Desde esta perspectiva, pues, la demanda de causalidad en
la explicación está garantizada, pero por razones básicamente hu-
meanas.
Este último aspecto del papel de la causalidad en la explicación
es particularmente relevante para nuestros propósitos presentes. Con­
forme nos adentremos en los pormenores del papel de la probabili­
dad en la teoría de la mecánica estadística, veremos que lo. que ahí
sucede es que una teoría «a nivel de superficie» del comportamiento
macroscópico, la termodinámica, se relaciona en un modo explicati­
vo con una teoría dinámica «a nivel profundo». Esta teoría a nivel
profundo es la teoría del comportamiento de los sistemas fundada en
las leyes fundamentales de la dinámica de los componentes microscó­
picos de los sistemas macroscópicos (tales como las moléculas de un
gas). Las consideraciones probabilísticas surgen cuando intentamos
La introducción de la probabilidad en la física 161

acoplar uno al otro estos dos niveles de descripción, utilizando la


teoría de nivel profundo para explicar la teoría de superficie. Se pre­
supone, pues, que podemos dar una descripción causal de la evolu­
ción del sistema en términos de la dinámica de sus constituyentes m i­
croscópicos. Este es el nivel amplio, profundo y fundamental de la
descripción científica indicado más arriba. La probabilidad juega un
papel al insertar la descripción del sistema forjada en los términos
del nivel superior en esta imagen causal global. Como veremos, la re­
lación entre correlación y causalidad introduce aquí sus propios enig­
mas particulares.

Explicación y reducción
Nuestra discusión ha procedido como si los acontecimientos indivi­
duales fueran los objetos primarios del entendimiento científico, esto
es, como si lo que quisiéramos explicar fuesen sucesos particulares.
En ciencia es más habitual, sin embargo, el entendimiento de las ge­
neralizaciones, leyes o correlaciones probabilísticas, que estamos bus­
cando. ¿Cómo podemos ampliar nuestro entendimiento de las gene­
ralizaciones legales? ¿Cómo podemos explicarlas?
La idea principal es que las generalizaciones, ya sean legales o es­
tadísticas, se explican en función de generalizaciones más amplias,
más profundas o más fundamentales. Nuestras leyes forman una je­
rarquía que abarca desde generalizaciones parcas, de superficie
(como la Ley de Snell de la refracción en óptica o la Ley de Ohm en
la electricidad), hasta las leyes extremadamente generales y profundas
de nuestras teorías físicas fundamentales. Explicamos leyes de un or­
den inferior mostrando que se siguen de las leyes de un orden supe­
rior. Las leyes de niveles inferiores puede que sólo sean válidas en
ciertas circunstancias especiales bien definibles (esto es, cuando la si­
tuación posee las condiciones especiales apropiadas). Explicamos la
óptica geométrica mostrando que se sigue de la óptica física (ondula­
toria), explicamos la óptica física como una consecuencia de la teoría
electromagnética, explicamos el electromagnetismo como un compo­
nente del campo electrodébil descrito por la teoría cuántica de cam­
pos, etcétera.
Generalmente, la idea es que las leyes más superficiales son expli­
cadas mediante su derivación de leyes del tipo más general y funda­
162 Filosofía de la física

mental. Pero las cosas son, en realidad, mucho más complicadas que
eso. Una afirmación habitual es que a menudo se encuentra que las
leyes más de superficie, una vez explicadas, no son realmente verda­
deras. Con frecuencia son sólo buenas aproximaciones a la verdad y
eso sólo en ciertas circunstancias. Así, una vez comprendida la teoría
ondulatoria de la luz, nos percatamos de que la óptica geométrica
sólo es válida cuando la longitud de onda de la luz es pequeña com­
parada con las dimensiones de los objetos físicos situados en la tra­
yectoria de la luz. El hacer aquí rigurosa la noción de aproximación
no es una tarea fácil.
Más problemáticas son las cuestiones que surgen cuando las le­
yes y las generalizaciones estadísticas menos profundas que se pre­
tende explicar se han forjado en conceptos diferentes a los utilizados
en la gestación de los principios más profundos. Esto ocurre cuando
una teoría menos profunda es reducida a una teoría más profunda,
siendo necesario establecer una conexión entre los conceptos, a ve­
ces bastante diferentes, de las dos teorías. Mientras la biología habla
de organismos y células, por ejemplo, la química molecular habla de
moléculas, gradientes de concentración, etcétera. ¿Cómo se relacio­
nan las células, por ejemplo, con sus constituyentes microscópicos?
Aquí la respuesta parece clara, a saber, que las células están formadas
por moléculas, pero esto necesita ser completamente aclarado.
En el caso del que nos ocuparemos en este capítulo, esta cone­
xión interteórica es aun más problemática. La teoría reducida que
describiré, la termodinámica, trata de características del mundo
como la temperatura, la cantidad de calor y la entropía. Pero la teoría
explicativa — reductora— se ocupa de los sistemas desde el punto de
vista de su construcción a partir de constituyentes microscópicos ta­
les como moléculas. Aunque los objetos macroscópicos estén cons­
truidos a partir de componentes microscópicos, el relacionar las pro­
piedades de los sistemas que han sido utilizadas para caracterizarlos
en el nivel explicativo (temperatura y entropía, por ejemplo) con las
propiedades de los sistemas (el número de sus constituyentes micros­
cópicos y el espacio en el que se encuentran confinados, por ejem­
plo) y las propiedades de los propios constituyentes microscópicos
(su momento, energía, masa y tamaño, por ejemplo) es una cuestión
sutil y compleja.
Esto resulta doblemente difícil por la curiosa interacción entre
las leyes globales y las generalizaciones estadísticas en el esquema ex­
La introducción de la probabilidad en la física 163

plicativo. Las leyes a explicar parecen tener inicialmente el estatus de


leyes sin excepción. Pero el hecho mismo de explicarlas arroja ciertas
dudas sobre esta suposición. En el nivel explicativo más profundo se
encuentran las leyes fundamentales de la dinámica de los constitu­
yentes microscópicos. Estas son, de nuevo, leyes de pleno derecho,
aunque en la versión de la mecánica estadística que adopta la diná­
mica cuántica como su teoría dinámica fundamental, estas leyes po­
seen en germen, como veremos en el capítulo 4, un elemento funda­
mentalmente estadístico. Lo que es importante por el momento es
observar que entre las leyes dinámicas fundamentales de los micro-
constituyentes, y las leyes explicadas de la teoría que se quiere redu­
cir, encontramos generalizaciones que introducen elementos probabi-
lísticos o estadísticos en la imagen explicativa. Así, como veremos, a
menudo se alega que la dinámica fundamental explica el comporta­
miento térmico en el nivel macroscópico presentándolo tan sólo
como el comportamiento ostensiblemente más probable o, en otros
casos, como el comportamiento medio que ha de esperarse.
Cuando uno intenta entender la mecánica estadística, las cuestio­
nes más importantes e interesantes aparecen precisamente en este
punto. ¿Cómo están las generalizaciones estadísticas que forman los
postulados centrales de la teoría relacionadas, de un lado, con las le­
yes dinámicas fundamentales que gobiernan a los constituyentes m i­
croscópicos del sistema bajo consideración y, del otro lado, con las
leyes que gobiernan el comportamiento macroscópico de los sistemas
según su caracterización por los conceptos de la física térmica tradi­
cional? La explicación del comportamiento en el nivel macroscópico
debe realizarse sobre la base de su entendimiento como una conse­
cuencia de la constitución del sistema macroscópico a partir de sus
partes microscópicas y de las leyes fundamentales que gobiernan la
dinámica de esas partes. ¿Qué tipo de explicación será ésta? Como
veremos, se trata de un esquema explicativo que incorpora, en un ni­
vel intermedio, nociones fundamentalmente probabilísticas y estadís­
ticas.
Pero ¿en qué se fundamenta la introducción de estos postulados y
suposiciones probabilísticas adicionales? ¿Pueden ser derivados a
partir de la dinámica fundamental por sí misma? ¿O se necesitan
otros postulados fundamentales para introducirlos en la física? Esta
cuestión es muy difícil y compleja. Y es muy importante. Pues de la
respuesta que se dé a esta cuestión se seguirá justamente el tipo de
164 Filosofía de la física

explicación de los fenómenos macroscópicos que está proporcionan­


do la física. Aunque hay casos en los que puede decirse que la gene­
ralización en el nivel inferior es explicada por la teoría más funda­
mental mediante la derivación de la primera a partir de la segunda,
con, presumiblemente, algunas nociones de aproximación intercala­
das, en el caso de la mecánica estadística hay elementos importantes
que juegan un papel en la derivación; éstos son muy diferentes de los
elementos habituales de los modelos filosóficos estándar de la expli­
cación estadística de las generalizaciones.

De la termodinámica a la mecánica estadística

Termodinámica
El fenómeno del calor nos es familiar por nuestra experiencia diaria,
por lo que no es sorprendente que la física intentase entenderlo. Las
primeras tentativas incluyeron el desarrollo de dispositivos tales
como el termómetro diseñados para reemplazar por medidas numéri­
cas precisas las impresiones subjetivas de calor y frío que experimen­
tamos. Con no poco esfuerzo intelectual se hizo la distinción entre
grado de temperatura y cantidad de calor, siendo lo primero una
cantidad «intensiva» y lo segundo «extensiva». Esto es análogo a la
distinción entre densidad y cantidad de materia respectivamente. Así,
cuando a una cantidad de agua fría se añade una menor cantidad de
agua a una temperatura mayor se obtendrá la misma temperatura
final de la mezcla que cuando se añade una mayor cantidad de agua
a una menor temperatura, de manera que uno podría afirmar que en
los dos casos se añadió la misma cantidad de calor aunque las tempe­
raturas fuesen diferentes.
Las primeras tentativas de entender estos resultados considera­
ron el calor como un tipo de sustancia o materia, llamada calórico, y
la temperatura como un tipo de medida de la densidad del calórico
en la materia. Cuanto más calórico hubiese en una porción dada de
materia ordinaria, mayor sería la temperatura. Semejante concepción
substantivista hace justicia a muchos resultados experimentales cuan­
do se introduce un principio de «conservación del calórico». Pero
hay otros resultados, en particular, la generación de nuevo calor por
acción mecánica o la conversión de calor en acción mecánica (como
La introducción de la probabilidad en la física 165

en una máquina de vapor alimentada por calor), que no encajan bien


en la concepción del calórico. Ya en un estadio muy temprano, algu­
nos pensadores imaginaron que el calor era una suerte de movimien­
to de minúsculos componentes del sistema, demasiado pequeños
para ser detectados por los procedimientos ordinarios.
Antes aún de que la teoría del calor como movimiento interno
triunfase, se avanzó notablemente en la formalización de una teoría
del calor. La reflexión acerca de la experiencia de quienes trabajaban
con máquinas de calor condujo a S. Carnot a la importante observa­
ción de que la cantidad de calor que podía ser convertida en trabajo
mecánico, incluso en el caso de una máquina perfectamente eficiente,
estaba limitada por la diferencia de temperatura entre el calor intro­
ducido en el motor y el calor disipado en su tubo de escape. Esto
condujo inmediatamente a la idea de un cero absoluto de temperatu­
ra, la temperatura del calor extraído de un motor que podía transfor­
mar todo el calor introducido en trabajo mecánico útil. R. Clausius y
otros desarrollaron una teoría formal del calor a partir de las ideas de
Carnot.
Primero se observó que, si bien el trabajo mecánico y el calor
pueden ser transformados uno en el otro, su cantidad total es inva­
riante. Ésta es la llamada Primera Ley de la Termodinámica. Des­
pués, el hecho de que la obtención de trabajo útil a partir de calor
requiriese que el calor introducido en el motor estuviese a una m a­
yor temperatura que el calor extraído, condujo, tras una brillante re­
flexión, al principio general de irreversibilidad, la llamada Segunda
Ley de la Termodinámica. Hay muchas formulaciones sutiles de esta
ley. Una de ellas dice básicamente lo siguiente: Sea un sistema ener­
géticamente aislado. Supongamos que algún calor en él se transforma
en trabajo mecánico. Supongamos que el sistema parte de un estado
dado. Entonces, al final del proceso no puede encontrarse en su
estado inicial. Podría suceder que al final del proceso hubiésemos
transformado el trabajo obtenido de nuevo en calor, pero el resulta­
do neto del proceso entero será que, si bien el calor total es el mismo
que cuando comenzamos, estará ahora a una temperatura menor y,
por lo tanto, menos «dispuesto» a ser convertido en calor.
La noción de estado de equilibrio de un sistema deviene crucial.
Supongamos que un sistema está aislado energéticamente del resto
del mundo. Más tarde o más temprano alcanzará un estado macros­
cópicamente invariable, su estado de equilibrio. Así, una barra de
166 Filosofía de la física

hierro caliente en un extremo y fría en el otro alcanza un estado uni­


forme de temperatura intermedia. Un gas inicialmente en una parte
de una caja alcanza una condición de densidad uniforme en toda la
caja. Una ley «Cero» de la termodinámica nos pide considerar tres
sistemasA, B, C, cada uno en su estado de equilibrio, y donde Ay B
son tales que cuando se les pone en contacto energético, permanecen
en el mismo estado de equilibrio. Supongamos que lo mismo puede
decirse de ByC cuando se ponen en contacto. Entonces, Ay C per­
manecerán en sus estados de equilibrio originales cuando se ponen
en contacto. Podemos etiquetar la «comunalidad» de equilibrio en
los sistemas mediante su temperatura común. Finalmente, es necesa­
rio introducir el novel concepto de entropía. La entropía sigue de
cerca la «utilidad» del calor para ser convertido en trabajo mecánico.
Mientras lacantidad de calor a una temperatura alta y a una baja pue­
de ser la misma, la primera tiene una mayor utilidad como fuente de
trabajo mecánico. Se dice entonces que tiene una entropía menor.Si
llevamos un sistema de un estado de equilibrio a otro, la cantidad de
calor transferida y la cantidad de trabajo mecánico realizado podrán
diferir de un proceso a otro con los mismos estados finales. Pero el
cambio de entropía de un estado a otro será el mismo. Así, los
estados de equilibrio de un sistema tienen una temperatura absoluta
definida y tienen una entropía definida (salvo una constante arbitra­
ria). Estas, junto a otras propiedades (como la presión y el volumen
de una parte del gas en equilibrio) mecánicas (o eléctricas, etc.), ca­
racterizan completamente la naturaleza de los estados de equilibrio.
El resultado final es, pues, una elegante teoría formal del calor.
Los sistemas tienen estados de equilibrio. En la conversión de uno
de estos estados a otro puede generarse o absorberse trabajo mecáni­
co. También puede transferirse energía sin realizarse ningún trabajo.
Esto se llama flujo de calor. Los estados de equilibrio se caracterizan
por su temperatura, de forma que el calor fluye sólo entre sistemas
con temperaturas que difieren unas de otras. La cantidad de trabajo
que se puede obtener en una transición de un estado de equilibrio a
otro depende de la temperatura de los estados. Sólo si el estado final
tiene un cero absoluto de temperatura, se habrá transformado todo
el calor disponible en trabajo mecánico. La transformación de calor
en trabajo es, en máquinas no ideales, irreversible: Esto es, tú no pue­
des transformar calor en trabajo en un sistema aislado y hacer a con­
tinuación algo más de forma que termines donde habías empezado
La introducción de la probabilidad en la física 167

con todo el calor tan disponible como al principio para hacer todavía
más trabajo. Puedes obtener trabajo a partir de calor y transformar
entonces el trabajo de nuevo en calor. Terminarás con la misma can­
tidad de energía en forma de calor con la que empezaste, pero ya no
estará disponible en la misma forma para ser convertida en trabajo
mecánico. Los estados de equilibrio no tienen solamente propieda­
des mecánicas como la presión y el volumen; también tienen una
temperatura determinada y una entropía determinada (o al menos
una entropía determinada en relación al valor asignado arbitraria­
mente a un estado). La entropía de un estado indica la disponibilidad
de su energía de calor interno a ser convertida en trabajo, siendo una
baja entropía indicativa dg una alta disponibilidad. Las leyes básicas
de la teoría son la transitividad del equilibrio (la ley Cero), la Conser­
vación de la Energía (la Primera Ley), y la Ley de Irreversibilidad (La
Segunda Ley). Algunas veces se añade una Tercera Ley, la imposibili­
dad de alcanzar el cero absoluto.

La teoría cinética del calor


Para algunos físicos, la teoría de los fenómenos térmicos que acaba­
mos de esbozar era plenamente satisfactoria como una teoría autóno­
ma fundamental de la física. No veían ninguna razón para reducirla en
alguna forma a una teoría más profunda, ni ninguna necesidad de dar
explicaciones en cuanto a porqué sus proposiciones básicas eran ver­
daderas. Pero para otros, la teoría clamaba por una explicación más
profunda. ¿Qué era
, en último término, el calor, esa cosa convertible
en, y a partir de energía mecánica? ¿Cuál era la característica de los
sistemas por la que éstos poseían una temperatura específica? ¿Porqué
existían los estados de equilibrio de los sistemas y porqué, admitiendo
que existiesen, tenían la estructura particular que mostraban tener? Y,
lo más importante de todo, ¿cuál era el origen de la extraña asimetría
en el tiempo del mundo, la asimetría revelada en el hecho de que los
sistemas fuera del equilibrio, dejados a su suerte, se movían uniforme­
mente hacia la condición de equilibrio, siempre en la dirección futura
del tiempo, y una vez obtenido el equilibrio, permanecían en él?
Aunque la idea de que el calor era un tipo de energía en movi­
miento de pequeños componentes del sistema macroscópico, compo­
nentes tan pequeños que sus movimientos individuales no eran de-
I6K Filosofía de la física

tcctables directamente a gran escala, fue objeto de especulación por


F. Bacon, J. Bernoulli y otros, fue sólo en el siglo XIX cuando esta idea
logró imponerse. Pero, aun cuando el calor fuese movimiento, ¿qué
tipo de movimiento era? Los sistemas podían, después de todo, tener
una estructura microscópica muy compleja y sutil. Dos pensadores
británicos, J. Herepath y J. Waterston, sugirieron ambos que la situa­
ción era muy simple para los gases. Estos estaban formados, dijeron
estos pensadores, por partículas minúsculas que pasaban la mayor
parte de su tiempo en movimiento libre, interaccionando sólo por
colisión unas con otras y con las paredes del recipiente. El contenido
de calor de un sistema era meramente la energía de este movimiento
de sus partes microscópicas. Pero sus sugerencias fueron ignoradas.
Finalmente, cuando estas ideas fueron expuestas por los físicos ale­
manes A. Krónig y Clausius, obtuvieron la atención que merecían.
Supongamos un gas en una caja compuesto por partículas peque­
ñas en su mayoría en movimiento libre. Si suponemos simplemente
que el calor es la energía total de este movimiento y que está distri­
buido uniformemente entre las moléculas, entonces resultados tales
como la Ley de los Gases Ideales, que establece una relación entre la
presión, el volumen y la temperatura del gas en equilibrio, pueden
derivarse fácilmente. La presión. es-al-reoultnckr t lcl -choque de las
partículas con las pare'descfeí recipiente, y la temperatura una medi-
~“da~de sus energías individuales de movimiento. Suponiendo qtre las
moléculas colisionan unas con otras, podemos resolver enigmas tales
como porqué, si las partículas (es decir, las moléculas) están en tan
rápido, casi libre, movimiento, la difusión de un gas de un lado a
otro de una habitación es tan lenta como indica su medición.
El siguíente avarice importante fue la observación hecha por J. C.
Maxwell en el sentido de que la suposición según la cual en el equili­
brio cada molécula tenía la misma velocidad era inverosímil. Hacien­
do uso de un argumento ingenioso, aunque no del todo convincente,
derivó una curva que establecía una distribución de velocidades para
las moléculas del gas en equilibrio. Algunas se movían muy despacio
y otras muy rápido, mostrando una concentración en torno a un va­
lor medio. ¿Podía darse a este resultado una justificación mejor, más
convincente? Aquí L. Boltzmann nos dejó su mayor contribución.
Boltzmann preguntó cómo esperaríamos que evolucionase un gas
que no estuviera en equilibrio. La evolución tendría lugar debido al
movimiento de las moléculas y, en particular, al intercambio de ener­
La introducción de la probabilidad en la física 169

gía entre unas y otras por colisión. ¿Podía demostrarse que si el gas
partía de una distribución de velocidades distinta a la de Maxwell, se
aproximaría por este proceso de intercambio de energía a la distribu­
ción de Maxwell para permanecer en ella?
Mediante suposiciones plausibles, una de las cuales la examinare­
mos en sus pormenores brevemente, Boltzmann fue capaz de derivar
una ecuación para la evolución de la función distribución de velocida­
des. Mostró que la distribución maxwelliana era una solución estacio­
naria de la ecuación, de manera que, una vez alcanzada, no cambiaría.
Fue capaz de definir una función distribución de velocidades y de­
mostrar que, hasta que esta función no alcanzase su valor mínimo (ob­
tenido para la distribución de Maxwell), la distribución de velocidades
no sería éstacionaria. Así pues, la distribución de Maxwell era la única
solución estacionaria de la ecuación. En conjunto, esto parecía expli­
car porqué un gas fuera del equilibrio evolucionaría hacia el equilibrio
y porqué, una vez alcanzado el equilibrio, permanecería en él.
Pero ahora comenzaron los problemas. Primero, los críticos ad­
virtieron que los sistemas estaban supuestamente compuestos por
moléculas que obedecían las leyes de la dinámica clásica. Pero en
tanto que un tal sistema cualquiera esté aislado y la energía se con­
serve, lo cual es cierto en este caso, debería evidenciar el resultado
de H. Poincaré: El sistema con punto de partida en un estado diná­
mico dado retornaría un número infinito de veces a estados muy pró­
ximos al estado original. Pero, entonces, ¿cómo podía tener razón
Boltzmann al afirmar que un sistema inicialmente en un estado de no
equilibrio evolucionaría al estado de equilibrio y permanecería en él?
Otro resultado de la dinámica clásica nos dice que si un sistema evo­
luciona desde el estado 51 al estado 52, evolucionará desde un
estado similar al 52, salvo con todas las direcciones de movimiento
invertidas, al «inverso temporal» del estado 51. Llamemos a los
estados invertidos temporalmente 51' y 52'. La evolución de 52' a
51'', si 52', al igual que 52, describe un estado de equilibrio, y 51', al
igual que 51, un estado de no equilibrio, violaría la ecuación de
Boltzmann, que siempre describe la evolución hacia el equilibrio.
¿Cómo puede entonces la ecuación de Boltzmann ser consistente
con la dinámica clásica? (Véase las figuras 3.1 y 3.2.)
Es en este punto donde las ideas probabilísticas comienzan a ju­
gar un papel en las diferentes versiones de la teoría. ¿Podría suceder
que la ecuación de Boltzmann no describa cómo debe comportarse
170 Filosofía de la física

F ig u r a 3.1. La recurrencia de Poincaré.


Trabajamos en el espacio de fases donde un
solo punto representa el estado m icroscópico exacto de un sistema en un momento
dado, esto es, la posición y velocidad de cada molécula en un gas. Poincaré demuestra
que para ciertos sistemas (un gas encerrado en una caja y aislado energéticamente del
mundo exterior es uno de tales sistemas), si un tal sistema parte de un estado micros­
cópico dado, o, entonces, excepto para un número «infinitamente pequeño» de dichos
estados iniciales, cuando se sigue la evolución del sistema a lo largo de la curvap,se
encontrará que el sistema, para cualquier región pequeña de microestados en torno al
microestado original, o, «regresará» a un microestado en esa pequeña región, E. Así
pues, «casi todos» los sistemas de esta índole que parten de un estado dado regresa­
rán en algún momento a un estado microscópico «muy próximo» al estado inicial.

cada sistema, sino sólo cómo se comportarán probablemente


los siste­
mas? Si bien, entonces esperaríamos una evolución hacia el equili­
brio con una probabilidad abrumadora, también esperaríamos casos
raros donde un sistema en no equilibrio evoluciona apartándose aun
más del equilibrio o donde un sistema en equilibrio evoluciona a un
estado de no equilibrio. Pero aquí uno tiene que andar todavía con
mucho cuidado. El teorema de recurrencia de Poincaré nos dice que
podemos estar seguros probabilísticamente de que los sistemas que
parten de una condición dada de no equilibrio regresarán en algún
momento a una condición de no equilibrio tan próxima como uno
quiera a aquélla de la que partieron. Así, ¿cómo puede ser probable
una aproximación monótona al equilibrio? Además, para toda evolu­
ción del no equilibrio al equilibrio, hay una posible evolución inver­
sa. Entonces, ¿no deberían ser las evoluciones en ambas direcciones
igualmente probables?
La respuesta de Boltzmann, aclarada por P. y T. Ehrenfest, pre­
senta varias componentes importantes. Primero está el descubrimien­
to de Boltzmann de una nueva forma de derivar la distribución de
velocidades en el equilibrio. Imaginemos todas las formas posibles en
que las moléculas se pueden colocar en «cajas» pequeñas en un espa-
La introducción de la probabilidad en la física 171

b
S(b) > S(a)

• a'

S(b') > S(a')


F ig u r a 3.2. El argumento de Loschmidt sobre la «reversibilidad».
Sea un sistema que par­
a
te de un microestado y evoluciona a un microestado b.
Supongamos, como es de es­
perar, que la entropía del estado b, S(b),es mayor que la del estado a, S(a).
Entonces,
dada la invariancia bajo inversión temporal de las leyes dinámicas subyacentes que ri­
gen la evolución del sistema, debe haber un microestado, b',
que evoluciona a un mi­
croestado, a\ y tal que la entropía de b’ b
es igual a la de y la entropía de a'
es igual a
la de a (según la definición por Boltzmann de entropía estadística). A sí pues, a cada
evolución «termodinámica» en la que la entropía aumenta debe corresponder una po­
sible evolución «antitermodinámica» en la que la entropía disminuye.

ció abstracto, correspondiendo a pequeñas regiones de posición y mo­


mento. El momento es crucial aquí: si utilizamos la velocidad o la
energía obtendremos resultados erróneos. Al mover una molécula de
una caja a otra, obtenemos un nuevo ordenamiento. No obstante, m u­
chas permutaciones de las moléculas pueden corresponder a un mis­
mo estado de «combinación», es decir, un estado caracterizado por
números de moléculas en cada caja, irrespectivamente de qué molécu­
la particular se encuentre en cada caja. La distribución de equilibrio
es el estado de combinación correspondiente a la combinación domi­
nante obtenida por un número ostensiblemente grande de permuta­
ciones de las moléculas en las cajas. En general, las combinaciones
cerca del equilibrio son obtenibles por un amplio número de permu­
taciones. Las combinaciones correspondientes a los estados macroscó­
picos lejos del equilibrio son obtenibles sólo por un número muchísi­
mo menor de permutaciones. Si consideramos que cada permutación
172 Filosofía de la física

v---- 'r - \ i—y -y


V sistema
F i g u r a 3 .3 .La imagen «simétrica en el tiempo» de Boltzmann.
E n esta imagen del mun­
do, se propone que un sistema aislado cuya entropía es Ssl¡lrm
«a lo largo de un tiem­
po infinito» pasa casi todo el tiempo en estados con entropía próxima al valor m áxi­
mo, Smáxlmi¡, esto es, en el estado de equilibrio. H ay fluctuaciones aleatorias del
sistema fuera del equilibrio. Cuanto mayor sea la fluctuación de un sistema a partir
del equilibrio, con menor frecuencia se dará. L a imagen es simétrica en el tiempo. Si
encontramos un sistema lejos del equilibrio, deberíamos esperar que en el futuro se
encontrase más cerca del equilibrio. Pero también deberíamos inferir que en el pasa­
do estuvo asimismo más cerca del equilibrio.

es igualmente probable, en virtud de algún principio de indiferencia o


simetría, ¿no podríamos concebir el equilibrio como el estado «osten­
siblemente más probable» del sistema?
Deberíamos entonces pensar en la situación como sigue: Un siste­
ma dado, observado durante todo el tiempo y perpetuamente aislado,
pasará casi todo el tiempo en o cerca del equilibrio. Se darán desvia­
ciones del equilibrio, pero cuanto mayor sea la desviación, menor será
su ocurrencia. La situación será simétrica en el tiempo, con transicio­
nes desde el no equilibrio al equilibrio, y viceversa, con igual frecuen­
cia. Todavía se cumplirá, sin embargo, que casi todo estado lejos del
equilibrio estará seguido por estados mucho más próximos al equili­
brio, como establece la ecuación de Boltzmann. (Véase la figura 3.3.)
No es posible, empero, considerar que la ecuación de Boltzmann
da la evolución más probable de un sistema en un tiempo infinito,
porque esto entraría en conflicto con la recurrencia. Antes bien, la si­
tuación debería verse de la siguiente forma: Tomemos una gran colec­
ción de sistemas que parten todos de un estado de no equilibrio en
un momento dado determinado. Examinémoslos en intervalos discre­
tos de tiempo, observando en cada intervalo de tiempo el estado del
sistema que puede ser obtenido por la mayoría dominante de siste­
mas. Dibujemos una curva a través de esos estados evolventes «más
probables». Esa
curva, la «curva de concentración» de la evolución de
la colección, obedecerá la ecuación de Boltzmann. Prácticamente
todos los sistemas se apartarán en algún momento del equilibrio, pero
estos excursos serán incoherentes, produciéndose en momentos dife­
La introducción de la probabilidad en la física 173

Smax

Si
F ig u r a 3.4. La «curva de concentración» de una colección de sistemas. Sé considera
una colección de sistemas cuyos miembros tienen cada uno una entropía S¡ en el
tiempo 1. Los sistemas evolucionan de acuerdo con sus microestados particulares de
partida en el tiempo inicial. E n tiempos posteriores, 2, 3, 4, 5, 6....... la colección se
examina de nuevo. E n cada tiempo una considerable mayoría de los sistemas tienen
entropías en o cerca de los valores Sp
-Vj, S„ 5^, ... ,
que están señalados sobre la
«curva de concentración». Esta curva puede aproximarse monótonamente al valor de
equilibrio Smx,
aun cuando casi todos los sistemas, individualmente, se aproximen y
se aparten de la condición de equilibrio en la manera ilustrada en la figura 3.3.

rentes para los diferentes sistemas. Después de un largo tiempo, casi


todos los sistemas se encontrarán en cualquier instante dado cerca del
equilibrio, tal como exige la ecuación de Boltzmann bajo esta nueva
interpretación. Así pues, esta interpretación probabilística de la ecua­
ción de Boltzmann es consistente con los resultados de la recurrencia.
(Véase la figura 3.4.)
Pero necesitamos ir más lejos en nuestra reflexión. Si, como sugie­
re esta nueva interpretación, el equilibrio es la condición «ostensible­
mente más probable» de un sistema, ¿porqué se encuentra el mundo
en el que vivimos tan inmensamente lejos del equilibrio? Boltzmann
ofrece una serie de argumentos para soslayar esto. Primero, dice, el
universo es muy extenso en el espacio y en el tiempo. Podemos pos­
tular, pues, que la región accesible a nuestra observación es muy pe­
queña. Recordemos que este trabajo se estaba llevando a cabo en los
años ochenta del siglo XIX y que la existencia de galaxias fuera de la
Vía Láctea no se estableció hasta algún tiempo después. Ahora bien,
esperamos que partes pequeñas de sistemas grandes estén, durante
pequeños lapsos de tiempo, en estados lejos del equilibrio. Así, pode­
mos entender el no equilibrio prevalente que experimentamos como
una «fluctuación local» en torno a una situación de equilibrio preva­
lente.
17-4 Filosofía de la física

A continuación podríamos preguntar cómo es que nosotros nos


encontramos en una parte tan singular del universo en lugar de en la
región dominante de equilibrio espacio-temporal. Aquí la respuesta
hace referencia a un tipo especial de sesgo observacional. Para que
pueda haber organismos sostenidos, complejos (como nosotros mis­
mos), capaces de realizar observaciones, debe haber flujos de energía.
Solamente éstos pueden contrarrestar el proceso normal de equilibrio
y mantener operando a un organismo activo sumamente estructurado
como es una forma de vida. Pero tal flujo de energía presupone una
situación de no equilibrio. Así pues, si ha de haber observadores,
éstos deben de encontrarse en las partes pequeñas, desviadas, en no
equilibrio del universo.
Ahora bien, es ostensiblemente probable que dicha parte del uni­
verso que se encuentra fuera del equilibrio sea una que esté todavía
más lejos del equilibrio en una dirección temporal y más cerca en la
otra. Estas son mucho más corrientes que los raros casos extremos de
partes del universo que son puntos de retorno donde la región está
más cerca del equilibrio en ambas direcciones temporales, y aun más
probables relativamente que los casos extraordinariamente raros de
un estado lejos del equilibrio flanqueado en ambas direcciones tem­
porales por estados todavía más lejos del equilibrio.
Pero, ¿porqué, en nuestra parte del universo, habríamos de hallar
a los estados más próximos al equilibrio en la dirección futura del
tiempo y no en la dirección pasada del tiempo? ¿No son las dos op­
ciones igualmente probables? En este punto, Boltzmann sostiene que
lo que entendemos por dirección futura del tiempo es la dirección del
tiempo en la que aumenta la entropía local, es decir, la dirección del
tiempo en la que nuestro trozo local de universo se está aproximando
al equilibrio. Sostiene que la dirección del tiempo que se toma como
futuro será, probablemente, opuesta en regiones separadas del univer­
so en las que el proceso hacia el equilibrio se da en direcciones tem­
porales opuestas. Esto es como el «abajo» para alguien situado en
nuestras antípodas sobre la tierra, que se encuentra en la dirección es­
pacial opuesta a nuestro «abajo». Y, dice, en la parte en equilibrio
prevalente del universo, no habrá distinción entre pasado y futuro,
aunque todavía habrá, por supuesto, dos direcciones opuestas del
tiempo. La analogía ahora se establece con el espacio vacío, donde
todavía existen todas las direcciones espaciales, pero donde ninguna
de ellas es «abajo» al no existir una dirección local de la fuerza gravi-
La introducción de la probabilidad en la física 175

tacional. Examinaremos críticamente estas brillantes ideas boltzman-


nianas brevemente.

La concepción ergódica de la mecánica estadística


Maxwell y Boltzmann aportan ocasionalmente un tratamiento algo di­
ferente de la situación de equilibrio. La idea ahora es considerar una
colección infinita de sistemas similares al sistema en cuyos aspectos
macroscópicos específicos uno está interesado. Uno podría, por ejem­
plo, considerar un gas con una energía interna determinada de sus
moléculas y encerrado en tin contenedor de tamaño estipulado. Uno
imagina entonces una colección en la que sus miembros tienen todos
la misma energía interna que el gas dado y están encerrados en conte­
nedores del mismo tamaño, pero en la que cada uno de sus miembros
posee una condición microscópica de sus microcomponentes diferen­
te. Esto es, uno considera muestras del gas con características macros­
cópicas constantes, pero donde se actualizan todas y cada una de las
posibles posiciones y momentos individuales de sus moléculas.
A continuación se asigna una cierta distribución natural de proba­
bilidades a estas condiciones microscópicas, de forma tal que el
estado microscópico de un caso situado en una serie específica de di­
chos estados tenga una probabilidad definida. La distribución elegida
es casi inevitable. Se deduce, una vez más, aplicando un principio de
indiferencia o simetría. Pero, como indicamos en la sección sobre pro­
babilidad, la aplicación de dicho principio significa ya la elección de
una caracterización preferida del sistema, que debe ser de suyo justifi­
cada. Uno puede probar que la distribución de probabilidades especi­
ficada no cambiará en el tiempo. Esto es, mientras cada gas en la co­
lección sufrirá un cambio de estado microscópico, el número total de
sistemas con sus estados en una región dada permanecerá constante,
aun cuando los estados de algunos sistemas habrán abandonado esta
región y los estados de otros sistemas habrán entrado en la región.
Así, esta probabilidad parece natural para describir el equilibrio, un
estado macroscópico invariable.
A continuación identificamos los observables macroscópicos
(como la presión) con promedios de una función de los microestados
del sistema, donde los promedios se calculan utilizando la distribu­
ción de probabilidades en cuestión. Es fácil demostrar que cuando
176 Filosofía de la física

esto se hace, las cantidades calculadas estarán relacionadas entre sí


como encontramos que lo están en los sistemas en equilibrio en el
mundo.
Este método para calcular los valores de equilibrio, identificándo­
los con «promedios de fases» sobre una colección (o «conjunto») de
sistemas sujetos todos ellos a las mismas ligaduras macroscópicas, fue
formalizado y generalizado por J. Gibbs. Gibbs desarrolla conjuntos
(esto es, distribuciones de probabilidad sobre microestados del siste­
ma) no solamente apropiados para sistemas energéticamente aislados,
sino también para los casos importantes de sistemas mantenidos en
contacto energético con una fuente de calor a temperatura constante
y de sistemas que pueden intercambiar moléculas con un manantial
exterior.
Observemos que hay algunas diferencias sutiles entre este método
y el enfoque alternativo de Boltzmann. Antes concebimos el estado de
equilibrio como el estado microscópico «ostensiblemente más proba­
ble» del sistema. Ahora las cantidades de equilibrio se conciben, no
ya como cantidades válidas en los microestados ostensiblemente pro­
bables, sino como promedios de cantidades sobre todos los estados
microscópicos posibles, incluyendo aquellos que son menos proba­
bles. Sólo si la distribución de probabilidades sobre los estados mi­
croscópicos tiene la propiedad de ser simétrica y estar sumamente
concentrada en torno el estado más probable, serán iguales (en gene­
ral) las dos cantidades. Puede demostrarse, en el caso de las distribu­
ciones de probabilidad utilizadas en la mecánica estadística y de las
cantidades calculadas con ellas, que las dos formas de calcular los va­
lores de equilibrio coincidirán entre sí.
Si bien la imagen presentada por Boltzmann, y por quienes han
explicado su trabajo, posee alguna plausibilidad, y si bien esta nueva
explicación evita las contradicciones obvias con la dinámica subya­
cente presentes en nuestro anterior entendimiento de la teoría,
todavía quedan muchos problemas por resolver. Una cosa es postular
una imagen semejante del comportamiento de los sistemas; otra muy
diferente es justificar la afirmación de que los sistemas se comporta­
rán según esta nueva descripción; y otra aún es explicar porqué los sis­
temas se comportan en esa forma boltzmanniana si es que, efectiva­
mente, lo hacen.
Una de las primeras tentativas de justificar parte de los procedi­
mientos estándar de lo que ahora puede denominarse mecánica esta-
La introducción de la probabilidad en la física 177

F ig u r a La Hipótesis Ergódica.
3 .5 . Sea un sistema que parte de cualquier microesta-
a c
do, representado por un punto en el espacio de fases. Supongamos que representa
cualquier otro microestado posible para el sistema. La Hipótesis Ergódica postula
a
que en un tiempo futuro u otro el sistema que partió en el estado pasará eventual­
c.
mente por el estado Pero el postulado es, de hecho, probablemente falso.

dística fue una sugerencia temprana de Boltzmann que, si se la pudie­


ra hacer funcionar, justificaría la elección de la distribución de proba­
bilidades estándar utilizada en el conjunto de equilibrio para un siste­
ma energéticamente aislado, al tiempo que aportaría una justificación
parcial de su concepción de que un sistema a lo largo de un tiempo
infinito pasaría casi todo su tiempo cerca del equilibrio. Supongamos,
dice Boltzmann, que el estado dinámico microscópico de cualquier
sistema individual pasa en algún momento por todos y cada uno de
los estados dinámicos microscópicos compatibles con las ligaduras del
sistema. Estas ligaduras podrían venir dadas, por ejemplo, por la ener­
gía total invariable del sistema y por el volumen de la caja en la que
se encuentra confinado. Llamemos a esta suposición la Hipótesis E r­
gódica. (Véase la figura 3.5.)
178 Filosofía de la física

Muchas cosas se seguirían de la Hipótesis Ergódica si fuera cierta.


A partir de ella, uno podría demostrar que la distribución de probabi­
lidades estándar no es sólo una distribución estacionaria bajo evolu­
ción dinámica, sino que es la única distribución de dicha índole. Uno
podría no sólo demostrar que un sistema, a lo largo de un tiempo infi­
nito, pasará casi todo su tiempo en o cerca del equilibrio, sino demos­
trar incluso que el tiempo que el sistema pasa con su microestado en
una región particular de microestados será justamente esa proporción
de tiempo que la región tiene como una proporción del conjunto de
todos los microestados accesibles de acuerdo con la medida de proba­
bilidad estándar. Esto permitiría identificar la «probabilidad» de un
microestado (determinada según la distribución de probabilidades es­
tándar) con un tipo más físico de probabilidad, a saber, la proporción
de tiempo que el sistema pasa con su microestado dotado de una ca­
racterística determinada. Todo esto será válido, sin embargo, sólo en
el límite de tiempo infinito. Si uno utilizase entonces el gran número
de grados de libertad de un sistema (su vasto número de moléculas) y
la naturaleza especial de las funciones utilizadas para calcular caracte­
rísticas macroscópicas observables, contaríamos con una justificación
bastante completa de la identificación de los valores medios calcula­
dos por medio de la medida de probabilidad estándar con los «valo­
res ostensiblemente probables». Entonces, si consideramos el equili­
brio como el estado ostensiblemente probable, contaríamos con una
justificación para considerar los valores medios de los conjuntos
como representativos del equilibrio.
Vaya, Boltzmann no pudo demostrar que la Hipótesis Ergódica
era cierta. De hecho, es falsa y puede demostrarse que lo es por me­
dio de razonamientos topológicos (o de medida-teóricos) muy genera­
les. Pero, como veremos, una modificación de la idea boltzmanniana
ha resultado ser inmensamente fructífera. '
La justificación de las afirmaciones de la teoría del no equilibrio
que describe la aproximación al equilibrio de sistemas que partieron
de ese estado es todavía más problemática. La nueva imagen boltz­
manniana sugiere esto: Si partimos de la colección de todos los siste­
mas posibles en un estado dado de no equilibrio, seguimos su evolu­
ción en el tiempo, y tomamos nota del estado dominante de los
sistemas en cada instante, la curva a través de esos estados dominan­
tes será la curva generada como solución de la ecuación de Boltz­
mann. Pero, ¿lo será? Y si lo es, ¿por qué lo es? La forma en que los
La introducción de la probabilidad en ia física 179

sistemas se comportarán en realidad dependerá de dos cosas: el


estado dinámico microscópico del que partieron y las leyes de la di­
námica que determinan cómo evolucionarán sus estados dinámicos
microscópicos a partir de ese estado inicial.
Así, una teoría estadística perfecta del no equilibrio nos debería
decir qué probabilidad atribuir a una clase de estados microscópicos
iniciales de sistemas preparados en una condición inicial dada de no
equilibrio. Nos debería explicar también por qué tenemos derecho a
esperar que esta distribución de microestados iniciales represente
verdaderamente, de algún modo apropiado, la distribución de los
estados iniciales de los sistemas reales en el mundo. Además, la teo­
ría nos debería explicar cómo" es que cuando la colección de sistemas
evoluciona en el tiempo, sufriendo cada sistema individual un cam­
bio de microestado de acuerdo con las leyes dinámicas dadas, la dis­
tribución de probabilidades de las colecciones de sistemas, esto es, la
proporción de sistemas que se encuentran en dominios determinados
de microestados posibles, evolucionará de forma tal que las últimas
colecciones se parecerán cada vez más a la distribución de probabili­
dades correspondiente al equilibrio.
Muy pronto se advirtió que Boltzmann, en la derivación de su fa­
mosa ecuación de evolución, se había valido de una suposición cru­
cial. Al describir la evolución de las moléculas de un gas simple, su­
puso que la frecuencia de las colisiones en las moléculas con una
velocidad dada sería proporcional a la fracción de moléculas en el
gas con esa velocidad. Esta es su famosa Hipótesis Relativa a los N ú ­
meros de Colisión. Se supone que no hay una correlación especial
entre las moléculas antes de la colisión. La evolución de la colección
de gases hacia la colección de equilibrio en la versión estadística de
la teoría depende de una suposición similar, el Postulado del Caos
Molecular. Se supone que, no sólo al comienzo de la evolución, sino
también en cada instante posterior, puede aplicarse un postulado de
«aleatoriedad» de las colisiones de las moléculas. Pero la evolución
del conjunto está fijada por el conjunto inicial y por la evolución di­
námica determinista de cada gas en la colección. ¿Es, entonces, con­
sistente con la colección inicial apropiada y estas leyes el postular la
validez del Caos Molecular? Evidentemente, si la evolución está to­
talmente determinada por el estado inicial y las leyes, uno debe justi­
ficar la legitimidad de hacer tal suposición de realeatoriedad. Explo­
raremos esto brevemente.
180 Filosofía de la física

Es importante observar que es justamente dicha suposición de


realeatoriedad, aplicada a las moléculas antes
, pero no después, de
que colisionen, lo que aporta el origen de la asimetría temporal de la
ecuación de Boltzmann y de su solución, describiendo la aproxima­
ción temporal-asimétrica al equilibrio en el futuro, pero no en el pa­
sado. Pero las leyes de la dinámica no muestran dicha asimetría tem­
poral. ¿Dónde se introduce físicamente? ¿Hay asimetrías ocultas en
las leyes de la dinámica? ¿Es nuestra idealización del sistema como
aislado del resto del m undo una idealización errónea? O ¿es el ori­
gen de la asimetría algo sobre la naturaleza física del m undo que ha­
ce de un conjunto inicial
apropiado — uno que genera la asimetría en
el tiempo de la descripción probabilística conjuntista del m undo y, a
continuación, captura en nuestra teoría la asimetría observada del
mundo como se expresa en la Segunda Ley de la Termodinámica—
el correcto para ser elegido? Semejantes cuestiones, como veremos,
siguen siendo frecuentes en los fundamentos de esta disciplina.

El problema de la irreversibilidad y las tentativas de resolverlo

Los años que siguieron a este trabajo pionero en mecánica estadística


presenciaron un enorme progreso. La ampliación de los primeros tra­
bajos con el objeto de aplicarlos a sistemas más generales que los ga­
ses rarificados de los primeros estudios significó un gran avance. La
teoría de los sistemas en equilibrio ha sido generalizada para abarcar
sistemas tales como los gases densos, y sistemas de índole radical­
mente diferente como la radiación en interacción con la materia. Sin
embargo, no se ha logrado un éxito comparable con la generalización
de la teoría del no equilibrio a los gases no densos, pues los métodos
de solución aproximada, que funcionan bien en el problema del
equilibrio, dejan de hacerlo normalmente cuando lo que se intenta
generalizar son las ecuaciones de no equilibrio. Pero incluso aquí se
ha realizado un progreso significativo.
Lina revisión fundamental de la teoría se dio cuando la dinámica
clásica, empleada para describir el comportamiento de los constitu­
yentes microscópicos en la teoría original, fue reemplazada por una
nueva teoría dinámica fundamental, la mecánica cuántica. Tal y como
veremos en el capítulo 4, la mecánica cuántica comporta su propia
descripción probabilística de la evolución de los sistemas en el tiem­
La introducción de la probabilidad en la física 181

po. Pero la concepción estándar es que sigue siendo imposible elimi­


nar los elementos probabilísticos de la mecánica estadística, pues
describen un aspecto probabilístico del mundo más allá de cualquie­
ra de los aspectos probabilísticos descritos al nivel mecánico-cuánti­
co. El problema de reconciliar la teoría estadística, o probabilística,
que aporta un fundamento a la termodinámica, con la teoría dinámi­
ca subyacente, pues, continúa siendo un problema abierto, aun cuan­
do la teoría dinámica subyacente sea la mecánica cuántica. De hecho,
por ciertas razones técnicas, algunos de los argumentos justificativos
y explicativos que discutiremos en esta sección, argumentos que pre­
suponen la dinámica clásica como teoría dinámica subyacente, dejan
de ser válidos en el nuevo contexto dinámico. Los fundamentos de
los postulados probabilísticos de la mecánica estadística resultan de
algún modo más difíciles de explicar, en lugar de más fáciles, en el
nuevo marco dinámico.
Aparte de en la generalización de la teoría y en su reconstrucción
sobre la nueva base dinámica, se ha realizado un enorme trabajo para
suministrar la justificación fundacional de la teoría, cuya necesidad
ya discutimos anteriormente. El programa general consiste en ver
qué parte de la postulación probabilística incluida en la teoría de la
mecánica estadística puede demostrarse que es no autónoma. Esto
es, deseamos averiguar hasta qué punto puede dotarse a las suposi­
ciones probabilísticas (y a su uso en el cálculo de cantidades observa­
bles) de un fundamento explicativo en fuentes no probabilísticas. En
particular, con lo que tenemos que trabajar es con los hechos sobre
la estructura de los sistemas en cuestión (que el gas está formado por
moléculas y está encerrado en una caja, por ejemplo) y los hechos so­
bre la teoría dinámica subyacente (que las moléculas se mueven en
una forma especificada por la dinámica clásica, que su intercambio
de energía por colisión viene también descrito por esa teoría, etcéte­
ra). ¿En qué medida podemos derivar los postulados requeridos por
la mecánica estadística de las características dinámicas fundamentales
del sistema? Entre los elementos de la mecánica estadística que que­
rríamos deducir se encuentran la distribución de probabilidades es­
tándar utilizada en la teoría del equilibrio, la identificación de canti­
dades observables en el equilibrio con promedios derivados de su
distribución de probabilidades, el Postulado de Caos Molecular utili­
zado en la teoría del no equilibrio, etcétera. Y si algunas de las supo­
siciones probabilísticas básicas de la mecánica estadística no fuesen
182 Filosofía de la física

derivables de la estructura del sistema y de su dinámica subyacente,


¿qué cabida puede darse a las mismas en el mundo descrito por la fí­
sica? Y si son postulados autónomos ¿cuál es la razón física que los
hace verdaderos?
Dado que el resto de esta sección sobre el problema de la irre-
versibilidad es bastante denso, permitidme esbozar la estructura que
tendrá. Primero examinaremos algunas tentativas de entender el
estado de equilibrio. Después discutiremos el problema general de la
aproximación al equilibrio. Acto seguido, distinguiremos algunos de
los enfoques «no ortodoxos» sobre el problema del equilibrio más
estándar. Luego examinaremos algunas variaciones del enfoque es­
tándar de estas cuestiones. A continuación, examinaremos el proble­
ma de caracterizar la distribución de probabilidades inicial que ha de
suponerse. Finalmente, examinaremos algunas tentativas de dar cuen­
ta del problema fundamental de la irreversibilidad de los sistemas
que introducen resultados sobre la estructura global del cosmos en la
argumentación.

Caracterizando el equilibrio
Examinemos primero el caso de la teoría del equilibrio. Como indi­
camos anteriormente, el procedimiento estándar para calcular los va­
lores de equilibrio de cantidades observables consistía en identificar
esas cantidades con los valores medios de ciertas funciones del
estado microscópico del sistema. El valor medio se calcula utilizando
la distribución de probabilidades estándar. La «imagen» de Boltz­
mann de la justificación de este procedimiento era que el sistema ais­
lado se encontraría en casi todo momento en o cerca del equilibrio.
Dado que la medida de probabilidad estándar podía interpretarse en
el sentido de indicar la proporción de tiempo que un sistema pasa
con su. microestado en una región determinada de condiciones, y da­
do que, además, los estados ostensiblemente más probables prevale­
cían absolutamente sobre los otros, de manera que los valores me­
dios podían ser identificados con los valores más probables, el valor
medio de una cantidad, calculado según la medida de probabilidad
estándar, sería igual a su valor ostensiblemente más probable. Éste
sería entonces su valor de equilibrio. Según indicamos, se logró dar
una justificación de estas afirmaciones utilizando la Hipótesis Ergódi-
La introducción de la probabilidad en la física 183

ca — que el microestado de cualquier sistema pasaría por todos y ca­


da uno de los microestados posibles en algún momento de su evolu­
ción— . Pero la Hipótesis Ergódica era presumiblemente falsa. ¿Po­
dría encontrarse algo que poner en su lugar?
Se probó un teorema en el sentido de que si un sistema satisfacía
una cierta ligadura determinada (esencialmente, la ausencia de cual­
quier constante de movimiento «global» que no fuesen las utilizadas
para especificar el sistema), los promedios de fase para cantidades,
calculados utilizando la medida estándar, serían iguales a los prome­
dios temporales de esas cantidades, al menos para la mayoría de los
sistemas. Esto es, excepto para un conjunto de sistemas con una pro­
babilidad de tamaño cero en la medida estándar, el promedio sobre
un tiempo infinito de una cantidad para un sistema dado a medida
que los sistemas evolucionaban sería igual al promedio de esa canti­
dad tomado sobre todos los sistemas en un mismo instante, utilizan­
do la medida de probabilidad estándar para especificar el número de
sistemas con sus microestados en un dominio dado de dichos mi­
croestados. Si esta condición se cumpliese, uno podría probar que,
para «casi todos» los sistemas, el tiempo pasado por el sistema en un
dominio de microestados determinado (en el límite de tiempo ten­
diendo a infinito) sería igual a la probabilidad de ese dominio de m i­
croestados en la medida de probabilidad estándar. Así pues, podría
derivarse una cierta «ley de los grandes números», a saber, que en el
límite de tiempo infinito, las proporciones temporales
eran iguales a
probabilidades, aun cuando, en este caso, no
estuviésemos tratando
con series probabilísticamente independientes sino, antes bien, con
una evolución determinista. Y uno podría probar, si la condición se
cumpliese, que la única medida de probabilidad que (1) era invarian­
te en el tiempo y (2) asignaba una probabilidad cero a las clases de
microestados que tenían probabilidad cero en la medida estándar,
era la propia medida estándar. Estos resultados se aproximan a los
obtenidos utilizando la falsa Hipótesis Ergódica. (Véase figura 3.6.)
Pero ¿satisfacen los sistemas interesantes alguna vez la condición
en cuestión? Primero se encuentra una condición dinámica para que
un sistema sea ergódico (es decir, para que satisfaga la condición del
teorema esbozado). Se trata de una condición sobre la inestabilidad
de los caminos de evolución de los sistemas en sus descripciones m i­
croscópicas y, esencialmente, exige que para cada microestado haya
microestados próximos tales que la evolución de los sistemas a partir
184 Filosofía de la física

El teorema ergódico. Sea un sistema que parte de un microestado, a. Sea


F ig u r a 3.6.
R una región cualquiera de microestados posibles del sistema dadas sus ligaduras. D i­
chas ligaduras podrían ser una especificación, por ejemplo, de la energía total del gas.
Supongamos que R tiene un tamaño definido, distinto de cero, en el espacio de fases.
Entonces, cuando un sistema es ergódico, sucederá que, excepto posiblemente para
un conjunto de microestados iniciales de tamaño cero, la trayectoria desde el mi­
a
croestado inicial pasará en algún momento por la región R.

de ellos diverja de la evolución del sistema dado muy rápidamente.


Después se demuestra cómo ciertos modelos de sistemas satisfacen
esta condición dinámica y, por lo tanto, son sistemas ergódicos. En
particular, el sistema formado por «esferas rígidas en una caja» es
uno de tales sistemas ergódicos. Las partículas deben interaccionar
sólo instantáneamente por colisiones entre sí y con las paredes de la
caja, y las colisiones deben ser perfectamente elásticas. Perfectamente
elásticas significa que no se absorbe o se emite energía alguna en las
colisiones. Como este modelo es uno de los modelos estándar adop­
tado para los gases ideales, parece que hemos encontrado un tipo de
justificación de la teoría del equilibrio utilizando solamente la estruc­
La introducción de la probabilidad en la física 185

tura del sistema y las leyes de la dinámica que gobiernan los micro-
componentes.
Estos resultados son impresionantes. Pero debemos ser cautelo­
sos. Para empezar, está el problema del «conjunto de medida cero».
Con la ayuda de los resultados ergódicos podemos demostrar que,
excepto para un conjunto inicial de condiciones iniciales de probabi­
lidad cero en la medida de probabilidad estándar, todo sistema pre­
sentará promedios temporales de sus cantidades iguales a los valores
medios calculados utilizando la probabilidad estándar. Pero, ¿por
qué suponer que, sólo porque un conjunto tenga probabilidad cero
en la medida estándar, es muy poco probable que un sistemé en el
mundo tenga una condición inicial semejante? Nuevamente, pode­
mos demostrar que de todas las distribuciones de probabilidad que
asignan probabilidad cero a aquellos conjuntos con probabilidad
cero en la distribución de probabilidades estándar, sólo la distribu­
ción de probabilidades estándar es constante en el tiempo. Pero, ¿por
qué restringir nuestra atención justamente a esas distribuciones de
probabilidad que «ignoran» (es decir, dan probabilidad cero a) los
conjuntos que tienen probabilidad cero en la medida estándar? Es
como si hubiésemos reemplazado nuestro postulado probabilístico
original, según el cual la medida de probabilidad estándar da la pro­
babilidad correcta, por una suposición de probabilidad autónoma,
más débil, pero aún no trivial, a saber, que los miembros del conjun­
to de condiciones iniciales que tiene probabilidad cero en la medida
estándar pueden ser ignorados. Estamos suponiendo que podemos
esperar con «certeza probabilística» que éstos no ocurrirán.
Otro importante problema se deriva del hecho de que, si bien las
condiciones necesarias para que el Teorema Ergódico sea válido son
probablemente ciertas para tales sistemas idealizados como el de las
esferas rígidas en una caja, probablemente no lo sean para sistemas
más realistas. Las moléculas en un gas no son esferas rígidas perfectas
que permanecen sin interaccionar unas con las otras o con las pare­
des del contenedor hasta que se produce la colisión. En lugar de ello,
se da una interacción suave y gradual de las moléculas entre sí y de
las moléculas con las paredes, una interacción que varía con la sepa­
ración de los componentes interactivos. En mecánica hay otro teore­
ma, el Teorema de Kolmogorov-Arnold-Moser (o KAM), el cual nos
dice que en ciertos casos determinados habrá regiones en el espacio
de fases cuya medida es distinta de cero y tales que el estado de todo
186 Filosofía de la física

E l teorema KAM.
F ig u r a .3.7. La curva cerrada, S, representa un sistema que parte
de un estado inicial dado, pasa a través de una serie de estados intermedios y regresa
después a su estado inicial exacto, repitiendo el procesoad infinitum. U n ejemplo po­
dría ser un planeta que, imperturbado, repite una órbita cerrada indefinidamente. E l
teorema K A M dice que para sistemas que satisfacen sus requisitos, una perturbación
suficientemente pequeña del sistema (digamos, del planeta por el tirón gravitacional
de otro planeta) producirá una órbita que, aunque ya no será cerrada, estará confina­
da a una región finita (indicada por el tubo Tí circunscribiendo (en el espacio de fa­
S.
ses) la curva inicial U n sistema semejante no puede entonces ser ergódico y «vagar»
por todo el espacio de fases disponible.

sistema cuyas condiciones iniciales estén en dicha región permanece­


rá en la misma durante todo el tiempo. Estos sistemas poseen una es­
tabilidad que les impide transitar por todos los lugares de la región
de microestados permitida, tal como requiere la ergodicidad. Aunque
no podemos (en general) probar que los sistemas realistas tengan la
condición necesaria para que se cumpla el Teorema KAM , es muy
plausible que lo hagan. Así pues, las idealizaciones más realistas de
un sistema no satisfarían las condiciones para la ergodicidad. (Véase
la figura 3.7.)
Lo que uno desearía demostrar en estos casos sería algo más mo­
desto que la ergodicidad. Uno utilizaría el hecho de que los sistemas
reales de los que nos ocupamos están constituidos por un vasto nú­
mero de microcomponentes tales como moléculas. Esto no se toma
en cuenta en absoluto en los resultados ergódicos. Después uno in­
La introducción de la probabilidad en la física 187

tentaría demostrar que, para tales sistemas, la región de las trayecto­


rias estables, requerida por el Teorema KAM, se hace muy pequeña
en la medida de probabilidad natural a medida que crece el número
de componentes en el sistema. Efectivamente, los modelos de orde­
nador parecen demostrar que esto es cierto. La región restante de
inestabilidad no tendría por qué ser tan caótica como la región ines­
table del sistema ergódico. Pero, aun cuando no se pudiera probar la
validez de la ergodicidad en la región de fases como un todo, ni si­
quiera en la región de inestabilidad dominante, quizá uno pudiera
demostrar que en esta región se daba un tipo
de inestabilidad. Esta
región constaría de la inmensa mayoría de los estados iniciales si se
medía en la forma natural. Esto sería suficiente para obtener algo pa­
recido a los resultados de Boltzmann. Es decir, sería suficiente para
garantizar que el comportamiento a largo plazo de las trayectorias
que hubieran arrancado de esta región podía ser modelado por las
probabilidades estándar. La exploración de posibilidades como ésta
es un proyecto de investigación en curso en los fundamentos de la
mecánica estadística. Sin embargo, aun cuando se obtuvieran dichos
resultados, su aplicación requeriría la suposición de que las regiones
pequeñas de estabilidad en la medida de probabilidad natural fueran
realmente «pequeñas» en el mundo. Necesitaríamos demostrar que
es poco probable físicamente encontrar un sistema con su microesta-
do en una tal región de estabilidad. Esto no sería derivable de la di­
námica subyacente.
Finalmente, deberíamos de reparar en la estructura de las expli­
caciones estadísticas ofrecida por esta teoría del equilibrio. ¿Cómo
son explicadas probabilísticamente las características de equilibrio de
los sistemas por esta teoría? No se demuestra que éstas son las carac­
terísticas de los sistemas que encontramos con gran probabilidad en
el mundo. De hecho, si esto se llegase a demostrar, nos encontraría­
mos con un problema, pues, como sabemos, existe una alta probabi­
lidad de que encontremos sistemas en el mundo que no están en
equilibrio. La teoría tampoco muestra en forma alguna que las ca­
racterísticas del equilibrio sean más probables de lo que hubiése­
mos esperado por la evidencia de fondo. Y tampoco aporta un tipo
de explicación estadístico-causal del equilibrio. No deriva el equili­
brio de algunas propensiones causales tiquistas, ni deriva su probabi­
lidad de una distribución probabilística sobre condiciones iniciales
causales. Dicha explicación probabilístico-causal, si es que puede
188 Filosofía de la física

darse en modo alguno, estará en el origen de la teoría mecánico-esta-


dística del no equilibrio y de la aproximación al equilibrio. Volvere­
mos sobre esto en un momento.
En lugar de ello, la teoría nos permite comprender las caracterís­
ticas de equilibrio de los sistemas en virtud de su demostración de
que bajo las condiciones adecuadas las características que se dan en
los sistemas cuando se observa que están en equilibrio son justamen­
te esas características que dominan el comportamiento de un sistema
a lo largo de un tiempo infinito idealizado. Una vez más, como he­
mos indicado, sólo el lograr establecer esto requiere una gran dosis
de idealización. La legitimidad de la idealización es una cuestión con­
trovertida. Pero el modelo de explicación es ciertamente interesante.
Una característica macroscópica es identificada con el promedio de
la cantidad microscópica correspondiente utilizando una distribución
de probabilidades natural. La distribución de probabilidades está jus­
tificada, demostrándose que es la única distribución estacionaria que
asigna probabilidad cero a las regiones que tienen probabilidad cero
en esa misma medida natural. El tiempo pasado en regiones de
estados microscópicos en el límite infinito se demuestra que es equi­
valente al tamaño de la región según dicha medida natural. Y, con el
enorme número de componentes microscópicos introducido, puede
demostrarse que los promedios de las cantidades son equivalentes a
los valores ostensiblemente más probables, y éstos equivalentes a los
valores estándar en el equilibrio. Finalmente, y de gran importancia,
es la medida en que se puede dotar de un fundamento firme a la na­
turalidad de la medida de probabilidad. Puede demostrarse, por lo
que se refiere a todos los requisitos que hemos indicado, que es la
medida de probabilidad «correcta». La demostración utiliza solamen­
te la estructura del sistema y las leyes de la dinámica. En alguna me­
dida, al menos, se ha reducido la necesidad de postular la medida de
probabilidad natural como una parte autónoma y fundamental de la
teoría. Como veremos, sin embargo, las cosas no son tan simples
cuando lo que está en juego es el no equilibrio.

La aproximación al equilibrio
¿Qué tipo de teoría deberíamos buscar para contar con una descrip­
ción estadística general de la aproximación al equilibrio y con una
La introducción de la probabilidad en la física 189

explicación de los fenómenos de no equilibrio? Esperamos que nues­


tra descripción incluya elementos probabilísticos, pues sabemos por
la estructura de la dinámica fundamental que los sistemas individua­
les pueden, de hecho, comportarse en el modo «contradinámico».
Pueden dejar de moverse suavemente desde un estado de no equili­
brio inicial a un estado de equilibrio. Será en el comportamiento de
una colección de sistemas, en la que cada sistema ha partido de la
misma condición de no equilibrio, donde encontraremos nuestra des­
cripción de la aproximación al equilibrio. Y será algo referente a la
evolución del conjunto de sistemas o, más precisamente, algo referen­
te a la evolución de una distribución de probabilidades inicial sobre
los posibles microestados de sistemas compatibles con la condición
de no equilibrio original del sistema, lo que representará para noso­
tros la aproximación al equilibrio.
Hay una buena forma de caracterizar el tipo de comportamiento
que estamos buscando que haría justicia a las ideas de Boltzmann y
de los Ehrenfest discutidas más arriba. Esto fue aclarado por Gibbs.
Consideremos una distribución de probabilidades inicial del no equi­
librio. Sigamos su evolución de acuerdo con las leyes dinámicas que
nos dicen cómo cada sistema en la colección, caracterizado por su
microcondición inicial específica, evolucionará. ¿Podría esta distribu­
ción de probabilidades mismamente aproximarse en el tiempo a la
distribución de probabilidades del equilibrio para las ligaduras espe­
cificadas? Por ejemplo, supongamos que en una caja tenemos gas que
comenzó en la parte izquierda y al que se permitió expandirse hasta
llenar la caja. Inicialmente la probabilidad está concentrada por com­
pleto en los estados correspondientes al gas confinado en la parte iz­
quierda de la caja. ¿Se aproximará esta distribución de probabilida­
des inicial a la correspondiente distribución de equilibrio para un gas
expandido suavemente por toda la caja?
La respuesta es, probablemente, no. Un teorema fundamental nos
dice que la distribución de probabilidades original no puede difumi-
narse en esta forma. Pero puede «difuminarse». La distribución de
probabilidades, en un principio compacta y regularmente acotada,
puede convertirse en una distribución caóticamente deshilachada
que ocupa la región entera de microestados posibles en un sentido
«de grano grueso». A medida que el tiempo avanza, cada microestado
será uno de los ocupados por uno de los sistemas originales o uno de
los no ocupados en esta forma. La fracción de microestados ocupa-
190 Filosofía de la física

Difuminación «de grano grueso» de un conjunto inicial.


F ig u r a 3.8. L a región A
repre­
senta la colección de puntos en el espacio de fases correspondiente a la colección de
sistemas preparados todos en una condición de no equilibrio que es macroscópica­
mente idéntica pero que permite una variedad de estados microscópicos iniciales.
Conforme los sistemas evolucionan siguiendo la dinámica que rige el cambio de
estado microscópico, A T(A).
se desarrolla en E l tamaño de T(A) debe ser igual al de
A por una ley de la dinámica, pero mientras A
es una región simple confinada a una
pequeña parte del espacio de fases disponible, T(A)
es una región deshilachada, com­
pleja, que se extiende por todo el espacio de fases disponible «en un sentido de gra­
no grueso». Una distribución uniforme sobre el espacio de fases disponible es lo que
T(A)
corresponde al equilibrio en la teoría. no está en realidad difuminada de manera
uniforme en el espacio de fases pero puede, no obstante, considerarse que representa
una difuminación del conjunto inicial representativa de una aproximación al equili­
brio.

dos se mantendrá constante. Pero la situación pasará de ser una en la


que todos los puntos ocupados están en una región compacta de los
estados accesibles, a una en la que, para cada pequeña región de mi­
croestados posibles, una parte proporcional a esa región consistirá en
estados ocupados. Gibbs utiliza como analogía la mezcla de tinta in-
soluble y agua. Si bien cada parte del fluido, si se examina con el su­
ficiente detenimiento, es siempre tinta o agua; la tinta, que comenzó
flotando en la superficie del agua, se deslíe en algún momento uni­
formemente por todo el volumen permitido. Dicha aproximación de
grano grueso al equilibrio de la distribución de probabilidades inicial
de no equilibrio se corresponderá muy bien, como noción formal,
La introducción de la probabilidad en la física 191

con las ideas sobre la aproximación al equilibrio resumidas por los


Ehrenfest en su solución a la ecuación de Boltzmann, representando
la «curva de concentración» de la distribución de probabilidades
evolvente para la colección. (Véase la figura 3.8.)
Pero, ¿podemos demostrar que una probabilidad inicial corres­
pondiente a una situación de no equilibrio evolucionará, efectiva­
mente, en el sentido de grano grueso, hacia la distribución de proba­
bilidades asociada con el equilibrio? Podemos obtener dicho
resultado si imponemos un enunciado general de un Postulado de
Caos Molecular a la teoría. Éste puede tomar formas diferentes, de­
pendiendo de cómo queramos modelar matemáticamente la evolu­
ción de la distribución de probabilidades. Pero, en cada caso, el pos­
tulado, el descendiente de la Hipótesis Relativa al Número de
Colisiones de Boltzmann, debe ser añadido a los enunciados subya­
centes sobre la estructura del sistema y a las leyes dinámicas subya­
centes. ¿Cómo podemos estar de algún modo seguros de que la evo­
lución así determinada tendrá, de hecho, el tipo de naturaleza
permanentemente «realeatoriadora» que se utiliza para derivar la
aproximación al equilibrio cuando se supone Caos Molecular? A quí
hay problemas profundos de consistencia entre el postulado y las d i­
námicas subyacentes.

Algunos enfoques no estándar del problema


Antes de abordar este problema, exploremos algunas de las concep­
ciones acerca del origen físico de la aproximación al equilibrio de los
sistemas. La teoría ortodoxa supone que los sistemas en cuya evolu­
ción estamos interesados pueden ser concebidos como verdadera­
mente aislados del mundo exterior. Pero ¿es legítima esta suposi­
ción? La teoría estándar supone leyes dinámicas de la naturaleza
subyacentes que son «invariantes bajo inversión temporal», y busca
la razón de la asimetría temporal de la termodinámica y de la mecá­
nica estadística en algo diferente a una asimetría subyacente de las le­
yes dinámicas básicas. ¿Es esta suposición correcta? El enfoque orto­
doxo supone que la asimetría en el tiempo está fundada en alguna
cuestión de hecho sobre el m undo que requiere una explicación si­
milar a las explicaciones físicas ofrecidas a otros fenómenos descu­
biertos. Pero ¿es esto correcto, o podemos encontrar la justificación a
192 Filosofía de la física

las suposiciones probabilísticas de la teoría en algunas características


generales de la inferencia inductiva y probabilística, antes que buscar
su fundamento en algunos hechos sobre el m undo físico?
Los métodos estándar de la mecánica estadística tratan a los sis­
temas como si verdaderamente pudieran aislarse energéticamente del
mundo exterior. Pero un aislamiento tan perfecto es, por supuesto,
imposible. Como mínimo se tiene la interacción gravitacional entre el
sistema y el entorno exterior, una interacción que no puede ser eli­
minada. Las fuerzas debidas a la interacción pueden, empero, ser de
hecho muy pequeñas. Considerad un gas confinado en la parte iz­
quierda de una caja. Dejad que se expanda por toda la caja. La con­
cepción del aislamiento puro sostiene que en las posiciones y en los
momentos de las moléculas en un tiempo posterior se encuentra im­
plícita la información sobre el estado original del gas. Pero, arguye el
intervencionista, incluso los cambios infinitesimales en el microesta­
do inducidos por las débiles interacciones con el m undo exterior
modificarán el microestado del gas de tal forma que el microestado
real en un tiempo posterior perderá cualquier correlación que indi­
que el estado macroscópico inicial del gas. La inversión temporal de
este microestado real, por oposición a ideal, no será un microestado
que evolucionará de nuevo a la situación del gas confinado en la par­
te izquierda de la caja sino, antes bien, uno de los innumerables mi­
croestados correspondientes al gas expandido en toda la caja. ¿Pue­
den ser eliminadas de esta forma las paradojas de la reversibilidad?
La mayoría piensa que no. Hay casos especiales en los que el ais­
lamiento es suficiente para que pueda construirse un verdadero tipo
de inversión de un estado. Podemos construir un microestado que
lleve al sistema a mostrar un comportamiento antitermodinámico. El
experimento del eco-espín es uno de ellos. Los núcleos con momen­
tos magnéticos evolucionan desde un estado de equilibrio macroscó­
picamente ordenado a uno aparentemente desordenado. Un pulso de
radio puede «voltear» los núcleos, de manera que el sistema parece
retroceder espontáneamente a su condición original ordenada de no
equilibrio. A quí el aislamiento es suficiente para que el microestado
ulterior del sistema en equilibrio retenga la información sobre el
estado original de no equilibrio. El experimento puede ser también
realizado cuando los núcleos interaccionan magnéticamente entre sí.
Pero el sistema parece mostrar, hasta el «volteo», la aproximación
macroscópica al equilibrio habitual, indicando que debemos explicar
La introducción de ia probabilidad en la física 193

dicho comportamiento incluso cuando el aislamiento es «perfecto».


La mayoría de los físicos están todavía convencidos de que hasta los
sistemas perfectamente aislados del entorno exterior mostrarían la
asimetría temporal caracterizada por la Segunda Ley. (Véase la figu­
ra 3.9.)
Los enigmas estándar concernientes a la reversibilidad suponen
también que las leyes dinámicas subyacentes tienen la propiedad de
invariancia bajo inversión temporal. Esto implicaría que el microes-
tado invertido de un sistema que ha evolucionado a partir del no
equilibrio sería uno que evolucionaría en el inverso temporal del
microestado original de no equilibrio. Se tendría entonces una evo­
lución con retorno a una situación de no equilibrio. ¿Podría estar
equivocada* esta suposición de simetría temporal para las leyes diná­
micas subyacentes, de manera que la asimetría temporal a este nivel
de la dinámica fundamental fuese realmente la fuente de la asimetría
termodinámica? La mayoría piensa que no. Las leyes de la dinámica
clásica, y también, se afirma habitualmente, las leyes de la dinámica
cuántica, son simétricas en el tiempo en el sentido convencional. En
realidad, para la mecánica cuántica, ésta es una cuestión que podría
ser controvertida. Según veremos en el capítulo 4, en la concepción
mecánico-cuántica del mundo existe un proceso denominado medi­
ción que entraña una clase especial de asimetría temporal. La natura­
leza y origen de esa asimetría son de por sí controvertidos, siendo
atribuidos por algunos a la asimetría termodinámica considerada
como la asimetría fundamental. Pero la opinión general es que las fa­
miliares asimetrías de la termodinámica no tienen su origen en ningu­
na asimetría semejante de la medición mecánico-cuántica, y que el
origen de la asimetría de la mecánica estadística debe buscarse en
otro lugar.
Curiosamente, hay fenómenos en la naturaleza que parecen de­
mandar leyes fundamentales asimétricas en el tiempo. Esto salta a la
vista en el estudio de ciertas interacciones en el dominio de la teoría
cuántica de campos. Aquí, parece, encontramos procesos que son po­
sibles de acuerdo a las leyes fundamentales, pero cuyas inversiones
temporales naturales son imposibles. Más concretamente, las proba­
bilidades del proceso no son invariantes bajo inversión temporal. Se
han llevado a cabo algunos trabajos con el propósito de demostrar
que no podría derivarse ninguna explicación de las familiares asime­
trías que nos ocupan aquí a partir de estos fenómenos, aun cuando
194 Filosofía de la física

- 0 O O O
— O' 0 o o
t=A, " Q 0 O 0

, = 2 a , 0 © o O
F ig u r a 3.9.E l experimento del eco-espín. L a fila de arriba de la figura representa una
colección de núcleos giratorios cuyos espines están alineados en la misma dirección
según un plano que es perpendicular a un campo magnético aplicado sobre el cristal
a cuyos átomos pertenecen los núcleos en cuestión. E n la segunda fila ha transcurri­
do un período de tiempo. Las direcciones de los espines han precesado, a diferentes
velocidades, en torno al campo magnético aplicado, de manera que en este punto los
espines, aunque todavia en el mismo plano, apuntan ahora en todas las direcciones
«al azar». E n la tercera fila, los espines han sido «volteados» por un pulso de frecuen­
cia de radio. Lo s espines «más adelantados» en la «carrera de precesión» son ahora
los «más atrasados». E l resultado se muestra en la fila de abajo. E l tiempo es ahora el
doble del transcurrido desde la fila de arriba a la segunda fila. Los espines se han «al­
canzado» ahora unos a otros, de forma que todos ellos apuntan de nuevo en la mis­
ma dirección. Desde la tercera línea a la linea de abajo parece haber una condición
de equilibrio (espines aleatorios) que evoluciona espontáneamente a una condición
de no equilibrio (todos los espines alineados).

éstos revelen una no invariancia bajo inversión temporal verdadera­


mente legal en el mundo.
Finalmente, está la escuela que busca la justificación de las apli­
caciones de la probabilidad en la mecánica estadística, no en el des­
cubrimiento de proporciones reales en el m undo o en alguna caracte­
rística especial de las leyes y estructuras de los sistemas como la
ergodicidad, sino en principios generales del razonamiento inductivo.
La introducción de la probabilidad en la física 195

En caso de equilibrio, se arguye, la justificación de la medida ordina­


ria de probabilidad es el Principio de Indiferencia. Éste nos dice que,
a falta de una evidencia ulterior, tratemos de la misma forma, en tér­
minos de peso probabilístico, todos los casos simétricos permitidos
por la evidencia disponible. Pero, como hemos indicado, el Principio
de Indiferencia estará vacío hasta que se proporcione una forma defi­
nitiva de caracterizar los sistemas. ¿Dónde, si no es en las propieda­
des de la dinámica y de la estructura, encuentran los «inductivistas»
esto?
En el caso de no equilibrio, los inductivistas arguyen que, con tal
que una situación sea «reproducible experimentalmente» en el nivel
macroscópico, uno puede justificar la concepción de que la entropía
aumenta con el tiempo. La idea es la siguiente: Podemos esperar que
sistemas idénticamente preparados en lo que a sus características ma­
croscópicas respecta evolucionen a sistemas semejantes en sus carac­
terísticas macroscópicas sólo si hay muchos más microestados que
correspondan a la situación macroscópica fundamental de los que
correspondían a la situación macroscópica original. Pero semejante
incremento en los microestados correspondientes a un macroestado
evolucionado es justamente la noción mecánico-estadística del au­
mento de entropía estadística. Bien, de acuerdo. Pero lo que noso­
tros queríamos explicar era por qué
se da algo como la repro-
ducibilidad experimental de los sistemas cuando se describen
macroscópicamente. ¿Cómo es que sistemas constituidos por un vas­
to número de componentes pueden ser descritos de manera sencilla
mediante un pequeño número de parámetros que evolucionan según
ciertas leyes? Y ¿por qué los sistemas descritos macroscópicamente
en esta forma evolucionan siempre en la misma dirección temporal
cuando se considera el movimiento hacia el equilibrio? ¿Cómo se ex­
plica, si quieres, que los experimentos sean todos reproducibles ex­
perimentalmente en la misma dirección temporal y algunos no lo
sean en la dirección opuesta? Y ¿cómo es que esta dirección tempo­
ral es la que consideramos como el futuro?
Si observamos un sistema en un estado de no equilibrio, somos
capaces de inferir sus estados en tiempos diferentes solamente en
una dirección temporal. Sabemos que un sistema calentado por un
extremo y frío en el otro estará más tarde todo él caliente, mientras
dada una barra caliente no somos capaces de inferir el estado de no
equilibrio del que partió, ya que son muchas las condiciones de no
196 Filosofía de la física

equilibrio que evolucionan hacia el mismo estado de equilibrio. Pero


¿por qué existen tales caracterizaciones macroscópicas y su comporta­
miento legal? ¿Por qué evolucionan los sistemas paralelamente unos
a otros en el tiempo? ¿Por qué es la dirección de aproximación al
equilibrio la dirección futura? Estos son los hechos que queríamos
explicar. La línea inductivista parece presuponer tan sólo que los fe­
nómenos en cuestión existen y entonces señala las consecuencias de
su existencia y lo que esta existencia y naturaleza presuponen sobre
la evolución microscópica de los sistemas. Pero por qué se dan los fe­
nómenos precisamente en esta forma es lo que queríamos explicar en
primer lugar.

Algunos enfoques estándar del problema


Regresemos a la escuela ortodoxa de pensamiento. Considerad un
sistema energéticamente aislado del resto del m undo y en una condi­
ción de no equilibrio. ¿Cómo deberíamos representar su aproxima­
ción al equilibrio en mecánica estadística? Pues bien, consideramos
toda condición posible de sus componentes microscópicos compati­
ble con el estado de no equilibrio original del sistema. Nos imagina­
mos una vasta (de hecho, infinita) colección de sistemas que tengan
todos los posibles microestados iniciales, e imponemos una distribu­
ción de probabilidades sobre esos microestados. Cada sistema indivi­
dual en la colección nos lo imaginamos ahora evolucionando de
acuerdo con su estructura y con las leyes dinámicas que gobiernan la
dinámica de los microcomponentes. Queremos mostrar que, dada la
distribución de probabilidades original y dadas esas leyes, se da una
evolución de las distribuciones de probabilidad que tiende, en un
sentido u otro, hacia la distribución de probabilidades en el equili­
brio correspondiente a las ligaduras impuestas sobre el sistema.
Una primera cuestión a plantear es cómo serán las distribuciones
iniciales de probabilidad. Sólo se entiende bien un número limitado
de casos. Un caso es aquel en el que el sistema, si bien no está en
equilibrio, está cerca del equilibrio para empezar. Otro caso, más ge­
neral, es aquel en el que el sistema, si bien no está en equilibrio, pue­
de considerarse que posee regiones suficientemente pequeñas y sufi­
cientemente próximas al equilibrio durante tiempos suficientemente
pequeños. Así, en este último caso, aunque no podamos atribuir una
La introducción de la probabilidad en la física 197

densidad, presión, temperatura o entropía al sistema, podemos consi­


derar que parte con una cierta distribución
de densidad, presión, den­
sidad de entropía y temperatura. El gas confinado inicialmente en el
lado izquierdo de la caja tiene una alta densidad uniforme en la m i­
tad del espacio físico ocupado y una densidad cero en la otra mitad.
La barra de hierro inicialmente caliente en un extremo y fría en el
otro no tiene una temperatura; tiene una distribución de temperatura
a lo largo de la longitud de la barra. En estos casos, las reglas que ge­
neralizan la forma en que el Principio de Indiferencia se aplicaba
para obtener la distribución de probabilidades en el equilibrio, pue­
den probablemente aplicarse para obtener las distribuciones iniciales
de probabilidad en el no equilibrio. En los casos donde ni siquiera
puede suponerse un «equilibrio local transitorio», no está claro cómo
debería ser nuestra distribución de probabilidades inicial. Pero, en
dicho caso, una vez más, tampoco existe realmente una teoría ma­
croscópica que describa la aproximación al equilibrio que ha de de­
ducirse y explicarse.
¿Podemos mostrar, en base solamente a la estructura del sistema
y a la dinámica de los microconstituyentes, sin invocar un postulado
tipo caos molecular de perpetua realeatoriedad, que esta distribución
de probabilidades inicial se aproximará a la distribución de equili­
brio, al menos en la forma de grano grueso sugerida por Gibbs? En
algunos casos sí podemos — en cierto modo. En los casos en los que
podía probarse la ergodicidad en la teoría del equilibrio, como los de
esferas rígidas en una caja, pueden también probarse algunas veces
resultados más fuertes.
La ergodicidad no es suficiente para nuestros propósitos. Im a­
ginemos una vasta colección de sistemas, preparados todos en una
condición dada de no equilibrio. Todos podrían ser ergódicos, evo­
lucionando de forma tal que en un tiempo infinito estuviesen
normalmente en o cerca del equilibrio. Aún así, podría resultar que
la colección no se aproximase, como un todo, al equilibrio. Podría
darse una aproximación regular y uniforme de los sistemas a, y des­
de, el equilibrio de una forma sincronizada, de manera que la distri­
bución de probabilidades sobre todos los sistemas no pudiera mos­
trar una aproximación uniforme al equilibrio ni siquiera en el sentido
de grano grueso. Es decir, podría haber momentos en el futuro en los
que la distribución de probabilidades estuviese alejándose de la dis­
tribución de equilibrio, aun cuando cada uno de los sistemas indivi­
198 Filosofía de la física

duales pasase la mayoría de su tiempo en o cerca del equilibrio del


sistema individual.
Sin embargo, un resultado más fuerte que la ergodicidad, «la
mezcla», puede probarse para sistemas idealizados del tipo de las es­
feras rígidas en una caja. Lo que la mezcla dice, concisamente, es que
si comenzamos con cualquier distribución de probabilidades inicial
«no patológica», ésta, al menos en el paso al límite cuando el tiempo
tiende a infinito, se aproximará en el sentido de grano grueso a la
distribución de probabilidades en el equilibrio. «N o patológica» sig­
nifica esencialmente que la distribución de probabilidades inicial
asignará una probabilidad cero a toda región de microcondiciones
que tenga probabilidad cero en la medida estándar familiar.
Uno puede, efectivamente, probar resultados más fuertes que el
de la mezcla para tales sistemas. Se puede probar que son sistemas K.
Ser un sistema K es tener un tipo de «indeterminación probabilísti­
ca» de grano grueso. Supongamos que concebimos a los microesta­
dos del sistema agrupados en pequeñas colecciones de microestados.
Si un sistema es un sistema K, no podremos determinar con probabi­
lidad uno o cero en qué subcolección se encontrará el microestado
de un sistema en un instante de tiempo dado, aun cuando sepamos
en qué subcolección se encontraba el microestado del sistema en
todos los instantes anteriores de tiempo, discretamente separados,
hasta el pasado infinito. La única excepción se daría en el caso de ser
trivialmente verdadero que el sistema tiene una probabilidad uno o
cero de tener su microestado en la subcolección designada.
Y, todavía más fuerte, uno puede probar que los sistemas son sis­
temas Bernoulli. Esto significa que uno puede construir conjuntos de
subcolecciones de microestados tales que la descripción en un tiem­
po infinito de en qué subcolección se encuentra el microestado de
un sistema en cada momento de observación determina completa­
mente la evolución estadística de la distribución de probabilidades.
Pero la información sobre las subcolecciones en las que el sistema ha
estado durante el pasado no aporta ninguna información probabilísti­
ca sobre la subcolección en la que se encontrará en el instante de
tiempo subsiguiente. Cuando se trata de en qué subcolección se en­
contrará el microestado, el sistema, si bien evolucionando determinis­
tamente, se comporta justamente igual que los resultados de series de
lanzamientos de monedas probabilísticamente independientes. Así
pues, el determinismo al nivel de microestado exacto es compatible
La introducción de la probabilidad en la física 199

Un conjunto mixto.
F ig u r a 3.10. T es una región del espacio de fases para el sistema
en la que el punto fásico para el sistema se encuentra localizado. A B
y son dos regio­
nes de puntos en el espacio de fases de tamaño distinto de cero. B se mantiene cons­
tante. Seguimos la evolución de los sistemas cuyos microestados iniciales se encuen­
tran en la región A E l resultado es una serie de regiones T(A) a medida que pasa el
tiempo. Un sistema «mixto» es uno en el que la región A evolucionará en una región
T(A) en el límite «a medida que el tiempo tiende a infinito». Esta región T(A) está dis­
tribuida uniformemente sobre el espacio de fases en el sentido de grano grueso. Para
que esto suceda, la proporción de cualquier región B ocupada por puntos que evo lu­
cionan desde la región A ha-de ser igual en el límite de tiempo infinito a la propor­
ción del espacio de fases ocupada originalmente por puntos» en la región A.

con el comportamiento más aleatorio imaginable al nivel de grano


grueso. (Véase la figura 3.10.)
¿Resuelven dichos resultados, de una vez por todas, todos los
enigmas sobre la aproximación al equilibrio? Ciertamente no. Prime­
ro está el hecho de que cuando aplicamos la mezcla para elaborar un
modelo de aproximación al equilibrio, debemos ignorar los «conjun­
tos de medida cero». Al suponer que podemos ignorar distribuciones
iniciales de probabilidad patológicas en las que la probabilidad dis­
tinta de cero se concentra en colecciones de microestados que tienen
probabilidad cero en la medida estándar, estamos suponiendo que
dichas colecciones de microestados pueden ser ignoradas. Esto es
una vez más una suposición probabilística no derivable de la estruc­
tura de los sistemas o de sus dinámicas.
Además está el problema de que la mayoría de los sistemas rea­
listas no cumplirán las condiciones necesarias para que se dé la
200 Filosofía de la física

mezcla. Esto es debido a que se encuentran (probablemente) en el


dominio del teorema KAM. Esto requiere nuevamente la existencia
de regiones distintas de cero de microestados que generar trayectorias
estables, trayectorias que no se desplazan por toda la región disponi­
ble de microestados. Así como esto hizo imposible la ergodicidad
para casos más realistas en la teoría del equilibrio, así también hace
imposible el resultado más fuerte de la mezcla. Al igual que antes, se
tendrá en alguna forma que recurrir en este punto al gran número de
constituyentes del sistema y a algún argumento en el sentido de que
las regiones de estabilidad serán muy pequeñas y de que fuera de
estas regiones el movimiento será lo bastante caótico para generar, si
no una mezcla en sentido puro, algún sustituto razonable de ésta.
Pero existe una dificultad mucho mayor que ésta para quien pre­
tenda fundamentar la aproximación al equilibrio solamente en resul­
tados de mezclas. Si un sistema está mezclado, entonces cualquier
distribución de probabilidades inicial no patológica sobre sus mi­
croestados presentará una aproximación de grano grueso a la distri­
bución de probabilidades en el equilibrio en el límite de tiempo infi­
nito. Pero ¿qué sucederá «a corto plazo», esto es, en intervalos de
tiempo correspondientes a ésos en que nos hallamos interesados, los
tiempos típicos que tarda un sistema en no equilibrio en acercarse al
equilibrio?
La mezcla es compatible con cualquier comportamiento a corto
plazo que uno pueda imaginar. La distribución de probabilidades en
el no equilibrio puede aproximarse en el sentido de grano grueso a la
distribución en el equilibrio, alejarse de ella, permanecer como distri­
bución de no equilibrio, o seguir cualquier modelo de aproximacio­
nes, retrocesos, o quedar igual que uno quiera, y ser todavía la distri­
bución de probabilidades de un sistema mezclado. Pero lo que
queremos modelar es la aproximación uniforme, a corto plazo, al
equilibrio de sistemas reales en no equilibrio. ¿Qué es lo que se ne­
cesita añadir al hecho de que un sistema esté mezclado para asegu­
rarnos de que nuestro modelo tendrá estas características?
Uno también puede ver que la mezcla por sí misma no basta
para responder a todas nuestras cuestiones, observando que es una
noción simétrica en el tiempo. Cualquier distribución de probabilida­
des inicial no patológica para un sistema mezclado evolucionará tam­
bién, conforme el tiempo tiende al pasado infinito, hacia una distri­
bución de probabilidades que se asemeja en el sentido de grano
La introducción de la probabilidad en la física 201

grueso a la distribución de equilibrio. Apenas sorprende que cual­


quier sistema que esté mezclándose hacia el futuro, esté mezclándose
hacia el pasado. Después de todo, la «mezclabilidad» de un sistema
se sigue de su estructura y de las leyes dinámicas subyacentes simétri­
cas en el tiempo. Naturalmente, la asimetría temporal de la termodi­
námica, y de la mecánica estadística que queremos para sustentar la
teoría macroscópica no puede derivarse de los elementos de la es­
tructura y la microdinámica únicamente. De nuevo, debe añadirse
algo más.
Discutiremos en un momento el elemento adicional requerido,
pero reparemos antes en que el enfoque del no equilibrio por la me­
cánica estadística que acabamos de discutir no es la única forma de
intentar justificar la teoría del no equilibrio. Hay un enfoque impor­
tante y bastante diferente; su contraste con el enfoque que acabamos
de discutir es muy iluminador. Ciertos resultados nos dicen que si
idealizamos un sistema en la forma apropiada, en particular, dejando
que el número de moléculas en el gas tienda a infinito, que la densi­
dad del gas tienda a cero, y que el tamaño de las moléculas del gas
comparado con el tamaño de la caja (el denominado Límite de G ra­
do de Boltzmann) tienda a cero, entonces podemos demostrar que,
para períodos de tiempo suficientemente pequeños, «casi todos» los
sistemas (es decir, todos los sistemas excepto un conjunto de proba­
bilidad cero) evolucionarán de acuerdo con la manera descrita por la
ecuación de Boltzmann. Esta es la «derivación rigurosa de la ecua­
ción de Boltzmann».
Ahora bien, puede demostrarse que estos resultados son válidos
solamente para tiempos que son fracciones del tiempo esperado en­
tre la colisión de una molécula con otra molécula y después con otra
molécula. Pero hay razones para pensar que se trata de resultados
verdaderos, aunque no se pueda probar, para tiempos más largos.
Este resultado, a diferencia del de la mezcla, proporciona una justifi­
cación del hecho de tomar como válida la descripción estadística ha­
bitual incluso para períodos breves y de considerar que la evolución
tiene la naturaleza unidireccional que esperábamos.
Pero los resultados aquí mencionados son de hecho enigmáticos.
Supongamos que consideramos que el resultado es válido en todo
momento, incluso cuando el tiempo tiende a infinito. Entraremos en­
tonces en contradicción con el Teorema de Recurrencia. Este nuevo
resultado dice que casi todos los sistemas evolucionarán hacia el
202 Filosofía de la física

equilibrio y permanecerán en el mismo, pero el Teorema de Recu­


rrencia nos dice que casi todos los sistemas retornarán a su condi­
ción original de no equilibrio un número infinito de veces. Y el resul­
tado es asimismo incompatible con la mezcla. N o hay ninguna
contradicción matemática, por supuesto, pues aquí sólo se ha proba­
do que los resultados son válidos en tiempos finitos, breves. Más im­
portante aún es que sólo son válidos en el límite indicado. En ese lí­
mite no se puede seguir representando el comportamiento del
sistema como un flujo de trayectorias a partir de microestados inicia­
les, de manera que las condiciones necesarias para la recurrencia y la
mezcla que había que demostrar dejan de ser válidas.
Pero no es la ausencia de una contradicción matemática lo que
es más interesante. La cuestión principal es que este modelo de apro­
ximación al equilibrio, un modelo que intenta demostrar que en una
idealización apropiada es altamente probable que un sistema evolu­
cione desde el no equilibrio al equilibrio y permanezca entonces en
el equilibrio, está conceptualmente muy en desacuerdo con la ideali­
zación familiar desde la clarificación por los Ehrenfest del programa
de Boltzmann. En esta idealización más familiar, la recurrencia es
aceptada y la mezcla es la idealización buscada del comportamiento
del no equilibrio. Lo que se espera de la solución a la ecuación de
Boltzmann no es que represente lo que casi todo sistema hará, sino,
en lugar de ello, la «curva de concentración» de la evolución de la
distribución de probabilidades. No es «la evolución más probable»,
sino «la evolución de las condiciones más probables» lo que ha de
representar la aproximación al equilibrio.
Lo que muestra la existencia de estos dos enfoques es que
todavía no hay un acuerdo tácito sobre cuál es la idealización correc­
ta que ha de utilizarse para intentar representar el comportamiento
termodinámico en términos de las probabilidades y del comporta­
miento dinámico microscópico. U n auténtico conflicto sobre cómo
debería.ser construida la teoría mecánico-estadística final y cómo ese
constructo debería ser utilizado para representar el m undo divide
todavía a la comunidad de teóricos. Deberíamos observar que los
problemas derivados de la introducción de la asimetría temporal en
el enfoque de la mezcla, a los que pronto regresaremos, aparecen asi­
mismo en esta «derivación rigurosa del enfoque de Boltzmann» alter­
nativa. Y deberíamos observar lo diferente que son los papeles que
juega el gran tamaño del sistema en los dos enfoques. Para el enfo­
La introducción de la probabilidad en la física 203

que de la mezcla, el vasto número de microcomponentes aparece


sólo al final del argumento cuando queremos pasar de los valores
medios a los valores más probables de las cantidades. Para el otro en­
foque, sin embargo, el hecho de que el sistema sea un sistema muy
suavizado con un número ilimitado de pequeños componentes es
crucial para la idealización desde un principio. Incluso un sistema de
dos esferas rígidas en una caja es una mezcla, pero el Límite del Gra­
do de Boltzmann es crucial para la derivación rigurosa de la ecua­
ción de Boltzmann.

El problema de las distribuciones iniciales de probabilidad


Trabajaremos por el momento en el ámbito de la idealización que se
vale de la mezcla del conjunto inicial para representar la aproxima­
ción al equilibrio. Como ya observamos, incluso si el sistema es un
sistema mezclado, se pueden encontrar conjuntos iniciales, esto es,
distribuciones iniciales de probabilidad sobre los microestados com­
patibles con la condición macroscópica original de no equilibrio, que
mostrarán la apropiada aproximación de grano grueso, uniforme, a
corto plazo, a una distribución de probabilidades en el equilibrio.
Pero también se pueden encontrar conjuntos iniciales que mostrarán
cualquier otra clase de comportamiento a corto plazo. Consideremos,
por ejemplo, la distribución de probabilidades sobre microestados
que aparece cuando una distribución aun más alejada del equilibrio
evoluciona en la forma esperada a una compatible con la condición
dada de no equilibrio del gas. La inversión temporal de la última dis­
tribución de probabilidades será una distribución de probabilidades
sobre microestados compatible con la condición de no equilibrio de
nuestro sistema que evolucionará a una condición de un «equilibrio
aún menor». (Véase la figura 3.11.)
Así pues, para obtener la correcta aproximación de grano grueso,
uniforme, a corto plazo, al equilibrio necesitamos partir de. una distri­
bución de probabilidades inicial «apropiada». Esencialmente, quere­
mos que la probabilidad se distribuya uniformemente (en relación a
la medida estándar) sobre una región de microestados que no sea de­
masiado pequeña y que tenga una forma regular. La demanda de un
tamaño suficiente es para asegurar que la distribución inicial se pro­
pague en forma de grano grueso con la suficiente rapidez como para
204 Filosofía de la física

3.11.
F ig u r a Reversibilidad al nivel del conjunto.
Supongamos, como en (a), que A es
una región del espacio de fases que evoluciona con el tiempo a la región fibrada,
T(A). Se puede entonces mostrar, como en (b), que debe haber una región fibrada de
puntos fásicos, T l(A'),
que según avanza el tiempo al futuro evoluciona a una región
simple compacta, como A'.
Además, A’y la región de la que proviene tendrán ambas
el mismo tamaño que A
y su sucesor fibrado.

representar el «tiempo de relajación» efectivo que tardan los sistemas


reales en alcanzar el equilibrio. La demanda de una forma regular es
para excluir las regiones que pueden ser construidas para representar
un comportamiento anti-termodinámico.
Pero ¿por qué
deberían elegirse dichas distribuciones iniciales de
probabilidad? ¿Qué hay en la naturaleza del mundo que las convier­
te en los conjuntos iniciales correctos
a elegir para obtener los resulta­
dos que representan el m undo tal como es? Una explicación fue
ofrecida por el físico N. Krylov. Este parte de una crítica a quienes
La introducción de la probabilidad en la física 205

por toda explicación de la naturaleza especial de estas distribuciones


iniciales de probabilidad alegarían tan sólo la observación de que es
así como parece estar distribuida la probabilidad sobre los estados
iniciales en el mundo. Estos teóricos negarían la posibilidad de algu­
na otra explicación más profunda. (Los filósofos hablan alguna vez de
la naturaleza «meramente de /acto»
de la Segunda Ley, queriendo
decir que «sucede simplemente que los estados iniciales están distri­
buidos así».) Krylov insiste en que este enfoque no hará justicia a la
naturaleza legal, incluso si es sólo estadísticamente legal, de la Segun­
da Ley. También arguye que no puede hacer justicia al hecho de que
para los sistemas que son intermediarios en el proceso de eyolución
desde una condición de no equilibrio inicial hasta una de equilibrio,
dicha distribución de probabilidades uniforme en relación a su des­
cripción macroscópica intermediaria no puede ser cierta, puesto que
sabemos que provenían de un estado inicial determinado aún más le­
jos del equilibrio. Pero dichos sistemas obedecerán todavía a la Se­
gunda Ley.
Krylov, cuya teoría positiva nunca recibió una exposición adecua­
da debido a su muerte prematura, explica la naturaleza especial de la
distribución de probabilidades inicial apoyándose en un argumento
procedente de las primeras tentativas de entender la mecánica cuánti­
ca. En el capítulo 4 discutiremos el denominado Principio de Incerti-
dumbre de la mecánica cuántica. Este principio nos dice que es impo­
sible especificar simultáneamente la posición y la velocidad de una
partícula a un grado arbitrario de precisión. Una temprana interpreta­
ción de este principio, hoy en día no aceptada ya por la mayoría de
quienes se ocupan de estas cuestiones, fue que el intento de nuestra
parte de medir una de las dos cantidades interfería físicamente con el
sistema de forma tal que «perturbaba» el valor existente de la otra
cantidad. Esta interacción física del observador con el sistema obser­
vado era lo que generaba la «incertidumbre». Krylov arguye que la
sensibilidad de un sistema a una pequeña perturbación en su estado
inicial, de manera que una ligera variación en la posición o velocidad
de una sola molécula cambie sustancialmente la microevolución futura
del sistema, nos da un Principio de Incertidumbre de un «nivel supe­
rior» al tratar con los sistemas de la termodinámica. A esta interferen­
cia con el sistema, cuando el sistema está preparado en esta condición
de no equilibrio, se debe que la distribución de probabilidades sobre
los microestados tenga el tamaño y la regularidad apropiados.
2D6 Filosofía de la física

No está claro cómo podría hacerse que esto funcionase en sus


pormenores. Pero hay, además, un problema más profundo. ¿Qué
constituye la «preparación» de un sistema? Supongamos que exami­
namos un sistema que está en no equilibrio en el momento de ser
creado (es decir, separado energéticamente del resto del universo).
También lo examinamos en el momento de ser destruido (es decir,
reintegrado al mundo exterior). Conviene suponer que a partir de la
condición inicial de no equilibrio tenderá a aproximarse al equili­
brio. Así, la distribución de probabilidades apropiada sobre los mi­
croestados en el instante inicial es la estándar. Pero si hiciésemos la
misma suposición respecto al estado final del sistema, nos veríamos
llevados a inferir, erróneamente, que este estado era una fluctuación
espontanea de estados más próximos al equilibrio. ¿A qué se debe
que sea apropiado atribuir la distribución estándar de probabilidades
sobre los microestados al comienzo de la evolución de los sistemas,
pero no al final?
Bien, el estado inicial es la forma en que el sistema ha sido «pre­
parado». El estado final es el resultado, no de la preparación, sino de
la evolución. Pero, ¿qué constituye la preparación y por qué ella, y
solo ella, habría de tener la característica de requerir la correcta dis­
tribución de probabilidades termodinámica sobre los microestados
asociados con los macroestados obtenidos por ella? Esencialmente, la
asimetría temporal de la mecánica estadística está siendo introducida
a través de la suposición de que siempre son los primeros estados de
los sistemas aislados los que están «preparados» y nunca sus estados
íinales. Intuitivamente pensamos que es cierto, pero dar un significa­
do coherente a lo que la intuición capta, que no sea reiterar la asime­
tría que queríamos explicar en primer lugar, es una cuestión intrin­
cada.
Lna solución diferente, y más radical, al problema ha sido ofreci­
da por I. Prigogine. Su solución presenta vanos elementos. Primero,
adopta el punto de vista extremadamente radical de que los sistemas
individuales no tienen microestados exactos. Mantiene, en lugar de
ello. que la inestabilidad radical de la dinámica significa que el mi­
croestado exacto de un sistema, según se postula en la dinámica sub­
yacente habitual, es una falsa idealización. Considera que la distribu­
ción de probabilidades sobre microestados utilizada en mecánica
estadística debería ser considerada como caracterizadora del sistema
individual. Esta distribución de probabilidades, sostiene, no caracte­
La introducción de la probabilidad en la física 207
riza a un supuesto colectivo compuesto por muchos sistemas cada
uno de los cuales tiene un microestado exacto. Una vez más, la mecá­
nica cuántica y su interpretación son relevantes aquí. Como veremos,
existen «pruebas de variables no ocultas» en la teoría cuántica. Estas,
se alega algunas veces, nos demuestran que la característica de «in­
certidumbre» de los sistemas en mecánica cuántica debería ser consi­
derada como irreducible. No hay, se afirma, parámetros subyacentes,
ni siquiera incognoscibles, que determinen exactamente el curso fu­
turo del sistema.
Ahora bien, en el caso de la mecánica estadística no encontramos
desde luego semejantes demostraciones de la no existencia de un m i­
croestado enteramente determinista. De hecho, la posibilidad de in­
versiones exactas del comportamiento, tal como ilustran los resulta­
dos del eco-espín mencionados anteriormente, hacen de la negación
de un microestado exacto una pretensión bastante dudosa. Pero las
restantes partes de la concepción de Prigogine no dependen, en reali­
dad, para su defensa de esta concepción ontológica radicalmente
nueva.
Prigogine esboza métodos por los que la distribución de proba­
bilidades original, cuya evolución siguió las leyes invariantes bajo in­
versión temporal derivadas de las leyes simétricas en el tiempo de
la dinámica subyacente, puede ser transformada en una nueva «re­
presentación» con una evidente asimetría temporal en su evolución.
Esto funciona en casos en los que se da una condición de «caos» su­
ficientemente fuerte, como es que el sistema sea un sistema K. Lo
que sucede aquí no es nada misterioso. Si un sistema tiene las carac­
terísticas de mezcla adecuadas, mostrará una aproximación temporal
de grano grueso al equilibrio, aun cuando su evolución sea reversible
temporalmente en el micronivel. Las técnicas utilizadas aquí para
pasar a la nueva representación muestran esencialmente cómo este
comportamiento de grano grueso de la distribución de probabilida­
des original puede ser reflejado en una nueva forma de representar
las estadísticas del conjunto de manera que la asimetría temporal, re­
presentada solamente en el sentido de grano grueso en la representa­
ción original, es ahora incorporada en la nueva forma de caracterizar
la distribución de probabilidades. Esta nueva distribución de proba­
bilidades está determinada unívocamente dada la original y determi­
na a ésta de manera unívoca. Genera los mismos valores medios de
todas las cantidades generados por la distribución de probabilidades
208 Filosofía de la física

original y es, por lo tanto, «estadísticamente equivalente» a la repre­


sentación original.
¿Resuelve la existencia de dicha nueva representación de la pro­
babilidad el problema de la asimetría temporal? No. Una razón para
esta respuesta negativa es que también hay una nueva representación
de la distribución de probabilidades original que es manifiestamente
antitermodinámica. Así como la distribución inicial se aproximaba en
la forma de grano grueso al equilibrio conforme el tiempo tendía a
menos infinito, así como a más infinito, así también hay dos transfor­
maciones de la misma a una nueva representación — una que ma­
nifiesta un comportamiento termodinámico y la otra antitermodiná-
mico.
Así pues, ¿de dónde procede la asimetría temporal? Prigogine
piensa que uno no puede captar esto utilizando una distribución de
probabilidades inicial no patológica, pues cualquiera de dichas distri­
buciones tenderá en la forma de grano grueso al equilibrio en el lími­
te de tiempo infinito, tanto en el futuro como en el pasado. En lugar
de ello, sugiere, deberíamos prestar atención a ciertas distribuciones
iniciales «singulares», unas que concentren toda la probabilidad en
una región de probabilidad cero en la medida estándar. Ahora bien,
en la representación original, semejante distribución inicial singular
no podría aproximarse a la distribución de equilibrio ni siquiera en
el sentido de grano grueso, pues siempre evolucionaría hacia una
nueva distribución cuyo tamaño es cero en la medida estándar. Pero,
señala Prigogine, puede suceder que, si bien la nueva representación
de la distribución original es también singular y de tamaño cero, las
nuevas representaciones de las distribuciones hacia las que evolucio­
na puede que no sean singulares. Puede que, de hecho, evolucionen
hacia la distribución de equilibrio. Y si se elige adecuadamente la
distribución inicial singular, esto es justamente lo que ocurre. Quizá,
pues, la solución a la asimetría temporal se encuentre en la regla se­
gún la cual, en la mecánica estadística, los sistemas físicos que co­
menzaron en no equilibrio están siempre representados adecuada­
mente por estos tipos de distribuciones de probabilidad inicial
singular.
¿Es ésta la respuesta? Yo creo que no. Primero, es importante
observar que también habrá distribuciones iniciales singulares de
probabilidad que son intrínsecamente antitermodinámicas. Éstas, cla­
ro está, no pueden representar sistemas reales. Pero ¿no estábamos
La introducción de la probabilidad en la física 209

buscando la razón física


de por qué es posible un tipo de comporta­
miento y no el otro? Nosotros no pretendíamos solamente encontrar
una forma más de «enchufar» una característica asimétrica a nuestra
representación del mundo. Peor aún, el uso de dichas distribuciones
iniciales singulares de probabilidad parece inapropiado para algunos
casos físicos reales. Una situación que se adecúa al modelo de Prigo­
gine sería, por ejemplo, un haz de partículas perfectamente paralelo.
Éste es un estado inicial de «probabilidad cero». Dicho haz perdería,
claro está, su asombrosa coherencia y orden originales, siendo esta
pérdida representada por la difuminación de la representación trans­
formada de la distribución de probabilidades originalmente singular
elegida para representar el sistema. Pero ahora consideremos un gas
confinado én el lado izquierdo de una caja. Removamos la partición
que la divide por la mitad. La distribución de probabilidades inicial
apropiada en este caso no será una cuya probabilidad esté confinada
a una región de tamaño cero, ni siquiera una aproximación de una
distribución singular semejante. En su lugar, la forma correcta de re­
presentar la física aquí sería la de una evolución de grano grueso al
equilibrio de una distribución inicial que no está, originalmente, difu-
minada en forma de grano grueso sobre la totalidad de microestados
disponibles, pero que tampoco está, originalmente, confinada a una
región de tamaño cero.
La cuestión es que los conjuntos iniciales correctos mostrarán
una evolución hacia el equilibrio incluso a corto plazo. Éstos pueden
representar correctamente la física incluso si en el límite de tiempo
infinito tienden hacia el equilibrio (en sentido estricto) en ambas d i­
recciones temporales. Los conjuntos iniciales singulares de Prigogine
parecen ser innecesarios y algunas veces no representan adecuada­
mente las situaciones físicas reales de interés.

Cosmología e irreversibilidad
¿Cuál, pues, es la razón física de la asimetría temporal? Prestemos
atención a un enfoque popular. Éste se funda en los resultados de la
cosmología. Como señalamos anteriormente, ya Boltzmann se había
valido de presuposiciones especulativas acerca de la estructura global
del universo a fin de reconciliar sus concepciones finales sobre el
equilibrio con los hechos observables sobre el predominio del no
210 Filosofía de la física

equilibrio en el mundo tal como lo encontramos. Revisemos un ins­


tante la estructura de las afirmaciones boltzmannianas: Primero, el
universo es extenso en el espacio y en el tiempo. Se encuentra en la
mayoría de las regiones del espacio y en la mayoría de los períodos
de tiempo cerca del equilibrio. Pero hay pequeñas regiones que se
desvían del equilibrio durante breves instantes de tiempo. Segundo,
podemos esperar encontrarnos a nosotros mismos en una de dichas
regiones fluctuantes, puesto que solamente en una región semejante
podrían evolucionar y sobrevivir observadores. Tercero, la entropía
aumenta en la dirección futura del tiempo en nuestra región porque
por dirección futura del tiempo entendemos la dirección del tiempo
en la que aumenta la entropía de los sistemas, es decir, en la que lo­
calmente éstos se mueven en paralelo unos con otros hacia el equili­
brio.
Ahora bien, nosotros nos encontramos en un universo lejos del
equilibrio. Y hallamos que el aumento de entropía de sistemas aisla­
dos temporalmente se produce en la misma dirección, la dirección
que llamamos el futuro. ¿Puede lo que ahora se sabe sobre la estruc­
tura cosmológica, global, del universo darnos una explicación de
esto?
La imagen del cosmos que nos presenta la cosmología contempo­
ránea es muy diferente a la del universo inactivo en su conjunto de
Boltzmann. El universo, o al menos esa parte accesible a nuestra ins­
pección observacional, parece haber estado concentrado en un punto
singular de energía material hace diez billones de años. Desde enton­
ces, el universo ha estado expansionándose. No se sabe si dicha ex­
pansión continuará eternamente o si, por el contrario, volverá a con­
traerse en algún momento para convertirse de nuevo en una
singularidad. Eso depende de la densidad de masa (energía material)
en el universo. El universo como un todo parece obedecer a la Se­
gunda Ley, con un aumento de su entropía en la dirección futura del
tiempo.
Este aumento de entropía necesita una explicación. Aquí el
estado termodinámico de la condición singular que se dio en el ori­
gen es crucial. Habitualmente se presupone que la materia estaba ori­
ginalmente en una condición uniforme de equilibrio, siendo el
estado ordinario de las estrellas calientes, brillando en el espacio frío,
una clara situación de no equilibrio, una evolución ulterior. Pero
¿significa esto que la entropía disminuyó con el tiempo? N o necesa­
La introducción de la probabilidad en la física 211

riamente. La disminución entrópica en la materia fue, de acuerdo


con la mayoría de los teóricos, «pagada» con un vasto aumento en la
entropía del campo gravitacional o, si queréis, del espacio-tiempo
mismo. El espacio-tiempo, originalmente uniforme, desarrolló «gránu-
los» a medida que la materia pasó de su condición uniforme original
a su condición actual alejada de la uniformidad. Por razones especia­
les relacionadas con la naturaleza puramente atractiva de la grave­
dad, esta transformación de un espacio-tiempo suave en uno granula­
do corresponde a un aumento de su entropía. U no podría, pues,
achacar el aumento de entropía del cosmos a su condición espacio-
temporal original altamente organizada y de muy baja entropía.
¿Por qué habría de ser la.condición original una de baja entropía?
De todas las condiciones originales posibles, ésta es una «altamente
improbable». Aquí se ponen a prueba los límites mismos de la expli­
cación científica. Nos vemos obligados a aceptar sencillamente como
un hecho que así fueron las cosas, pese a haber sido sugeridas una
diversidad de «explicaciones» de este hecho. Es importante observar
que la expansión del universo no es responsable por sí sola del au­
mento de entropía. En un universo en contracción, según el punto
de vista prevalente, la entropía continuaría aumentando, conducien­
do a una singularidad final, de naturaleza intrínsecamente compacta.
La inversión temporal de dicha recontracción sería compatible con
todas las leyes y representaría un universo en expansión con entropía
decreciente. La naturaleza especial del big bang
y el big cruncb
, siendo
el primero de baja entropía y el segundo de alta entropía, es lo que
distingue a un universo en el que la expansión seguida de una con­
tracción es acompañada por un aumento, en lugar de por una dismi­
nución, de la entropía.
¿Se funda entonces la Segunda Ley de la Termodinámica en su
aplicación a los sistemas individuales pequeños en el estado original,
singular, de baja entropía, del universo? Cuando se intenta que esta
concepción funcione,.surgen problemas. La propuesta habitual es tra­
bajar con la noción de sistema derivado. Un sistema derivado es un
sistema individual aislado que originalmente estuvo en contacto
energético con el m undo exterior, fue posteriormente aislado del
mismo durante un tiempo y, finalmente, fue unido de nuevo al mis­
mo al final de su tiempo de vida finito.
Supongamos que tenemos un sistema derivado aislado en una
condición lejos del equilibrio. Como el universo a nuestro alrededor
212 Filosofía de la física

está claramente en un estado de no equilibrio, es mucho más razona­


ble suponer que el no equilibrio del sistema derivado es el resultado
de haber sido «separado» del sistema global en no equilibrio, a supo­
ner que la condición de no equilibrio del sistema derivado es el re­
sultado de una de las extrañísimas fluctuaciones del equilibrio espe­
radas incluso en sistemas totalmente aislados.
Imaginemos ahora un gran número de sistemas derivados, cada
uno al comienzo de su vida y todos en una condición común de no
equilibrio. No podemos inferir un comportamiento para los sistemas,
puesto que no tienen una vida pasada, habiendo comenzado a existir
sólo recientemente como sistemas derivados. Si ahora hacemos la su­
posición de que la distribución de probabilidades sobre los microes­
tados de los sistemas es del tipo estándar, podemos inferir que en un
tiempo breve en el futuro el punto de concentración de los estados
del sistema estará más cerca del equilibrio. Este es el conocido mo­
delo de Boltzmann. Descansa en una suposición probabilística acerca
de la distribución de microestados compatible con una condición
macroscópica dada. Pero, se alega, esta suposición no es de por sí asi­
métrica en el tiempo. Así pues, el paralelismo de la evolución de los
sistemas derivados, el hecho de que el aumento de entropía de uno
tendrá lugar probablemente en la misma dirección temporal que el
aumento de entropía en cualquiera de los otros, ha sido derivado
simplemente de los resultados cosmológicos, del hecho de que los
sistemas son sistemas derivados y de una suposición probabilística
acerca de las microcondiciones iniciales que no es intrínsecamente
asimétrica en el tiempo.
H. Reichenbach dio una versión formal de este argumento. Rei-
chenbach coloca los estados de una colección de sistemas derivados
en una tabla, con los estados posteriores a la derecha de los anterio­
res y los sistemas colocados en una lista vertical. Suponiendo que la
evolución de cada sistema es estadísticamente independiente de la
de todos los demás y suponiendo que los cambios en las distribucio­
nes de los microestados en las columnas verticales (es decir, distribu­
ciones de microestados sobre la pluralidad de sistemas de un tiempo
a otro) duplican los cambios esperados en un solo sistema a lo largo
del tiempo, es capaz de mostrar que, si la columna de la izquierda en
dicha tabla corresponde al no equilibrio, en el límite del tiempo ten­
diendo a más infinito, la columna de la derecha representará el equi­
librio. A dicha tabla la llama una «red de mezcla».
La introducción de la probabilidad en la física 213

¿Introduce realmente esta técnica la explicación del comporta­


miento paralelo en el tiempo del cambio de entropía de los sistemas
en la imagen sin simplemente presuponerla? Pienso que no. Habi­
tualmente se supone que la dirección del tiempo en la que se produ­
ce un aumento paralelo de la entropía en los sistemas derivados es la
misma dirección temporal en la que aumenta la entropía del univer­
so como un todo. Pero, curiosamente, la dirección del cambio de en­
tropía del universo nunca se utiliza en el argumento. Lo único que se
utiliza es el hecho de que el universo está lejos del equilibrio, no la
dirección de su cambio entrópico. Esto sugiere que el paralelismo
entre unos sistemas derivados y otros también puede haber sido «in­
troducido subrepticiamente» en el argumento.
De hecho, yo creo que lo ha sido. Suponed que consideramos
una colección de sistemas derivados, partiendo la mitad de ellos de
un estado de no equilibrio y terminando la otra mitad en el mismo
estado de no equilibrio. Ahora distribuidlos en una red al estilo Rei­
chenbach con su estado de no equilibrio a la izquierda. La misma
clase de suposiciones que hicimos anteriormente nos llevará a espe­
rar que los estados de los sistemas en o cerca del equilibrio estén a la
derecha. Pero eso correspondería a sistemas que habían partido del
no equilibrio y se aproximaron al equilibrio en el futuro y conduciría
a la inferencia de que los sistemas que terminaron en el no equilibrio
habían estado cerca del equilibrio ¡en el pasado distante! Esto, por
supuesto, es la inferencia errónea. Deberíamos inferir que los siste­
mas que terminaron en el no equilibrio procedían de sistemas aisla­
dos aún más alejados del equilibrio en el pasado.
Lo que ha sucedido aquí es algo con lo que estamos familiariza­
dos a estas alturas. Es razonable imponer la distribución de probabi­
lidades estándar a los microestados de un sistema en no equilibrio, si
el estado de no equilibrio es un estado verdaderamente inicial en re­
lación al proceso que uno está infiriendo. Es ilegítimo — da los resul­
tados incorrectos— utilizar dicha distribución de probabilidades
para retrodecir el comportamiento de un sistema a partir de su con­
dición de no equilibrio, si esa condición es una condición final y no
inicial en relación al proceso que pretendemos inferir. Esto es justa­
mente reiterar el hecho de que los sistemas muestran efectivamente
un comportamiento termodinámico (es decir, aproximación al equili­
brio) en una dirección temporal paralela y, de hecho, en la dirección
del tiempo que llamamos el futuro. Pero los argumentos que acaba­
214 Filosofía de la física

mos de examinar no proporcionan una explicación física del hecho.


Antes bien, lo incluyen una vez más como un postulado en su des­
cripción del mundo. La cosmología por sí misma, incluyendo el big
bang su baja entropía, la expansión del universo y el aumento de en­
tropía de ese universo en la dirección temporal en la que se está ex­
pandiendo, no parece proporcionar la explicación del paralelismo en
el tiempo del aumento de entropía de los sistemas derivados. De he­
cho, el comportamiento del cosmos según la Segunda Ley parece, des­
de esta perspectiva, sólo un ejemplo más del comportamiento legal es­
tadístico general de los sistemas, ya sean cosmológicos o derivados.
Así pues, el origen del comportamiento paralelo en el tiempo de
los sistemas sigue siendo en lo que a su incremento entrópico respec­
ta algo misterioso. Sabemos cómo representar la asimetría en mecáni­
ca estadística imponiendo una distribución de probabilidades sobre
los microestados de sistemas en no equilibrio solamente en una for­
ma temporal asimétrica. Debemos suponer que la hipótesis estadísti­
ca usual sobre cuán probable es un microestado es válida sólo si
tomamos el macroestado que estamos considerando como inicial, y
sólo si vamos entonces a utilizar la hipótesis estadística para inferir el
comportamiento futuro y no el pasado del sistema. Pero el por qué se
da el paralelismo temporal del aumento de entropía sigue siendo un
enigma.
Pero supongamos que el paralelismo se da efectivamente.
Todavía podríamos preguntarnos cómo es que la entropía crece en la
dirección futura del tiempo y no en la pasada. A quí debemos una vez
más considerar la brillante sugerencia de Boltzmann de que el signifi­
cado mismo de la distinción pasado-futuro de las direcciones del
tiempo se funda de por sí en el aumento paralelo de entropía. De
acuerdo con Boltzmann, y aquellos que le siguieron, lo que quere­
mos decir con dirección «futura» del tiempo es justamente la direc­
ción del tiempo en la que la entropía aumentará con una probabili­
dad abrumadora. ¿Es esto plausible? Volveremos a esta cuestión en
«El problema de la dirección del tiempo».
Resumen
La estructura de las explicaciones probabilísticas en mecánica esta­
dística es, como hemos visto, muy compleja. Sería muy agradable po­
der informar que disponemos de una solución simple a todas las difi­
La introducción de la probabilidad en la tísica 215

cultades que acabamos de revisar, pero no es el caso. Las cuestiones


aquí siguen siendo muy controvertidas, a pesar del hecho de que
estos problemas han sido explorados durante más de un siglo.
Hemos visto que uno puede dar una explicación interesante de
las características del equilibrio identificándolas con ciertos aspectos
de un sistema que se manifiestan en el límite de tiempo infinito. Pero
el tipo de «explicación» sobre los fenómenos observados que obtene­
mos así dista mucho de la clase de explicación involucrando proba­
bilidades que cabría esperar a tenor de las descripciones que los filó­
sofos dan de la explicación estadística.
Cuando pasamos al caso de no equilibrio, la estructura explicati­
va se parece más a la esbo&da por los filósofos. Pero subsisten m u­
chos enigmas. Algunas descripciones de la aproximación al equilibrio
invocan el no aislamiento del sistema o la posibilidad de leyes de la
naturaleza no simétricas en el tiempo. Otras explicaciones descansan
sobre supuestas reglas generales de inferencia probabilística. Los en­
foques más estándar descansan en la inestabilidad de las dinámicas
microscópicas del sistema y en el vasto número de microcomponen-
tes que forman el sistema. Pero incluso en el seno de estos enfoques
estándar, como hemos visto, hay ideas enfrentadas sobre el modelo
apropiado que ha de utilizarse y sobre la noción apropiada de expli­
cación estadística a la que apelar.
También hemos visto cómo en el seno de los enfoques estándar
el problema del conjunto inicial o de la distribución de probabilida­
des inicial correctos es crucial. Cómo elegir la correcta de dichas dis­
tribuciones iniciales de probabilidad y, una vez elegida ésta, cómo
explicar por qué puede suponerse legítimamente válida en el mundo,
siguen siendo cuestiones abiertas. El problema fundamental de la asi­
metría de los sistemas en el tiempo forma parte de este problema del
conjunto inicial.
Finalmente, hemos visto cómo, aunque uno invoque la asimetría
global en el tiempo del universo como un todo, el problema de la
asimetría en el tiempo de los sistemas individuales permanece abier­
to. El problema general de adecuar el comportamiento termodinámi-
co de los sistemas a la descripción general de la dinámica de sus par­
tes microscópicas sigue requiriendo un mayor conocimiento, no sólo
de la física de los sistemas, sino también de la estructura misma de lo
que consideramos como explicaciones probabilísticas legítimas en
nuestra descripción teórica del mundo.
216 Filosofía de la física

Hemos visto que la inestabilidad de las trayectorias dinámicas


del sistema contribuye al comportamiento predecible, estable, del sis­
tema al nivel macroscópico. Sin embargo, la inestabilidad puede ser
también una característica del comportamiento macroscópico del sis­
tema. A partir del trabajo de Poincaré, los físicos han descubierto
que el comportamiento de los sistemas es con frecuencia fundamen­
talmente irregular e impredecible incluso al nivel de las descripcio­
nes macroscópicas. Muchos sistemas pueden ser descritos por un pa­
rámetro que caracteriza alguna propiedad del sistema. Para algunos
valores de este parámetro, el sistema mostrará un comportamiento
regular, pero para otros valores, el comportamiento del sistema varia­
rá tan sensiblemente con su estado inicial que cualquier esperanza de
predecir el comportamiento futuro del sistema será vana. Tales siste­
mas deterministas, pero irregulares, son llamados caóticos.
La descripción de los sistemas caóticos ha introducido un nuevo
ámbito de comportamiento en la física, un ámbito en el que los mo­
dos de pensamiento probabilísticos pasan a ser herramientas impor­
tantes. Y con estos nuevos modos de descripción surgen nuevas cues­
tiones filosóficas. En el momento actual, los filósofos están ocupados
con algunas de estas cuestiones, tales como la definición de un siste­
ma caótico, los modos de explicación utilizados en la caracterización
del comportamiento de dichos sistemas, y las cuestiones generadas
por el hecho de que los sistemas pueden ser completamente determi­
nistas, pero presentar un comportamiento macroscópico fundamen­
talmente impredecible. Aunque no será posible echar un vistazo a
estas cuestiones aquí, en las lecturas sugeridas al final de este capítu­
lo hemos indicado algunas lecturas introductorias a este nuevo y ex­
citante campo.

El problema de «la dirección del tiempo»

Las discusiones de las tesis de Boltzmann a menudo van acompaña­


das por debates sobre si la asimetría entrópica representa una asime­
tría del «tiempo mismo» o simplemente una asimetría del comporta­
miento de los sistemas físicos en el tiempo. Los defensores de la
primera tesis señalan habitualmente la naturaleza profunda y preva-
lente de la asimetría. Los defensores de la segunda afirmación hacen
referencia con frecuencia a otros hechos sobre el mundo que son asi­
ll -introducción de la probabilidad en la física 217

métricos temporalmente, pero en los que la asimetría no está genera­


da por leyes de la naturaleza subyacentes asimétricas en el tiempo.
Éstos arguyen que únicamente las asimetrías legales podrían llevar­
nos a inferir una asimetría del tiempo mismo.
Aquellos que mantendrían que la asimetría entrópica no refleja
una asimetría en la naturaleza subyacente del tiempo normalmente
tienen en mente que deberíamos postular asimetrías del espacio-
tiempo sólo cuando se necesitan para explicar asimetrías de las leyes
de la naturaleza. Un ejemplo, indicado en el capítulo 2, sería la pos­
tulación de una diferencia espacio-temporal subyacente para explicar
la distinción legal en la naturaleza entre movimiento inercial y no
inercial. Sin dicha asimetría legal, arguyen, no se necesita postular
ninguna asimetría del espacio-tiempo mismo subyacente. Aquellos
que piensan que la asimetría entrópica nos exige que concibamos al
tiempo mismo como asimétrico negarán que la asimetría entrópica,
con su alcance fundamental y universal, pueda ser reducida a cual­
quier «mera» asimetría de los sistemas. Se requiere, arguyen, una ex­
plicación más profunda en la asimetría del tiempo mismo.
Como vimos en el capítulo 2, la noción misma de una estructura
espacio-temporal que explique alguna característica estructural entre
las cosas del mundo es de por sí muy problemática. Desde el punto
de vista de muchos relacionistas, dista de estar claro que tenga algún
sentido plantear la cuestión de si la asimetría del aumento de entro­
pía es meramente una asimetría estadística universal de los sistemas
físicos en el tiempo o, por el contrario, representa una asimetría sub­
yacente del tiempo mismo.
En cualquier caso, las cuestiones cruciales para Boltzmann no
dependerían de la respuesta a estas cuestiones. Boltzmann quiere
vindicar que nuestra distinción intuitiva entre pasado y futuro puede
«fundarse» en la asimetría entrópica. Se esfuerza en vindicar que si
hay partes locales del universo donde la entropía «corre hacia atrás»,
esto es, en la dirección temporal opuesta a aquella en la que crece en
nuestra región del universo, los recuerdos de la gente lo serían tam­
bién de sucesos acontecidos en lo que denominamos la dirección fu­
tura del tiempo, como lo serían sus registros. Y ellos pensarían que la
causalidad discurre desde esa dirección del tiempo que considera­
mos el futuro a esa dirección del tiempo que consideramos el pasa­
do. Pensarían en los sucesos en la dirección temporal que llamamos
futuro como fijos y determinados, y en los sucesos en la dirección
218 Filosofía de la física

temporal que llamamos pasado como abiertos. Pero, por supuesto,


según las tesis de Boltzmann, ellos, como nosotros, afirmarían recor­
dar el pasado y tener registros del mismo y pensarían en la causali­
dad como discurriendo del pasado al futuro. Ellos llamarían a la di­
rección del tiempo que nosotros llamamos futuro la dirección
temporal pasada, y llamarían a lo que nosotros llamamos la dirección
temporal pasada el futuro del tiempo.
Algunas veces, la gente defiende las tesis de Boltzmann señalan­
do que solamente a partir de hechos entrópicos es como podemos
determinar si una película está siendo proyectada en la dirección co­
rrecta o, por el contrario, está siendo pasada hacia atrás por un pro­
yector. Otros critican las tesis de Boltzmann señalando que para los
sucesos reales apenas necesitamos averiguar las características entró-
picas de los sistemas para determinar qué sucesos son posteriores a
qué otros. Estos dos argumentos, sin embargo, fallan por no entender
bien cuál es la tesis de Boltzmann.
Algunas veces los filósofos afirman que un dominio conceptual
se reduce a otro porque el significado mismo de las proposiciones en
uno de los dominios viene dada por afirmaciones en el otro. El argu­
mento aquí es habitualmente que todos nuestros medios de deter­
minar la verdad o falsedad de las proposiciones de la primera clase
dependen de proposiciones de la segunda clase. Así pues, el fe-
nomenalista arguye que hablar sobre objetos materiales se reduce a
hablar sobre datos sensoriales en la mente, y el relacionista espacio-
temporal arguye que toda conversación sobre el espacio y el tiempo
se reduce a una conversación sobre relaciones espaciales y tempora­
les entre cosas y sucesos materiales. Pero yo no creo que sea razona­
ble pensar que Boltzmann está afirmando que todo nuestro conoci­
miento de la dirección en el tiempo que los sucesos tienen unos
respecto a otros lo derivamos de nuestro conocimiento acerca de las
relaciones entrópicas de los estados de unas cosas respecto a otras en
el tiempo. No es ese tipo de reducción filosófica de la asimetría tem­
porada una asimetría entrópica lo que él tiene en mente.
Su noción de reducción, antes bien, está más cerca de lo que el
científico tiene presente al afirmar que la teoría de la luz se reduce a
la teoría del electromagnetismo, o cuando afirma que el hablar sobre
mesas se reduce a hablar sobre ordenaciones de átomos. Las ondas
luminosas son ondas electromagnéticas, según hemos descubierto, y
las mesas son ordenaciones de átomos. Es algo de este estilo lo que
La introducción de la probabilidad en la física 219

Boltzmann quiere decir cuando afirma que la asimetría futuro-pasado


del tiempo es justamente la dirección temporal fijada por los resulta­
dos del aumento de entropía. Pero ¿qué tipo de afirmación es ésta?
Boltzmann nos habría hecho reflexionar sobre nuestra noción de
la dirección abajo en el espacio. Para Aristóteles, la dirección abajo
es una noción primitiva. El probablemente creía que en todos los
puntos del espacio existía una dirección abajo y que todos estos
«abajo» estaban en la misma dirección espacial. Pero ahora sabemos
que «abajo» es sólo la dirección en la que está apuntando la fuerza
gravitacional local. Ahora comprendemos que hay regiones del uni­
verso en las que no hay una dirección abajo ni tampoco una arriba, y
aceptamos sin dificultad que 4a dirección abajo para alguien que se
encuentre en Australia no sea paralela a la de alguien que se encuen­
tre en Nueva York. Esto es lo que sucede con la distinción pasado-
futuro, afirma Boltzmann. Donde no hay una asimetría entrópica
local, no hay una distinción futuro-pasado, aunque, por supuesto, hay
todavía dos direcciones opuestas del tiempo. Y donde los aumentos
de entropía tienen direcciones opuestas en el tiempo, sucede igual
con la distinción pasado-futuro.
¿Qué se necesitaría para justificar esa afirmación? N i siquiera
una asociación legal del aumento de entropía con una dirección tem­
poral intuitiva sería suficiente por sí sola para justificar la afirmación
de Boltzmann. Para ver que esto es así, necesitamos solamente obser­
var que ahora parece claro que ciertos procesos entre micropartícu-
las de materia no son simétricos entre sistemas dextro- y levógiros.
Existe una asimetría legal entre derecha e izquierda en la naturaleza
que se revela, por ejemplo, en el hecho de que ciertos procesos de
desintegración que involucran partículas giratorias son posibles,
mientras las imágenes especulares de estos procesos no lo son. Pero
¿se sentiría alguien inclinado a argüir que nuestra misma distinción
entre lo que es un guante de la mano izquierda y lo que es uno de la
mano derecha, por ejemplo, depende en algún sentido de esa asime­
tría legal en la naturaleza que estamos considerando? No por mucho
tiempo, pienso. N o sólo no distinguimos la izquierda de la derecha
utilizando estos procesos espacialmente asimétricos, sino que nada
de la existencia o inexistencia de dichos procesos parece tener algo
que ver con la explicación de porqué se da la familiar distinción iz­
quierda-derecha en nuestro esquema conceptual intuitivo. Pero es
muy diferente con la gravedad y el «abajo». Nos sentimos inclinados
220 Filosofía de la física

a decir que, incluso si no existiesen los procesos asimétricos descu­


biertos recientemente por la física, la distinción izquierda-derecha
todavía existiría. Pero si no hubiera ninguna fuerza gravitacional, no
existiría simplemente una distinción arriba-abajo, ni en la naturaleza,
ni en nuestro esquema conceptual para tratar con la naturaleza.
La diferencia entre los dos casos es, pienso, la siguiente: En el
caso de la gravedad y el «hacia abajo», creemos que todos los hechos
relevantes sobre la dirección hacia abajo — que las rocas caen y los
globos de helio se elevan, por ejemplo— son explicados por los he­
chos sobre la gravedad. Incluso el hecho de que podamos decir, sin
inferencia, qué dirección es la dirección hacia abajo es explicado por
los efectos de la gravedad sobre el fluido en nuestros canales semicir­
culares. Pero nada sobre nuestras distinciones intuitivas entre objetos
dextrógiros y levógiros queda explicado en términos de los procesos
de la física que violan la denominada conservación de paridad. La
cuestión crucial es, pues, la siguiente: ¿se parece la conexión entre la
distinción futuro-pasado y la asimetría del aumento de entropía más
a la establecida entre la distinción arriba-abajo y la gravedad, como
Boltzmann pensaba, o se parece más a la conexión entre la distinción
izquierda-derecha y los procesos subatómicos que violan la simetría
de orientación?
Para responder a esta cuestión, tendríamos que caracterizar
todos esos aspectos fundamentales de la experiencia que tomamos
como básicos para la determinación de la distinción intuitiva futuro-
pasado. Después tendríamos que explorar la cuestión de si podría­
mos explicar todos estos fenómenos asimétricos utilizando la asime­
tría entrópica como el único factor asimétrico explicativo. Se han
llevado a cabo tentativas justamente en este sentido, pero por el mo­
mento dejan mucho que desear.
Sin duda, una de las distinciones intuitivas más importantes entre
pasado y futuro es que hay trazos o registros del pasado, pero no del
futuro. Incluso la memoria, quizás, pueda considerarse como un sis­
tema de registros del pasado. Pero ¿porqué tenemos registros y re­
cuerdos del pasado y no del futuro?
Una respuesta a esta cuestión, dada por Reichenbach, se centra
en lo que él llamaba macroentropía. Aquí no es el orden y desorden
de los microconstituyentes de la materia lo que se cuestiona, sino di­
chas clases más aparentes de orden y desorden que distinguirían,
pongamos, una disposición ordenada de objetos de tamaño medio de
La introducción de la probabilidad en la tísica 22 1

una colección caótica y desordenada de dichos objetos. ReiihiMibach


arguye que cuando encontramos un sistema con una macroentropiu
menor de la que habríamos esperado normalmente, debemos dar
cuenta de este macroestado improbable. Arguye que no es probable
que un microsistema de baja entropía sea una fluctuación espontanea
de un sistema aislado desde un microestado de alta entropía, sino
que es más fácil que se trate de un sistema que interaccionó con el
entorno exterior en el pasado. Después arguye que un sistema que
posea una macroentropía baja precisa también haber interaccionado
con el exterior para haber generado esa macroentropía baja. Una ma­
croentropía baja, entonces, nos permite también inferir una interac­
ción en el pasado. Y, afirma, esta inferencia de una interacción pasa­
da es lo que aporta lo que entendemos por registro o traza.
Su ejemplo favorito es la huella sobre la arena de la playa. Espe­
ramos encontrar una playa de macroentropía alta, esto es, una playa
suave con los granos de arena distribuidos aleatoriamente. Al encon­
trar la huella, podemos inferir una interacción pasada de la playa con
algo diferente, el pie que produjo la huella. Así la huella es un regis­
tro o traza de un suceso pasado.
Pero esta explicación presenta muchos problemas. Algunas veces,
los registros o las trazas son estados de macroentropía alta. Cuando
esperamos orden y encontramos desorden, también lo consideramos
indicativo de una interacción pasada. Los trozos dispersos de una ex­
plosión son un registro de macroentropía alta. Algunas veces pode­
mos inferir de estados de macroentropía baja a estados futuros. Algu­
nos estados de macroentropía baja, por lo demás no esperados, son
pronosticadores de sucesos futuros. Estas situaciones son tales que, da­
do que esos sucesos futuros ocurrirán, el suceso presente deviene
más probable. La señal en el radar de la pantalla puede muy bien ser
un buen indicador de una interacción futura, pongamos, del misil
dando en el objetivo, pero no es un registro de ese suceso futuro.
Una justificación real de la afirmación de Reichenbach sería una
razón para creer que hay un modelo general de inferencia de sucesos
pasados que es caracterizable en términos macroentrópicos y que no
rivaliza con un modelo similar de inferencia del futuro. Quizás po­
dría llevarse a cabo algo de esta índole. Después de todo, mi periódi­
co diario con sus caracteres ordenados es un indicador de lo que su­
cedió anteriormente, y no hay nada parecido a un periódico para el
futuro. Pero la razón por la que esto es así sigue siendo muy confusa.
Filosofía de la física

Lo que es especialmente confuso es cómo va a ser utilizado el au­


mento hacia el futuro de la microentropía, la irreversibilidad termo­
dinámica del mundo, para dar cuenta de la clara asimetría real que
hay en la Forma en que podemos obtener conocimiento del pasado y
del futuro. La ruta a través de la macroentropía es especialmente des­
concertante debido al problema de que lo que la macroentropía de
un sistema es, depende de cómo clasificamos los sucesos en clases o
tipos de macrosucesos. Nosotros veríamos algunas formas de hacer
esto como «naturales», y otras como «innaturales» o perversas en al­
gún modo. Cualquier teoría que intente explicar cómo es que algu­
nos estados ordinarios deberían ser tomados como registros del pasa­
do, pero ningún estado ordinario debería ser visto como un registro
del futuro a pesar de la habilidad para inferir algunas veces el futuro
a partir de ellos, y que intente hacer esto invocando la noción de ma­
croentropía, debe hacer plena justicia a estas cuestiones de clases de
sucesos naturales versus innaturales. Ni qué decir tiene que la ruta
desde el aumento de entropía termodinámica a una explicación de
porqué tenemos recuerdos del pasado y no del futuro es si cabe más
misteriosa, dado lo poco que sabemos siquiera sobre cuál es realmen­
te la base física de la memoria.
Algunos enfoques que secundan las tesis de Boltzmann conside­
ran la asimetría del conocimiento, el hecho de que existan registros
del pasado pero no del tuturo, como fundamental. Estos puede que
busquen derivar otras asimetrías, pongamos, nuestra creencia en que
la causalidad va del pasado al futuro, de la asimetría del conocimien­
to. Otros enfoques puede que busquen primero una derivación de la
asimetría causal a partir de la entrópica, considerando los registros
como efectos de los sucesos de los que son registros, siendo los suce­
sos que son registrados, por definición, la causa del registro de los
mismos.
Un ataque particularmente ingenioso a la asimetría causal que
busca una explicación de la misma en fenómenos que podrían estar
conectados a la asimetría entrópica ha sido propuesta por D. Lewis.
Lewis asocia la causalidad con los denominados condicionales con­
tractuales. La idea es vieja: La causa de un suceso es el suceso tal
que, si rio se hubiera producido, el suceso considerado el efecto no
hubiera ocurrido. (La explicación completa es más complicada que
esto, pero la versión simple bastará para nuestros propósitos.) Pero
¿cómo determinamos qué condicionales contrafactuales son verdade­
La introducción de la probabilidad en la física 223

ros? Lewis arguye que nuestras intuiciones son tales que cuando pre­
guntamos qué habría sucedido si un suceso real no hubiera ocurrido,
o si hubiera ocurrido en una forma distinta a cómo en realidad lo hi­
zo, tendemos a pensar en las clases de cambios que nos veríamos for­
zados a hacer en el mundo si el suceso hubiera sido diferente a como
fue. Elegimos como lo que hubiera sucedido lo que sucede en un
mundo que es, en algún sentido, lo más próximo al nuestro posible,
dado que el cambio postulado se necesitó por ser el suceso diferente
a como en realidad fue. Nuestros criterios para hacer tales juicios de
«proximidades de mundos» tolerarán pequeñas violaciones de las le­
yes de la naturaleza, pero no violaciones importantes o muchas de
ellas. Buscarán grandes regiQnes del espacio y el tiempo donde las
cosas permanezcan justo como son en este mundo, pero tolerarán
grandes cambios en realidades particulares, incluso si estas realidades
son importantes para nosotros. Los criterios de proximidad están
concebidos para que nuestros juicios intuitivos sobre «lo que sería el
caso» resulten correctos tan a menudo como sea posible.
Un resultado de este análisis es hacer que los «contrafactuales re­
troactivos» resulten falsos. Éstos son contrafactuales que nos dicen
que si algún suceso se hubiese dado de otra forma, su pasado habría
sido diferente. Al menos resultan falsos en algunos casos. Los casos
son de los del tipo de la piedra lanzada al agua que genera una onda
expandiéndose en el estanque en el futuro del impacto de la piedra
con el agua. La idea es que mientras el no haber lanzado la piedra
habría requerido solamente un milagro menor en su pasado (mi neu­
rona no disparando y no provocando en mí la volición de lanzar la
piedra), el impacto de la piedra en el agua se asocia a una vasta serie
de hechos dispersos espacio-temporalmente en el futuro del impacto.
Éstos son todas esas partes onduladas que aparecen, todas las ondas
luminosas que son emitidas desde ellas, etcétera. Según el análisis de
Lewis, entonces, resulta que si un suceso hubiera sido diferente a
como fue, el futuro de ese suceso habría sido diferente, pero el pasa­
do habría sido el mismo, porque un suceso dado está «sobredetermi-
nado» por sucesos de su futuro. Hay muchos sucesos en el futuro de
un suceso dado que requieren la existencia de ese suceso, pero
pocos en su pasado que lo hagan. Y la causalidad siempre va, pues,
desde el pasado al futuro asimismo.
De nuevo hay muchos enigmas. En primer lugar, pensamos en la
causalidad como yendo del pasado al futuro, y no en la otra direc­
224 Filosofía de la física

ción,'incluso en casos que no involucran dicha «propagación de or­


den en el futuro». A quí uno podría intentar una línea de argumenta­
ción debida a Reichenbach según la cual nuestra idea básica de cau­
salidad asimétrica se forma a partir de casos donde hay una
propagación macroentrópica. El concepto es entonces «proyectado»
por una suerte de analogía a los casos en los que no hay tal propaga­
ción. (Pero ¿parece esto realmente plausible?) De nuevo existe el
problema de que todos estos hechos sobre la propagación de un ma-
croorden en el futuro dependen fuertemente de cómo son caracteri­
zados los sucesos. Como antes, queda la posibilidad de caracterizar
los macrosucesos de una forma tan perversa que uno observa una
propagación de orden en la dirección temporal equivocada. Final­
mente, como Lewis mismo establece, no está nada claro cómo rela­
cionar la explicación de la asimetría de la causalidad aquí bosqueja­
da con el aumento de la microentropía de la termodinámica. Podrían
hacerse sugerencias acerca de la manera en que esto podría funcio­
nar, de la misma forma que existen explicaciones que intentan carac­
terizar fenómenos como la propagación de la correlación en los fenó­
menos ondulatorios por medio de las características termodinámicas
de los emisores y receptores de las ondas. Einstein intentó explicar la
asimetría de la propagación de ondas electromagnéticas en esta for­
ma. Pero todavía hay mucho aquí que no se entiende bien.
Probablemente la única estimación justa de la situación en el mo­
mento actual es que la tesis de Boltzmann no es manifiestamente ab­
surda o incoherente. Es también una que reposa sobre un argumento
de fuerte plausibilidad. Después de todo, si la asimetría termodinámi­
ca de los sistemas en el tiempo es la forma en que la asimetría tem­
poral radical se manifiesta en el comportamiento de los sistemas físi­
cos, ¿no es evidente que esta asimetría física global es responsable en
alguna forma de todas nuestras asimetrías intuitivas en el tiempo?
Una cosa es cierta: Las tentativas de tomar el tiempo como funda­
mentalmente asimétrico en alguna otra forma, pongamos, basada en
algún análisis metafísico profundo de la naturaleza del «tiempo mis­
mo» parecen fracasar inevitablemente en explicar la asimetría entró-
pica. N i tampoco está claro cómo explican realmente las asimetrías
de conocimiento y causalidad. Sin embargo, debe admitirse que na­
die ha demostrado nunca realmente que la tesis final de Boltzmann
pueda ser completada en la manera circunstanciada necesaria para
hacerla convincente.
La introducción de la probabilidad en la física

Supongamos que somos capaces de propon?*0i5&wjn«frftóU*b^


vincentes en el sentido de que todas nuestras asimetrías i!!Lflft\fc*en
el tiempo tienen un fundamento explicativo en la asimetría entropífca.
¿Cuál deberíamos entonces decir que es la conexión entre estas dos
relaciones: 1) la relación que un suceso presenta con otro cuando el
primero es posterior al segundo en el tiempo, y 2) la relación que un
suceso presenta respecto a otro cuando el primer suceso está separa­
do en el tiempo del segundo suceso y donde también la dirección
temporal del primer suceso al segundo es esa dirección temporal en
la que la entropía de los sistemas aislados casi siempre aumenta? Una
sugerencia que con frecuencia se hace es que una extensión satisfac­
toria del argumento explicativo nos llevaría a afirmar que las dos re­
laciones son idénticasentre sí.
Aquí la analogía se establece con frecuencia con otras «identida­
des descubiertas» en el dominio de la ciencia. Descubrimos que los
cristales de sal son — es decir, son idénticos a— ordenamientos de
iones de sodio y cloro. Descubrimos también que las ondas de luz
son — es decir, no son sino— un tipo de ondas electromagnéticas.
¿No es también justo decir que hemos descubierto que la dirección
«abajo» en el espacio en cualquier lugar es justamente — es justamen­
te idéntica a— esa dirección del espacio en la que está dirigida la
fuerza gravitacional en dicho lugar? ¿No sería también plausible en­
tonces que si el programa explicativo de Boltzmann pudiera ser desa­
rrollado por completo, deberíamos simplemente vindicar una identi­
dad entre la asimetría futuro-pasado en el tiempo y esa asimetría
generada por el aumento de entropía?
No obstante, se han dejado escuchar algunas dudas de que
podamos llegar tan lejos, aun cuando el éxito del programa explicati­
vo esté garantizado. Estas dudas están relacionadas con las expresa­
das en el contexto del problema filosófico mente-cuerpo acerca de la
tesis que identificaría ciertos procesos mentales, como sentir un
dolor o tener una cierta sensación visual, con el desarrollo de un
cierto proceso en el cerebro. Quienes expresan estas dudas no ponen
en tela de juicio, en el contexto de este argumento, que podría darse
el caso de que para todas esas cualidades sentidas o percibidas de la
vida mental, ciertos procesos cerebrales fueran condiciones necesa­
rias y suficientes. Podrían incluso estar de acuerdo en que los proce­
sos mentales fueron «sobrevinientes» en lo físico, lo cual significa
que dos personas cualesquiera con idénticos procesos cerebrales
22(i Filosofía de la física

deberían tener procesos mentales idénticos. Lo que se niega es que


los procesos mentales y físicos puedan, en alguna forma razonable,
considerarse como uno y el mismo proceso.
Algunas veces estas dudas se expresan en un formato modal que
se retrotrae a R. Descartes. Podemos imaginar un proceso mental del
tipo apropiado sin el proceso cerebral asociado, se dice, o el último
sin el primero. Así pues, los procesos no son necesariamente idénti­
cos uno al otro. Pero todas las identidades auténticas son identidades
necesarias, lo cual no significa decir que su descubrimiento podría
no ser una cuestión empírica. De forma que la contingencia de la co­
nexión cualidades/procesos cerebrales pone de manifiesto que es
una no identidad. El argumento debe llevarse más lejos, sin embargo,
porque pensamos que también podemos imaginar agua que no es
H-O, aunque el agua sea ciertamente idéntica a H20. Llegados a este
punto se da un argumento para explicarnos porqué no podemos real­
mente imaginar agua que no es H2Ot sino sólo sustancia que tiene
muchas de las características propias del agua sin ser agua. Se arguye,
sin embargo, que la «inmediatez» de nuestro acceso a las cualidades
mentales hace que las dos situaciones sean radicalmente diferentes.
A. Eddington propuso un argumento parecido, en el sentido de
que cualquiera que fuera la relación entre que un suceso se diera
después que otro y que un suceso se diera en la dirección temporal
J.e! -.nimentó de entropía con respecto al otro, no podría ser la identi­
dad Sabemos, afirmó, cómo es la «posterioridad». Y sabemos cómo
es la noción entrópica de estar un estado más desordenado que otro.
Y sabemos, afirmó, que las dos relaciones simplemente no son la mis­
ma relación. Así es justamente como sabemos que cualquiera que sea
la relación de la percepción mental a los procesos cerebrales, no es
una relación de identidad entre lo que está sucediendo.
Aquí, como Eddington recalcó, el papel especial del tiempo en el
m undo es importante. Con frecuencia logramos que las identificacio­
nes funcionen eliminando del mundo físico algunas de las caracterís­
ticas del objeto identificado y trasladándolas al mundo mental. Así
pues, cuando decimos que una onda luminosa azul es idéntica a una
onda electromagnética, no tenemos que preocuparnos por el hecho
de que las ondas electromagnéticas no pueden pensarse como azules.
Pues ya hemos presupuesto que el azul percibido de la onda lumino­
sa no es una característica de la onda de luz física, sino solamente
una «cualidad secundaria» en la mente, generada causalmente por
La introducción de la probabilidad en la física 227

luz de un cierto tipo que alcanza nuestras retinas. Pero las relaciones
temporales entre los sucesos en el mundo, argüiría Eddington, son
características genuinas de esos sucesos. Y esa clase de temporalidad,
afirma, debe ser exactamente la misma clase de temporalidad que re­
laciona los sucesos de la experiencia inmediata entre sí. Por estas ra­
zones, razones que son muy difíciles de aclarar filosóficamente, pero
que no obstante son muy sugerentes, él piensa que la demanda de
identidad entre relaciones temporales, según se dan en el mundo y
según las experimentamos de forma inmediata, y relaciones tales
como las que se dan entre diferentes grados de orden, como es la d i­
ferencia de entropía, es implausible. La teoría entrópica de la asime­
tría del tiempo tiene aspectos importantes y filosóficamente descon­
certantes aun cuando el programa de Boltzmann como programa
explicativo pueda hacerse completamente plausible.

Lecturas adicionales

Reichenbach (1956) es una discusión seminal de las cuestiones de


este capítulo. Una discusión contemporánea es Horwich (1987). Da-
vies (1974) es una introducción excelente a diversos aspectos de la fí­
sica. Sklar (próxima publicación) es una discusión sistemática de la fí­
sica estadística desde una perspectiva filosófica.
Una buena introducción a la teoría de la probabilidad es Cramer
(1955). Feller (1950) da más detalles y es más avanzado. Un vivido re­
sumen de la base axiomática por su inventor es Kolmogorov (1950).
Un estudio de las teorías filosóficas de la probabilidad puede encon­
trarse en Kyburg (1970) o, más concisamente, en el capítulo 3 de
Sklar (próxima publicación). Para una introducción a la aleatoriedad
objetiva véase Earman (1986), capítulo 8.
Una visión de conjunto de lo que los filósofos dicen sobre las
explicaciones estadísticas puede encontrarse en Salmón (1984) y
Humphreys (1989). De nuevo, un breve resumen es el capítulo 4 de
Sklar (próxima publicación).
Los artículos más importantes de la historia de la mecánica esta­
dística están traducidos en Brush (1965). Brush (1976) contiene una
buena cantidad de información sobre la historia de la disciplina. Eh-
renfest y Ehrenfest (1959) es una temprana exposición crítica de la
disciplina, también muy útil para formarse una idea histórica.
228 Filosofía de la física

Buchdahl (1966) y Pippard (1961) son buenas introducciones a


los conceptos de la termodinámica. El trabajo original de Gibbs
(1960) es una buena introducción a los fundamentos de la mecánica
estadística. Tolman (1938) es un tratamiento discursivo y sutil donde
se recalcan los aspectos fundacionales. Jancel (1963) cubre muchos
de los detalles de los enfoques fundacionales de la teoría.
El enfoque temprano de la teoría ergódica puede encontrarse en
Farquhar (1964). El enfoque más moderno es expuesto brillantemen­
te (a un nivel matemático bastante sofisticado) en Arnold y Avez
(1968). Sinai (1976) es también conciso y profundo (pero difícil). Para
una discusión filosófica de los enfoques alternativos a la teoría del no
equilibrio, véase Sklar (próxima publicación), capítulo 7.
El enfoque «subjetivista» (mejor dicho, inductivista) de la mecá­
nica estadística puede encontrarse en Jaynes (1983), Katz (1967), y
Hobson (1971). Las ideas fundamentales de Krylov se encuentran en
Krylov (1979). Véase también Batterman (1990) y Sklar (próxima pu­
blicación), capítulo 7. Sobre el enfoque de Prigogine, véase Prigogine
(1980 y 1984). Véase también Sklar (próxima publicación), capítulo 7,
y Batterman (1991).
Una introducción no técnica al estudio de los sistemas caóticos
es Gleick (1987). Devaney (1986) es una introducción a los aspectos
matemáticos de la teoría. Schroeder (1991) explica la estructura de
muchos aspectos de la teoría del caos y discute, asimismo, otras áreas
donde el razonamiento probabilístico ha pasado a ser central en la
explicación científica.
Un trabajo clásico sobre la relación de la cosmología a la entro­
pía es Tolman (1934). Davies (1974) es accesible y cubre muchos tó­
picos importantes. R. Penrose (1979) es un tratamiento sutil acerca
del aumento de entropía y de los resultados cosmológicos. Sklar (pró­
xima publicación), capítulo 8, es un breve estudio desde una perspec­
tiva filosófica.
Sobre sistemas derivados, el origen de la discusión se encuentra
en Reichenbach (1956), especialmente en la sección 3. Davies (1974),
capítulo 3, esboza los sistemas derivados. El escepticismo sobre la co­
nexión del aumento de entropía cósmica al aumento paralelo de en­
tropía en los sistemas derivados se discute en Sklar (próxima publica­
ción), capítulo 8.
Sobre el tema de la dirección del tiempo, Reichenbach (1956),
sección 4, es seminal. Las concepciones a lo Reichenbach se defien­
L* introducción de la probabilidad en la física 229

den en G rünbaum (1973), capítulo 8. Mehlberg (1980), especialmente


los capítulos 5 y 8, ofrece una crítica. Una discusión penetrante de
las afirmaciones reichenbachianas se encuentra en Earman (1974).
Horwich (1987) ofrece, tanto una explicación de los orígenes cósmi­
cos de la asimetría en sistemas derivados, como una tentativa de fun­
damentar la asimetría temporal intuitiva en la asimetría de los siste­
mas derivados. Sklar (próxima publicación), capítulo 10, y Sklar
(1985), capítulo 12, exploran cómo deberá ser la estructura de una
descripción reduccionista del orden temporal.
Capítulo 4
LA IMAGEN CUÁNTICA DEL MUNDO

La base experimental de la teoría cuántica

La teoría cuántica ha confrontado a científicos y filósofos de la cien­


cia con una serie de cuestiones sorprendentes. Muchos piensan que
cualquier tentativa de comprender un m undo descrito por la teoría
cuántica requerirá una revisión en nuestro entendimiento de la natu­
raleza de las cosas mucho más radical que la revisión en nuestro en­
tendimiento de la naturaleza del espacio y el tiempo demandada por
las teorías de la relatividad. Se ha afirmado que para comprender la
teoría cuántica debemos revisar nuestro entendimiento mismo de
cuestiones tales como la naturaleza objetiva de la realidad y su inde­
pendencia de nuestra percepción de ella, la naturaleza de un sistema
complejo y su relación con sus componentes, y la naturaleza de la de­
terminación causal y de otros tipos en el mundo. ¿Qué es lo que en
esta teoría parece imponernos una revisión tan radical en nuestras
categorías básicas de la naturaleza?
Nos será de ayuda explorar muy brevemente algunos de los mo­
mentos culminantes en el desarrollo histórico de la teoría. Primero,
hemos de remontarnos a la historia de las teorías sobre la naturaleza
de la luz. En el siglo xvn se propusieron dos modelos sobre la natu­
raleza de la luz. Uno, adoptado tentativamente por Newton, decía
que la luz era una corriente de partículas emitidas desde una fuente

231
232 Filosofía de la física

y reflejadas por los objetos iluminados. El otro, propuesto por C.


Huyghens, entre otros, decía que la luz era una forma de movimiento
ondulatorio en un medio de transmisión, de forma parecida a como
el sonido es una onda generada por una fuente y transmitida como
un movimiento periódico a través del aire.
La teoría ondulatoria tuvo que superar algunas dificultades. ¿Có­
mo podía una onda ser transmitida desde el sol a la tierra si existía
un vacío desprovisto de materia entre ellos? Haría falta postular un
medio de transmisión, el éter, que sirviese de soporte a las ondas ori­
ginadas en el sol y recibidas en la tierra. Resultados ulteriores sobre
la polarización de la luz indicaron que si la luz fuese una onda, ten­
dría que ser tal que su movimiento ondulatorio fuese perpendicular
a la dirección de propagación de la onda. Esto hizo la constitución
de este medio etéreo muy problemática, pues se pensaba que tales
ondas sólo podían transmitirse en un cuerpo rígido. En el caso del
movimiento ondulatorio, uno también espera fenómenos de difrac­
ción. Podemos escuchar el sonido producido detrás de una pared en
la que sólo hay una pequeña abertura pues, una vez que el sonido
entra en la abertura, se propaga también detrás de la barrera. Pero
¿no proyecta la luz sombras nítidas, sin mostrar ninguno de dichos
efectos de dispersión, cuando es interceptada por una barrera? Eso
es lo que uno esperaría según la teoría corpuscular.
Pero en los siglos xvm y xix la teoría ondulatoria logró lo que a
todas luces parecía ser una clara victoria. Las mediciones indicaron
que, de acuerdo con lo esperado en la teoría ondulatoria y en con­
flicto con las predicciones de la teoría corpuscular, la luz viajaba más
despacio en medios con índices de refracción mayores que en me­
dios con índices menores. Una observación detenida reveló, además,
que los efectos esperados de difracción en una onda podían obser­
varse en la luz. Anteriormente no habían sido detectados debido a
que la longitud de onda de la luz, a diferencia de la del sonido, es
muy pequeña comparada con el tamaño de los objetos macroscópi­
cos. Esto hace que los efectos de dispersión asociados a la difracción
sean muy difíciles de discernir.
Lo más convincente de todo a favor de la teoría ondulatoria fue
el descubrimiento de los efectos de interferencia. Una onda es un fe­
nómeno periódico, tanto en el espacio, como en el tiempo. Tiene una
amplitud que aumenta y disminuye periódicamente en cualquier lu­
gar determinado, y aumenta y disminuye de un lugar a otro en un
La imagen cuántica del m undo 233

tiempo determinado. Las ondas pueden superponerse unas a otras. Si


la cresta de una onda se superpone a la cresta de otra onda, la ampli­
tud de la onda resultante aumenta. Si la cresta se superpone a un
vientre, la onda compuesta resultante tiene una amplitud menor en
ese lugar y momento. Si una onda simple se divide en partes que se
superponen unas a otras a continuación, pongamos, haciendo pasar
la onda a través de dos rendijas separadas en una placa y haciendo
que los haces resultantes se superpongan e impresionen una pantalla,
entonces aparecerá una «figura de interferencia» como resultado de
la alternancia sistemática de superposiciones «constructivas» y «des­
tructivas». Dicha figura, obtenible con luz, se considera claramente
indicativa de un fenómeno ondulatorio. Si la luz consistiese de partí­
culas en fugar de ondas, esperaríamos encontrar la figura mucho más
simple de dos series de amplitud superpuestas, una por cada rendija,
en vez del sistema periódico de amplitudes grandes y pequeñas co­
rrespondiente a una onda.
Hacia el final del siglo XIX, Maxwell convenció a la comunidad
científica de que la luz era una forma de onda electromagnética. Más
tarde, se fue abandonando gradualmente la idea del éter como un
medio de transmisión de la onda. El campo electromagnético mismo
fue visto como un tipo de entidad substantiva que podía ser transmi­
tida a través de un vacío genuino, quedando así explicada la transmi­
sión de la luz desde, por ejemplo, el sol a la tierra.
Los primeros signos de dificultades en la teoría ondulatoria es­
tándar provinieron de las tentativas de entender la interacción entre
la materia y la luz. Un cuerpo material emitirá y absorberá luz. M an­
tenido a una temperatura fija, ese cuerpo emitirá luz y la absorberá.
El cuerpo estará en equilibrio con la luz, cuya energía está distribui­
da de acuerdo con una ley de distribución fija entre las diversas fre­
cuencias posibles asociadas con cada onda. La ley puede ser determi­
nada experimentalmente. La distribución de frecuencias variable con
la temperatura es conocida: uno puede ver cómo una barra de metal
calentada va cambiando de color a medida que va aumentando su
temperatura.
Varias tentativas de entender esta importante función de distri­
bución espectral fueron llevadas a cabo. Un enfoque, partiendo de la
ley de distribución de Maxwell-Boltzmann para las moléculas de un
cuerpo caliente, dio lugar a la ley de Wien. Esta ley daba una buena
aproximación de la distribución de frecuencias observadas a altas
234 Filosofía de la física

temperaturas, pero fallaba a bajas temperaturas. Otro enfoque trabajó


también a partir de los postulados de la teoría de la mecánica estadís­
tica discutidos en el capítulo 3, pero aplicó el razonamiento estadísti­
co a la radiación misma. Esto dio como resultado la ley de Rayleigh-
Jeans. Dicha ley funcionaba bien a bajas frecuencias, pero daba
resultados imposibles — divergentes— a frecuencias altas.
M. Planck buscó una ley de compromiso que se adaptase mejor a
los hechos experimentales, y la encontró. Pero la reflexión sobre su
significado físico parecía conducir a una interpretación casi inevita­
ble. La Ley de Planck podía ser considerada válida, sobre la base del
razonamiento teórico ordinario, únicamente si uno suponía que la
materia y la luz intercambiaban energía sólo en «paquetes» discretos,
siendo la energía de cada paquete igual a una constante fija multipli­
cada por la frecuencia de la luz emitida o absorbida. Esto estaba en
fuerte contradicción con las suposiciones habituales de la teoría on­
dulatoria, a saber, que la luz y la materia podían intercambiar energía
en cualquier cantidad y a cualquier frecuencia. ¿Cuál era el origen de
esta peculiar discontinuidad en el intercambio de energía?
Einstein llamó más tarde la atención sobre otro tipo de interac­
ción entre la luz y la materia, a saber, la liberación de electrones por
un metal cuando éste era bombardeado con luz de alta energía, el lla­
mado efecto fotoeléctrico, que también parecía sugerir que la energía
existía en la luz sólo en paquetes discretos. Los resultados experi­
mentales indicaron una vez más que cada paquete tendría una ener­
gía proporcional a la frecuencia de la luz que representaba. La ener­
gía de los electrones liberados del metal dependía de la frecuencia
de la luz utilizada, pero no de su intensidad. Sólo el número de elec­
trones liberados dependía de la intensidad de la luz. Era como si ca­
da electrón fuese liberado por la interacción con un solo paquete de
energía luminosa («fotón») y como si la intensidad de la luz indicase
cuántos fotones había presentes a una frecuencia dada. La luz pare­
cía, una vez más, poseer algo parecido a un aspecto corpuscular.
Inspirado por los aspectos corpusculares de la luz, un conocido
fenómeno ondulatorio, L. de Broglie sugirió que los familiares fenó­
menos corpusculares podrían tener también un aspecto ondulatorio.
Las partículas componentes que forman el átomo, tales como el elec­
trón, mostrarían entonces, bajo condiciones experimentales apropia­
das, aspectos de un fenómeno ondulatorio como la difracción o la in­
terferencia. Un ingenioso argumento procedente de la relatividad
La imagen cuántica del m undo 235

permitió a De Broglie asociar a una partícula, no ya una frecuencia


considerada proporcional a la energía como era el caso con los pa­
quetes de energía luminosa, sino también una longitud de onda. Esta
longitud de onda se tomó como inversamente proporcional al mo­
mento de la partícula.
Curiosamente, la confirmación experimental de la audaz conjetu­
ra de De Broglie ya se había obtenido, si bien la importancia de los
datos reunidos no fue reconocida hasta que la tesis de De Broglie se
dio a conocer. Uno puede obtener fenómenos de interferencia a par­
tir de una onda utilizando no sólo un dispositivo de rendija múltiple,
sino también dispersando la onda mediante un arreglo regular de
fuentes difusoras, tales como líneas gravadas en una placa reflectora,
una así denominada red de difracción. La onda es dispersada por ca­
da línea, y las ondas dispersadas se combinan unas con otras, interfi­
riendo y produciendo uno de los familiares patrones periódicos de
interferencia tan típicos de la interacción de una multiplicidad de on­
das coherentes. Para el electrón, con su pequeña longitud de onda,
los átomos de un cristal proporcionan una tal red de difracción.
Efectivamente, si un haz de electrones es dispersado por la superficie
de un cristal, los electrones reflejados se distribuyen mismamente en
una figura cuya distribución angular es justo la que uno esperaría de
la figura de interferencia generada por una onda de la longitud de
onda asociada de De Broglie tras ser dispersada por una red de d i­
fracción con el espaciado apropiado al de los átomos en una red cris­
talina. Si la luz, una onda, tiene un aspecto corpuscular, los haces de
electrones, haces de partículas, muestran un aspecto ondulatorio.
(Véase la figura 4.1.)
A continuación, E. Schródinger encontró la ecuación apropiada
cuyas soluciones representarían no sólo la onda asociada a un elec­
trón libre, sino también las ondas asociadas a electrones sujetos a va­
rios campos de fuerza. La aplicación de la ecuación a un electrón en
órbita alrededor del núcleo de un átomo dio por resultado que sólo
un número discreto de energías del electrón correspondían a ondas
que podían existir en una tal situación de partícula ligada. Efectiva­
mente, las energías correspondían a esas energías permitidas de los
electrones en un átomo ya postuladas por una teoría atómica exis­
tente.
Esta vieja teoría de los electrones y de su comportamiento en el
átomo, el modelo atómico de Bohr, condujo, curiosamente, al descu-
236 Filosofía de la física

F ig u r a 4.1. El aspecto ondulatorio de los electrones revelado por la difracción en un cristal


Se dispara un haz de electrones a la superficie de un cristal en una dirección que for­
ma un cierto ángulo con la misma. E l haz reflejado es detectado por D
en un ángulo
diferente. L a curva C
indica esquemáticamente ia variación en intensidad del haz re­
flejado conforme el ángulo de D al cristal y al haz incidente, e,
va cambiando. Tiene
una forma que sería la esperada si el haz de electrones fuese una onda que produjese
excitaciones que generasen nuevas ondas dispersándose desde cada átomo de la red
cristalina, ondas que entonces «interferirían» entre sí.

brimiento de la teoría cuántica, la cual tomó un rumbo muy diferen­


te al que se había seguido desde Planck a De Broglie y a Schródin-
ger. El movimiento de los electrones en un átomo da como resultado
la emisión de luz por el átomo. Pero el patrón de frecuencia de la luz
emitida, el denominado espectro del átomo, es muy diferente al que
se esperaría en las situaciones clásicas. Clásicamente, uno esperaría
que las frecuencias aparecieran en familias de una frecuencia básica y
de múltiplos enteros de la misma. Esto se sigue de unos teoremas clá­
sicos muy fundamentales sobre la forma en que el movimiento de
una partícula cargada puede descomponerse en componentes sim­
ples, básicos, y de la asociación clásica del tipo de movimiento de
una carga al tipo de luz emitida por esa carga. Lo que se descubrió
en su lugar fue que las frecuencias emitidas podían ser ordenadas en
familias caracterizadas por diferencias
de enteros, antes que por sim­
ples múltiplos de una frecuencia fundamental.
La imagen cuántica del m undo 237

Bohr ofreció una imagen del átomo que generaba este resultado,
aunque el modelo se apartaba fundamentalmente de lo que debería
ser posible de acuerdo con la teoría entonces estándar. Según la des­
cripción de Bohr, los electrones podían existir en estados de energía
definidos, discretos, contrariamente al punto de vista clásico que per­
mitía cualquiera de un continuo de estados. En la nueva imagen, los
electrones «saltaban» de un estado de energía a otro. En cada salto
se emitía o absorbía energía en una cantidad igual a la diferencia de
energía entre los dos estados. El cambio de energía en el átomo lleva­
ba asociado la emisión o absorción de luz de una frecuencia asociada
con dicha energía por la regla de Planck. Esto se contrapone clara­
mente al punto de vista clásico — en el que los electrones emitirían o
absorberían energía de manera continua. El modelo de Bohr era
capaz de generar estos estados de energía para los átomos más senci­
llos por medio de un grupo de reglas simples, si bien algo infunda­
das. Pero resultó incapaz de aportar un método general para determi­
nar los estados de energía en casos más complejos e incapaz
asimismo de indicar una forma sistemática de determinar la intensi­
dad y la frecuencia de la luz asociada a la emisión y absorción ató­
micas.
W. Heisenberg acometió la resolución de estos problemas bus­
cando una forma sistemática de tratar el problema de la interacción
entre los átomos y la luz. Dada la incompatibilidad del modelo de
Bohr con la teoría existente sobre el movimiento de los electrones,
buscó un esquema que evitara por completo el dar una imagen diná­
mica del electrón en el átomo. El esquema intentaría, en lugar de
ello, calcular directamente las cantidades observables deseadas. C u ­
riosamente, la teoría terminó por aportar, más bien, un nuevo sopor­
te a la dinámica en su totalidad. El procedimiento de Heisenberg re­
curría al método clásico de reducir los movimientos complejos a
movimientos simples y de asociar la radiación emitida con la canti­
dad de cada componente simple de movimiento presente. Pero ahora
hizo falta un tipo de descomposición doble que respondiese a la ca­
racterización de las frecuencias observadas por dos números, corres­
pondiendo a diferencias en los estados de energía, en lugar de por un
solo número, correspondiendo al múltiplo del movimiento funda­
mental, como en la física clásica.
En su nuevo formalismo, Heisenberg duplicó por analogía la es­
tructura formal de las viejas reglas para calcular energías, frecuencias
Filosofía de la física

e intensidades. Así consiguió un procedimiento sistemático para de­


terminar las energías permitidas del electrón en cualquier átomo, las
frecuencias correspondientes de la luz emitida y las intensidades de
la luz observada.
Así como Heisenberg, M. Born y P. Jordán trabajaron también en
la teoría, proponiendo una teoría dinámica enteramente nueva. Aun­
que las matemáticas estaban claras, la interpretación física de la teo­
ría era menos obvia. Las cantidades dinámicas básicas de posición y
momento habían sido hasta entonces representadas matemáticamen­
te por funciones que asignaban números a la partícula como una fun­
ción del tiempo. Estos eran la posición y el momento de una partícu­
la en un instante dado. Ahora, sin embargo, las cantidades dinámicas
estaban representadas por objetos matemáticos llamados operadores.
Estos operadores aplicaban una entidad matemática abstracta, el
estado del sistema, de un estado a otro. Se construyeron reglas para
determinar, dado el estado de un sistema y dado el operador corres­
pondiente a la cantidad en cuyos valores uno estaba interesado, los
posibles valores observados de la cantidad. Uno podía calcular, por
ejemplo, los posibles valores de la energía para un electrón en un
átomo de un tipo dado. Otras reglas permitían el cálculo de las «am­
plitudes de transición» de un estado correspondiente a un valor de
una cantidad a otro en una situación física dada. Así, se podía calcu­
lar la razón a la que los electrones saltarían de un estado de energía a
otro en un átomo, aun cuando el átomo estuviese sometido a alguna
interferencia exterior. Esto daba las intensidades de la luz emitida de
una frecuencia específica.
Pero ¿qué tipo de mundo físico correspondía a estas innovadoras
matematicas.' Algo muy nuevo había ocurrido en la física. Mientras
que anteriormente un modelo físico había conducido a una descrip­
ción matemática, aquí teníamos una estructura matemática que fun­
cionaba, cuya interpretación física parecía bastante problemática.
Pronto se propuso una forma de resolver estas cuestiones sobre
el significado tísico de la teoría de Heisenberg. Si uno calculaba los
posibles estados de energía de un electrón en un átomo según el mé­
todo de Schródinger, considerando como tales los posibles valores
de la energía para ondas del electrón «estacionarias» en el potencial
del núcleo del átomo (algo parecido a las ondas de sonido estaciona­
rias que pueden formarse en un tubo de órgano de una longitud da­
da), uno obtenía valores predichos idénticos a los que se obtenían
La imagen cuántica del m undo 239

mediante las enigmáticas reglas de Heisenberg, utilizando el opera­


dor correspondiente a la energía del átomo en cuestión. Si uno calcu­
laba las tasas de transición entre estados por el método de Schródin­
ger, utilizando un razonamiento similar al que explica cómo un
diapasón vibrando puede poner a otro en oscilación por resonancia,
uno obtenía los mismos valores que los obtenidos por Heisenberg al
calcular las amplitudes de transición con su misterioso cálculo de
operadores. Finalmente, Schródinger fue capaz de demostrar la rela­
ción matemática entre las dos teorías que garantizaba que siempre
predecirían los mismos resultados observables. Matemáticamente, los
dos métodos eran «isomorfos» entre sí, debiéndose algunas diferen­
cias en su apariencia al hecho de que mientras Schródinger incluía la
evolución temporal del sistema en la evolución de su función de on­
da, Heisenberg trabajaba con un estado del sistema independiente
del tiempo e incluía la dinámica de la evolución temporal en la varia­
ción en el tiempo de los operadores asignados a un observable físico
dado.
Ahora, parecía, teníamos al menos los rudimentos de un modelo
físico del electrón como una onda en la teoría de Schródinger. ¿No
podría verse la teoría de Heisenberg simplemente como un medio
matemático de tratar a los electrones y a las otras partículas como
verdaderas ondas físicas?
Esto fue lo que propuso Schródinger. Pero esta sencilla solución
a las dificultades pronto resultó difícil de aceptar. La función de on­
da «dispersa» que describía al electrón tomaba de hecho la forma de
una onda en el espacio y tiempo físicos sólo en el caso de una sola
partícula. Cuando se consideraba un complejo de partículas, la fun­
ción de onda se asemejaba a una onda sólo en un espacio coordena­
do abstracto de más dimensiones, en el que las posiciones de todas
las partículas eran representadas simultáneamente por un solo punto.
Mucho peor era la aparente incompatibilidad de la interpretación del
electrón como una onda «real» dispersa con sus obvios aspectos cor­
pusculares puntuales. Cuando aplicamos los aparatos experimentales
utilizados para detectar la presencia de un electrón, descubrimos que
todas sus manifestaciones, como la masa y la carga, pueden encon­
trarse concentradas en una región física muy pequeña. Si no partícu­
las «puntuales», los electrones son, al menos, bastante pequeños en
extensión. Pero la onda que describe la presencia de un electrón es­
tá, de hecho, esparcida en un gran volumen físico que llega con fre­
240 Filosofía de la física

cuencia hasta el «infinito», al menos en un grado pequeño. Así pues,


¿cómo puede una partícula localizada ser identificada con una onda
dispersa físicamente real?
Una cierta esperanza de reconciliar los aspectos corpusculares de
un electrón con su pretendida naturaleza física ondulatoria surgió del
hecho de que los fenómenos ondulatorios pueden mostrar con fre­
cuencia una concentración estable de la energía de la onda en un vo­
lumen pequeño. Se sabía por la teoría ondulatoria clásica de la exis­
tencia de algunos casos de «paquetes de ondas» en los que el grueso
de la energía del campo está concentrada en un volumen muy peque­
ño del espacio. En un caso excepcional, el oscilador armónico sim­
ple, podía demostrarse que el paquete de ondas concentrado de un
electrón se mantenía estable en el tiempo. Pero, vaya, en el caso ge­
neral podía demostrarse que el paquete de ondas concentrado co­
rrespondiente a un electrón disipaba su concentración muy rápida­
mente, dando lugar a una onda ampliamente dispersa en el espacio.
El problema de reconciliar la onda dispersa con la partícula localiza­
da seguía abierto.
Nos vemos, pues, enfrentados a un dilema. La luz, de la que se
sabía hacía tiempo que mostraba claramente aspectos ondulatorios
de difracción, interferencia, longitud de onda y frecuencia, resultaba
ahora poseer asimismo un aspecto corpuscular. Cualquier detección
de luz por un aparato material, pongamos, un trozo de una película
fotográfica, revelaba que la luz interaccionaba con la materia en un
modo corpuscular. La energía en la luz parecía estar contenida en pa­
quetes discretos que podían interaccionar con la materia sólo «uno
por uno». La materia en forma de partículas elementales, que se sa­
bía de tipo corpuscular, con sus masas y cargas concentradas en un
pequeño volumen físico, se veía ahora que tenía también un aspecto
ondulatorio. Los haces de electrones eran difractados al pasar por pe­
queños agujeros en paredes, como lo hacían los rayos de luz al pasar
por agujeros muy pequeños del tamaño de un alfiler. Los electrones
dispersados por una red cristalina mostraban una clara figura de in­
terferencia exactamente análoga a la mostrada por la luz dispersada
por una red de difracción ordinaria.
Pero ¿cómo podía entenderse esto? ¿Cómo podían aplicarse tér­
minos tales como longitud de onda o frecuencia a partículas localiza­
das? ¿Cómo podían los constituyentes físicos descritos por una fun­
ción de onda dispersa encontrarse, siempre que eran detectados,
La imagen cuántica del m undo 241

localizados en un pequeño volumen en la forma propia de las par­


tículas discretas no dispersas?

Primeras tentativas de interpretar la teoría:


el principio de incertidumbre

Interpretando elformalismo: probabilidad, interferencia y medición


Un vislumbre crucial para la comprensión de la teoría fue la descrip­
ción por M. Born de la intensidad de la función de onda como indi­
cativa de una probabilidad. Toda onda tiene una amplitud, la «altu­
ra» de la magnitud onda. La intensidad de una onda, más o menos
proporcional al cuadrado de esa amplitud, es lo que normalmente re­
gistramos, en el caso de la luz, como la luminosidad de la luz; es una
medida de la energía de la onda. Las amplitudes de las ondas de la
mecánica cuántica ondulatoria fueron expresadas en números com ­
plejos, pero sus «cuadrados» eran números reales que representaban
una cantidad física directamente interpretable. Fue idea de Born el
considerar a estas intensidades como representativas de la probabili­
dad con la que se obtendría uno de los posibles valores de un obser­
vable físico si se hacía una medición apropiada. La función de onda
puede ser representada por una función de distintas variables, por
ejemplo, por una función de la posición, o bien del momento, de la
partícula a la que está asociada la onda. Dependiendo de la represen­
tación elegida, las probabilidades, pongamos, de encontrar a la partí­
cula en una región si se efectuase una medición de la posición, o en
un intervalo dado de momentos si se efectuase, por el contrario, una
medición del momento, podían ser calculadas a partir de la intensi­
dad apropiada sobre una región de la «onda de probabilidad» cuánti­
ca, como algunos comenzaron a llamarla. Las probabilidades de tran­
sición de una partícula desde un estado a otro también podían ser
determinadas a partir de las funciones de onda y sus interrelaciones,
tales como las amplitudes de transición asociadas con las intensida­
des de luz espectral emitida, calculadas originalmente por el método
de Heisenberg.
Claramente, la idea de Born proporciona la primera clave sobre
cómo reconciliar la «dispersión» de la función de onda con la natura­
leza localizada de las cantidades medidas. La onda no representaba
24 2 Filosofía de la física

una partícula real dispersa, sino sólo una probabilidad de encontrar


el valor localizado de la partícula en algún lugar de una región defini­
da de valores.
Pero la simple identificación de la intensidad de la función de
onda con probabilidades entendidas en los términos habituales está
plagada de dificultades. El mejor lugar para ver dónde residen las d i­
ficultades es en el fenómeno de interferencia. Supongamos que un
resultado puede ser obtenido con un cierto grado de probabilidad en
una de dos formas, siendo las dos formas causalmente independien­
tes una de otra. Representemos las probabilidades de los resultados
por P(0/A) y P(0/B),donde O es el resultado y A y B son los dos
modos en los que puede ser obtenido. Normalmente esperaríamos,
dada la independencia causal de A y B, que la probabilidad del resul­
tado O condicionada a haber sido obtenido por la ruta A o por la B
fuese la suma de las dos probabilidades indicadas. Pero, en general,
esto no es cierto en la situación cuántica. Por ejemplo, la probabili­
dad de que un fotón se detecte en un cierto punto de una pantalla
iluminada por dos rendijas no es la suma de la probabilidad de que
el fotón alcance dicho punto cuando sólo la rendija 1 está abierta
más la probabilidad de que el fotón alcance dicho punto cuando sólo
la rendija 2 está abierta. De hecho, si ambas rendijas están abiertas, la
probabilidad de que el fotón alcance un punto dado puede ser menor
de lo que sería si sólo una de las dos rendijas estuviese abierta. En
términos ondulatorios esto es debido a que la onda de la rendija 1 y
la de la rendija 2 «interfieren destructivamente» una con otra para
dar la probabilidad reducida en cuestión. Pero si la función de onda
representa sólo una probabilidad y no una onda física en el mundo,
¿cómo puede darse semejante interferencia? Las probabilidades nor­
males sencillamente no «interfieren» unas con otras.
Unos cuantos sencillos experimentos idealizados muestran lo cu­
rioso que es en realidad el mundo cuántico. Consideremos primero
el experimento de la doble rendija. A quí se deja pasar a un rayo de
luz simple a través de una placa con dos rendijas que pueden cerrar­
se o abrirse indistintamente, y se deja que el rayo vaya a dar a una
pantalla. Si sólo una de las dos rendijas está abierta, se obtiene en la
pantalla una distribución característica de luz centrada en torno al
lugar donde está localizada la rendija abierta. Si ambas rendijas están
abiertas, sin embargo, la figura de la pantalla no es la suma de las fi­
guras de cada rendija como indicamos anteriormente, sino que en su
La imagen cuántica del m undo 243

lugar se obtiene la famosa figura de interferencia. Es importante ad­


vertir que esto mismo se obtiene cuando la intensidad del rayo es tan
débil que por término medio sólo un paquete de energía, un fotón,
está viajando en cada momento desde la fuente a la pantalla a través
de las rendijas. Esto indica que la figura obtenida no puede ser expli­
cada como una interacción causal normal entre los fotones. Es como
si, antes bien, cada fotón pasase por las dos rendijas como una onda,
pero fuese absorbido en la pantalla como una partícula localizada.
(Véase la figura 4.2.)
Si uno modifica el experimento colocando detrás de cada rendija
un detector que indique si un fotón ha pasado o no por la rendija, la
figura de interferencia desaparece y la pantalla muestra, en su lugar,
el tipo de figura que se obtendría si se sumasen sencillamente las fi­
guras de dos experimentos individuales de una sola rendija. La mis­
ma figura se obtiene si cada rendija es iluminada con una fuente de
luz independiente, en lugar de tener una misma fuente iluminando
ambas rendijas. Éstas son la mayoría de las peculiaridades caracterís­
ticas del m undo que el formalismo cuántico requiere a fin de que
puedan ser captadas.
Otro experimento idealizado, llamémoslo el experimento de la
doble trayectoria, toma un haz simple de partículas luminosas y lo d i­
vide en dos haces, recorriendo cada uno de estos haces una trayecto­
ria diferente, y siendo los dos llevados en un momento dado a coin­
cidir en un punto. La división del haz de luz puede efectuarse
utilizando un espejo con una sola mitad azogada que refleje la mitad
de la luz que incide en el mismo y deje pasar la otra mitad a su
través.
En el punto en el que los dos haces son llevados de nuevo a con­
verger, podemos elegir el tipo de experimento de detección que que­
remos realizar. En un experimento se colocan detectores de tal ma­
nera que sólo se dispararán si la «partícula» que está siendo
detectada (el fotón) recorre uno de los caminos y no el otro. Si la in­
tensidad del haz se divide uniformemente, este experimento registra­
rá resultados compatibles con la hipótesis según la cual parece como
si el divisor del haz original escindiera un haz de partículas en dos
mitades, estando uno de los haces formado por las partículas que re­
corrieron solamente el camino A y el otro por las partículas que re­
corrieron solamente el camino B. Pero si, en su lugar, los dos haces
son recombinados en el nuevo punto de coincidencia, se puede obte-
244 Filosofía de la física

(a)

F i g u r a 4.2. El experimento de las dos rendijas.


Si se dirige un haz de partículas, e,a
una pared con dos rendijas y las partículas se detectan sobre una pantalla situada al
otro lado de la pared, se esperará una distribución de las partículas en la pared de la
forma indicada en (a). Dos densidades de partículas, centrada cada una alrededor de
una de las rendijas, sencillamente sumadas una a la otra. Pero si se dirige una onda a
la rendija, se espera obtener el patrón de interferencia para la intensidad de la onda
indicado en (b). Esto se debe a que las ondas emitidas desde las dos rendijas pueden
sumarse una a la otra o cancelarse entre sí, dependiendo de las distancias relativas a
un punto de la pantalla desde las dos rendijas. Si se dirige un haz de electrones, e,a
un dispositivo de dos rendijas, el patrón indicado en (b) se detecta en la pantalla, a
pesar de la naturaleza corpuscular de los electrones puesta de manifiesto en otros ex­
perimentos.
La imagen cuántica del m undo 245

E l experimento de la doble trayectoria.


F i g u r a 4 .3 . e
U n haz de electrones, , puede divi­
dirse de manera que siga una de las dos trayectorias señaladas con y a b en la figura.
En la esquina distante, donde las trayectorias se reencuentran, se podría colocar un
dispositivo R en el camino para recombinar los haces y detectar patrones de interfe­
rencia por medio del detector D¡ (mostrando de esta forma la naturaleza ondulatoria
de los electrones) o quitar el recombinador R
y por medio de los detectores D2í D2h
y
detectar a los electrones como partículas que no recorrieron los dos caminos, sino
uno u otro solamente. U no puede decidir realizar el experimento en un momento
posterior al momento en el que el electrón se encuentra ya recorriendo su trayectoria
(bien las dos trayectorias como onda o bien una de las dos com o partícula). Éste es el
experimento de «elección retrasada».

ner interferencia entre los dos haces. De hecho, un detector de inter­


ferencia, o interferómetro, de este diseño es un dispositivo óptico clá­
sico. Estos efectos de interferencia revelan datos en conformidad con
la hipótesis de que es como si el espejo medio azogado original u
otro dispositivo divisor hubiese separado de hecho una onda en dos
componentes, una de las cuales recorrió el camino A
y la otra el ca­
mino B, pero de forma que permanecieron en fase entre sí, permi­
tiendo que las componentes mostrasen al recombinarse el típico fe­
nómeno de coordinación conocido como interferencia de ondas. Es
como si cada partícula, si los haces se imaginan como haces de par­
tículas, ¡viajase por ambos
caminos simultáneamente! (Véase la figu­
ra 4.3.)
Tal y como J. Wheeler ha señalado, es importante advertir que la
elección del tipo de experimento a realizar en el punto de coinciden­
cia final puede hacerse mucho tiempo después de que el haz haya si­
246 Filosofía de la física

do dividido y enviado a seguir su curso. Esto demuestra que el ape­


lar a la elección de los experimentos como algo que determina cuál
de los aspectos corpuscular u ondulatorio del experimento propor­
ciona en la división del haz la descripción real del mundo, no contri­
buirá a explicar estos efectos.
Es como si en el momento de la división uno tuviera que pensar
en algo que tenga al mismo tiempo los aspectos de un haz de partícu­
las dividido en dos haces de partículas separados y los aspectos de
una onda descompuesta en dos ondas componentes correlacionadas.
Otro tipo de experimento, el experimento de Stern-Gerlach, pue­
de ayudar a visualizar todo el espectro de fenómenos cuánticos. Una
partícula elemental puede poseer una cantidad, conocida como es­
pín, y una cantidad relacionada, el momento magnético de espín.
Esto presenta una relación con la magnetización clásica de una par­
tícula giratoria cargada, pero, como la mayoría de los fenómenos
cuánticos, la relación es solamente por analogía. Para un electrón, el
momento magnético de espín se manifiesta como una «doble valora­
ción» interna de la partícula. Si se envía a través de un campo mag­
nético uniforme en todas las direcciones menos en una que es per­
pendicular a la dirección de movimiento del electrón, el electrón se
verá desviado de su trayectoria hacia arriba o hacia abajo en la direc­
ción de la inhomogeneidad magnética. Si elegimos entonces una di­
rección como la dirección arriba-abajo, y dejamos que el campo sea
no uniforme en esa dirección, el haz de partículas se dividirá en un
haz de partículas «arriba» y un haz de partículas «abajo».
Sea un haz de partículas procedente de una máquina arriba-abajo
que absorbe todas las partículas abajo. Hagamos pasar el haz «arriba
puro» obtenido por una máquina cuya no uniformidad magnética es
perpendicular a la de la máquina arriba-abajo. Llamemos a esta nue­
va máquina una máquina derecha-izquierda. Uno descubre que en el
producto final de la máquina derecha-izquierda, la mitad de las partí­
culas salen en el haz izquierdo y la mitad en el haz derecho.
Ahora vienen los efectos cuánticos de interferencia característi­
cos. Si bloqueamos el haz derecho de la máquina derecha-izquierda y
hacemos pasar su haz izquierdo por una nueva máquina arriba-abajo,
la mitad de las partículas saldrán de la máquina arriba-abajo arriba y
la mitad abajo. Lo mismo sucederá si bloqueamos el haz izquierdo
de la máquina izquierda-derecha y dejamos pasar sólo el haz derecho
por la nueva máquina arriba-abajo. La mitad de los electrones sal­
La imagen cuántica del m u nd o 247

drán arriba y la mitad abajo. Pero si recombinamos los haces izquier­


do y derecho procedentes de la máquina izquierda-derecha y envia­
mos el haz recombinado a través de la segunda máquina arriba-abajo,
¡todos los electrones saldrán de esa máquina en el haz de arriba! Los
haces izquierdos y derechos procedentes de la máquina izquierda-de-
recha están correlacionados entre sí de forma tal que son capaces de
«recordar» la naturaleza original, puramente arriba, del haz introduci­
do. Cuando los haces se recombinan, «interfieren» uno con el otro
para generar no una «mezcla» de partículas izquierdas y derechas, si­
no un haz de partículas que están todas definidamente arriba. Sin
embargo, al igual que en el caso de las dos rendijas, si hubiésemos
colocado detectores en las trayectorias de los haces izquierdo y dere­
cho a fin de anotar para cada electrón si salió de la máquina izquier-
da-derecha como una partícula izquierda o como una derecha, y lue­
go hubiésemos recombinado los haces y los hubiésemos enviado a
través de la máquina arriba-abajo, la mitad de los electrones habrían
salido de esa máquina arriba y la mitad abajo. La medición de los es­
pines producidos por la máquina izquierda-derecha hace que cada
uno de ellos sea definidamente izquierda o definidamente derecha y
destruye la coherencia de los dos haces, resultando imposible recons­
truir el haz arriba puro por medio de su recombinación. Esto indica
que los efectos de interferencia no son sólo relevantes para la distri­
bución espacial de las partículas, sino también para cualquier carac­
terística observable que puedan tener. (Véase la figura -4.4.)
En los haces recombinados de productos izquierda y derecha
que generan un haz arriba puro se da una coherencia entre sus com­
ponentes izquierda y derecha que no se encuentra en un haz en el
que una de sus mitades está compuesta por el producto de una má­
quina izquierda y la otra por el producto de una máquina derecha in­
dependiente de la anterior. El último haz se dice que es una «mez­
cla» de partículas izquierdas y derechas. El primero se dice que es
una «superposición» de partículas izquierdas y derechas.. Dicho
estado de superposición contiene información no presente en un
estado mixto. En el caso que nos ocupa, la información es que el
producto de la máquina izquierda-derecha es el resultado de haberse
alimentado a la máquina con un haz arriba puro como entrada.
El fenómeno de interferencia hace problemática la interpretación
tradicional y simple de la función de onda como una medida de pro­
babilidad. Podríamos probar a considerar la probabilidad como una
248

(a)

(b)

(c)

(d)

(e)

F i g u r a 4 .4 . El experimento ele Slem-Gerlach.


La mecánica cuántica permite a un elec­
trón tener solamente uno de dos valores de espín a lo largo de cualquier eje elegido
E l aparato de Stern-Gerlach puede separar un haz de electrones en dos haces, tenien­
do todos los electrones de cada uno de los haces salientes el mismo valor de espín.
E n (a) un haz «aleatorio» de electrones (e)
es enviado a una máquina de Stern-Ger-
lach con el eje arriba y abajo. L a mitad de los electrones salen en el haz arriba y la
mitad en el haz abajo. E n (b) el haz saliente puro-arriba de un aparato es enviado a
otro aparato orientado según el mismo eje. Todos los electrones que entran en el se­
gundo aparato salen del mismo en el haz arriba. E n (c) un haz puro-arriba de un pri­
mer aparato es enviado a un segundo aparato cuyo eje de orientación forma un ángu­
lo de 90° con el del primer aparato. A l enviar un haz puro-arriba a una máquina
izquierda-derecha se obtiene una mitad de electrones emergentes con espín derecha y
una mitad con espín izquierda. E n (d) la salida de (c) es registrada por detectores a la
derecha de la máquina izquierda-derecha. Los haces registrados son recombinados y
enviados a una segunda máquina arriba-abajo. La mitad salen arriba y la mitad abajo.
Esto es lo que uno esperaría si el haz introducido en la ultima máquina está com
puesto por una mitad de electrones con espín derecha y mitad de electrones con es
pin izquierda. E n (e) la interferencia para el espín del electrón se pone de manifiesto.
Esta vez los haces resultantes de la máquina izquierda-derecha son recombinados sin
ser perturbados de ninguna forma (pongamos, por contadores). E l haz recombinado
es introducido en una máquina arriba-abajo. Ahora todos los electrones emergen de
la última máquina con espín arriba. A pesar del paso por la máquina izquierda-dere-
cha, el hecho de que el haz que se introdujo en la máquina izquierda-derecha era un
haz «arriba puro» es «recordado» por la interferencia y se pone de manifiesto en la
forma en que la salida final de (e) difiere de la de (d).
I t i e a gen cuántica del m undo 249

me<Hda de nuestro conocimiento de los valores de un sistema. Proba­


ría m o s entonces a considerar la asignación de una probabilidad un
medio a las partículas de un haz que fuese izquierdo o derecho como
la afirmación de que cada partícula es definidamente izquierda o de­
recha y de que una apuesta razonable sobre si es una cosa o la otra
tendrá las mismas posibilidades en el resultado. O podríamos probar
a considerar la función de onda como diciéndonos que la fracción de
partículas del haz que son izquierdas es un medio y que el resto son
derechas. Pero, como hemos visto, dicho acuerdo no es suficiente.
Pues también hemos de entender que cada partícula del haz recom-
binado está definidamente arriba, y esto distingue al haz de uno muy
diferente compuesto por una mitad de partículas definidamente iz­
quierdas y ufia mitad definidamente derechas. La superposición en­
tre izquierda y derecha no es la mezcla de izquierda y derecha, aun
cuando para ambos haces es correcto afirmar que una medición iz­
quierda-derecha indicará que la mitad de las partículas eran izquier­
da y la mitad derecha al ser medidas.
Reflexionando sobre la interrelación formal entre la teoría ondu­
latoria de Schródinger y la dinámica formal de Heisenberg, J. von
Neumann y P. Dirac desarrollaron formalismos que se substraían de
los dos enfoques para captar la esencia de la teoría cuántica. En cada
descripción hay representantes matemáticos de los estados del mun­
do y de los observables físicos. Supongamos que un sistema tiene un
estado definido. La evolución de su estado en el tiempo cuando está
sometido a una influencia causal exterior es el objeto de estudio de
la dinámica. Dado el estado en un instante determinado y una espe­
cificación del observable que va a ser medido, los representantes ma­
temáticos del observable especifican cuáles pueden ser los resultados
posibles de la medición, y este representante del observable combi­
nado con el estado del sistema determina las probabilidades de que
sea uno de los resultados posibles el que de hecho se obtenga.
Si conocemos el estado de un sistema en un momento dado y las
influencias causales en momentos posteriores, podemos determinar
su estado según el sistema evoluciona. Pero ¿cómo determinamos el
estado inicial de un sistema? Lo hacemos preparando el sistema, un
proceso que constituye al mismo tiempo un tipo de medición de los
valores del sistema. Podemos, por ejemplo, determinar el estado de
espín inicial de una partícula como definidamente arriba en el instan­
te = 0 sabiendo que la partícula fue emitida desde el canal superior
250 Filosofía de la física

t
de una máquina arriba-abajo en = 0. Podemos entonces conocer el
estado de espín de la partícula en tiempos posteriores conociendo las
influencias causales (campos eléctricos y magnéticos en este caso) a
las que estuvo sometida desde el momento en que fue emitida por el
canal superior de la máquina arriba-abajo. Si entonces decidimos
efectuar una nueva medición de espín en el sistema, podemos deter­
minar — a partir del operador correspondiente a la dirección del es­
pín que decidimos medir— qué valores podrán obtenerse (en el caso
del electrón sólo dos, arriba o abajo en la dirección elegida) y a partir
de ese operador y del estado de la partícula en el momento de la me­
dición podemos determinar la probabilidad de que se obtenga un va­
lor dado del espín en la medición.
La atribución del estado apropiado a la partícula justo después
de su preparación descansa en el famoso Postulado de la Proyección
de Neumann. Este establece que si se acaba de realizar una medición
que revela un valor dado de un observable, entonces el estado del
sistema inmediatamente después de la medición es el que correspon­
de al sistema con ese valor exacto para la cantidad medida. (En reali­
dad, esto necesita un remedo para dar cuenta del hecho de que algu­
nas veces la medición destruye un sistema y del hecho de que una
medición no determina normalmente todas las cantidades compati­
bles de un sistema, pero para nuestros propósitos lo hará.) Un argu­
mento principal de von Neumann es que solamente dicha atribución
de estados nos garantizará que, si la medición se repitiese a continua­
ción, estaríamos seguros de obtener el mismo valor que obtuvimos
en la primera medición. La teoría formalizada expuesta por von Neu­
mann, considerada la versión ortodoxa de la teoría cuántica, es
notable, pues, por presentar dos reglas diferentes para determinar el
cambio del estado de un sistema en el tiempo. Una, la regla dinámi­
ca, nos dice cómo el mismo paso del tiempo y las influencias exter­
nas, como la interacción del sistema con algún otro sistema, conduci­
rán a una evolución dinámica del estado del sistema. La otra regla
nos dice que cualquiera que sea el estado de un sistema antes de una
medición, el estado del sistema después de haberse efectuado la me­
dición corresponderá al sistema con el valor del observable recién
medido. El estado del sistema es «proyectado» en la medición al de­
nominado estado característico correspondiente al valor observado o
medido que se ha obtenido en la medición. Cuando la medición tie­
ne lugar, las reglas dinámicas de la evolución del estado son desecha­
La imagen cuántica del m undo 251

das. Como veremos, la noción de medición como un proceso espe­


cial ajeno a la dinámica ordinaria se convierte en uno de los grandes
apartados problemáticos de la teoría cuántica.

La interpretación de Copenhague
El gran físico Niels Bohr intentó gestar una imagen global del m undo
que hiciera justicia a los extraños fenómenos cuánticos recién descu­
biertos, y diseñar la estructura teórica apropiada. No es fácil resumir
limpiamente su denominada interpretación de Copenhague. Algunos
han visto en ella una nueva filosofía del ser y del conocimiento, cuya
importancia trasciende la mera clarificación de los aspectos cuánticos
del mundo. Otros se han mostrado más escépticos. Einstein en una
ocasión la llamó «la filosofía tranquilizadora de Heisenberg-Bohr
— ¿o religión?— », para decir a continuación que «proporciona una
mullida almohada al fiel creyente de la que no se le puede despertar
fácilmente», es decir, que «encubría» los aspectos problemáticos de
la imagen cuántica en lugar de ofrecer una descripción coherente e
inteligible de los fenómenos cuánticos.
Bohr considera que el objetivo de la ciencia ha de ser determinar
las interrelaciones entre cantidades observables del mundo. Para que
se entienda la teoría cuántica, se considera como observable, no «los
datos sensoriales directamente percibidos por la mente», como en la
filosofía positivista tradicional, sino, antes bien, los resultados de las
observaciones con aparatos de medida típicos. Pero la filosofía de
Bohr comparte algunos aspectos del positivismo tradicional, como el
hincapié en una clase de «los observables» dada de una vez por
todas y en la teoría como sólo un instrumento para obtener las co­
rrectas correlaciones de unos observables con otros. Bohr afirmó que
en nuestra descripción de estos resultados observables de la medi­
ción nos veremos siempre limitados a los típicos medios «clásicos»
para describir el mundo desarrollados por la física cuántica. Así, las
cantidades que leemos en nuestros aparatos de medida son cosas ta­
les como la posición de una partícula, su momento, carga y momento
angular, etc. Un aparato de medida es algo caracterizable nuevamen­
te en términos clásicos. Posee estados «salida» definidos, que están
correlacionados a las cantidades medidas de los microsistemas. La
marca depositada de plata metálica indicará, por ejemplo, que un
252 Filosofía de la física

fotón ha sido absorbido en alguna región limitada de una pelíecula


fotográfica; un destello determinado de un tubo detector puede indi­
car el paso por una región de una partícula cargada, etc. En nuestro
registro de los resultados de una medición no habrá lugar para
estados de «superposición» cuánticos, sólo para estados descritos clá­
sicamente.
El objetivo de los estados cuánticos es permitirnos hacer predic­
ciones de probabilidad sobre los resultados del proceso de medida.
Una lectura clásica nos dice que un sistema ha sido preparado en un
estado cuántico dado. Las reglas dinámicas clásicas nos permiten se­
guir la evolución a través del tiempo del estado cuántico asignado al
sistema. En un momento posterior, nos podemos valer de ese estado
cuántico para hacer predicciones probabilísticas sobre los valores
descritos clásicamente que se obtendrán en cualquier medición que
decidamos realizar. Pero es erróneo, desde este punto de vista, consi­
derar que los sistemas entre una medición y otra poseen estados clá­
sicos. Si podemos inferir del estado cuántico que en una medición
particular se obtendrá con seguridad un resultado específico, enton­
ces, quizá podamos atribuir ese valor clásico al sistema aun cuando
no esté siendo medido. Pero, en general, cuando sólo pueden darse
probabilidades menores que la certeza de una variedad de valores
posibles para el resultado de una medición, es erróneo, bajo este
punto de vista, considerar que el sistema no medido posee alguno de
los valores posibles del resultado. Esto es muy diferente a lo que su­
cede con la probabilidad clásica, donde nos figuramos que el sistema
tiene un valor definido pero desconocido, siendo la probabilidad
sólo una medida de nuestra ignorancia del estado real.
Bohr combinó esta concepción sobre la naturaleza de la medi­
ción y sobre la escasa legitimidad de atribuir estados físicos clásicos a
los sistemas con lo que él llamó la idea de «complementariedad» a
fin de resolver algunas de las paradojas de la teoría cuántica. La com­
plementariedad es una noción muy difícil de precisar completamen­
te. Bohr mismo a menudo extiende la noción en formas bastante dra­
máticas, hablando, por ejemplo, de las descripciones mentales y
físicas de la mente y el cerebro como complementarias. Pero, incluso
en el contexto teórico-cuántico, se da al término un uso muy amplio.
Los aspectos ondulatorio y corpuscular de una partícula se dice que
son complementarios uno del otro. Algunas veces son dos aspectos
de la descripción dinámica de un sistema — como la posición y el
2?3

momento— los que se toman como complementarios. La idea #0


neral es que un sistema puede ser descrito clásicamente en más de
una forma. E n la física clásica, un sistema es, bien una onda, bien
una partícula, y un sistema tiene a la vez una posición definida y
un momento definido. E n la teoría cuántica, sin embargo, estos pa­
res de características aparecen curiosamente entrelazados. Los dos
aspectos complementarios del sistema son necesarios para su com ­
pleta caracterización. Pero es imposible describir el sistema simul­
táneamente en términos de las dos características complementarias.
Podemos caracterizar los aspectos ondulatorios de un sistema, o
podemos caracterizar sus aspectos corpusculares. Pero no podemos
pensar en un sistema como ondulatorio y corpuscular al mismo
tiempo. Podemos imaginarnos un sistema que posea una posición
definida o un momento definido, pero, según Bohr, es imposible
atribuir simultáneamente una posición y un momento definidos a
una partícula.
La «exhaustividad conjunta pero mutua exclusividad» de las ca­
racterísticas complementarias se manifiesta físicamente cuando pen­
samos en formas posibles de utilizar la medición para asignar una
característica a un sistema. Podemos montar un dispositivo de inter­
ferencia para descubrir los aspectos ondulatorios de un sistema,
como su longitud de onda y frecuencia. O podemos usar detectores
de partículas para determinar sus aspectos corpusculares, observando
por qué rendija pasa realmente la partícula. Pero el montar uno de
estos dispositivos experimentales imposibilita la construcción del
otro. Es físicamente imposible construir un dispositivo de medida
que pueda determinar simultáneamente dos de las características
descriptivas complementarias atribuibles a un sistema. Es lícito, en­
tonces, concebir un sistema como ondulatorio, significando esto que,
si se realizase un experimento de carácter ondulatorio, el sistema re­
velaría sus aspectos ondulatorios. Y es lícito concebir el sistema
como corpuscular, por razones similares. Pero nos vemos liberados
de la responsabilidad de atribuir aspectos contradictorios al sistema
debido al hecho de que nada de lo que hagamos en el ámbito de la
medición podrá poner de manifiesto estos aspectos contradictorios
simultáneamente.
Bohr pasa a mantener que es ilícito incluso pensar en el sistema
cuántico entre mediciones como dotado de la característica que que­
remos atribuirle en un sentido absoluto, no relativizado. Valiéndose
214 Filosofía de la física

de una analogía con la demostración relativista de Einstein por la


que los intervalos de longitud y tiempo eran atribuibles a las cosas
sólo en relación a la elección de un particular sistema de referencia
de movimiento, Bohr argüyó que se podía atribuir estados a los sis­
temas — en el sentido de atribuirles características tales como as­
pectos ondulatorios o corpusculares— sólo en relación a una elec­
ción de los aparatos de medida. En relación a un dispositivo
interferométrico experimental la luz era ondulatoria. En relación a
un dispositivo detector de partículas luminosas, o fotones, la luz
era corpuscular. Si no era en relación a una elección específica del
dispositivo experimental, no era nada en absoluto. (Naturalmente,
Einstein no aceptó de buen grado la analogía con la relatividad,
diciendo que ¡hasta un buen chiste podía contarse demasiadas
veces!).
Bohr argüyó entonces que en cualquier situación experimental
era esencial distinguir entre el sistema que estaba siendo medido, el
cual, hasta que la medición fuese realizada, debía describirse sólo en
estados cuánticos que expresaran potencialidades hacia valores ob­
servables que se obtenían en la forma de probabilidades, y el aparato
de medida. El aparato de medida estaba, según Bohr, correctamente
caracterizado en términos clásicos, tanto en lo que se refería a su
construcción y finalidad prior a la medición, como a su estado final
que revelaba el valor medido correcto que había de atribuirse al sis­
tema. Mientras que la teoría cuántica era universal en el sentido de
que cualquier sistema físico en el mundo obedecía las leyes básicas
de la teoría cuántica, en cualquier situación de medición uno tenía
que «separar» el mundo en dos componentes, el sistema medido y el
aparato de medida. El primero estaba correctamente caracterizado en
términos cuánticos; pero la descripción correcta para la parte restan­
te de la medición del mundo estaba forjada en los conceptos físicos
clásicos tradicionales. Además, la medición no podía ser comparada
con la ipteracción física ordinaria, pues aunque esta última estaba re­
gida por las leyes dinámicas de la mecánica cuántica, el proceso de
medida obedecía la regla independiente del Postulado de Proyec­
ción.
Pero ¿en qué parte del mundo debía trazarse la línea divisoria
entre el sistema cuántico medido y el aparato de medida clásico? La
respuesta era que podía trazarse a cualquier nivel. Para algunos pro­
pósitos era útil considerar únicamente a la partícula elemental como
La imagen cuántica del m undo 255

sistema cuántico y al resto del m undo físico como aparato de medi­


da. Pero también podíamos, consistentemente, tratar cualquier parte
del aparato de medida como un sistema físico en interacción con la
partícula elemental, caracterizando al sistema conjunto formado por
la partícula y por esa fracción del aparato como un sistema cuántico.
Si hacíamos esto, reduciríamos el aparato descrito clásicamente a lo
que quedaría después de que la parte que inicialmente había reaccio­
nado a la partícula hubiese sido traspasada al dom inio cuántico. No
había nada en la física que marcase una línea divisoria estricta entre
la naturaleza cuántica y el aparato de medida clásico. La división po­
día ser trazada a cualquier nivel. Pero la misma inteligibilidad de la
imagen cuántica demandaba que ésta fuera trazada en algún lugar.
Sería incoherente pensar en el universo entero como un sistema pu­
ramente cuántico, pues la misma inteligibilidad de la atribución de
un estado cuántico a un sistema requería considerar al sistema como
medido por un aparato de medida descrito clásicamente, ajeno al sis­
tema cuántico propiamente dicho.
La interpretación de Copenhague es una tentativa extraordinaria­
mente ingeniosa de hacer justicia a todos los aspectos peculiares de
la nueva teoría cuántica. Abarca todo, desde la necesidad de descrip­
ciones aparentemente incompatibles de un mismo sistema como on­
dulatorio y corpuscular, hasta el papel especial jugado por la medi­
ción y el Postulado de Proyección en el formalismo de la teoría. Pero
no es evidentemente una concepción del mundo fácil de entender.
Lo más sospechoso de todo es el papel especial que se reserva a los
aparatos de medida descritos clásicamente como esenciales para la
interpretación de la teoría. ¿Cómo puede haber tales cosas si, como
la teoría afirma, todo es en realidad un sistema cuántico? Y ¿cuál es
el papel especial reservado a los procesos de medida? ¿No son éstos
sólo interacciones de un sistema con otro sistema físico? ¿No pueden
ser descritas dichas interacciones por las reglas ordinarias de la teoría
cuántica? ¿Por qué debería haber una regla especial para los proce­
sos de medida, si las mediciones no son más que otra variedad de in­
teracción física? Y ¿es el punto de vista de Copenhague, con su rela­
tivismo radical de los estados físicos de los sistemas respecto a las
elecciones de los aparatos de medida, capaz de proporcionarnos una
caracterización «realista» de cómo es realmente el m undo en su «pro­
pia naturaleza»? Volveremos sobre estas cuestiones dentro de un mo­
mento.
256

El principio de incertidumbre
Pronto se vio que la teoría cuántica en cada uno de sus modos for­
males conducía a una variedad de relaciones entre las características
de un sistema, que fueron resumidas como las Relaciones de Incerti-
dumbre. Una sencilla ilustración de estos resultados puede encon­
trarse en la imagen ondulatoria de la versión por Schródinger de la
mecánica cuántica. Podemos preguntar por la probabilidad de encon­
trar a una partícula localizada en alguna región espacial específica,
calculando las probabilidades según el grado al que la función de on­
da está confinada a esa región. Alternativamente, podemos reescribir
la función de onda como una función del momento de la partícula,
encontrando así una nueva función que puede ser utilizada para de­
terminar la probabilidad de encontrar a la partícula con su momento
en un intervalo dado. A través de la física ondulatoria clásica se vio
que había una relación recíproca entre el grado al que una función
de onda poseía una extensión espacial y el grado al que se encontra­
ría dispersa en el «espacio de frecuencias» si la onda se reformulaba
en términos de varias componentes de frecuencias puras. Traducida
a términos cuánticos, esta relación recíproca conduce a la observa­
ción de que cuanto menos dispersa en posición sea la distribución de
probabilidades para una partícula calculada a partir de su estado
cuántico, más dispersa tendrá que ser la distribución de probabilida­
des para calcular su momento. Ningún estado cuántico podría gene­
rar simultáneamente probabilidades fuertemente concentradas en
torno a un único punto en el espacio y a un único valor del momen­
to. (Véase la figura 4.5.)
Desde la perspectiva de Heisenberg, este tipo de relación inversa
se manifestaba en el hecho de que los representantes matemáticos de
las cantidades observables, los operadores en su formalismo matemá­
tico, eran «no conmutativos». Esto significa que el producto de dos
de ellos en un orden dado no era, en general, igual al producto
tomado en el orden inverso. Esta relación se cumple entre otras can­
tidades conjugadas asimismo, no sólo entre la posición y el momento.
Si se pasaba a la representación abstracta de la teoría cuántica de von
Neumann y Dirac, era posible encontrar algunas relaciones matemá­
ticas muy generales que resumían el Principio de Incertidumbre.
El grado de incertidumbre se toma como el producto de una me­
dida de la dispersión de la probabilidad de las dos cantidades, cuan-
La imagen cuántica del m undo 257

« n
Pi

A
q2
F i g u r a 4 .5 . relaciones de incertidumbre.
E n cualquier estado cuántico de una par­
tícula, hay una cierta probabilidad de que la partícula sea encontrada en una región
determinada del espacio y una cierta probabilidad de que su momento tenga un va­
lor situado en una horquilla determinada de momentos. E n (a) se esboza un estado
en el que la posición de la partícula está fuertemente circunscrita por una estrecha
distribución de probabilidades (trazo q¡).
L a distribución de probabilidades corres­
pondiente para el momento (trazo p¡)
muestra una distribución de probabilidades
muy «dispersa». E n (b) se esboza un estado en el que la distribución de probabilida­
des para el momento (trazo p2)
tiene ahora un pico marcado. Ahora la distribución de
probabilidades para la posición (trazo q2)
muestra una probabilidad ampliamente
«dispersa», de acuerdo con las relaciones de incertidumbre.

do estas distribuciones de probabilidad son calculadas a partir del


estado cuántico. Algunas veces la incertidumbre varia de un estado
físico a otro. En otros casos, por ejemplo, el de la posición y el mo­
mento, había una incertidumbre mínima, fija, de validez universal.
Pero ¿qué significa físicamente esta «incertidumbre ineliminable»?
Al explorar este problema, Heisenberg ofreció una imaginativa
explicación de la incertidumbre, considerándola como indicadora de
una limitación fundamental de nuestra capacidad para fijar todas las
propiedades de un sistema a un grado arbitrario de precisión por
cualquier técnica experimental. La idea básica aquí era que cualquier
medición realizada sobre un sistema debe, inevitablemente, perturbar
físicamente al sistema medido. El fijar una cantidad a un grado deter­
minado de precisión perturbaría, pues, el sistema de forma tal que
nuestro conocimiento del valor de alguna cantidad conjugada queda­
ría reducido, pudiendo ésta tomar después de la medición cualquier
valor de un gran intervalo de valores.
25H Filosofía de la física

Un famoso experimento conceptual de Heisenberg para ilustrar


su interpretación del Principio de Incertidumbre es un tipo de m i­
croscopio diseñado para determinar a un alto grado de precisión la
posición espacial de una partícula en un tiempo determinado. ¿Cómo
podría hacerse dicha determinación de posición? Solamente, arguye
Heisenberg, haciendo que una señal detectora interaccione con la
partícula en cuestión. Uno podría, por ejemplo, iluminar la partícula
con luz y buscar la luz dispersada por el choque con la partícula.
Viendo dónde ha sido dispersada la luz por la partícula obtendría­
mos información sobre la localización de la partícula.
Pero el tratamiento clásico del uso de la luz en microscopía rela­
ciona la capacidad de la luz para resolver pequeñas diferencias espa­
ciales a la longitud de onda de la luz. La luz de corta longitud de on­
da puede determinar diferencias espaciales a un grado más fino de lo
que puede hacerlo la luz de una longitud de onda mayor. Pero en la
teoría cuántica, la longitud de onda más corta está asociada a la fre­
cuencia más alta y, por consiguiente, a una energía mayor para el pa­
quete mínimo de energía de la luz, el fotón. Para poder observar la
partícula ai menos un fotón debe ser dispersado por ella. Cuanto ma­
yor sea la energía de dicho fotón, mayor será la horquilla de valores
del «puntapié» que podría dar a la partícula, modificando su momen­
to inicial a algún nuevo valor. Si se siguen todos los pormenores se
obtiene una imagen en la que un esfuerzo microscópico para situar la
posición de la partícula en una estrecha horquilla se ve acompañado
de una inevitable interferencia causal en la vida de la partícula, que
disminuye la precisión con que somos capaces de determinar el mo­
mento de la partícula después de la medición de la posición.
Teóricamente, incluso en la física precuántica, cualquier medición
de un sistema debe interferir con el estado del sistema en un grado
mínimo. Pero, en la imagen clásica, dicha interferencia puede ser redu­
cida a una cantidad tan pequeña como uno quiera. Para Heisenberg,
al menos en esta interpretación de la incertidumbre, el elemento esen­
cial de la teoría cuántica era la ahora inevitable interferencia mínima
en el sistema, la perturbación irreducible de su estado, una perturba­
ción que no podía ser reducida por ningún medio físico, y que debe
acompañar a cualquier tentativa de determinar el valor de una propie­
dad dada del sistema dentro de un pequeño intervalo de valores.
Desde esta perspectiva, la incertidumbre se considera una limita­
ción a nuestra capacidad de discernir los valores simultáneos exactos
La imagen cuántica del m undo 259

de dos propiedades conjugadas de un sistema. Esto es, consideramos


que el sistema tiene, por ejemplo, valores simultáneos precisos de la
posición y del momento, pero que nosotros somos incapaces, debido
a la interferencia inevitable del proceso de medida con el sistema, de
determinar con exactitud esos valores precisos, existentes conjunta­
mente.
Bohr nunca quedó satisfecho con semejante interpretación de la
incertidumbre. Insistió desde el principio en que la especificación del
estado cuántico de un sistema constituía una descripción completa
de cada sistema individual del que ese estado cuántico era correcta­
mente predecible. Era erróneo, argüyó, considerar que el estado
cuántico era válido en una colección de partículas, en la que cada
partícula posee de hecho un estado preciso más completo, si no com­
pletamente cognoscible, de tipo clásico. Antes bien, argüyó, el estado
cuántico, con su «dispersión» intrínseca de los valores de las cantida­
des clásicas representada por la dispersión de las distribuciones de
probabilidad asociadas con esos valores, era una descripción total del
estado real de la partícula. Para cualquiera de dichos estados cuánti­
cos, como hemos indicado, habría conexiones entre los grados de
dispersión de las distribuciones de probabilidad para cantidades con­
jugadas. Cualquier determinación de un estado cuántico que reduje­
se la dispersión en la posición generaría automáticamente un estado
cuántico con una amplia distribución de probabilidades para el mo­
mento. Pero, argüyó Bohr, era demasiado conservador interpretar
esta relación inversa como si se tratase meramente de una limitación
a nuestra capacidad de fijar con precisión valores conjugados simul­
táneamente. En lugar de ello, uno debía considerar que cada partícu­
la individual poseía — en el mejor de los casos— valores dispersos de
una cantidad clásica, si se insistía en considerar que las partículas no
poseían ninguna propiedad clásica entre mediciones.
Heisenberg se vio inducido a aceptar la lectura bohriana «ontoló-
gica». más radical, de la incertidumbre. Esto es, aceptó la idea de que
la incertidumbre refleja la dispersión irreducible de características
del sistema, no meramente una limitación en nuestro conocimiento
de propiedades conjuntas a grados arbitrarios de precisión. Más tar­
de veremos algunas de las razones que le movieron a adoptar esta
postura más radical. Einstein, sin embargo, se vio consternado por la
teoría radical de Bohr y durante algún tiempo intentó hallar buenas
razones físicas para refutarla.
260 Filosofía de la física

Siguieron una serie de fascinantes debates entre Einstein y Bohr.


Einstein se propuso como cometido personal el encontrar una situa­
ción experimental en la que se violasen las limitaciones a la especifi­
cación exacta de cantidades conjugadas dictadas por las Relaciones
de Incertidumbre. Diseñó ingeniosos experimentos conceptuales
para intentar mostrar que uno podía determinar dos cantidades con­
jugadas a un grado de precisión conjunta que el Principio de Incerti-
dumbre declaraba imposible. A cada una de las sugerencias de Eins­
tein, sin embargo, Bohr argüía que el procedimiento experimental en
cuestión requería en último término la determinación de dos cantida­
des básicas por uno de los procedimientos que, como podía demos­
trarse utilizando argumentos heisenbergianos, limitaban nuestro co­
nocimiento de las cantidades conjugadas necesarias de acuerdo con
las familiares limitaciones de la incertidumbre. Si uno acepta los con­
traargumentos de Bohr, parecería imposible encontrar la manera de
soslayar las Relaciones de Incertidumbre por medio de algún experi­
mento real que superase su limitación. Sin embargo, esto todavía deja
sin responder, incluso si el Principio de Incertidumbre es verdadero,
la cuestión de cómo exactamente han de entenderse las relaciones.
¿Deben de ser entendidas en el viejo, más modesto, sentido heisen-
bergiano como una limitación sobre lo que podemos determinar, o
en el- modo bohriano, más radical, que niega la existencia misma de
valores precisos de dos cantidades conjugadas?

¿Qué es la medición en la teoría cuántica?

El problema de la medición
El formalismo básico de la teoría cuántica es claro y su aplicación al
mundo de la observación y del experimento no es, en la práctica,
más polémico que el de cualquier otra teoría física formal. Pero la
teoría nos plantea un montón de problemas interpretativos sorpren­
dentes. Miembros de la comunidad científica, que se muestran de
acuerdo plenamente con los resultados de la teoría cuántica aplicada
al mundo físico, se encuentran enfrentados entre sí cuando intentan
explicar justamente cómo «entienden» lo que la teoría nos dice sobre
la estructura fundamental del mundo.
La teoría asocia a los sistemas entre mediciones un estado cuánti­
La imagen cuántica del m undo 261

co. Presumiblemente, pues, este estado «representa» en una forma u


otra el estado de naturaleza del sistema. Pero ¿qué es ese estado físi­
co del sistema? y ¿cómo lo representa el estado cuántico? ¿Debería
considerarse al estado cuántico como una descripción de sistemas in­
dividuales, pongamos, el de un fotón en el experimento de la doble
rendija? Después de todo, el hecho de que los resultados de la inter­
ferencia sean válidos incluso si las partículas son enviadas una por
una a través de las rendijas, sugiere que cada fotón debe ser conside­
rado de una forma u otra como «capaz de percibir» ambas rendijas
en la forma descrita por el estado cuántico. Pero ¿cómo puede des­
cribirse correctamente una parfícula tan localizada por medio(de una
función de onda dispersa?
El uso‘ probabilístico de la función de onda, sugerido en primer
lugar por Born, hace alusión a una interpretación por la que la fun­
ción de onda describiría, más bien, una colección, o «conjunto», de
sistemas, a la manera reminiscente del papel de las distribuciones de
probabilidad sobre posibles microestados de sistemas en la mecánica
estadística descrita en el capítulo 3. Dicha interpretación es también
sugerida por la lectura más obvia del Postulado de Proyección. Si la
función de onda es una descripción probabilística de una colección
de sistemas o, en una interpretación paralela, una representación de
nuestro conocimiento parcial del estado completo de un sistema in­
dividual, entonces parece claro por qué descartar una función de on­
da en favor de la correspondiente a un sistema en el que el valor
exacto de un observable dado se conoce tan pronto como ese valor
del observable haya sido obtenido en una medición. Si la medición
aumenta nuestro conocimiento específico de un sistema particular y
si la función de onda es relativa a ese conocimiento, no es sorpren­
dente que se produzca un tipo de «colapso» no dinámico de la fun­
ción de onda en la medición.
Pero esta interpretación también se encuentra plagada de dificul­
tades. ¿Cómo explicamos los famosos efectos de interferencia tan pa­
radigmáticos de la situación cuántica? El conocimiento parcial de
que el fotón pasó por la rendija uno no debería «interferir» con el
conocimiento parcial de que pasó por la rendija dos. Los fenómenos
de interferencia son característicos, más bien, de ondas físicas reales
dispersas. Hay también otras dificultades con la sencilla interpreta­
ción conjuntista o del conocimiento parcial de la función de onda
cuántica. El complemento normal a considerar una representación
262 Filosofía de la física

como «parcial», a la manera de la descripción conjuntista estadística


de un sistema, es abrigar la esperanza de que una descripción ulte­
rior es posible; la descripción ulterior localizará el sistema específico
como miembro de una colección más restrictiva de sistemas. De he­
cho, lo que se espera normalmente es que exista una descripción de
un sistema por la que éste sea el único miembro de la «clase unidad»
de un, y solo un, sistema físico. Así, por ejemplo, si en mecánica esta­
dística tenemos una descripción de un sistema como miembro de
una colección de sistemas caracterizados por su temperatura común,
pensamos que son posibles descripciones más completas de los siste­
mas, siendo la más fundamental aquella que especificase exactamente
el microestado completo del sistema en cualquier instante de tiempo.
Pero Bohr insistió en que el estado cuántico de un sistema espe­
cífico era una descripción completa del estado de ese sistema. Aunque
dicha descripción especificaba solamente probabilidades para los re­
sultados de las diversas observaciones que podían ser realizadas so­
bre el sistema, era la descripción «más fina» posible del sistema. Si
esto es así, entonces es erróneo pensar que la función de onda carac­
teriza una colección o caracteriza un conocimiento parcial en el sen­
tido de las interpretaciones tradicionales de la probabilidad. La cues­
tión de si Bohr estaba en lo cierto sigue siendo controvertida. Sin
embargo, como veremos, muchos resultados han mostrado que si
Bohr estuviese equivocado, no seria una cuestión trivial explicar de
que manera exactamente podría una descripción cuántica ser com­
plementada para dar una descripción más completa del estado de un
sistema individual. Algunas cuestiones que aparecen aquí implican la
posibilidad de seguir describiendo el estado de un sistema en los tér­
minos clásicos tradicionales. ;Es posible, por ejemplo, pensar que
una partícula en un estado cuántico que es una superposición de dos
estados de espín posee, de hecho, una de las componentes del espín,
aunque no sepamos cuál de ellas es? Otros debates contemplan la
posibilidad cié complementar la descripción cuántica de un sistema
con una ¿aracterización más detallada del sistema que sea suficiente
para precisarlo en una manera no estadística, incluso en una forma
que evite los términos descriptivos clásicos. Por el momento basta
con decir que ni la simple interpretación del estado cuántico de un
sistema al modo de un estado tradicional físicamente disperso como
una onda clásica, ni la interpretación ingenua del mismo al modo de
una medida de probabilidad tradicional de una colección especifica­
La imagen cuántica del m undo 263

da sólo mediante un conocimiento parcial del estado del sistema, pa­


recen hacer justicia al papel que juega el estado cuántico en la teoría.
La teoría cuántica hace uso no sólo de los recién introducidos
estados cuánticos, sino también de los viejos estados clásicos. Bohr
interpreta que la función de onda especifica las probabilidades de los
resultados en las mediciones de varias cantidades. Pero, tal como
Bohr señala, estos resultados se especifican en los viejos términos clá­
sicos. Una partícula sale de un aparato Stern-Gerlach de medida de
la componente del espín «definidamente en el haz de arriba» o «defi­
nidamente en el haz de abajo». Un fotón que es sometido al experi­
mento de las dos rendijas es finalmente localizado como habiendo
impresionado en alguna región definida la pantalla fotográfica. Alter­
nativamente, si se han colocado detectores en las rendijas, el fotón es
detectado en el estado y «pasa definidamente por la rendija uno y
dispara el detector uno» o «pasa definidamente por la rendija dos
y dispara el detector dos».
Pero si todos los sistemas físicos pueden ser descritos adecuada­
mente de acuerdo con las leyes de la mecánica cuántica — y la teoría
afirma esta universalidad— ¿cómo puede haber lugar en el universo
para instrumentos de medida cuyos estados de detección están carac­
terizados en términos clásicos anticuados? ¿Existen realmente dos ti­
pos diferentes de sistemas en el mundo, sistemas cuánticos y sistemas
clásicos, debiendo escribirse los primeros en términos de funciones
de ondas y los segundos en términos clásicos? O ¿es la práctica de
caracterizar en términos clásicos los resultados de las mediciones
algo que se ha de «eliminar» del contexto de la teoría cuántica como,
quizás, un tipo de «descripción aproximada», legítima pero condu­
cente a errores, del estado real del aparato de medida? Si uno adopta
el argumento de que las descripciones clásicas de los aparatos de me­
dida no son una descripción falsa de los mismos sino, al contrario, la
caracterización real de su verdadero estado físico, entonces surge la
cuestión de si no sería legítimo considerar a los sistemas cuánticos
medidos como poseedores de dichos estados clásicos.
Finalmente está la cuestión de la naturaleza del proceso de medi­
da. Como indicamos, la teoría formal traza una clara línea de demar­
cación entre los dos procesos, evolución dinámica y medición. Su­
pongamos que conocemos el estado cuántico de un sistema en un
momento dado. ¿Cómo vamos a determinar el estado cuántico que
hemos de atribuirle en un tiempo posterior? Si el sistema no es ob­
264 Filosofía de la física

servado en ningún momento entre los dos instantes de tiempo, en­


tonces, de acuerdo con la teoría, tendremos que seguir la evolución
de la función de onda que describe el estado cuántico del sistema
utilizando la famosa ecuación de Schródinger. Esta ecuación es el
análogo en la teoría cuántica de las ecuaciones dinámicas de la diná­
mica clásica que nos dicen cómo evolucionará en el tiempo el estado
dinámico clásico de un sistema, teniendo en cuenta que el sistema es­
tuvo sometido a ciertas fuerzas y tenía una constitución interna espe­
cífica. Al igual que en la física clásica, pues, existe un tipo de «deter­
minismo» de la evolución de un estado cuántico. Un sistema
sometido a fuerzas determinadas y de una naturaleza dada que tiene
un estado cuántico definido en un momento dado, tendrá en un mo­
mento posterior un estado cuántico definido relacionado al primero
por las leyes de la dinámica.
Pero, ¡esto no es así si se realiza una medición sobre el sistema en
dicho intervalo de tiempo! Pues, dice la teoría, cuando la medición
tiene lugar, la evolución dinámica ha de ser ignorada y, en su lugar,
debe aplicarse el Postulado de Proyección. La función de onda que
describe el sistema prior a la medición debe ser descartada y, en su
lugar, introducirse la función de onda correspondiente al valor de la
cantidad observable obtenido en la medición. (Si la medición no de­
termina los valores de todas las cantidades observables del sistema
que podrían ser determinadas, entonces se utiliza en su lugar una
versión modificada del Postulado de Proyección, la Regla de Lüder.
Al igual que el Postulado de Proyección, empero, no se trata eviden­
temente de un mero ejemplo de evolución dinámica ordinaria.)
Ahora bien, si pudiéramos librarnos de la interpretación de la
función de onda por la que ésta pasó a ser, como es el caso de algu­
nas distribuciones de probabilidad clásicas, una representación de
nuestro conocimiento parcial del sistema, podríamos entender la me­
dición y el Postulado de Proyección de una forma muy simple. Una
medición sería cualquier proceso que aumentase nuestro conoci­
miento del estado del sistema. No es de extrañar, pues, que la fun­
ción que describe nuestro conocimiento parcial del sistema «salte»
en la forma discontinua indicada por el Postulado de Proyección en
la medición. Pero, como hemos visto, dicha interpretación de la fun­
ción de onda no llega a hacer plena justicia a sus otros aspectos — tí­
picos de un estado físico— como es el de la interferencia. Si concebi­
mos la función de onda como un tipo de estado físico del sistema.
La imagen cuántica del m undo 265

resulta mucho más difícil entender el lugar que ocupa en el formalis­


mo el peculiar proceso denominado medición y entender el cambio
no dinámico de la función de onda en los procesos de medida.
¿Qué es lo que distingue, desde esta última perspectiva, un pro­
ceso de medida de cualquier otra interacción dinámica ordinaria?
¿Cómo está el sistema relacionado a un aparato de medida en alguna
forma diferente al sistema meramente interaccionando con algún
otro sistema físico? Esa interacción tiene una descripción perfecta­
mente clara en el seno de la teoría. Se trata de un aspecto de la diná­
mica de los sistemas, en este caso de la dinámica que describe dos
sistemas inicialmente independientes uno de otro y más tarde en in­
teracción física entre sí. Pero la evolución del nuevo sistema conjun­
to (el sistema original combinado con el sistema físico con el que ha
llegado a interaccionar) no se parece en nada, de acuerdo con el for­
malismo de la teoría, a ese proceso descrito por el Postulado de Pro­
yección. Más decisivo es que, en la interacción dinámica ordinaria,
los efectos de interferencia debidos a encontrarse el sistema original­
mente en una superposición de estados se conservan cuando el siste­
ma interacciona con algún nuevo sistema físico. Las correlaciones
que caracterizan el proceso de interferencia son simplemente transfe­
ridas al nuevo sistema conjunto.
Pero en un proceso de medida, según la descripción del Postula­
do de Proyección, la interferencia se destruye. En el «colapso del pa­
quete de ondas» que describe el Postulado de Proyección, los térmi­
nos de interferencia sencillamente desaparecen. Un electrón descrito
por una función de onda extendida por todo el espacio está, una vez
que el electrón ha sido medido y localizado en una región espacial li­
mitada, descrito por una función de onda confinada enteramente a esa
región. Un fotón descrito como una superposición de estados corres­
pondientes a pasar por la rendija uno y por la rendija dos, está, des­
pués de haber accionado el detector frente a la rendija uno, descrito
por una función de onda «pura» asociada a la rendija uno. ¿Por qué
las mediciones son diferentes de las interacciones físicas ordinarias?

La solución de Bohr y sus críticos


Hemos señalado anteriormente la ingeniosa y sutil tentativa de Bohr
de hallar una justificación de la naturaleza paradójica del m undo
266 Filosofía de la física

cuántico. En la Interpretación de Copenhague, la medición se toma


como una noción «primitiva». Un sistema interaccionando con el
mundo exterior puede ser medido y no sólo tomar parte en la inte­
racción dinámica. Los resultados de los procesos de medida se consi­
dera que constituyen los hechos verdaderamente incuestionables so­
bre el mundo, y la teoría se considera un mecanismo cuyo único
papel es proporcionar correlaciones entre el valor basado en un pro­
ceso de medida que prepara a un sistema en un estado cuántico da­
do y el valor de alguna cantidad observable en una medición poste­
rior. Entre una medición y otra no debe considerarse al sistema
poseyendo algún valor clásico dado pero desconocido. Antes bien,
posee meramente «potenciales» de revelar valores observables con
probabilidades especificables en relación a un aparato de medida ele­
gido. Como la medición simultánea de algunas cantidades — las com­
plementarias— no es posible, y carece de sentido preguntar por las
probabilidades de que el sistema posea dichos valores conjuntos, in­
compatibles, de los observables complementarios.
Pero ¿es aceptable la Interpretación de Copenhague? Una obje­
ción a la misma procede de Schródinger y Einstein. Al igual que
Einstein, Schródinger fue uno de los grandes inventores de la teoría
cuántica y al mismo tiempo uno de los más severos críticos de sus in­
térpretes «ortodoxos».
Recordemos, en primer lugar, que para Bohr es incorrecto pensar
que un sistema que todavía no ha sido medido tenga un estado clási­
co, salvo quizás en la situación poco corriente de tenerse la certeza
de que se obtendrá un valor particular al medir el sistema. Recorde­
mos, además, que para Bohr cualquier medición consiste en la medi­
ción de un sistema cuántico por un aparato que debe ser descrito en
términos clásicos. Y recordemos por último que, en la explicación
que Bohr da de la medición, la línea divisoria entre el sistema (des­
crito por un estado cuántico) y el aparato (descrito por estados clási­
cos) puede trazarse a cualquier nivel. Aunque debe haber una parti­
ción en algún lugar entre el sistema cuántico medido y el aparato de
medida clásico, la línea divisoria entre uno y otro no es algo que esté
determinado por la física de la situación, sino que puede ser trazada
en cualquier lugar de la cadena que va desde el sistema microscópico
hasta el valor observado al final. De hecho, varios resultados de con­
sistencia de la teoría cuántica muestran que se inferirán las mismas
probabilidades para los diversos resultados de una medición, tanto si
La imagen cuántica del m undo 267

consideramos que un sistema A es medido por un aparato compues­


to B + C, como si consideramos en su lugar que el aparato C está
midiendo el sistema compuesto A+ B.
Sea ahora una caja en cuyo interior se encuentran un espejo divi­
sor de haces y una fuente débil de fotones. Pongamos detectores en
las trayectorias del dispositivo y conectémoslos de manera que si el
detector uno se enciende primero, se produce una explosión por me­
dio de una señal amplificada que mata a un gato en la caja. Es más,
dispongamos las cosas de manera que si el detector dos se enciende
primero, el mecanismo explosivo se desconecta. Schródinger nos pro­
pone considerar lo siguiente: hasta que el fotón sea medido y locali­
zado en una de las dos trayectorias, tenemos que figurárnoslo como
una superposición de haber estado en ambas trayectorias, cada una
con un peso asociado de un medio. Ahora podríamos considerar que
la medición ha tenido lugar tan pronto como uno u otro de los dos
detectores se enciende primero. En ese momento en el tiempo, pues,
el fotón habrá estado efectivamente en la trayectoria uno o efectiva­
mente en la trayectoria dos. La superposición de los estados asocia­
dos a las trayectorias colapsará a un único estado puro asociado a
una única trayectoria. (Véase la figura 4.6.)
Pero también podemos figuramos que la medición ha tenido lu­
gar sólo en el momento en que hemos mirado dentro de la caja ce­
rrada para ver qué había sucedido. La línea divisoria entre el mundo
cuántico y el aparato clásico podría ser, pues, correctamente trazada
tomándonos a nosotros como aparato de medida y a todo el conteni­
do de la caja, incluyendo la fuente de fotones, el divisor del haz, los
detectores, los amplificadores, los mecanismos explosivos, los disposi­
tivos interruptores del circuito, y el gato , como componentes todos
ellos de un único sistema cuántico complejo. Si trazamos la línea d i­
visoria en esa forma, entonces la concepción de Bohr nos obliga a
creer que, hasta que nosotros miremos en la caja, el fotón permane­
cerá en una superposición de estados asociados a la trayectoria uno y
a la trayectoria dos. Pero lo mismo ocurrirá con el resto del sistema
acoplado al fotón y sus detectores. En otras palabras, hasta que no
miremos en la caja, es incorrecto decir que el gato está vivo o muer­
to. En lugar de ello debemos decir que está «en una superposición
de estados vivo y muerto». N o obstante, como Schródinger hace ver,
semejante concepción de algo que es macroscópico y animado es un
absurdo. Puede que sea posible (aunque difícil) figurarse un fotón en
268 Filosofía de la física

El gato de Schródinger.
F i g u r a 4.6. E n una caja cerrada herméticamente se monta un
e
aparato en el que un haz de partículas, , es dividido en dos haces, siendo igual la
probabilidad de que una partícula vaya por uno u otro camino. Si la primera partícu­
la sigue la ruta que pasa por D¡, se activa un barril de explosivos, destruyendo a un
pobre gato colocado encima de él. Si la primera partícula pasa por D¡, el interruptor
S se abre, salvando al gato de la posibilidad de ser dinamitado. ¿Cóm o debería un ob­
servador que se encuentra fuera de la caja y es incapaz de saber lo que ha sucedido
en ella describir al gato tras un período de tiempo en el que no hay duda de que una
partícula al menos ha pasado por Dt o ha pasado por D2? De acuerdo con la Inter­
pretación de Copenhague, el observador no debería imaginarse al gato vivo o muerto,
sino, antes bien, «en una superposición de estados vivo y muerto», de la misma ma­
nera que un electrón que sale de una máquina Stern-Gerlach izquierda-derecha sin
ser detectado debe imaginarse en una «superposición de estados de espín izquierda y
espín derecha» hasta su detección. Pero ¿es aceptable semejante descripción del gato
(o de cualquier otro objeto macroscópico)? Si no lo es, ¿en qué momento antes de
que el observador exterior haga una observación de lo que queda dentro de la caja
debería dicho observador considerar que el gato está «definidamente vivo» o «defini­
damente muerto»?

una superposición de estados de trayectorias o un electrón en una


superposición de estados de espín, pero ¿no es manifiestamente ab­
surdo figurarse al gato ni muerto ni vivo, sino «en una combinación
de los dos estados con igual peso»? Recordad que el estar en una su­
perposición no puede ser interpretado, de acuerdo con Bohr, como
estar en un estado definido u otro, sin saber en cuál de los dos se es­
tá. Es una «combinación» efectiva de los dos estados.
Advirtamos, claro está, que Schródinger no demuestra en modo
alguno que la explicación de Bohr conduzca a observaciones des­
La imagen cuántica del m undo 269

mentidas por el mundo. En el momento en que miramos al gato, por


supuesto, el paquete de ondas colapsa y encontramos al gato vivo o
muerto. De hecho, Bohr estaría sin duda alguna contento creyéndose
las consecuencias de su teoría. Todos los objetos en el m undo obede­
cen a la mecánica cuántica, desde el más pequeño al más grande. Y
todos son susceptibles, pues, del tipo de efectos de interferencia que
nos obliga a considerar a los sistemas como si estuviesen en estados
de superposición. De nuevo, para Bohr estos estados son sólo poten­
cialidades hacia resultados con probabilidades dadas en la medición.
El gato existe, al igual que el fotón mientras no es medido, en un
estado potencial que requiere referencia a una superposición. Pues,
en principio, podrían llevarse a cabo experimentos que revelarían la
interferencia latente en el estado del gato, así como podríamos quitar
los detectores y sustituirlos por una pantalla que pusiera de manifies­
to la interferencia latente en la superposición de los estados trayecto­
ria que es la condición cuántica del fotón.

Soluciones idealistas
Pero a otros les resulta absurdo pensar que el gato está en una super­
posición de estados vivo y muerto. Llevando la sugerencia de
Schródinger un paso más adelante, E. Wigner introduce «el amigo de
Wigner». Sustituyamos el gato en la caja por un científico. Según
Bohr, hasta que miremos en la caja, deberíamos pensar que el cientí­
fico está en una superposición de estados vivo y muerto, aunque, cla­
ro está, el científico puede — en un momento en el que nos lo
estamos imaginando en dicha superposición— verse a sí mismo efec­
tivamente volado, o no. Pero, dice Wigner, esto es absurdo. Esto lle­
va a Wigner a una concepción de la medición y del m undo que es
bastante sorprendente procediendo de un físico, pero casi inevitable
como un camino alternativo para pensar en las perplejidades cuán­
ticas.
¿Qué tiene de especial la medición, pregunta Wigner, en tanto
que opuesta a la interacción física ordinaria de dos sistemas físicos?
En una medición real, algún medidor debe «apercibirse» del valor
determinado por el proceso de medida. La concepción de Wigner
nos recuerda a la de los dualistas filosóficos, quienes consideran a un
ser humano (y, quizás, a otros seres sensibles) como una criatura mix­
270 Filosofía de la física

ta compuesta al mismo tiempo de un cuerpo físico y de una mente


— un tipo de entidad no física «ligada» al cuerpo, quizás mediante
una causalidad mutua a través del cerebro. Así, Wigner piensa que
una medición ha tenido lugar cuando, y sólo cuando, una mente es
afectada por el sistema medido. El efecto sobre la mente puede ser
muy indirecto, produciéndose por mediación de muchos aparatos fí­
sicos intermedios (incluyendo los órganos sensoriales, los nervios y el
cerebro del cuerpo).
Pero no podemos considerar la medición como una mera ganan­
cia de información por parte de un sujeto y, por consiguiente, como
un cambio de su «función de conocimiento parcial». Como ya indica­
mos, la concepción de una función de onda como un mero compen­
dio de nuestro conocimiento de un sistema y la de su colapso en la
medición como tan sólo el familiar cambio discontinuo de una fun­
ción de conocimiento cuando se adquiere nuevo conocimiento, no
hace justicia a las otras propiedades de la función de onda. Éstas son
las propiedades de interferencia, por las que la función de onda se
parece mucho más a una representación de un estado de un sistema
natural independiente del conocimiento. Para Wigner, antes bien, la
medición es una interacción de doble sentido entre la mente y el
mundo físico. El mundo afecta causalmente a la mente, diciéndole
qué valor determinado se ha medido en el sistema; el mundo hace
esto indicando a la mente en qué posible estado acabó el aparato de
medida físico. Pero la mente también actúa sobre el mundo. Pues el
solo hecho de estar el sistema físico en un estado clásico definido y
no más en una superposición, es un efecto de la interacción de la
mente con la materia.
Para Wigner, pues, la medición ha tenido claramente lugar una
vez que el científico en la caja sabe si está siendo volado, o no. Pro­
bablemente, si los gatos tienen mentes, lo mismo es cierto para el ga­
to de Schródinger. La concepción bohriana, que permite incluso a
los científicos y a los gatos formar parte de un sistema cuántico res­
pecto a un medidor externo — como un científico fuera de la caja ce­
rrada— se rechaza.
No es extraño que la descripción del mundo aportada por Wig­
ner, con su metafísica dualista del mundo físico y las mentes observa­
doras, no resulte atractiva para muchos. Además de tolerar lo que
muchos tacharían de metafísica absolutamente extravagante, la expli­
cación de la medición ofrecida es de por sí problemática. El colapso
La imagen cuántica del m u nd o 271

de la función de onda causado por la acción de la mente sobre el sis­


tema físico es algo que no se explica y que no compete a los físicos
explicar. Junto a los procesos legales de la naturaleza gobernados por
las leyes ordinarias de la física, en particular, por la ley dinámica de
la evolución dada por la ecuación de Schródinger, uno tiene ahora
un proceso «extrafísico» en el que algo de «fuera», la mente del ob­
servador, interfiere en los mecanismos legales de la naturaleza física.
¿No podríamos encontrar una forma de explicar la medición que evi­
te llegar a los extremos tolerados por estas explicaciones idealistas,
pero que evite asimismo, tanto la introducción de nociones primiti­
vas de medición a la manera de Bohr, como la curiosa separación
ineliminable del sistema cuántico respecto al aparato de medida clá­
sico propuesta por Bohr?

La medición como interacción física


Un grupo de enfoques busca la caracterización de un proceso de me­
dida, como distinto a las interacciones físicas ordinarias, viendo en el
mismo no una clase distinguida de proceso a la manera metafísica
del enfoque de Bohr o del enfoque idealista, sino intentando caracte­
rizar una interacción por medición como una subclase específica de
las interacciones físicas ordinarias. Dentro de esta escuela, un grupo
de enfoques se centra en el hecho de que en un proceso de medida
el sistema cuántico interacciona con un instrumento de medida «ma­
croscópico», y en el proceso de medida una microcaracterística del
sistema que está siendo medido se correlaciona con una macrocarac-
terística del aparato medidor en una forma que revela el valor de la
microcantidad.
En una operación que detecte por cuál rendija pasa la partícula,
por ejemplo, la partícula puede ser detectada al salir de la rendija
por medio de algún dispositivo de descarga electrónico (como un
contador Geiger) que amplifique el paso de la partícula por el detec­
tor. Esto podría funcionar mediante la inducción al paso de la partí­
cula de una cascada de un gran número de partículas cargadas segui­
da de una gran descarga macroscópica de voltaje que involucre
enormes cantidades de partículas actuando concertadamente, reve­
lando la presencia de la partícula microscópica. En una máquina de
Stern-Gerlach, las partículas con distintas componentes de espín en
272 Filosofía de la física

la dirección que se está midiendo son, primero, separadas espacial­


mente unas de otras a distancias macroscópicas por el campo magné­
tico inhomogéneo del aparato. Después son detectadas, bien en el
haz superior, bien en el haz inferior, por un aparato similar al descri­
to más arriba. En el caso del gato de Schródinger, el aparato revela la
ruta tomada por la partícula amplificando la elección cuántica reali­
zada a los estados macroscópicamente diferenciables de un gato ínte­
gro con vida y un gato volado, muerto, disperso.
Hay, pues, dos importantes características de la medición que
debemos tener en cuenta. La primera es que el estado final del apara­
to medidor involucra cantidades enormes de partículas y es identifi-
cable en una escala macroscópica. La otra es que los estados finales
del aparato son macroscópicamente diferenciables (son «puros» y no
una superposición de estados) y están perfectamente correlacionados
con los estados microscópicos del sistema cuántico que está siendo
medido.
Además, arguye esta escuela, debemos percatarnos de que en rea­
lidad el aparato macroscópico es, al igual que el sistema cuántico ori­
ginal, un sistema físico ordinario en el mundo. Desde este punto de
vista, el sistema macroscópico debe poder ser descrito por la teoría
cuántica, y su interacción con el sistema cuántico que está siendo
medido debe poder ser determinada por las leyes cuánticas ordina­
rias de la interacción de dos sistemas físicos. Pero, en este punto, la
interpretación tropieza con una dificultad. La teoría cuántica nos d i­
ce que si un sistema interacciona con otro, estando el primer sistema
en un estado superposición antes de que se diera la interacción, el
sistema combinado formado por el primer y segundo sistemas des­
pués de tener lugar la interacción debe estar en un estado super­
posición. Esto es cierto incluso si el segundo sistema estaba ori­
ginalmente en un estado puro o en uno de los estados mixtos
correspondientes a estar en uno u otro estado puro con diferentes
grados de probabilidad en el viejo sentido. Si una partícula con espín
a la izquierda interacciona con un aparato detector de espines en la
dirección arriba-abajo, la partícula entra en la interacción en una su­
perposición de estados de espines arriba y abajo. El estado funda­
mental del sistema partícula-más-aparato-medidor debe ser, entonces,
un estado superposición. Es la superposición de dos estados puros
— «la partícula con espín arriba y la máquina dice espín arriba» y «la
partícula con espín abajo y la máquina dice espín abajo»— . Pero si
La imagen cuántica del m undo 273

esto es así, ¿cómo puede la interacción representar una medición en


la que el resultado se supone que es un estado «partícula arriba y
máquina diciendo arriba» definido, o bien un estado «partícula abajo
y máquina diciendo abajo» definido?
Aquí se propone con frecuencia una manera de resolver esto que
hace referencia al hecho de que en una interacción por medición
puede considerarse a efectos prácticos que la superposición final no
existe en absoluto, aun cuando, propiamente hablando, la interacción
por medición tiene como resultado un estado superposición. En su
lugar, el estado superposición final puede ser reemplazado por un
estado mezcla similar. La idea fundamental es que, si bien la interac­
ción del sistema y el aparato de medida debe, de acuerdo con las le­
yes de la mecánica cuántica, retener esas correlaciones tipo interfe­
rencia que distinguen una superposición de estados de una mezcla
de los dos estados, puede que en la práctica esta interferencia y sus
efectos sean irrecuperables después de haber tenido lugar la interac­
ción.
¿Qué es lo que nos dice que el estado de una partícula espín-iz­
quierda, después de haber sido enviada a través de una máquina de
espín arriba-abajo y no detectada, debe ser descrito como una super­
posición de estados arriba y abajo, y no como una mezcla de los mis­
mos? Si uno examinase el producto de una máquina de espín arriba-
abajo en cuanto a estados de espín arriba-abajo, encontraría a la
mitad de las partículas con espín arriba y a la mitad con espín abajo.
Ésta es la predicción que uno obtiene al describir a la partícula bien
en una superposición, o bien en una mezcla de estados de espín arri­
ba y abajo con igual peso. Pero si uno enviase este producto a través
de un detector de espín izquierda-derecha, las partículas saldrían
todas a la izquierda. Eso es lo que la descripción tipo superposición
predice, pero no lo que la descripción tipo mezcla predice. Eso reve­
la la interferencia remanente.
Pero si la partícula que sale de la máquina arriba-abajo se detecta
a la salida, será imposible en la práctica poner de manifiesto alguna
diferencia entre la mezcla de los estados «partícula arriba, aparato d i­
ce arriba» y «partícula abajo, aparato dice abajo» y su superposición.
Hacer esto requeriría un proceso que siguiera el curso exacto de
todos los microestados de todas las partículas en la cadena causal ini­
ciada por la interacción del sistema de partículas y el detector. Tal
capacidad para poner de manifiesto la correlación debida a la interfe-
27A Filosofía de la física

renda remanente está fuera del alcance de cualquier posibilidad real.


Así pues, a los efectos predictivos de las probabilidades de los resul­
tados de ulteriores experimentos que involucren a la partícula o al
aparato, bastara con la descripción tipo mezcla como una aproxima­
ción de la verdadera descripción tipo superposición. La correlación
debida a la interferencia se ha disipado en el enorme número de gra­
dos de libertad de las innumerables partículas que conforman el apa­
rato macroscópico. Esta disipación se produce en el proceso amplifi­
cador que revela el microestado de la partícula que está siendo
medida. Así pues, la superposición, aunque realmente presente, pue­
de ser tratada como si se anulase cuando la medición tiene lugar.
Esta forma de considerar el proceso de medida cuenta con m u­
chas ventajas. N o se necesita introducir mentes que interaccionen
con el mundo físico mientras uno permanece fuera del mismo y sin
posibilidad de lograr una física comprehensiva que describa el mun­
do. Ni se necesita la curiosa y elástica escisión del m undo en sistema
y aparato de medida que la Interpretación de Copenhague demanda.
En lugar de ello, hay solamente un m undo físico con interacciones fí­
sicas ordinarias. Algunas de estas interacciones presentan las caracte­
rísticas necesarias para que la verdadera descripción cuántica pueda
ser reemplazada por una aproximación falsa, pero adecuada. Estas
características son la macroscopicidad y la complejidad de los apara­
tos de medida y ia perfecta correlación entre sus estados indicadores
y los estados microscópicos del sistema que está siendo medido. La
medición es. bajo esta concepción, sólo un tipo especial de interac­
ción física y, cuando se la describe exactamente, cae bajo las leyes de
la dinámica cuántica y no fuera de ellas como sucede en las concep­
ciones interpretativas idealistas o de Copenhague.
Pero esta forma de considerar la medición presenta problemas
propios. Los argumentos están diseñados para demostrar que uno
puede reemplazar una función de onda superposición por una fun­
ción de onda mezcla a efectos predictivps cuando el sistema cuántico
medido interacciona con un aparato de medida suficientemente gran­
de v complejo. Pero la medición de un sistema cuántico individual
da como resultado un sistema que debe tener, no la función de onda
mezcla, sino la función de onda pura de uno de sus componentes. Si
medimos el espín arriba-abajo de una partícula originalmente en un
estado que es una superposición de estados arriba y abajo, encontra­
remos a la partícula en la medición definidamente arriba o definida-
La imagen cuántica del m undo 275

mente abajo. Esto es «el colapso del paquete de ondas». El argüir


que la superposición original de estados arriba y abajo, convertida
ahora en una superposición de sistema y estados del aparato combi­
nados, puede ser reemplazada por un estado mezcla, parece estar de
acuerdo implícitamente con la idea de que la función de onda
debería ser considerada como una descripción, no de una sola partí­
cula, sino de una colección de partículas. Pues es a una colección de
partículas medidas, algunas ahora definidamente arriba y otras defíni-
damente abajo, a la que se atribuye propiamente el estado mezcla.
Pero ¿cómo puede reconciliarse esta concepción implícitamente
conjuntista de la función de onda con los hechos que parecían indi­
car que cada partícula individual tenía la cualidad de una función de
onda superposición? Por supuesto, puede responderse que esas cu­
riosas correlaciones tipo interferencia de una partícula, las cosas que
nos mueven a decir que cada fotón individual «pasa por las dos ren­
dijas», siguen siendo características del mundo cuántico. Lo que se
está defendiendo aquí, se dirá, es que podemos entender por qué en
un proceso de medida configuramos nuestra teoría para hablar como
si la interferencia desapareciese, cuando sabemos que realmente no
lo hace. El argumento es, de nuevo, que el tamaño y la complejidad
del aparato de medida nos asegura que los restantes potenciales de
interferencia realmente existentes nunca podrán ser detectados ob-
servacionalmente por ningún experimento practicable.
Hay, quizá, una objeción más profunda, pero una que al menos
tiene una respuesta potencial. Born, buscando desentrañar lo que sig­
nificaba la función de onda, hizo la famosa sugerencia de que su in­
tensidad debía ser tomada como la probabilidad de obtenerse un va­
lor dado para el sistema. Confrontado con la cuestión de cómo era
posible que las probabilidades cuánticas difiriesen tan radicalmente
de las probabilidades clásicas, Bohr sugirió una sutil enmienda a la
idea de Born y habló de probabilidades en relación a la elección de
uno u otro de un conjunto de procesos de medida complementarios.
Pero estas interpretaciones, así como las idealistas, presuponen que
en algún momento los resultados de las mediciones son verdadera­
mente caracterizables en términos clásicos. Pues, sólo podremos in­
terpretar el estado cuántico como «potencial» de que el sistema reve­
le aspectos clásicos, si conservamos los conceptos clásicos para
describir los resultados de las mediciones.
La interpretación de la que nos ocupamos ahora, sin embargo,
276 Filosofía de la física

debe tratar el papel de los conceptos clásicos en la interpretación de


la teoría en una forma mucho más compleja. Esto se debe a que, de
acuerdo con esta interpretación, no existen en realidad estados del
mundo físico que puedan ser descritos correctamente en términos
clásicos. La forma más correcta de caracterizar el estado total del
m undo — sistema y aparato de medida— será siempre por medio de
una función de onda cuántica. Pero si la función de onda debe de
suyo entenderse en términos de las probabilidades de estados descri­
tos clásicamente, ¿cómo puede resolverse este dilema?
Se puede contar una historia que quizá explique cómo es posible
que podamos llegar a entender el significado de la función de estado
cuántica por una vía que «de paso» implica conceptos clásicos, aun
cuando en nuestro entendimiento final estos conceptos clásicos no
desempeñan ningún papel legítimo en la caracterización de los
estados del m undo físico. La historia dirá que nuestro anterior enten­
dimiento precuántico del m undo es falso, pero que su suficiencia a
efectos prácticos para caracterizar los estados del m undo puede ser
explicada en última instancia por la relación de esta imagen falsa a la
verdadera imagen cuántica. Esta relación ha de fundamentarse en la
teoría de los procesos de medida indicada más arriba, donde la ca­
racterización clásica del aparato de medida se explica como una «for­
ma falsa pero adecuada de hablar». La historia nos dirá que, sobre la
base de un aparato conceptual que forma parte de, y depende de,
una falsa concepción del mundo, construimos la teoría cuántica co­
rrecta, entendiendo inicialmente sus conceptos por referencia al mar­
co de trabajo clásico anterior. Entonces, una vez en dominio del apa­
rato cuántico, reconstruimos el marco de trabajo clásico anterior
como la imagen falsa, pero útil, del m undo que es. Después de utili­
zar el marco de trabajo clásico a modo de escalera, nos deshacemos
de él una vez que hemos alcanzado nuestro objetivo.
Quizá. Pero surgen muchas preguntas. ¿Creemos realmente que
los objetos están efectivamente en estados de superposición en todo
momento? ¿Creemos realmente que no hay nada semejante a un gato
que esté, verdaderamente, del todo vivo o del todo muerto, sino que
permanece siempre en una superposición de estados? ¿Cómo
debemos de entender realmente dicha afirmación? ¿Habrá un
retorno final a la idea de que los conceptos clásicos son todavía ade­
cuados para caracterizar lo que experimentamos directamente como
un tipo de característica de nuestra percepción inmediata, cuando no
La imagen cuántica del m undo 277

de todos los objetos físicos reales? Esto asemejaría los estados clási­
cos a las «cualidades secundarias» de la tradicional metafísica lockea-
aa, esto es, características que son verdaderamente predecibles sólo
de los contenidos de la percepción inmediata y no de los objetos físi­
cos «como son en sí mismos».

La interpretación de Kocben y las interpretaciones estocásticas


Debería tenerse en cuenta que hay otras interpretaciones de los pro­
cesos de medida que comparten con la que acabamos de discutir su
afirmación básica de que la medición debe ser considerada como
una especie de interacción física en general y no, como en la concep­
ción de Bohr o en la concepción idealista, como un proceso diferen­
ciado de la evolución dinámica ordinaria de los sistemas. Pero no
todas las concepciones semejantes del proceso de medida explicarán
la adecuación del Postulado de Proyección, esto es, la utilidad de ver
a la función de onda colapsando y perdiendo todos sus términos de
interferencia, como resultado del tamaño y de la complejidad del
aparato de medida y de la disipación consiguiente de interferencia en
irrecuperabilidad.
S. Kochen, por ejemplo, ha propuesto otra descripción del lugar
de la medición en la dinámica. Una vez más, es en la naturaleza de la
interacción del sistema medido con el aparato de medida, según la
descripción de la dinámica cuántica, donde es hallado el fundamento
para justificar el lugar ocupado por el Postulado de Proyección en la
teoría. No se reserva ningún papel a los aparatos de medida descritos
clásicamente, como en la teoría de Bohr, ni se invoca un reino espe­
cial del ser fuera de la física y, por consiguiente, fuera de la mecánica
cuántica, como en las interpretaciones idealistas. Pero tampoco de­
sempeñan un papel crucial el tamaño macroscópico y la complejidad
del aparato de medida. La naturaleza de la interacción que establece
correlaciones entre los estados puros del sistema medido y el aparato
de medida sigue, empero, siendo relevante.
La interpretación de Kochen descansa en un importante teorema
de la mecánica cuántica. Dejemos que dos sistemas interaccionen.
Existirán entonces propiedades de cada uno de los dos sistemas
componentes dotadas de una naturaleza especial. Si la función de on­
da del sistema combinado se desarrolla en función de aquellos
278 Filosofía de la física

estados puros de los sistemas individuales basados en estas propieda­


des especiales, entonces los términos de interferencia de esa función
de onda desaparecerán. Por lo que se refiere a estas propiedades,
pues, la función de onda del sistema combinado será igual a la que
caracteriza una «mezcla». Las propiedades especiales vienen determi­
nadas por la naturaleza de los sistemas componentes y por la natura­
leza de su interacción. En muchos casos existirá solamente una tal fa­
milia de propiedades especiales. Aunque la costumbre en la teoría
cuántica ha sido expresar la función de onda del sistema interactivo
en función solamente de los estados puros relevantes para el sistema
aislado y del aparato, la nueva expresión elige una «base» para repre­
sentar el estado dependiente de la naturaleza de la interacción. (La
matemática aquí es reminiscente de la posibilidad en física clásica de
representar sistemas dinámicos acoplados en «coordenadas norma­
les». Si dos péndulos están acoplados mediante un muelle débil, por
ejemplo, la energía va y viene de un péndulo al otro dando lugar a
estados variables en el tiempo para los sistemas individuales. Pero
existen nuevas coordenadas en las que el movimiento puede ser ex­
presado. Éstas dependen de la interacción. El estado del sistema aco­
plado entero es estacionario cuando se mira en esta nueva, más com­
pleja, representación coordenada.)
La idea de esta nueva interpretación es que el sistema y el apara­
to, cuando interaccionan, puede considerarse que tienen uno respec­
to del otro uno de los valores definidos de las propiedades que for­
man la base de esta forma especial de representar la función de onda.
Asi pues, puede decirse que una partícula con espín, interaccionando
con la maquina Stern-Gerlach de medición arriba-abajo, está defini­
damente arriba o definidamente abajo en relación al aparato de me­
dida con el que está interaccionando. De manera similar, puede de­
cirse que la máquina está definidamente en un estado «señala arriba»
o definidamente en un estado «señala abajo» en relación a la partícu­
la cuyo espín está midiendo. Es la dinámica de la interacción lo que
determina en cualquier interacción por medición cuáles característi­
cas del sistema y del aparato puede afirmarse que son definidas.
Pero hasta esta definitud es solamente una definitud del sistema
relativa al aparato y del aparatorelativa al sistema. La partícula está
definidamente arriba o abajo según el «testimonio» del aparato de
medida, y el aparato señala definidamente arriba o abajo según el tes­
timonio del sistema medido. En esta nueva interpretación no hay un
La imagen cuántica de! m undo 279

«colapso del paquete de ondas» en el sentido estipulado por la inter­


pretación bohriana o por la idealista. En este aspecto se parece a la
interpretación discutida anteriormente que recurre al tamaño y com­
plejidad del aparato de medida. La mecánica cuántica tiene un alcan­
ce universal, y los teoremas que nos dicen que la superposición nun­
ca desaparece realmente en la interacción, siguen siendo válidos. Se
puede ver esto si se considera el estado del sistema medido y del
aparato de medida combinados en relación a todo el entorno exte­
rior, esto es, en relación al universo entero salvo la partícula interacti­
va y el aparato de medida bajo consideración. Según el testimonio
del mundo exterior, la partícula y el aparato combinados presentan
el estado cuántico total de un sistema interactivo con todas las carac­
terísticas correlaciónales de interferencia que ello implica.
Kochen llama a la observancia del sistema-más-aparato combina­
dos por el mundo exterior «observancia pasiva», ya que no hay nin­
gún acoplamiento dinámico del sistema-más-aparato al mundo exte­
rior. A la observancia del sistema por el aparato y del aparato por el
sistema las llama «observancia activa», ya que hay un acoplamiento
dinámico entre el sistema y el aparato. Puede ser cierto, pues, que
una partícula espín-izquierda, después de interaccionar con una má­
quina de medición arriba-abajo, tenga un espín arriba definido en re­
lación al aparato de medida o un espín abajo definido en relación a
dicho aparato. Y el aparato tendrá una lectura arriba o abajo defini­
das en relación a la partícula. Sin embargo, la información según la
cual la partícula era originalmente espín izquierda se conserva y la in­
terferencia de los estados básicos para el sistema combinado (arriba
para la partícula y señala arriba para la máquina, abajo para la partí­
cula y señala abajo para la máquina), interferencia que contiene la in­
formación de que la partícula era originalmente espín izquierda, se
conserva y puede, en principio, ser revelada por una observación lo
suficientemente sutil.
Esta interpretación, pues, intenta hacer justicia a nuestra intui­
ción de que, tras la medición, la partícula y el aparato poseen estados
definidos. Los tienen si los estados son los apropiados a la dinámica
de la interacción y si se considera que la partícula y el aparato tienen
estos estados puros según el testimonio de cada uno por el otro. E
intenta hacer justicia, asimismo, a la vindicación mecánico-cuántica
de que la superposición nunca se destruye. Esto se debe a que la su­
perposición sigue estando presente en el estado del sistema y del
280 Filosofía de la física

aparato de medida combinados según el testimonio del mundo exte­


rior. Por supuesto, queda aún mucho por decir en el sentido de in­
tentar demostrar que esta interpretación hará justicia a todos los he­
chos observacionales sin invocar la dicotomía radical entre medición
e interacción dinámica del punto de vista bohriano.
Algunas otras interpretaciones recientes proceden postulando un
reino de procesos físicos que discurren a un nivel inferior al del
estado cuántico. En este nivel más profundo se sugiere que tiene lu­
gar un tipo de actividad aleatoria, o estocástica. Con una formulación
adecuadamente inteligente de dicha física adicional describiendo
nuevos procesos físicos, uno puede confiar en obtener una teoría en
la que, en ciertas circunstancias, el proceso físico subyacente de tipo
aleatorio pueda «conducir» un sistema originalmente en un estado
cuántico que es una superposición a un estado cuántico que es
«casi» un estado puro correspondiendo a un solo valor para la canti­
dad medida. Naturalmente, estas circunstancias físicas se supone que
son las que corresponden a lo que tomamos por proceso de medida
en la versión ortodoxa. En todas estas teorías, sin embargo, el nuevo
estado no es en realidad el estado ondulatorio completamente colap-
sado que la mecánica cuántica predice después de que una medición
haya tenido lugar. Dicha teoría debe, pues, contener también elemen­
tos que nos digan por qué es legítimo adoptar el Postulado de Pro­
yección y suponer que el estado es un estado puro tras la medición,
cuando realmente no lo es. En este caso, los argumentos habituales
se construyen de manera tal que a todos los efectos prácticos las pre­
dicciones realizadas utilizando el estado real y el estado puro aproxi­
mado sean las mismas.

Las interpretaciones de «muchos mundos»


Hay todavía otra interpretación, propuesta inicialmente por H.
Everett y J. Wheeler, que intenta hacer justicia a las desconcertan­
tes características de la medición abogando por una nueva metafísi­
ca del mundo. A diferencia del revisionismo metafísico radical de
Bohr, uno que niega en algún sentido una realidad objetiva al
mundo físico en su conjunto, conservando una realidad sólo en re­
lación a la elección del aparato de medida, la nueva metafísica es
objetivista. Pero el m undo real que postula es tal que choca, de he­
cho, con nuestras intuiciones.
La imagen cuántica del m undo 281
En la explicación bohriana del proceso de medida se «desecha»
una parte de la función de onda siempre que se realiza una medi­
ción. La partícula, con espín izquierda, entra en la máquina de medi­
da arriba-abajo en una superposición de estados arriba y abajo. Pero
una vez que se ha realizado la medición, la partícula se encuentra de­
finidamente arriba (y el aparato de medida señala definidamente arri­
ba) o definidamente abajo (y el aparato de medida señala definida-
mente abajo). Pero de acuerdo con la dinámica cuántica, justo antes
del «colapso de la función de onda» el complejo partícula-y-aparato
estaba en una superposición de estados «arriba y señala arriba» y
«abajo y señala abajo» combinados. Supongamos que la medición da
el valor «arriba» para la partícula. ¿Qué pasó con la componente
«abajo y señala abajo» de la función de onda? Sencillamente desapa­
reció del mundo. Y con ella desaparecieron también las posibilidades
generadas por interferencia latentes en su presencia conjunta con la
otra componente de la función de onda.
Pero Everett y Wheeler suponen que ambas componentes de la
función de onda continúan existiendo después de que la medición
haya tenido lugar. ¿Cómo puede ser éste el caso? Cuando una partí­
cula se detecta a la salida de una máquina que mide el espín arriba-
abajo, ¿no está definidamente arriba o definidamente abajo? ¿Cómo
podría darse las dos cosas? La respuesta dada por esta interpretación
es que en cada medición el universo se desdobla en una multiplici­
dad de mundos, uno por cada resultado posible del proceso de me­
dida. Hay un m undo en el que la partícula sale de la máquina en el
estado espín-arriba. En ese mundo también se obtiene en la máquina
la lectura espín arriba, pues los estados de detección del aparato de
medida se supone, de nuevo, que están perfectamente correlaciona­
dos con el valor de la cantidad medida en cuestión. Pero junto al
mundo que tiene una partícula espín-arriba y un aparato de medida
donde se lee arriba, hay también un mundo con una partícula espín-
abajo y una máquina que lee espín abajo. La función de onda de la
partícula con espín a la izquierda que entra en la máquina e interac-
ciona con ella podría escribirse como una superposición de estados
«espín arriba y señala arriba» y «espín abajo y señala abajo». En la in­
terpretación «de los muchos mundos» que estamos considerando
ahora, cada componente de esta superposición representa lo que está
aconteciendo en alguno de los muchos mundos presentes que se «es­
cinden» de un universo cada vez que se realiza una medición.
282 Filosofía de la física

Naturalmente, la interpretación requiere una forma de tratar la


probabilidad de los resultados. También requiere varios resultados
de consistencia para intentar convencernos de que la imagen de la
medición que nos está ofreciendo dará resultados observacionales
consistentes con los conocidos resultados resumidos en el formalis­
mo estándar de la mecánica cuántica. Naturalmente, tampoco esta in­
terpretación está libre de críticas. En primer lugar, la imagen metafí­
sica es considerada por muchos grotesca y extravagante, lo cual no
sorprende. Después de todo, nosotros experimentamos sólo uno de
los posibles estados resultantes como producto de una medición, no
una variedad de todos los productos posibles. Es por esto por lo que
hablábamos del «colapso del paquete de ondas» en primer lugar.
¿Qué razón, que no sea una predilección por la simetría frente a la
experiencia, tenemos realmente para suponer que todos los otros re­
sultados también ocurrieron y permanecen ocultos para nosotros de­
bido a que son experimentados por otras «derivaciones» nuestras
que existen en otras derivaciones del universo? La teoría también
presenta problemas internos en lo que se refiere a cuándo tiene lugar
la escisión. ¿Ocurre con cada interacción? ¿Sólo en las interacciones
por medición? En el caso de estas últimas, ¿qué las distingue de las
evoluciones dinámicas ordinarias en una forma que justifique la me­
tafísica de la escisión del universo? Y ¿a lo largo de qué dimensiones
tiene lugar? Una función de onda puede ser descompuesta en com­
ponentes diferentes. ¿Representan escisiones todas estas descomposi­
ciones? ¿De qué manera? O, ¿hay una descomposición preferida que
rige la forma en que el universo se divide, pongamos, determinada en
la manera que la interpretación kocheniana de la interacción deter­
mina la propiedad medida y la propiedad de medición especiales?
En los últimos años algunos han combinado la concepción «de
los muchos mundos» y la concepción idealista de la medición en una
interpretación de «muchas mentes» (D. Albert y B. Loewer). En ésta,
solamente hay un mundo físico descrito en todo momento por la
función de onda evolvente que sigue la evolución dictada por la
ecuación de Schródinger y que nunca colapsa. Pero cualquier mente
que registre el valor de una cantidad medida se disocia en una varie­
dad de mentes, cada una de las cuales experimenta uno solo de los
resultados posibles del proceso de medida. De nuevo, se proponen
pruebas de consistencia para intentar convencernos de que en cues­
tiones tales como la comunicación de los resultados de nuestras me­
La imagen cuántica del m undo 283

diciones a otros, o la recepción de comunicaciones de su parte (me­


diadas por el m undo físico), o en la repetición de las mediciones, ob­
tendremos los conocidos resultados probabilísticos predichos por la
teoría cuántica.

La lógica cuántica
Hemos estado explorando enfoques diseñados para explicar las cu­
riosas características del mundo implicado por la mecánica cuántica;
estos enfoques descansan en programas que explican los fenómenos
por referencia a características metafísicas del mundo. Ya sea que los
programas postulen una dualidad flexible entre sistema cuántico y
aparato de medida clásico, como hace la teoría de Bohr; un papel re­
manente para los conceptos clásicos en el reino de la mente fuera de
la realidad física, como hacen los enfoques idealistas; una visión del
mundo como uno en el que la dinámica cuántica rige universalmen­
te, como hacen los enfoques que se apoyan en el tamaño y la com­
plejidad del aparato de medida o en la interpretación de la interac­
ción por Kochen; o una ampliación radical de nuestra ontología para
explicar los fenómenos, como hacen los enfoques tipo muchos m un­
dos; todos buscan la solución en alguna modificación de nuestras
concepciones tradicionales sobre la naturaleza de los sistemas físicos
del mundo.
Un enfoque algo diferente busca la resolución de los problemas
en una modificación de nuestras ideas tradicionales concernientes a
algunos de los modos más difundidos y generales que tenemos para
describir el mundo. Quizá sea necesaria una reinterpretación radical
de los esquemas más generales de que disponemos para asimilar los
fenómenos del mundo, se arguye, si se quiere comprender el sentido
de las misteriosas propiedades cuánticas que hemos indicado.
Uno de dichos enfoques recalca el importante papel que la pro­
babilidad juega en la teoría. Algunas de las desconcertantes propieda­
des cuánticas pueden ser resumidas haciendo notar cuán radicalmen­
te difieren en su forma de operar las probabilidades cuánticas de las
probabilidades más familiares de la física clásica. Tomemos, por
ejemplo, el experimento de la doble rendija. Nos figuramos que la
luz está compuesta de fotones localizables porque los detectores co­
locados en las rendijas indican que toda la energía luminosa pasa por
2H4 Filosofía de la física

una de las rendijas o por la otra, fotón por fotón, y nunca por ambas
al mismo tiempo. ¿No deberíamos, entonces, concebir la probabili­
dad de que un fotón alcance la pantalla como el resultado de dos
procesos «independientes», el fotón llegando a x después de pasar
por la rendija uno y el fotón llegando a x después de pasar por la
rendija dos? Pero, entonces, las reglas clásicas de la probabilidad nos
llevan a esperar que la probabilidad de que un fotón llegue a pa­ x
sando, bien por la rendija uno, bien por la rendija dos, será la suma
de las dos probabilidades separadas. Por supuesto, esto no es así,
pues tenemos los ya familiares efectos de interferencia. Quizá, pues,
deberíamos rechazar nuestras conocidas reglas para combinar proba­
bilidades condicionadas por causas independientes.
Otra característica anómala de la probabilidad en la teoría cuán­
tica puede verse cuando consideramos las denominadas distribucio­
nes compuestas. Supongamos que tenemos una población de seres
humanos cuyos pesos se distribuyen de acuerdo con alguna distribu­
ción de probabilidades de pesos. Y supongamos también que hay
una distribución del color de los ojos, caracterizable de nuevo por
una distribución de probabilidades. Entonces tiene sentido preguntar
por la distribución compuesta del peso y del color de ojos a la vez. Si
hay una cierta probabilidad de que una persona mida por encima de
un metro ochenta centímetros, y una cierta probabilidad de que una
persona tenga ojos azules, hay entonces una probabilidad compuesta
de que tenga ojos azules y una altura superior a un metro ochenta
centímetros.
Pero, como sabemos, dichas distribuciones de probabilidad com­
puesta no siempre son posibles en mecánica cuántica. Puede que ha­
ya una probabilidad dé encontrar a una partícula en una región par­
ticular del espacio y también una distribución de probabilidades que
determine cuándo el momento de la partícula se encuentra dentro
de una horquilla determinada de valores del momento. Pero no ha­
brá una probabilidad compuesta de encontrar a la partícula a la vez
en un intervalo espacial definido y en un intervalo de momentos de­
finido. Bohr trata esto haciendo notar la imposibilidad física de reali­
zar mediciones simultáneas de la posición y el momento. Posición y
momento son, en sus términos, complementarios entre sí. Y para los
observables complementarios uno no puede esperar de la mecánica
cuántica funciones distribución de probabilidad compuesta bien defi­
nidas. Una de las sugerencias actuales es que quizá esta ausencia de
La imagen cuántica del m undo 285

funciones de probabilidad compuesta pueda ser fundamentada en al­


guna nueva teoría, no estándar, de la probabilidad.
Un diagnóstico todavía más profundo de los problemas concep­
tuales de la mecánica cuántica busca la raíz de los problemas en
cuestiones sobre la naturaleza misma de la lógica propiamente dicha.
La lógica dicta las reglas básicas que rigen las relaciones vinculantes
que presentan entre sí nuestras proposiciones sobre el mundo. La ló­
gica clásica nos dice, por ejemplo, que una proposición y su negación
no pueden ser las dos verdaderas, que una o la otra debe ser verda­
dera; que si dos proposiciones son verdaderas, su unión también es
verdadera; etcétera. ¿Podría una revisión de la lógica clásica ayudar­
nos a comprender el sentido de los fenómenos cuánticos? Nosotros
hemos considerado a la lógica como si de algo inmutable e indepen­
diente de nuestro conocimiento experimental del mundo se tratase.
Pero, después de todo, también pensábamos lo mismo de la geome­
tría hasta hace dos siglos. Quizá la lógica sea una cuestión empírica
en la misma medida que ahora consideramos que la química y la geo­
metría lo son.
Una sugerencia en esta dirección fue realizada por H. Reichen-
bach, quien pensó que dando cabida a proposiciones que no fueran
ni ciertas ni falsas, algunas de las características de los sistemas cuán­
ticos podrían representarse adecuadamente. Una afirmación sobre la
posición de una partícula era verdadera o falsa después de que se
hubiese realizado una medición de la posición. Pero para una partí­
cula en un estado cuántico entre mediciones, en el que la posición
tuviera un valor definido con probabilidad uno, ¿no podríamos decir
que las afirmaciones sobre la posición tenían un valor de verdad «in­
determinado», no siendo ni verdaderas ni falsas?
Una sugerencia mucho más fructífera de una revisión lógica para
ayudarnos con la mecánica cuántica tiene sus orígenes en el trabajo
de G. Birkhoff y J. von Neumann. Este trabajo presenta a la vez un
aspecto polémico y otro no polémico. El no polémico procede del
proyecto general de intentar discernir en la teoría cuántica las carac­
terísticas más básicas que condujeron a los desconcertantes fenóme­
nos cuánticos. Ya hemos observado que la teoría fue desarrollada ini­
cialmente en dos formalismos que al principio parecieron tener muy
poco que ver uno con otro, la mecánica matricial de Heisenberg y la
mecánica ondulatoria de Schródinger. Schródinger mostró la equiva­
lencia formal de las dos teorías, y Dirac y von Neumann pasaron a
286 Filosofía de la tísica

exponer la teoría en un modo más abstracto, que tomó de los dos en­
foques su núcleo común.
Pero incluso estas formulaciones estándar de la teoría cuántica
podrían contener, a la par que elementos esenciales, elementos que
son inesenciales, artificios meramente de un modo particular de ex­
poner la teoría. ¿Podríamos hallar una forma de encontrar los ele­
mentos más esenciales de la teoría, aquellos que tendrían que apare­
cer en cualquier «representación» de los hechos físicos?
Birkhoff y von Neumann señalaron que una forma de hacer esto
es centrándonos en las relaciones entre estados de sistemas, relacio­
nes que podrían ser consideradas como un tipo de «lógica» de pro­
posiciones sobre el sistema. Supongamos que una partícula pasa efec­
tivamente, es decir, con probabilidad igual a uno, a través de un
filtro que sólo permite el paso de partículas espín-arriba. Entonces
podemos decir que «espín arriba» es verdadero para la partícula. Si
la partícula pasa definidamente a través de un filtro que deja pasar
tanto partículas espín-arriba como partículas espín-abajo, diremos
que en este caso «espín arriba qo espín abajo» es verdadero. Si una
p
partícula pasa efectivamente a través del filtro y a través del filtro j
diremos que en este caso «p qys» es verdadero.
Consideremos ahora la «ley distributiva» de la lógica tradicional,
p r s
la ley que dice que sí es verdadero para algo y o es verdadero
para algo, entonces, bien pyr son verdaderos para el sistema, o bien
pys son verdaderos para el mismo. Si un hombre es alto y tiene los
ojos azules o bien marrones, entonces el hombre es alto con ojos azu­
les, o bien alto con ojos marrones. ¿Es «qy» distributiva sobre «qo»
de la misma forma que «y» es distributiva sobre «o»? No lo es. Con­
sideremos una partícula que es «espín izquierda qy (espín arriba qo
espín abajo)». Cuando todas las partículas relevantes hayan pasado a
través de la máquina (arriba qo abajo), «arriba qo abajo» será verda­
dero para cada partícula. Las partículas que son «espín izquierda qy
(espín arriba qo espín abajo)» son. pues, sólo las partículas definida-
mente espín-izquierda. Pero ninguna partícula tendrá probabilidad
uno de pasar a través de una máquina espín-izquierda y probabilidad
uno de pasar a través de una máquina espín arriba. Pues, espín iz­
quierda y espín arriba son propiedades complementarias, y ningún
sistema puede definidamente tener estas dos propiedades al mismo
tiempo. Lo mismo es cierto para el espín izquierda y para el espín
abajo. No hay, pues, nada que sea «espín izquierda qy espín arriba» y
La imagen cuántica del m undo 287

nada que sea «espín izquierda qv espín abajo», y, en consecuencia,


nada que sea «(espín izquierda qy espín arriba) qo (espín izquierda
qy espín abajo)». Aunque muchas partículas son «espín izquierda qy
(espín arriba qo espín abajo)», es decir, todas las que son espín iz­
quierda, ninguna partícula es «(espín izquierda qy espín arriba) qo
(espín izquierda qy espín abajo)». Por consiguiente, «qy» no es distri­
butiva sobre «qo» en la forma que «y» es distributiva sobre «o».
Uno puede formular una lógica de proposiciones del tipo ordina­
rio utilizando el «no» ordinario, el «y» ordinario y el «o» ordinario.
Dicha lógica tiene la propiedad distributiva indicada más arriba y se
denomina una álgebra booleana. Uno puede formular una estructura
formal del tipo apropiado a «qy» y «qo» (junto con una negación
cuántica apropiada). Se denomina una red modular ortocomplemen-
tada. (En realidad, la estructura requerida por la mecánica cuántica
es, por razones que no vienen al caso, un poco más débil, una red
modular «débil»). El uso no polémico de dicha nueva «lógica» es el
siguiente: Uno puede captar los elementos esenciales de la estructura
de superposición, tan característica de los sistemas cuánticos, repre­
sentando la estructura de las proposiciones acerca de los sistemas
cuánticos como una red modular. Entonces uno puede explicar por
qué la formulación estándar de la mecánica cuántica funciona tan
bien como lo hace demostrando que «representa» la red de proposi­
ciones. (De un modo similar, uno puede justificar la introducción de
un espacio de fases clásico en la mecánica clásica como una repre­
sentación del álgebra booleana de proposiciones sobre los sistemas
clásicos).
El asunto se torna más controvertido, de hecho, muy controverti­
do, cuando se hace la propuesta (en su día por H. Putnam, por ejem­
plo) de que la «lógica» cuántica debería ser interpretada como lógica
en el pleno sentido del término. La idea ahora es que, así como la re­
latividad nos mostró que la geometría euclídea, en su día considera­
da como válida para el mundo, era en realidad falsa y debía ser reem­
plazada por razones empíricas por la geometría no-euclídea del
espacio-tiempo, así la mecánica cuántica nos dice que la lógica boo­
leana estándar a la que estábamos acostumbrados es incorrecta como
lógica del mundo. Los hechos empíricos nos llevan a ver que la ver­
dadera lógica del mundo es una caracterizada por la lógica no distri­
butiva de la mecánica cuántica y no por la lógica distributiva que,
creíamos, describía correctamente las relaciones entre proposiciones
288 Filosofía de la física

sobre el mundo. Desde este punto de vista, «qy» es en realidad «y» y


«qo» es «o». Sucede únicamente que algunas cosas que considerába­
mos verdaderas sobre «y» y «o» son falsas, ocupando otras verdades
su lugar.
Es fácil ver por qué una concepción de esta índole resultaría
atractiva. Consideremos un haz de partículas, todas las cuales fueron
preparadas en el estado de espín-izquierda. El haz se envió entonces
a través de una máquina de medida de espín arriba-abajo con ambos
canales arriba y abajo abiertos. Los rayos emergentes se recombina-
ron a continuación. Nos gustaría decir de este haz que es un haz es­
pín-izquierda definido. También nos gustaría decir de sus partículas
constituyentes que son, bien espín arriba, bien espín abajo. Pero no
queremos decir de ninguna de las partículas en el haz que está en un
estado «espín izquierda y espín arriba» o «espín izquierda y espín
abajo», pues espín izquierda y espín arriba son propiedades comple­
mentarias, como lo son espín izquierda y espín abajo. Ninguna partí­
cula, pues, puede ser definidamente espín izquierda y definidamente
espín arriba, y ninguna partícula puede ser definidamente espín iz­
quierda y definidamente espín abajo.
Pero en la lógica cuántica podemos afirmar que las partículas en
el haz son todas espín izquierda, y que cada partícula en el haz es
«espín arriba o espín abajo», siempre que leamos el «y» como «qy» y
el «o» como «qo». La paradoja se evita porque, dada la no distributi-
vidad de «qy» sobre «qo», el decir que cada partícula es «espín iz­
quierda y (espín arriba o espín abajo)» con estas nuevas lecturas para
la conectivas, no implica que sea forzosamente verdad que cualquier
partícula en el haz haya de ser «espín izquierda y espín arriba» o «es­
pín izquierda y espín abajo».
Pero ¿nos muestra realmente la mecánica cuántica que debería­
mos sustituir nuestra lógica clásica por una nueva lógica? Y ¿elimina­
mos con ello realmente los aspectos paradójicos del mundo cuánti­
co? Una objeción es que aunque «qy» y «qo» jueguen un papel útil,
sería totalmente erróneo pensar en ellos como sustitutos de «y» y
«o». Un problema es que «y» y «o» todavía juegan, en su significado
tradicional, un papel en la descripción cuántica del mundo. Un haz
mixto de partículas procedente de una máquina arriba-abajo, partícu­
las que han sido detectadas a la salida de los canales correspondien­
tes de la máquina arriba-abajo, antes de haber sido recombinadas, es
uno en el que las partículas están correctamente descritas por «espín
La imagen cuántica del m undo 289

arriba o espín abajo», dando a «o» su significado clásico. Solamente


el haz superposición de esas partículas que pasaron por los canales
sin ser detectadas y luego fueron reunidas en el haz recombinado, es­
tá correctamente descrito por «espín arriba qo espín abajo». Es, pues,
erróneo pensar que en la imagen cuántica del m undo «qy» y «qo»
reemplazan, antes que complementan, a «y» y «o». Otra objeción co­
rriente a la tesis de la sustitución es que la argumentación utilizada
en la propia discusión supone las reglas de la lógica estándar.
También internamente, en su tentativa de reconstruir la descrip­
ción cuántica del mundo, el enfoque revisionista lógico encuentra d i­
ficultades. Es cierto que en la lógica cuántica «p qy (r qo s)» no es
equivalente a «(p qy r) qo (p qy s)». Pero incluso en la lógica cuántica
el segundo contiene al primero, esto es, si el segundo es verdadero, el
primero debe ser también verdadero. Es sólo en la dirección del pri­
mero al segundo en la que no se da la inclusión. Supongamos ahora
que aplicamos la teoría estándar de la probabilidad a nuestra nueva
lógica. Un resultado básico de la teoría de la probabilidad es que si t
contiene a w, entonces la probabilidad de w es como mínimo tan
t. t
grande como la de Después de todo, si el ser verdadero garantiza
que w sea verdadero, sin duda es al menos tan probable que w sea el
caso como que lo sea t.
En el caso de las dos rendijas en la teoría cuántica, esta conexión
entre inclusión y probabilidad parece sugerir que, dadas la lógica
cuántica y la teoría estándar de la probabilidad, la probabilidad de
x
que una partícula aterrice en un punto sobre la pantalla, suponien­
do que las dos rendijas estuvieran abiertas, debería ser al menos tan
grande como la probabilidad de que aterrice en x, suponiendo que
una de las dos rendijas está abierta, pero no las dos. La primera pro­
x
babilidad es la probabilidad asignada a la aserción «aterriza en y pa­
só por la rendija uno o pasó por la rendija dos». La segunda probabi­
x
lidad es la de «aterriza en y pasó por la rendija uno o aterriza en y x
pasó por la rendija dos». Y, una vez más, este segundo fenómeno con­
tiene al primero. Pero el fenómeno de interferencia permite que la
x
probabilidad de aterrizar en cuando las dos rendijas están abiertas
sea menor que la probabilidad de aterrizar en x
suponiendo que una
de las rendijas está abierta, y mucho menor que la suma de las proba­
bilidades derivadas de estar las dos rendijas abiertas individualmente.
Esto al menos parece indicar que la lógica cuántica, por sí sola, no re­
solverá todos nuestros dilemas sobre las paradojas cuánticas.
Filosofía de la tísica

Resumen
Acabamos de examinar, de una forma muy rápida y superficial, varias
de las tentativas de «dar sentido» a la peculiar naturaleza del mundo
revelada por la teoría cuántica. El lector debería percatarse de que
cada una de las interpretaciones aquí mencionadas es una sutil, y al­
gunas veces muy compleja, tentativa de hacer justicia a la plétora de
hechos que la teoría cuántica pone de manifiesto. Cada interpreta­
ción precisa de un examen detenido de sus virtudes y de sus debili­
dades críticas antes de que pueda juzgársela adecuada o inadecuada
para la tarea asumida.
El mismo alcance de las cuestiones que permanecen sin respues­
ta definitiva es intimidador. ¿Cuál exactamente es el papel de los
conceptos clásicos en la descripción cuántica del mundo? ¿Son ellos
los conceptos primitivos e ineliminables del m undo necesarios para
describir la parte del mundo en el lado de la medición de un «corte»
flexible entre el sistema cuántico y el aparato de medida clásico?
¿Son ellos los términos ineliminables mediante los que ha de descri­
birse la experiencia de mentes fuera del reino físico? ¿O son esos
conceptos clásicos sólo las maneras falsas, pero provechosamente fic­
ticias, que son legítimamente aplicadas para describir estados verda­
deramente cuánticos en circunstancias especiales, donde los concep­
tos sirven para caracterizar «aproximadamente» los estados de los
sistemas? Más aún, ¿en qué medida pueden ser aplicados a los siste­
mas entre mediciones? ¿Son totalmente inaplicables a estos sistemas,
o hay alguna forma en la que podamos legítimamente considerar a
los sistemas evolventes como caracterizados por valores clásicos, aun
cuando éstos nos sean desconocidos?
Y ¿cuál es la naturaleza del estado cuántico representado por la
función de onda? ¿Es una caracterización de los sistemas individua­
les o sólo de una colección de sistemas? ¿Es la caracterización de un
aspecto físico real del mundo, o deberíamos de considerarla, por el
contrarío, como un tipo de mecanismo de cálculo intermedio que no
representa ninguna realidad física? Dado el papel de esa función de
onda en el cálculo de probabilidades de los resultados de una medi­
ción, ¿puede considerarse que es algo muy parecido a una probabili­
dad precuántica, pongamos, una medida de proporción en una colec­
ción o un grado de creencia racional? O ¿dejan claro los fenómenos
de interferencia, más bien, que se trata de algo más parecido a una
La imagen cuántica del m u n d o 291

función de onda física? Más aún, ¿es el estado cuántico de un siste­


ma relativo a un proceso de medida particular, como insiste Bohr?
¿Qué podemos decir del peculiar proceso de medida? ¿Debe ser
considerado como una componente ineliminable de la teoría, de nin­
gún modo asemejable a las evoluciones dinámicas o interacciones de
los sistemas ordinarias? ¿Es el «colapso del paquete de ondas» una
descripción de un fenómeno físico real o algo similar al cambio sufri­
do por una distribución de probabilidades clásica cuando cambia la
base de conocimiento del agente? ¿Qué es lo que caracteriza exacta­
mente las situaciones que son mediciones frente a las que son inte­
racciones físicas ordinarias? ¿Nos da una distinción bohriana entre el
sistema y el aparato de medida clásico la clave? ¿Es esencial la pre­
sencia de una «mente» que actúe sobre el mundo? ¿O es el proceso
de medida sólo un caso especial de una interacción cuántica ordina­
ria caracterizada, ya sea por el tamaño y la complejidad de uno de los
sistemas interactivos, o por la naturaleza especial de la interacción en
relación a alguna propiedad preferida del sistema y el aparato?
¿Debemos postular una ontología radicalmente nueva de universos
desdoblados para hacer justicia a los hechos sobre la medición?
Claramente, aquí hay un conjunto complejo de cuestiones inter-
conectadas. El desarrollo pormenorizado de las cuestiones ha arroja­
do mucha luz sobre lo peculiar justamente que es en realidad la ima­
gen cuántica del mundo. La comprensión de algunas de las
interpretaciones de la medición requiere ahondar profundamente,
tanto en los hechos observacionales del mundo cuántico, como en el
formalismo de la teoría que intenta hacer justicia a estos hechos. El
lector que vaya a explorar la literatura más detallada, y algunas veces
bastante sofisticada en su aspecto formal, sobre estos temas, debería
sin embargo tener presente ciertos hechos básicos. Siempre es bue­
no repasar con asiduidad las peculiaridades fundamentales de los
experimentos básicos. La luz que pasa por una pantalla con dos
rendijas muestra una figura de interferencia fácilmente explicable si
la luz es una onda dispersa cuya energía pasa por las dos rendijas al
mismo tiempo. Las partes individuales de las ondas se recombinan
después en el lado opuesto de la pantalla que contiene las rendijas.
Pero todo experimento diseñado a fin de detectar la energía de la
luz, encuentra a esa energía en una forma localizada. Los detectores
colocados en las rendijas muestran que los fotones pasan por una
rendija o por la otra, nunca por las dos simultáneamente. La luz ab­
29 2 Filosofía de la física

sorbida por la película fotográfica siempre se pone de manifiesto por


la interacción de un fotón con una molécula iónica de plata, nunca
tom o una onda dispersa de energía. Los electrones, al ser detectados,
se manifiestan asimismo como partículas localizadas. Pero cuando los
electrones son difractados por una red cristalina, aun cuando sean di­
fractados uno a uno, el haz difractado recibido en los detectores
muestra la típica figura de interferencia de una onda interaccionando
con una red difractora. ¿Cómo puede cada electrón individual, si es
que es sólo una partícula «puntual», «saber», al encontrarse con el
cristal, que está interaccionando con un ordenamiento regular distri­
buido espacialmente de átomos difractores en la red del cristal?
Hechos como éstos y sus análogos para otras características,
como los efectos de interferencia observados en los experimentos de
medición del espín, son los que demandan la revisión radical de
nuestro formalismo físico, desde el de la física clásica al de la mecáni­
ca cuántica. No es de extrañar que dichos hechos peculiares requie­
ran, no ya una revisión de detalle, pongamos, modificando algunas de
las leyes de fuerzas que gobiernan los sistemas, sino un replantea­
miento radical de lo que significa ser un sistema en el mundo, de lo
que significa para semejante sistema tomar un valor, y de lo que sig­
nifica que dicho valor sea revelado en un proceso de medida. Como
veremos en el resto del capítulo, éste no es el último de los enigmas
con los que nos confronta la teoría cuántica.

El problema de las variables ocultas y el determinismo

Deterninismo e indeterminismo
El influjo de la imagen dinámica mecanicista newtoniana del mundo
condujo a un nuevo énfasis en una vieja doctrina, el determinismo.
La idea del determinismo — que a partir del estado del mundo en un
momento dado, las leyes de la naturaleza fijan completamente el
estado del mundo en momentos posteriores— apenas es nueva. Ideas
de la misma índole habían formado parte de la especulación en la
Grecia antigua. Pero el modelo de un sistema de partículas interac­
cionando unas con otras mediante fuerzas, de forma tal que una con­
dición inicial dada del sistema genere su condición posterior en todo
momento del futuro siguiendo las famosas leyes del movimiento de
Newton, proporcionó un ímpetu renovador a esta visión determinis­
La imagen cuántica del m undo 293

ta del mundo. La famosa afirmación del físico Laplace en el sentido


de que si conociera el estado del m undo en un momento dado, po­
dría inferir su estado en todos los instantes futuros, caracteriza esta
nueva concepción.
Naturalmente, dicha doctrina tiene también sus consecuencias
preocupantes. Si, como T. S. Eliot lo expresa, «el tiempo pasado y el
tiempo futuro están en el tiempo presente, y el tiempo presente en el
tiempo pasado», si todo lo que ha de ser, está ya determinado por lo
que ha sido, ¿dónde hay lugar en el universo para la «libre elección»?
¿Cómo puede nuestra capacidad de decisión, determinando como
hace — al menos a un cierto grado— lo que será nuestra vida futura,
ser considerada de suyo nada menos que el resultado del estado del
m undo anterior incluso a nuestro nacimiento, algo obviamente fuera
de nuestro control? N o tendré más que decir sobre tales cuestiones
filosóficas ampliamente debatidas.
Examinemos más detenidamente el determinismo. Ni siquiera en
la física clásica está claro que pueda decirse con seguridad que en el
mundo impera un determinismo ingenuo. En el caso de la mecánica
corpuscular newtoniana, existe la posibilidad de colisiones multicor-
pusculares. Si las partículas se conciben como partículas puntuales
para las que son válidas las leyes de fuerza usuales, no podemos, en
general, derivar el estado del mundo posterior a la colisión a partir
del estado anterior a la colisión. También existe la posibilidad, en
cualquier momento, de partículas «procedentes del infinito» de for­
ma tal que resulte imposible determinar el estado en un tiempo pos­
terior a partir de un estado suficientemente anterior. En contextos
relativistas generales, cuestiones acerca de la complejidad de la topo­
logía del espacio-tiempo pueden incluso poner en tela de juicio la
noción de «el estado del mundo entero» en un instante dado. El es­
tudio de la posibilidad de «superficies de Cauchy», es decir, de
estados del mundo «en un instante» suficientes para determinar los
estados del m undo en todos los tiempos posteriores, es una cuestión
teórica intrincada. De nuevo, como vimos en el capítulo 3, está la
cuestión de la inestabilidad radical del movimiento, incluso en la
descripción newtoniana. Un sistema puede estar constituido de tal
forma que haya estados tan próximos como uno quiera a cualquiera
de sus condiciones iniciales; pero estos estados pueden conducir a
estados futuros del sistema que diverjan radicalmente de aquellos a
los que conduce la condición inicial dada. No importa cuán precisos
Filosofía de la física

puedan ser nuestros aparatos de medida, puede que seamos incapa­


ces de determinar el estado inicial de un sistema a un grado de preci­
sión que nos permita en alguna forma predecir su estado futuro tras
un intervalo de tiempo siquiera mínimo. De hecho, hay quienes argu­
yen que, ante dicha inestabilidad radical, es irrazonable pensar que el
sistema tiene alguna condición inicial exacta que determine comple­
tamente su evolución futura, aunque esta concepción es, evidente­
mente. minoritaria.
Pese a estas incertidumbres, hay claramente aspectos de la mecá­
nica newtoniana, y de otras teorías físicas clásicas como la teoría del
electromagnetismo, que nos llevan a considerar el m undo descrito
por ellas como genuinamente determinista. Y estos resultados de la
física tienen un impacto en las concepciones filosóficas que intentan
describir el mundo como uno en el que todo lo que sucede está de­
terminado a suceder por algún acontecimiento pasado y por las cone­
xiones legales entre los estados del m undo en un instante y sus
estados en algún otro instante.
La idea de que todo suceso tiene su causa, de que para cada ocu­
rrencia en el m undo puede encontrarse una «razón suficiente» para
dicha ocurrencia en los sucesos pasados, fue considerada como un
postulado metafísico fundamental por Leibniz. Kant argüyó que el
principio de «causalidad universal» era una regla del funcionamiento
del entendimiento humano. Con ello estaba respondiendo en parte al
escepticismo de Hume, según el cual no podía encontrarse en el
m undo nada que correspondiese a la noción del metafísico de la «co­
nexión necesaria» de unos sucesos con otros (nada, esto es, aparte de
las actuales regularidades «de hecho» del acontecer y de las expecta­
tivas psicológicas generadas por ellas). De acuerdo con Kant, podía­
mos saber a priori que el mundo de nuestra experiencia estaba sujeto
a los principios de causa y efecto. (De hecho, no está nada claro que
las dudas sobre el determinismo generadas por la teoría cuántica que
vamos a explorar seguidamente hubieran desalentado realmente a
Kant. habida cuenta del papel que éste reserva al principio de «todo
suceso tiene una causa».)
Un grupo de filósofos hallaron el principio de que todo suceso
tiene una causa universalmente verdadera, pero no como una verdad
metafísica a la manera de Leibniz o como una verdad «trascenden­
tal» a la manera de Kant. Para ellos, el principio de que cada suceso
era tal que podía hallarse un suceso pasado suficiente para garantizar
La imagen cuántica del m undo 295

la ocurrencia del suceso dado era un «dictado metodológico». Era


una decisión nuestra el no abandonar la búsqueda de un suceso an­
terior explicativo. Si se daba un suceso para el que no pudiésemos
encontrar un suceso anterior que lo explicase causalmente, ¿no po­
dríamos entonces mantener que simplemente no habíamos mirado
bien o el tiempo suficiente? Después de todo, ¿cómo podíamos estar
seguros de que no existiese semejante suceso explicativo? Nuestra
mera incapacidad para haber encontrado ya uno podía siempre ser
tomada, alegaban estos filósofos, como una señal, no de la inexisten­
cia de un suceso que aportase una explicación causalmente adecua­
da, sino simplemente de nuestra incapacidad de determinarlo.
Quizá el impacto más ^interesante de la teoría cuántica sobre
estas cuestiones sea la afirmación por muchos de que por primera
vez contamos con una teoría del mundo que nos permite negar, para
un suceso dado, que pueda siempre hallarse cualquier suceso pasado
que sea adecuado causalmente para explicar porqué el suceso dado,
en lugar de algunas alternativas especificables del mismo, ocurrió.
Aquí, se afirma, existen razones para negar la existencia de la causa
necesaria, no sólo razones para pensar que dicha causa ha escapado
simplemente a nuestra percepción. Pasaremos a explorar los tipos de
argumentos propuestos para rebatir dicho argumento. El lector
debería notar, sin embargo, que ocultas en el fondo se encuentran
toda suerte de desconcertantes cuestiones filosóficas que nosotros no
vamos a explorar. Por ejemplo, la misma noción de determinismo
presupone la noción de una ley científica, una generalización que co­
necte sucesos en un instante a sucesos en algún otro instante. Pero
como B. Russell señaló, si admitimos cualquier tipo de descripción de
los sucesos como legítima y cualquier generalización que haga uso de
dichas descripciones, resulta una cuestión trivial que cada suceso
pueda ser conectado «legalmente» a algún suceso anterior. Así pues,
quedan por resolver muchas cuestiones importantes, puramente filo­
sóficas, si queremos saber con certeza qué significa verdaderamente
la afirmación de que el mundo es determinista.

Argumentos contra las variables ocultas


Pero regresemos a nuestra preocupación central. ¿Qué nos movería a
decir que la mecánica cuántica muestra que el mundo es indetermi-
Filosofía de la física

nisia.’J Supongamos que un sistema está preparado en un estado


cuántico dado en un momento determinado. Supongamos ahora que
durante un intervalo de tiempo ese sistema permanece aislado de
cualquier interacción con el mundo exterior a él. ¿Está el estado
cuántico de ese sistema al final de dicho intervalo de tiempo comple­
tamente «determinado» por su estado cuántico al inicio del interva­
lo? La respuesta es que lo está. La evolución dinámica del estado
cuántico está regida por la ecuación de Schródinger. Y esta ecuación
determina completamente el estado cuántico en el instante posterior
a partir de su forma al inicio del intervalo de tiempo. Nada, pues, en
la evolución de los propios estados cuánticos sugiere un nuevo inde­
terminismo debido a la teoría cuántica.
Es, antes bien, en la determinación de los valores de los resulta­
dos de una medición donde podría surgir el indeterminismo. Dada la
cantidad observable que queremos determinar mediante una medi­
ción, queda fijada una clase de resultados posibles para ese proceso
de medida. Pero el estado cuántico atribuido al sistema sólo permite
inferir que se obtendrá uno en particular de dichos resultados con
una cierta probabilidad. Solamente en casos muy excepcionales, el
estado cuántico asignará una probabilidad de uno a un resultado po­
sible y una probabilidad de cero a cada uno de los restantes resulta­
dos posibles. Así pues, el saber que un sistema ha sido preparado de
una manera determinada en un instante dado, e incluso el saber que
el sistema no ha sufrido interferencias en un intervalo de tiempo da­
do, no nos permitirá por lo general predecir que se obtendrá un, y
solo un, valor de un observable, si ese observable es medido al final
del intervalo de tiempo.
Pero, por supuesto, eso todavía es compatible con el determinis­
mo que se da en el mundo. Pues aunque el estado cuántico no de­
termina completamente cuál de los resultados se obtendrá, eso po­
dría todavía quedar determinado en cualquier caso por algún factor
no tomado en cuenta en el estado cuántico. Hay argumentos diseña­
dos para convencernos de que la cantidad obtenida en una medición
no debe ser considerada, en general, como una cantidad poseída por
el sistema antes de la medición. Consideremos una partícula de la
que se sabe que está en un estado espín izquierda, por ejemplo. Si se
realiza una medición izquierda-derecha sobre esa partícula, sabemos
que la partícula resultará ser definidamente espín izquierda. Si se re­
aliza una medición arriba-abajo sobre la partícula, se tendrá que la
La imagen cuántica del m undo 297

mitad de las partículas son espín arriba y la otra mitad espín abajo.
Pero ninguna partícula es «definidamente izquierda y definidamente
arriba» y ninguna es «definidamente izquierda y definidamente aba­
jo». Sería erróneo, pues, considerar a la colección de partículas antes
de la medición como una colección en la que el cien por cien son es­
pín izquierda, el cincuenta por cien espín arriba y el cincuenta por
cien espín abajo. Consideraciones de esta índole llevaron a muchos a
sugerir que el proceso de medida no «determina un valor preexisten­
te para una cantidad» sino, antes bien, «crea la cantidad». Como ve­
remos, incluso el considerar la medición de esta forma, al menos el
considerarla como un tipo de proceso causal que cuando actúa sobre
el sistema produce el estado medido del mismo, tiene sus propias di­
ficultades.
Sin embargo, ¿no podríamos pensar que la partícula antes de ser
medida tiene alguna cantidad «variable oculta» que determina com­
pletamente el valor obtenido como resultado de la medición? Pensad
en la partícula que es definidamente espín izquierda. ¿No podría ha­
ber algún otro factor propio de la partícula que determine su natura­
leza, bien de forma tal que en una medición arriba-abajo se encuen­
tre que está en el estado arriba, o bien de forma tal que en una
medición arriba-abajo se encuentre que está en el estado abajo? Este
factor no es tenido en cuenta en el estado cuántico del sistema, en el
hecho de que el sistema es definidamente espín izquierda. El estado
cuántico de espín-izquierda genera las probabilidades correspondien­
tes a ser espín arriba o espín abajo si se realiza una medición arriba-
abajo. Pero eso no significa de por sí que no exista un factor oculto,
uno ignorado por el formalismo cuántico. Bohr negó explícitamente
que dicho factor pudiera existir, insistiendo en que el estado cuánti­
co era una descripción completa del sistema cuántico. Pero la mera
insistencia dogmática, aun cuando provenga de alguien tan versado
como Bohr, no es un argumento. Einstein, como es sabido, fue impla­
cable a la hora de insistir en que el indeterminismo del formalismo
cuántico indicaba que la teoría era incompleta. No podía creer, ase­
guraba, que Dios «jugase a los dados» con el universo. ¿Podrían los
estados cuánticos, al igual que los estados estadísticos clásicos, po­
seer por debajo una descripción más detallada de los sistemas que
reintrodujese un determinismo total en la descripción del mundo?
Para entender porqué muchos han negado la posibilidad misma
de variables ocultas que reintroduzcan el determinismo, necesitamos
298 Filosofía de la física

seguir hasta el final un largo argumento que ha sido desarrollado a lo


largo de muchos años. Primero necesitamos la noción del valor espe­
rado de una cantidad en un estado cuántico dado. En un estado
cuántico determinado, un observable dado podría tener muchos va­
lores posibles en la medición. Cada valor posible tendrá su probabili­
dad de ocurrencia. Multipliquemos cada valor por su probabilidad y
sumemos los productos de cada uno de los posibles valores. El resul­
tado es el promedio o valor medio de la cantidad medida para un
sistema en un estado cuántico dado. Se le denomina el valor espera­
do de esa cantidad en ese estado cuántico.
Ahora bien, algunas cantidades pueden ser escritas como funcio­
nes de otras cantidades. Un caso muy simple, por ejemplo, es el cua­
drado del momento de una partícula, el cual es una sencilla función
de su momento. Algunas cantidades son funciones de un número da­
do de cantidades diferentes. Por ejemplo, la energía total de una par­
tícula es la suma de su energía potencial y de su energía cinética.
C
Ahora bien, si el observable es, por ejemplo, una función de los
observables A B ¿cómo
y se relacionará el valor esperado de C con
A B
los valores esperados de y en un estado dado? Si A, B Cy son
cantidades simultáneamente mensurables, sin duda el valor esperado
de C será la misma función de los valores esperados de A B y que el
observable C A B.
lo es de los observables y Pues podríamos medir
simultáneamente los valores de A, B C y para un sistema y obtener el
valor de C de dos formas diferentes, una directamente y otra calcu­
lándolo a partir de los valores obtenidos para A y B. Los resultados
deben ser consistentes para cantidades simultáneamente mensu­
rables.
Pero supongamos ahora que A, B y C no son cantidades simultá­
neamente mensurables. En el ejemplo dado anteriormente, por ejem­
plo, la energía total, la energía cinética y la energía potencial no son
en general simultáneamente mensurables. La energía potencial es una
función ele la posición y la energía cinética una función del momen­
to, y las energías potencial y cinética son ejemplos típicos de cantida­
des bohrianas complementarias. Podemos preparar un sistema en un
estado cuántico dado, al que corresponderá entonces ciertos valores
esperados de la energía potencial, la energía cinética y la energía to­
tal. Aún si estas cantidades no son simultáneamente mensurables,
¿será el valor esperado de la energía total para sistemas en ese estado
cuántico igual a la suma del valor esperado de la energía potencial en
La imagen cuántica del m undo 299

ese estado cuántico y el valor esperado de la energía cinética en ese


estado cuántico, si la energía total puede definirse como la suma de
las energías potencial y cinética? La respuesta es sí, incluso si las can­
tidades no son simultáneamente mensurables. U n teorema sencillo
de la teoría cuántica es justamente que los valores esperados se com­
portarán de esta manera para todos los observables en cualquier
estado cuántico.
Pero nosotros no estamos ahora tan interesados en los estados
cuánticos como lo estamos en los pretendidos estados subyacentes
«más profundamente», donde todas las variables ocultas no tenidas
en cuenta por el estado cuántico tienen valores definidos. Para cada
uno de estos estados, el resultado de cualquier observación relativa a
la especificación del estado más profundo es que un valor de la can­
tidad observada tiene probabilidad uno y todos los otros valores tie­
nen probabilidad cero. ¿Podían existir dichos estados? Un argumen­
to al respecto fue diseñado por von Neumann para demostrar que
no podían existir. Von Neumann supuso que para dichos estados va­
riables ocultos se cumple la misma relación entre valores esperados
que la que se cumple en los estados cuánticos, es decir, que el valor
esperado de la cantidad C será la misma función de los valores espe­
rados de las cantidades Ay B que el observable C lo es de los obser­
vables A y B. Esto se denomina la «suposición de linealidad». Par­
tiendo de esta suposición, fue capaz de probar que la existencia de
dichos estados variables ocultos conllevaría una violación de las inte-
rrelaciones de las probabilidades de los resultados predichas por la
mecánica cuántica. La postulación de variables ocultas sería, enton­
ces, incompatible con las predicciones hechas por la mecánica cuán­
tica. He aquí un argumento en el sentido de que las variables ocultas
no existen. Éste sostiene que no se trata simplemente de que la teo­
ría cuántica no haga predicciones deterministas sobre los sistemas. Su
tesis es que si existiese un tal nivel subyacente de valores de paráme­
tros totalmente determinativos, aun cuando éstos nos fueran desco­
nocidos, su misma existencia confirmaría que las predicciones esta­
dísticas hechas por la mecánica cuántica deberían estar equivocadas.
Durante muchos años el argumento de von Neumann fue visto
por muchos como una refutación decisiva de la compatibilidad del
determinismo con la mecánica cuántica. Nos había demostrado, se
argumentaba, que si el determinismo era válido, la mecánica cuántica
debía estar equivocada. La mecánica cuántica no podía, pues, ser vis-
Filosofía de la física

(a como una teoría estadística que se asentaba sobre una descripción


determinista subyacente del mundo, como se veía a la mecánica esta­
dística clásica asentada sobre la dinámica determinista subyacente de
los microestados de los sistemas por ella descritos.
Más tarde, sin embargo, surgieron dudas acerca de la legitimidad
de la prueba de la «no existencia de variables ocultas» dada por von
Neumann — no acerca de su razonamiento matemático, claro está, si­
no de la legitimidad de una de las suposiciones básicas sobre la que
descansa. Se trata de la suposición de linealidad cuando se extiende
más allá de los estados cuánticos a los estados variables ocultos y, en
particular, cuando se aplica a observables que no son simultáneamen­
te mensurables. ¿Es en realidad tan obvio que, incluso para observa­
bles que no puedan ser medidos simultáneamente, el valor esperado
C
de en un estado variable oculto dado debe ser la suma de los valo­
res esperados de A y B, siempre que el observableC sea la suma de
los observablesA y B? ¿No podríamos imaginar lo siguiente?: Hay un
estado variable oculto. Todo sistema en el mismo estado variable
oculto dará el mismo valor determinado cuando se mide la energía
total. También se obtendrá el mismo valor determinado cuando se
mide la energía potencial. Y el mismo valor determinado cuando se
mide la energía cinética. Pero la energía total de los sistemas en ese
estado no será la suma de las energías potencial y cinética. Si pudié­
semos determinar simultáneamente todos estos valores para un siste­
ma único, esto parecería absurdo; pero, tal y como Bohr insistió una
y otra vez, en ningún sistema podemos realizar las tres mediciones al
mismo tiempo.
Que la suposición de von Neumann era demasiado fuerte, reci­
bió confirmación adicional. Su fortísimo resultado mostraba que nun­
ca podrían existir variables ocultas, ni siquiera para las cantidades
observables más sencillas. Pero, para los casos más sencillos, se pue­
den de hecho construir teorías de tipo variables ocultas. Considere­
mos, una vez más, una partícula que presente sólo dos estados com­
ponentes de espín respecto a una elección determinada de un eje de
dirección, como un electrón que presenta un valor arriba o abajo de
su componente de espín a lo largo de cualquier dirección arriba-aba­
jo que uno decida medir. Supongamos un haz de electrones com­
puesto por electrones que son todos definidamente espín izquierda.
Si los hacemos pasar a través de un aparato de medida arriba-abajo,
midiendo su componente de espín perpendicular a su conocida di­
La imagen cuántica del m undo 301

rección de espín izquierda, la mitad saldrán espín arriba y la otra m i­


tad espín abajo. La dirección arriba-abajo es perpendicular a la direc­
ción izquierda-derecha. Elijamos cualquier otra dirección distinta a la
dirección izquierda-derecha y a la dirección arriba-abajo. La teoría
cuántica asignará probabilidades definidas a la componente del espín
del electrón que sale en una de las dos direcciones posibles a lo largo
del nuevo eje elegido.
Resulta que en este caso puede proponerse una teoría de variables
ocultas muy simple para dar cuenta de las relaciones probabilísticas
entre esas componentes de espín en el caso de una sola partícula
cuya componente de espín en-una dirección dada puede tener sólo
uno de dos valores (arriba o abajo en esa dirección), como sucede
con el electrón. Supongamos que la partícula tiene espín izquierda
definidamente. Uno puede entonces imaginar un parámetro adicional
que describa la partícula; el valor del parámetro puede variar en un
cierto dominio. Elijamos cualquier dirección en la que medir la com ­
ponente del espín. Supongamos que si el parámetro oculto está en un
cierto subconjunto de su dominio, la partícula será encontrada con
espín arriba en esa dirección. Puede construirse un modelo con las
siguientes características: A cada dirección en la que se mida el espín
y a cada posible resultado de esa medición, arriba o abajo en esa d i­
rección, se les asigna un conjunto de valores del parámetro oculto.
Cuando la partícula tiene un espín definido en una dirección dada,
queda entonces determinada una distribución de probabilidades so­
bre los valores del parámetro oculto. La probabilidad de que una
partícula sea encontrada con espín arriba, pongamos, en una direc­
ción elegida, será entonces la probabilidad, de acuerdo con esta dis­
tribución, de que el valor del parámetro caiga en el subdominio de
valores del parámetro correspondiente a este resultado en esta direc­
ción. Una única distribución de probabilidades para el parámetro
oculto dará la probabilidad correcta
para cada resultado en cada d i­
rección posible, como predice la mecánica cuántica. En otras pala­
bras, en el caso especial de una sola partícula con sólo dos posibles
estados componentes de espín en cualquier dirección, la totalidad de
las predicciones probabilísticas de la mecánica cuántica puede, de
hecho, duplicarse mediante un sencillo modelo de variables ocultas
en el que cada uno de sus resultados está determinado por el valor
que tiene la variable oculta en un caso particular. Las probabilidades
de un resultado dado para un sistema en un estado cuántico dado
302 Filosofía de la física

quedarán, pues, fijadas simplemente por las probabilidades de que


los valores de las variables ocultas subyacentes se encuentren en el
subdominio correspondiente de los posibles valores variables ocultos.
Ahora bien, en este argumento no hay nada diseñado para de­
mostrar que los resultados de la mecánica cuántica en este caso espe­
cial quedan, efectivamente, explicados por semejante variable física
oculta real. Antes bien, el argumento está diseñado para demostrar
que, en este caso especial, no hay nadainconsistente en la postulación
de dicho modelo determinista, de variables ocultas, de los fenómenos
y de las predicciones probabilísticas de la mecánica cuántica. Pero si
el argumento de von Neumann hubiera de tomarse como concluyen-
te, si tuviésemos que aceptar el fortísimo postulado de von Neu­
mann, entonces las variables ocultas serían inconsistentes con los re­
sultados mecánico-cuánticos incluso en este sencillo caso de una
única partícula con sólo dos valores posibles de la componente del
espín en cualquier dirección. El argumento parece demostrar, pues,
que la suposición de von Neumann es demasiado fuerte para ser legí­
tima.
Pero esto no es desde luego el final de la historia. Si von Neu­
mann supone demasiado en su prueba de la «imposibilidad de varia­
bles ocultas», quizá un argumento que suponga menos, de hecho uno
que suponga solamente postulados que parezcan intuitivamente ne­
cesarios para cualquier teoría auténtica de variables ocultas, servirá
para fundamentar de una manera más sólida la prueba de imposibili­
dad. Tales argumentos han sido, de hecho, construidos. Supongamos
que las variables ocultas existen. Entonces, en cualquier estado en el
que se especifiquen completamente los valores de todas las variables
ocultas, deberían quedar completamente determinados todos los re­
sultados de un conjunto de observaciones — todas las cuales pueden
ser realizadas simultáneamente. Esto es, si hay un conjunto máximo
de posibles mediciones simultáneas (o una multiplicidad de conjun­
tos), el tfalor de las variables ocultas debería determinar para cada
uno de dichos conjuntos de posibles mediciones un, y solo un, resul­
tado efectivo en cada medición. Estos resultados deben ser compati­
bles con las predicciones mecánico-cuánticas, si es que la teoría de
variables ocultas ha de respaldar a la mecánica cuántica en vez de
ocupar su lugar como una teoría falsa refutable. ¿Puede existir seme­
jante teoría de variables ocultas? Observemos que aquí no se está ha­
ciendo la suposición de von Neumann, según la cual, incluso en
La imagen cuántica del m undo 50)

estados de variables ocultas, se cumplirá la relación de linealidad


para los valores esperados de observables incluso incompatibles.
Todo lo que se supone es que entre los resultados de cualquier con­
junto de mediciones, todas ellas realizables simultáneamente, se cum­
plirán las correctas relaciones mecánico-cuánticas. Y esto se supone
para cada uno de dichos conjuntos de observaciones simultáneamen­
te realizables.
Que ninguna teoría de variables ocultas puede siquiera satisfacer
este, más modesto, requisito, se sigue de un teorema de A. Gleason o,
más directamente, del trabajo de Kochen y E. Specker. Su trabajo
muestra que ninguna teoría de variables ocultas reproducirá los re­
sultados de la mecánica cuántica para ningún sistema siquiera un pa­
so más avanzado del sistema discutido más arriba: la partícula única
con dos posibles resultados en una observación. En este último caso,
el más simple, sabemos que un modelo de variables ocultas es consis­
tente con la mecánica cuántica. Pero para el caso siguiente en orden
de complejidad no puede hallarse una teoría de variables ocultas que
satisfaga el requisito mencionado más arriba.
Una ilustración del teorema, ideada por Kochen y Specker, dará
al lector una idea básica de cómo funciona la prueba, aunque los
pormenores de la misma no serán indicados aquí. Sea un sistema con
las siguientes características: una medida del cuadrado de la compo­
nente del espín en cualquier dirección dará el valor 1 o el valor 0. En
cualquier triplete de tres direcciones, donde cada una forma ángulos
rectos con las otras dos, el sistema tendrá un valor 1 del cuadrado
del espín en dos de las direcciones y un valor 0 del cuadrado del es­
pín en la tercera de estas direcciones al ser medido. Y para uno cual­
quiera de dichos tripletes de direcciones mutuamente perpendicula­
res, las tres mediciones pueden realizarse simultáneamente de
acuerdo con la teoría cuántica. ¿Podrían existir variables ocultas que
caracterizasen más completamente al sistema, yendo más allá de la
caracterización cuántica que nos da las relaciones entre los valores
indicados más arriba, pero proporciona sólo predicciones probabilís­
ticas sobre si una dirección dada tendrá el valor 1 o el valor 0? Para
una asignación dada de variables ocultas completamente especifica­
da, el que una dirección dada tenga un valor 1 o 0 es algo que debe
estar completamente determinado, y las relaciones cuánticas entre
estos valores indicadas más arriba deben ser satisfechas por esta ca­
racterización más completa del sistema.
304 Filosofía de la física

Ninguna teoría de variables ocultas semejante es posible. El argu­


mento por el que esto es así utiliza solamente resultados de la geo­
metría elemental. Puede demostrarse que es sencillamente imposible
asignar los valores 1 y 0 (o cualquier otro par de valores diferentes) a
las direcciones a partir de un punto dado en forma tal que para cual­
quier triplete de tres direcciones mutuamente perpendiculares, se
asigne a dos de las direcciones el valor 1 y a la otra el valor 0. Así
pues, ninguna teoría de variables ocultas podría determinar comple­
tamente el valor correcto del cuadrado del espín para todo conjunto
de tres direcciones mutuamente perpendiculares. Y ninguna teoría
de variables ocultas podría ser tal que se cumpliesen las correctas re­
laciones mecánico-cuánticas entre los resultados de cada conjunto de
posibles mediciones simultáneas que uno pudiera realizar sobre el
sistema.
Pero el proponente de la concepción según la cual la mecánica
cuántica es una teoría estadística incompleta que precisa de una teo­
ría determinista completa subyacente, no se dará por vencido tan fá­
cilmente. Si examinas cómo funciona la prueba anterior de la «no
existencia de variables ocultas», descubrirás que el paso fundamental
es observar que cada dirección a partir de un punto puede ser consi­
derada como miembro de una infinidad de tripletes de direcciones
perpendiculares. Así pues, el valor de la cantidad medida en una di­
rección debe ser consistente, de acuerdo con las predicciones de la
mecánica cuántica, con los valores en las otras dos direcciones per­
pendiculares a ella para muchos tripletes de direcciones. A esto se
debe que la prueba pueda demostrar la inconsistencia de las varia­
bles ocultas con la mecánica cuántica. Partiendo de una asignación
de 1, 1 y 0 a tres direcciones perpendiculares, uno puede encontrar
una diversidad de tripletes de direcciones que contienen una o más
de las direcciones del conjunto original. Uno prosigue entonces ese
proceso hasta que se ve obligado a asignar el valor 0 a una dirección
a la que se le asignó en un principio el valor 1. (Véase la figura 4.7.)
Pero ¿qué sucederá si declaramos que el valor de la cantidad me­
dida en una dirección dada relativa a una elección de las otras dos
direcciones perpendiculares no es la misma cantidad física que ese
valor relativo a otra elección de las dos direcciones perpendiculares?
Pues tener el valor 1 para cada cantidad física «relativa» semejante y
0 para la otra no será una contradicción flagrante. Pero ¿cómo po­
dríamos nosotros, desde un punto de vista físico, sostener que seme-
La imagen cuántica del m undo 305

0
z

F ig u r a 4.7. Un sistema utilizado en un argumento contra las variables ocultas.


Existe un
sistema cuántico que es tal que para cualesquiera tres direcciones mutuamente per­
pendiculares una cierta cantidad debe tener el valor 0 en una de esas direcciones y el
valor 1 en las otras dos direcciones. ¿Podría un único conjunto de variables ocultas
determinar todos esos valores? E l argumento de que esto no podría ser se apoya en
el hecho de que cualquier dirección dada es parte integrante de innum erables triple-
z
tes de direcciones mutuamente perpendiculares. P or ejemplo, en la figura es miem­
bro del triplete (z, x, y),
pero también lo es del triplete (z, x , y).
Se puede demostrar
que es imposible asignar valores O' y V
a todas las direcciones que parten de un
punto de forma tal que para todo triplete de direcciones mutuamente perpendicula­
res, una dirección tenga el valor 0 y las otras dos el valor 1.
Pero mientras los valores
a lo largo de cualesquiera tres direcciones mutuamente perpendiculares son «simultá­
neamente mensurables» (pongamos, a lo largo de ez, x y),
los valores no serán en ge­
neral simultáneamente mensurables a lo largo de, pongamos, y x x".
Esto conduce a
una concepción de las variables ocultas en la que los valores determinados puede
que varíen con el conjunto de medidas simultáneamente posibles elegidas.

jante relativización de la cantidad en cuestión es razonable? La res­


puesta reside en el hecho de que, si bien los valores de la cantidad
en las tres direcciones perpendiculares son todos simultáneamente
mensurables, los valores de esa misma cantidad en otras direcciones
306 Filosofía de la física

no son por necesidad simultáneamente mensurables con las tres can­


tidades en cuestión. Asi, aunque se podrían determinar tres valores
en tres direcciones perpendiculares en una medición, no se podrían
determinar todos los valores en todas las direcciones simultáneamen­
te. Quizá, entonces, el cambio en el aparato de medida que medía el
valor en una dirección, A, al tiempo que determinaba el valor de esa
cantidad en otras dos direcciones, B y C, respecto al aparato diferen­
te necesario para medir el valor en la direcciónA y en dos direccio­
nes diferentes perpendiculares a la misma, D E,y afecte causalmente
al sistema. Esto podría arrojar como resultado que el valor de la can­
tidad en la dirección A relativo a la medición de B y C está determi­
nado por las variables ocultas de manera diferente a como la canti­
dad en la dirección A está determinada por esas variables ocultas
cuando los valores en las direcciones D E y están siendo medidos a
la vez. ¿No podríamos imaginar que el mismo acto de cambiar el
aparato de medida que actúa sobre el sistema interacciona causal­
mente con las variables ocultas del sistema para producir la diferen­
cia? Después de todo, el resultado de la medición del valor en la di­
rección A es el resultado causal conjunto de las variables ocultas del
sistema y del aparato de medida a la vez. Así, la medición de A
junto
B
con una medición de y C podría muy bien dar un valor en la direc­
ción A diferente al que se obtendría midiendo el valor en la direc­
ción de ,4 junto con una medición en las direcciones D y E.
Con
todo, en ambos casos, los valores de las variables ocultas subyacentes
son los que determinan completamente cuál será el resultado de
todos esos valores medidos.
Si adoptamos una concepción «contextual» semejante de la natu­
raleza de una cantidad medida, entonces la prueba bosquejada más
arriba, la prueba de que las interrelaciones entre los valores medidos
predichos por la teoría cuántica son incompatibles con cualquier po­
sibilidad de que estos valores estén completamente determinados
por valores subyacentes de parámetros ocultos, no será válida. ¿Pode­
mos encontrar otro tipo de prueba de la «no existencia de variables
ocultas» que sea inmune al tipo de razonamiento utilizado más arriba
para hacer que el contextualismo no parezca demasiado implausible
desde un punto de vista causal, determinista? La respuesta es que sí
podemos, y a esos argumentos vamos a dirigir ahora nuestra aten­
ción.
La imagen cuántica del m undo 307

La inseparabilidad de los sistemas

El argumento de Einstein, Podolsky y Rosen


Bohr y Einstein fueron, respectivamente, los dos exponentes más
eminentes de dos concepciones contrarias de la teoría cuántica. Para
Bohr, la teoría cuántica proporcionaba una descripción fundamental
del mundo. Por supuesto, cualquier explicación cuántica del mundo
requería ser complementada por esas teorías pormenorizadas que
nos informaban sobre el tipo de fuerzas que actuaban entre las partí­
culas elementales, los constituyentes básicos del mundo; pero, hasta
donde alcanzaba la descripción subyacente de los estados básicos de
la naturaleza y su evolución dinámica, la descripción cuántica sumi­
nistraba un suelo firme. Si un sistema era preparado en un estado
cuántico dado, mediante una de esa clase de mediciones que deter­
minaban, para el sistema tras la medición, los valores de algunos
miembros de un conjunto de observables compatibles, simultánea­
mente mensurables, ese estado cuántico era una descripción comple­
ta del estado del sistema después del proceso de preparación. Cual­
quier inferencia que pudiera derivarse concerniente a los posibles
resultados de una medición futura del sistema, o a la posibilidad de
que dichos resultados se dieran, tendría que ser derivada de nuestro
conocimiento del estado cuántico del sistema. Si estas inferencias de
resultados medidos en un futuro fueran como mucho probabilísticas,
como es el caso normalmente en mecánica cuántica, también lo sería
el sistema. La mecánica cuántica nos demostraba que, en su nivel
más profundo, el mundo era genuinamente indeterminista. Contraria­
mente al ideal determinista, respaldado al menos en cierta medida,
como hemos indicado, por los resultados de la física clásica, el m un­
do tenía una naturaleza irreduciblemente «tiquista», o de carácter
azaroso.
Einstein, al contrario, no cedió en su concepción de que la mecá­
nica cuántica no podía ser una teoría completa del mundo. Como
teoría estadística, capaz a lo sumo de predicciones probabilísticas so­
bre el mundo, debería verse necesitada de un sostén en la forma de
una teoría determinista de los sistemas que descansase en una des­
cripción de los mismos a un nivel más profundo que el suministrado
por la descripción cuántica. Un sistema preparado en un estado
cuántico tenía que tener, pues, otros factores propios del mismo, in-
«08 Filosofía de la física

duso si no sabíamos cuáles eran éstos, y mucho menos cuáles eran


los valores particulares de estas características ocultas que poseía el
sistema particular. Estos factores subyacentes determinarían exacta­
mente el resultado de cualquier medición que se realizase sobre el
sistema, y las predicciones meramente probabilísticas derivables del
estado cuántico del sistema habrían de ser vistas como un reflejo del
hecho de que el estado cuántico proporcionaba sólo una descripción
parcial, no una completa, del estado del sistema.
Para Bohr, un proceso de medida «creaba» el valor de la canti­
dad medida. Antes de la medición, el sistema no tenía ese valor de la
cantidad medida, a no ser que estuviese en un estado cuántico muy
especial en el que dicho valor se obtuviera con certeza en la medi­
ción para empezar. Y antes de la medición, el sistema no era caracte­
rizable por ningún otro parámetro interno que determinase comple­
tamente que el resultado de hecho obtenido era el que se hubiera
obtenido si el sistema hubiese interaccionado con el aparato de me­
dida apropiado. Para Einstein, esto era inaceptable. Si el sistema re­
sultaba poseer efectivamente un valor determinado cuando se realiza­
ba la medición, algo en el m undo que caracterizaba el estado previo
del sistema (y, quizá, del aparato de medida) tendría que dar cuenta
de que se hubiese obtenido dicho valor, y no ninguno de los otros
resultados posibles.
En 1935 Einstein, en colaboración con B. Podolsky y N. Rosen,
publicó un artículo seminal en el que se cuestionaba la forma bohria-
na de ver las cosas. Este artículo dio pie a una larga discusión en tor­
no al tipo de «experimento conceptual» que Einstein propuso. Final­
mente, estos estudios condujeron a una serie de resultados que
parecían plantear las más serias dificultades a un entendimiento de la
mecánica cuántica desde el punto de vista einsteiniano.
La idea de Einstein parte de la consideración de un sistema que
está compuesto por dos partes componentes. Éstas podrían ser, por
ejemplo, dos partículas nucleares unidas en un núcleo de dos partí­
culas. Los sistemas pueden ser construidos de forma tal que el valor
de una cantidad para una de las partículas en el sistema compuesto
esté exactamente correlacionado con el valor de esa misma cantidad
para la otra componente. De hecho, el sistema puede ser tal que,
para toda una familia de propiedades, si la partícula uno tiene un va­
lor dado de una de las propiedades en la familia, la partícula dos
debe tener un, y solo un, valor correlacionado de esa propiedad.
La imagen cuántica del m undo 309

Einstein utilizó originalmente propiedades de la posición y el mo­


mento para su modelo, pero nosotros utilizaremos en su lugar el
modelo de dos partículas con espines correlacionados. Éste es el sis­
tema que se utiliza normalmente para explicar el experimento con­
ceptual y sus consecuencias. Las partículas podrían ser, por ejemplo,
electrones que posean las familiares propiedades de espín que hemos
indicado en las secciones anteriores. Para cualquier dirección dada,
la componente del espín de cada partícula tendrá uno de dos valo­
res, «arriba» en esa dirección o «abajo» en esa dirección. Los siste­
mas compuestos en los que estaremos interesados son los que están
en un estado «singlete». En un tal estado, las partículas están correla­
cionadas de forma tal que si el espín está arriba en una dirección da­
da, el espín de la otra debe estar abajo en esa misma dirección. (El
nombre singlete proviene de la espectroscopia, donde los estados sin-
gletes corresponden a líneas espectrales que no son divididas cuando
el sistema se coloca en un campo magnético externo. Otros sistemas
acoplados podrían ser, por ejemplo, un estado «triplete», donde la lí­
nea espectral se divide en tres líneas cuando se sumerge al sistema en
un campo magnético.)
A continuación, hemos de imaginar al sistema compuesto dividi­
do en sus dos componentes. Cada una de éstas se alejará en el espa­
cio hasta que las partículas componentes originalmente constituyan
ahora dos partículas bien separadas en el espacio. Al mismo tiempo,
se supone que la división ha sido realizada por algún método que no
perturba las correlaciones de espín que las partículas tienen entre sí.
Esto puede hacerse mediante una intervención física apropiada sobre
el sistema desde el exterior. Bajo estas circunstancias, ¿cuál es la des­
cripción correcta de las partículas una vez que han sido separadas,
según la mecánica cuántica? La respuesta es que todavía se las debe
considerar conjuntamente como un sistema compuesto en un estado
singlete de espín. Propiamente hablando, no existe un estado cuánti­
co de una partícula que ignore a la otra, aunque para algunos propó­
sitos se puede construir un tipo de estado «reducido» para una sin la
otra. (Véase la figura 4.8.)
¿Cuáles son las predicciones que podemos hacer sobre las medi­
ciones del espín de las partículas, dado su estado cuántico conjunto?
Pues bien, para cualquier dirección podemos predecir la probabili­
dad de que una de las partículas se encuentre, si su espín se mide en
esa dirección, en un estado espín arriba o espín abajo. En este caso,
310 Filosofía de la física

(a)
oo
(P1 +P2)

La inseparabilidad de ios sistemas cuánticos.


F ig u r a 4.8. E n (a) se muestra un sistema
que está compuesto por dos partículas (Pt P2).
y E l sistema es tal que los valores de
espín de las partículas en cualquier dirección serán encontrados, si se miden, en d i­
recciones opuestas entre sí, independientemente del eje que se elija para hacer la me­
dida. E n (bl las partículas son separadas y enviadas lejos una de la otra en direcciones
opuestas. La separación se efectúa de forma tal que se conserve la «anticorrelación»
de espín entre las dos partículas. Uno puede decidir medir el espín de la partícula P¡
en una dirección cualquiera utilizando el detector D¡, y medir el espín de la partícula
P2 en una dirección cualquiera utilizando el detector D2. Los valores obtenidos pre­
sentan en mecánica cuántica relaciones correlaciónales probabilísticas definidas entre
si. Se puede demostrar que ninguno de los conjuntos de variables ocultas postulados,
capaces de determinar los resultados de las mediciones en D¡ D¿
y con independen­
cia de ¡a medición elegida en cada caso, dará las predicciones correctas para las pro­
babilidades de todas las correlaciones predichas por la mecánica cuántica. Además,
ahora es difícil imaginar que la elección de una medición sobre una de las partículas
atecte a la variable oculta que determina el resultado de la medición en la otra partí­
cula, va que las dos mediciones se hacen a distancias y a proximidades en el tiempo
tan colosales que hacen la interacción causal entre ellas imposible.

cada una de esas probabilidades es de un medio. Estas probabilida­


des se seguirían ambas del estado cuántico total del sistema com­
puesto y de los estados reducidos que podemos atribuir a cada partí­
cula por separado. Pero, de la naturaleza del estado conjunto se sigue
algo distinto, a saber, la perfecta correlación de las partículas. No im­
porta lo distantes en el espacio que lleguen a estar las partículas, po­
demos siempre inferir, suponiendo que nada interaccione con ellas
desde el exterior entre la división del sistema original y las medicio­
nes realizadas, que si en una medición se encuentra que una partícu­
la tiene espín arriba en una dirección dada, se encontrará sin duda
que la otra partícula tiene espín abajo si su espín se mide en la mis­
La imagen cuántica de! m undo 311

ma dirección. Además, si se realiza una medición sobre una partícula


en una dirección dada y se anota el resultado, se encontrarán probabi­
lidades definidas para el resultado de una medición del espín sobre la
otra partícula en cualquier otra dirección elegida. Estas probabilida­
des condicionadas del resultado de una medición sobre la partícula
dos al resultado de una medición sobre la partícula uno se siguen del
estado cuántico total del sistema compuesto. Éstas son eliminadas en
las descripciones reducidas que pueden construirse para las partículas
en cada momento, razón por la que dichas descripciones reducidas
no sirven para especificar el estado cuántico total del mundo.
Ahora bien, dice Einstein, miremos desde el punto de vista boh-
riano al estado de la partícula dos antes y después de que el estado
de la partícula uno haya sido determinado mediante una medición.
De acuerdo con Bohr, antes de realizarse una medición, ninguna de
las partículas tiene un espín definido. Ni tienen, de acuerdo con
Bohr, una propiedad por la que tendrían necesariamente un valor
definido de espín en una dirección definida en caso de realizarse una
medición. Más bien, antes de una medición, las partículas poseen
únicamente una disposición a aparecer con un valor de espín dado
en una dirección dada con probabilidad un medio, junto a la disposi­
ción a tener sus valores de espín, si se miden los dos, correlacionados
en la forma descrita por la función de onda del estado singlete. Pero
supongamos que se mide el espín de la partícula uno en una direc­
ción dada, pongamos, A.
Supongamos que se obtiene el valor «arri­
ba». En ese mismo instante, de acuerdo con Bohr, la segunda partí­
cula, aunque se encuentre a una distancia de años luz, «salta»
instantáneamente al estado cuántico apropiado para que su espín
tenga la dirección «abajo» en la dirección A. Esto es cierto porque
una vez que se ha determinado que el espín de la partícula en la po­
sición «arriba» está en la dirección A, es seguro que el espín de la
partícula dos se encuentra «abajo» en esa dirección, y la única fun­
ción de onda que otorga esa probabilidad a la partícula dos sería una
función de onda «abajo pura en la dirección A». Esta función de on­
da para la partícula dos difiere mucho de la asignación a la partícula
dos, en unión con la partícula uno, de una función de onda previa
correspondiente a la partícula dos formando parte de un sistema
compuesto en un estado singlete.
Ahora bien, dice Einstein, si concebimos la función de onda
como una caracterización física completa de la partícula, este tipo de
Filosofía de la física

cambio es absurdo. Bohr concibe la medición como la «creación» de


un valor para la observación del sistema, un valor que no existía an­
tes de haberse realizado la medición, y no como la revelación de un
valor preexistente (o al menos predeterminado) para esa cantidad.
Esto puede ser plausible si nosotros interaccionamos físicamente con
el sistema cuando lo medimos, pero carece de sentido si el sistema
no se ve perturbado lo más mínimo por nuestra medición. Eso es lo
que sucede en el caso del sistema acoplado que estamos consideran­
do. Medimos el valor del espín en la partícula dos haciendo interac-
cionar nuestro aparato de medida con la partícula uno.
La medición
que realizamos determina el valor del espín en la dirección A
para la
partícula uno. Eso nos dice inmediatamente cuál es el valor del espín
para la partícula dos, es decir, qué valor del espín en la dirección A
mostraría ahora una medición de la partícula dos. Pero, como no
tocamos para nada en absoluto, en el sentido físico, a la partícula dos
durante el proceso de medida, sea lo que fuere lo que determina que
la partícula dos tenga un valor definido de espín en la dirección si A
se mide, deberá haber sido cierto para la partícula dos antes de nuestra medi­
ción de la partícula uno.Pero, antes de nuestra medición de la partícu­
la uno, la función de onda que describía las partículas no asignó un
valor definido de espín en la dirección A
a la partícula dos. Y, repito,
la partícula dos debe haber poseído semejante valor determinado del
espín en la dirección Aaun antes de nuestra medición de la partícula
uno. Por lo tanto, concluyen Einstein y sus colaboradores, el estado
cuántico del sistema compuesto antes de la medición no contenía
una descripción total del estado actual del mundo. N o asignó, por
ejemplo, una disposición definida de la partícula dos a mostrar un, y
solo un, valor de espín en la dirección A,
una disposición que la par­
tícula dos debe haber tenido «desde un principio», de acuerdo al ar­
gumento que acabamos de exponer.
Concluyen, pues, que la mecánica cuántica es una teoría incom­
pleta. La función de onda, arguyen, debe considerarse que represen­
ta, no el estado físico total de un sistema, sino sólo nuestro conoci­
miento parcial de ese estado. El cambio instantáneo de la función de
onda en la medición deja así de resultar misterioso. Supongamos que
sabemos que una peseta se encuentra, bien en una caja de cerillas en
la Tierra, bien en una caja de cerillas en un planeta de Alpha Centau-
ri. Podemos representar esto por una función de probabilidad que
asigna, pongamos, la probabilidad de un medio a cada posibilidad.
La imagen cuántica del m undo 313

Miramos ahora en la caja de cerillas en la Tierra y vemos la peseta.


Por supuesto, la probabilidad de que la peseta esté en la otra caja de
cerillas se reduce instantáneamente a cero. Pero esto no implica un
cambio físico misterioso de la caja de cerillas en el planeta distante,
sólo un cambio en lo que nosotros sabemos sobre ella. Pues si la caja
de cerillas distante resulta estar vacía, debe haber estado vacía aun
antes de que mirásemos en la caja de cerillas en la tierra.
Bohr no se mostrará en absoluto de acuerdo con este argumento.
Es verdad, responde, que la función de onda asignada a un sistema
es relativa a la elección de alguna medición. Antes de que la medi­
ción se haya realizado sobre la partícula uno, la función de onda ade­
cuada para caracterizar a la partícula dos es la que la caracteriza
como una componente del sistema original compuesto en estado sin­
glete. En relación a la medición inicial de preparación, ésta es la fun­
ción de onda correcta para describir el mundo. Después de que la
partícula uno ha sido medida y se ha hallado que tiene un valor defi­
nido de espín en la dirección A, la función de onda correcta para
describir el mundo es la que asigna a cada partícula un espín defini­
do en la dirección A Asigna a la partícula uno el valor de espín de­
terminado por la medición, y asigna a la partícula dos el valor de es­
pín que debe tener debido a la perfecta correlación de los espines de
las dos partículas. La medición de la partícula uno, pues, cambia
efectivamente la función de onda atribuida a la partícula dos. Pero
esto no implica, ni que la función de onda sea meramente un com­
pendio de nuestro conocimiento y no una especificación total del
estado físico, ni que la medición de la partícula uno tenga un efecto
«causal» sobre la partícula dos. Antes bien, es una característica de la
relatividad de la función de onda respecto al proceso de medida. Es
este aspecto relacional de la mecánica cuántica, a saber, que los
estados existen sólo en relación a las mediciones, lo que Bohr preten­
de en su explicación de la situación, argumentando que la relatividad
de la función de onda respecto a la medición realizada es algo análo­
go a la relatividad de la longitud de una vara de medir respecto al
movimiento de un observador en la relatividad. El cambio del estado
de movimiento de uno mismo respecto a la vara de medir cambia la
longitud de la vara de medir respecto a uno mismo como observa­
dor. Pero esto no significa un cambio causal en la vara de medir, tal y
como la teoría del éter lo habría explicado. N i significa que la longi­
tud es una característica subjetiva de la vara de medir. La longitud es
114 Filosofía de la física

relativa al sistema de referencia. De manera similar, afirma Bohr, la


(unción de onda es física, pero relativa.

1:1 Teorema de Bell


¿Podría cualquier argumento servir para ayudar a determinar cuál de
estas posturas respecto a la función de onda es la correcta? Al menos
podríamos confiar en hacer lo siguiente: podríamos ser capaces de
determinar si la postulación de variables ocultas que fijan los estados
de los dos sistemas separados individualmente, así como el estado de
la partícula distante independientemente de la medición que decida­
mos realizar en la partícula más cercana, es consistente con todas las
predicciones probabilísticas hechas por la mecánica cuántica. Noso­
tros vamos a considerar ahora la afirmación de que una postulación
semejante, una que esté de acuerdo con la imagen de Einstein de la
función de onda como una descripción incompleta del m undo soste­
nido por un nivel de descripción más completa, determinista, ya nos
sea o no conocida, no es de hecho consistente con la mecánica cuán­
tica. Un teorema de J. Bell, y algunas extensiones del mismo, están
diseñados para demostrar que la imagen que Einstein sugiere cómo
la correcta interpretación de la función de onda asignada a sistemas
correlacionados no puede ser correcta.
¿Cómo funciona la demostración? Para empezar, supongamos
que Einstein está en lo cierto. En el caso de las dos partículas corre­
lacionadas con posibles valores de espín que se ha descrito más arri­
ba, supongamos que tan pronto como las partículas se separan una
de la otra, cada partícula arrastra consigo un valor de un parámetro
oculto. El valor del parámetro oculto asociado a una partícula deter­
minará completamente, para esa partícula, si aparece arriba o abajo
en cualquier medición de espín realizada sobre la misma en cual­
quier dirección que elijamos. Supongamos, también, que sucesos
muy distantes en el espacio y próximos entre sí en el tiempo, de for­
ma tal que, por relatividad, ninguna señal causal pudiera ser enviada
desde el uno al otro, no pueden afectarse mutuamente. Una conse­
cuencia de esto es lo siguiente: Supongamos que medimos la partícu­
la dos en la dirección B.
El resultado de esta medición no debe de­
pender de ninguna elección por nuestra parte de la dirección en la
que decidamos medir el espín de la partícula uno. Después de todo,
La imagen cuántica del m undo 315

podríamos disponer las dos mediciones, una vez que las partículas se
hubiesen separado una distancia entre sí, de forma tal que una medi­
ción no pueda afectar causalmente a la otra. Así, la elección de la di­
rección en la que mediremos el espín de la partícula uno no debería
tener efecto alguno sobre el resultado de una medición de espín en
la partícula dos en la dirección elegida para hacer esa medición.
Supongamos ahora que decidimos efectuar dichos pares de medi­
ciones del espín en una clase amplia de pares de partículas, todas
preparadas de la misma forma, con las mismas correlaciones de espín
predichas por la mecánica cuántica. Suponemos que cada resultado
está completamente determinado por el valor del parámetro oculto
que cada partícula arrastra en cada uno de los experimentos. Tam­
bién suponemos que las probabilidades de los resultados de las me­
diciones en una de las partículas son independientes de qué medi­
ción de espín elijamos hacer sobre la otra partícula. La probabilidad
de que se obtenga un valor dado en una medición sobre una partícu­
la dada en una dirección dada debería, entonces, depender sólo de la
probabilidad con la que los diversos valores posibles de los paráme­
tros ocultos para cada partícula están distribuidos.
Introduzcamos la siguiente notación: es un símbolo con
seis lugares disponibles. Los tres lugares anteriores al punto y coma
corresponden a la partícula uno y los tres después del mismo a la
partícula dos. Cada uno de los tres lugares a cada lado del punto y
coma corresponde a una dirección A, B y C. Consideraremos medi­
ciones de la componente del espín de cada partícula en cada una de
estas tres direcciones. Un símbolo «i-» en un lugar significa que el
valor del espín para esa partícula en esa dirección está determinado
por los parámetros ocultos a aparecer en la dirección arriba. Un sím­
bolo «—» significa que está determinado a aparecer abajo. (Cuál de las
dos direcciones se toma como arriba y cuál como abajo para cada A,
By C es indiferente). U n «0» en un lugar significa que el parámetro
oculto tiene un valor tal que el espín en esa dirección aparecerá arri­
ba o abajo, es decir, cualquier valor consistente con los más y los me­
nos asignados a los otros lugares. Recordad que las partículas tienen
una correlación perfecta, de manera que si aparece un más, ponga­
mos, en el primer lugar a la izquierda del punto y coma, eso forzará
un valor menos en el primer lugar a la derecha del punto y coma.
Por ejemplo, el símbolo (+,0,0;0,0,+) indicará la probabilidad de que
en una medición de la primera partícula en la dirección A aparezca
316 Filosofía de la física

y
necesariamente un espín arriba en esa dirección, en una medición
de la segunda partícula en la dirección C
aparezca necesariamente un
C
valor arriba en la dirección del espín.
Consideremos la siguiente ecuación:

Ecn. A-C: (+,0,0;0,0,+) = (+,+,—~ , —,+) + (+,—,—;—,+,+)

A quí nos apoyamos en los dos argumentos siguientes: 1) si se ob­


tiene el valor + para una partícula en una dirección, el valor de la
otra partícula en esa dirección es forzosamente menos; 2) dados los
valores determinados para los espines de las partículas uno y dos en
las direcciones A y C,quedan solamente dos posibilidades para el va­
lor de estos espines en la dirección indeterminada B.
Como todas
estas probabilidades están bien definidas y son independientes de la
medición que decidamos realizar sobre cada partícula, parece razona­
ble sobre la base de los postulados elementales de la teoría de la pro­
babilidad que la probabilidad total de que la partícula uno resulte
más en la dirección A y la partícula dos resulte más en la dirección C
es la probabilidad de ese suceso y también de que la partícula uno
resulte más en la dirección B
(con la partícula dos resultando menos
en esa dirección) más la probabilidad de que se dé el resultado men­
cionado y que la partícula uno resulte menos en la dirección (con B
la partícula dos resultando más en esa dirección). Esto se debe a que,
dado el resultado mencionado, estas dos otras posibilidades para el
resultado en la dirección B se excluyen mutuamente y agotan todas
las posibilidades que pueden darse.
Siguiendo exactamente el mismo razonamiento se obtiene una se­
gunda ecuación:

Ecn. B-C: (0,+,0;0,0,+) = (+,+,— ,—,+) + (—,+,—;+,—,+)

y una tercera ecuación:

Ecn. A-B.: (+,0,0;0,+,0) = (+ ,- ,+ ;- ,+ ,-) +

Ahora viene la observación que pone en duda la postulación de


las denominadas variables locales ocultas subyacentes a las probabili­
dades mecánico-cuánticas. Si miramos al lado derecho de la Ecn. A-C,
observamos que el primer término en el mismo aparece en el lado
La imagen cuántica del m undo 317

derecho de la Ecn. B-C y el segundo término aparece en el lado dere­


cho de la Ecn. A-B. Ahora bien, los otros términos en el lado derecho
de cada una de estas dos últimas ecuaciones deben ser mayores que,
o iguales a, cero porque representan probabilidades, y las probabili­
dades nunca son números negativos. Así pues, si sumamos los lados
izquierdos de las Ecns. B-C y A-B, debemos obtener un número que
sea al menos tan grande como el lado izquierdo de la Ecn. A-C. D i­
cho en palabras esto se reduce a lo siguiente: «La suma de las proba­
bilidades de que la partícula uno aparezca arriba en la dirección B y
la partícula dos aparezca arriba en la dirección C
con la probabilidad
de que la partícula uno aparezca arriba en la dirección A
y la partícu­
la dos aparezca arriba en la dirección B
no puede ser menor que la
probabilidad de que la partícula uno aparezca arriba en la dirección
A y la partícula dos aparezca arriba en la dirección C. Esto debe ser
cierto para todas las direcciones A, B
y C.»
Pero resulta que hay direcciones de A, B
y C en las que ¡esta des­
igualdad se ve violada por las probabilidades predichas por la mecá­
nica cuántica! En mecánica cuántica, la correlación probabilística de
la dirección A con la dirección C puede ser mayor que la suma de la
correlación de la dirección A
con alguna otra dirección, B,
y la corre­
lación de esta otra dirección, B,
con la dirección C.Parece que el
postular que todas las probabilidades indicadas están bien definidas
es incompatible con las predicciones mecánico-cuánticas sobre pro­
babilidades de resultados conjuntos. Y los postulados tras la existen­
cia de estas probabilidades parecen ser, entonces, incompatibles con
las predicciones probabilísticas mecánico-cuánticas. Estos postulados
son, primero, que hay valores de parámetros ocultos que determinan
los resultados de todos los experimentos de espín que puedan reali­
zarse sobre las partículas separadas y, segundo, que el resultado de
una medición sobre la segunda partícula es independiente de la me­
dición de espín que hagamos para medir el espín de la primera partí­
cula (y viceversa). Parece como si estuviésemos obligados a pensar
que el realizar una medición particular sobre la primera partícula tie­
ne un efecto determinante sobre la distribución de probabilidades
para el resultado de mediciones sobre la segunda partícula. Este efec­
to no puede ser comparado con el caso clásico donde hay una proba­
bilidad ya determinada para cada resultado en la segunda partícula,
independientemente del experimento que realicemos sobre la prime­
ra, sirviendo el experimento sobre la primera partícula sólo para per­
318 Filosofía tle la física

mitirnos hacer inferencias más profundas acerca de la segunda por


un tipo de condicionamiento probabilístico.
Suponed que admitimos que los parámetros ocultos portados por
cada una de las partículas no determinan con certeza el resultado de
cada una de las mediciones que pueden realizarse sobre las partícu­
las; fijan el resultado sólo indeterminista y probabilísticamente. Aquí,
pues, las variables ocultas no restaurarían el determinismo en la físi­
ca. Pero ¿no podrían al menos restaurar la «localidad»? ¿No podría­
mos pensar que cada partícula, después de la separación, porta su
propia probabilidad de dar un resultado específico en cualquier me­
dición que se realice sobre ella, aun si la partícula no porta un resul­
tado completamente determinado para cada posible medición? Vaya,
si se hace una suposición de «localidad» natural, adicional, esta ver­
sión de las «variables ocultas locales estocásticas» es también incon­
sistente con la mecánica cuántica. La suposición adicional es que la
probabilidad determinada para los resultados de todas las posibles
mediciones sobre la partícula dos por su variable estocástica oculta
es independiente del resultado de cualquier medición que realicemos
sobre la partícula uno. En el caso de variables ocultas deterministas,
supusimos que el resultado sobre la partícula dos era independiente
de la elección del experimento realizado sobre la partícula uno. A ho­
ra suponemos, asimismo, que la probabilidad de un resultado en la
partícula dos es independiente del resultado que podríamos obtener
en una observación hecha en la partícula uno. Seguramente ésta es
una suposición razonable si lo que pretendemos es construir una teo­
ría que esté de acuerdo con el desiderátum de Einstein de que el
estado de la partícula dos, una vez separada de la partícula uno de
cualquier modo causal ordinario, es independiente de lo que pueda
sucederle a la partícula uno.
Aun en el caso de una teoría de variables ocultas probabilística,
la suposición de localidad para la variable oculta, interpretada natu­
ralmente, está en desacuerdo con las predicciones cuánticas. Se da
una suerte de «enmarañamiento» entre los sistemas, en su momento
unidos y ahora separados, que no puede ser reducido al mero hecho,
clásicamente inteligible, de que cada uno de ellos, independiente­
mente del otro, porta un registro de su existencia pasada como com­
ponentes de un sistema compuesto con propiedades determinadas.
Es cierto que juntos portan un registro de ese estado anterior, pero
parece que este registro no puede ser factorizado en características
La imagen cuántica del m undo 319

independientes de las dos partículas tomadas como sistemas físicos


independientes y distintos.
La idea de que el realizar un experimento en un lugar parece, de
acuerdo con la mecánica cuántica, producir un efecto en las probabi­
lidades de los resultados de otro experimento realizado en algún lu­
gar distante evoca la posibilidad de una comunicación que sobrepasa
los límites impuestos a la transmisión de la energía por la famosa afir­
mación relativista de que la luz es la señal más rápida posible para la
transmisión de una señal causal. Pero un examen detenido de la si­
tuación muestra que no hay nada que un experimentador pueda ha­
cer en el lugar de la partícula uno para modificar cualquier resultado
que un experimentador obtenga en el lugar de la partícula dos y que
pudiera ser utilizado para informar al segundo experimentador de
que, por ejemplo, el primer experimentador había de hecho decidido
medir el espín de la partícula uno en una dirección particular o de
que había obtenido resultados específicos al hacerlo. Las correlacio­
nes entre los espines de las partículas que se obtendrían si se hicie­
ran dos mediciones particulares sobre dos partículas correlacionadas
particulares separadas del mismo sistema compuesto original en
estado singlete, las correlaciones predichas por la mecánica cuántica,
no son reproducibles mediante variables ocultas locales, ya sean del
tipo determinista o del estocástico. Pero ninguno de estos hechos so­
bre la correlación podría ser utilizado para violar los límites relativis­
tas sobre la velocidad o transmisibilidad de una señal causal.
Parece falso, pues, que las probabilidades de las componentes se­
paradas de un sistema, en su momento unificado, puedan ser fijadas,
deterministamente o simplemente probabilísticamente, por caracte­
rísticas locales a este sistema aislado y en forma tal que las probabili­
dades de resultados en mediciones de los sistemas individuales satis­
fagan todos los resultados correlaciónales sobre los productos de las
mediciones dictados por las leyes de la mecánica cuántica. Y es falso
si uno hace las suposiciones fundamentales contenidas en estos argu­
mentos sobre «variables ocultas no locales». Existen tentativas de
soslayar estos argumentos que se fundan, por ejemplo, en teorías pro­
babilísticas no estándar. Pero la rareza del m undo implicado por
estas teorías es al menos tan extrema como la aparente no localidad
de los sistemas que normalmente se asume como consecuencia de
estos argumentos.
Pero ¿podría estar la mecánica cuántica equivocada en sus pre­
320 Filosofía de la física

dicciones sobre las correlaciones de estados de sistemas separados?


No parece probable. Se ha llevado a cabo un trabajo experimental
(no con la clase de partículas que utilizamos en nuestro ejemplo, sino
con fotones de luz polarizada para los que se puede probar un resul­
tado relacionado de «variables no ocultas»). Este parece mostrar, sin
ser motivo de sorpresa, que las correlaciones entre los estados de las
partículas en su momento unidas son justo como predice la mecánica
cuántica.
Así, el seguimiento de la astuta idea de Einstein de apelar a siste­
mas que en su momento habían interaccionado causalmente pero
que, en el momento en que se realizaron las mediciones sobre ellos,
constituían sistemas ampliamente separados que no podían ser consi­
derados en contacto causal entre sí, ha tenido el efecto opuesto al
que Einstein pretendía. Einstein consideró absurdo que una medi­
ción en un lugar y tiempo pudiera provocar un cambio real en otro
lugar y tiempo no conectado causalmente al primero, y que esto de­
mostrase que el estado cuántico debía ser tomado como una repre­
sentación de nuestro conocimiento parcial del estado del mundo y
no como una descripción completa de ese estado. Pero los resultados
del teorema de Bell parecen indicar, antes bien, que no es plausible
un entendimiento de la mecánica cuántica como una teoría estadísti­
ca sobreimpuesta a una teoría de variables ocultas local subyacente.
Dichos resultados van más allá de los discutidos en «Argumentos
contra las variables ocultas» en que, en los casos que estamos consi­
derando ahora, la solución dada por los teóricos de variables ocultas
al dilema — primero tomando los observables como contextúales y
relativos a otras cantidades observadas y después considerando las
otras mediciones realizadas simultáneamente como actuando causal­
mente sobre las variables ocultas que determinan el resultado de la
medición en cuestión— no parece ser válida. Si admitimos que la
elección de qué medición realizar sobre una partícula en un momen­
to dado, y el resultado obtenido en esa medición, no pueden afectar
causalmente a los valores de las variables ocultas de la otra partícula
a una gran distancia y cuya medición se realiza en un tiempo próxi­
mo al de la primera medición, esta forma de soslayar los resultados
de «variables no ocultas» queda ahora invalidada.
La imagen cuántica del m undo 321

Resumen
Los resultados esbozados en El argumento de Einstein, Podolsky y Ro­
sen y en el Teorema de Bell no pueden, por sí mismos, determinar cuál
de las posibles interpretaciones metafísicas de la mecánica cuántica y
del proceso de medida es la correcta. Parecen, no obstante, inclinarse
a favor de las interpretaciones que proponen revisiones radicales en
nuestro entendimiento de la naturaleza del m undo y en contra de
quienes afirman que podríamos entender la nueva teoría con sólo re­
visiones más o menos menores en nuestros conceptos sobre cómo es
el mundo. Estas eran, por ejemplo, esas interpretaciones del Princi­
pio de Incertidumbre que veían en el mismo una limitación mera­
mente en nuestro posible conocimiento del estado de un sistema.
Nosotros no podíamos conocer, argumentaban estas interpretaciones,
valores simultáneos exactos de la posición y del momento de una
partícula. Pero podíamos suponer, continuaba el argumento, que d i­
chos valores todavía existían. No obstante, el hecho de que ninguna
variable oculta no contextual de ningún tipo pudiera generar los re­
sultados probabilísticos correctos para todas las mediciones posibles
sobre un sistema parecería militar contra esta concepción y a favor,
antes bien, de la argumentación más radical de Bohr, según la cual
las características atribuidas a un sistema, cuando éste era medido y
se encontraba que tenía ciertos valores de una cantidad observable,
eran «creadas» por la medición y no se encontraban previamente
presentes en el sistema.
Los aun más sorprendentes resultados del Teorema de Bell pare­
cen permitirnos ir un poco más lejos. Una cosa es considerar la medi­
ción como una «creación» del estado observado del sistema por me­
dio de un tipo de proceso causal, el resultado de la interacción
causal entre el aparato de medida y el sistema medido. Después de
todo, somos conscientes del hecho de que, incluso en la física pre-
cuántica, el acto de medir una cantidad de un sistema puede cambiar
el estado del sistema. La introducción de un termómetro en un líqui­
do para medir la temperatura de ese líquido cambiará la temperatura
del líquido en el proceso. ¿No podría considerarse de este modo el
«efecto de la medición sobre el sistema medido»? La diferencia entre
el caso clásico y el cuántico residiría entonces en el hecho de que en
el caso precuántico es posible, en principio, hacer que la perturba­
ción del sistema por el aparato de medida sea tan pequeña como uno
522 Filosofía de la física

quiera, mientras que en mecánica cuántica el límite irreducible sobre


la cantidad mínima de energía transferida en un proceso de medida
(debido a la naturaleza cuántica de la energía transferida desde un
sistema a otro) podría hacer imposible reducir dicha perturbación a
«casi cero». Semejante forma de entender la incertidumbre tuvo sus
partidarios, especialmente en la primera interpretación del Principio
de Incertidumbre.
Pero, tal y como hemos visto, la mecánica cuántica parece reque­
rir que una medición pueda ejercer un efecto sobre un sistema aun
cuando el aparato de medida y el sistema no están en contacto causal
de ninguna forma. La medición del espín en la partícula uno cambia
el estado cuántico de la partícula dos. Como hemos visto, este cam­
bio no puede ser reducido a la simple modificación en las probabili­
dades que resulta de un aumento en nuestro conocimiento del m un­
do para cuyo propósito servirá un modelo clásico. La inexistencia de
variables ocultas locales parece implicar esa conclusión. Así Bohr pa­
rece estar en lo cierto cuando mantiene que los estados del mundo,
estados cuánticos de los sistemas, poseen una cierta clase de relativi­
dad respecto a la elección y al resultado de la medición que no es
comparable, ni a una modificación causal del sistema por la medi­
ción, ni a la consideración del estado cuántico como sólo una des­
cripción parcial del sistema, un compendio de nuestro conocimiento
sobre el mismo cuya modificación en la medición es comprensible en
una forma clásica. Los resultados de los teoremas de «variables no
ocultas» refuerzan la vindicación de que la mecánica cuántica nos
exigirá un replanteamiento radical de la naturaleza del mundo, una
vez que hallamos logrado algo parecido a un entendimiento coheren­
te de la misma.
No se sabe bien en qué consistirá dicho replanteamiento. Como
mínimo parecería que la mecánica cuántica sitúa bajo una luz muy
diferente la vieja cuestión de si Leibniz estaba en lo cierto al pensar
que todo suceso que ocurría tenía una «razón suficiente». Si la mayo­
ría de los intérpretes de la mecánica cuántica están en lo cierto, no
hay sencillamente razón causal alguna en absoluto por la que un nú­
cleo de un elemento radioactivo se desintegraría en un intervalo de
tiempo dado, mientras un núcleo idéntico de la misma clase no lo
haría. Peor aun, como hemos visto, las causas estocásticas o probabi-
lísticas parecen descartadas, si se supone que la causalidad — aun si
es indeterminista— es una relación puramente local en la que los
La imagen cuántica del m undo 323

estados de las cosas están determinados solamente por lo que está


sucediendo en su vecindad espacio-temporal. Junto a la noción de
una cadena causal del acontecer en el mundo discurre nuestra no­
ción de lo que significa explicar por qué ocurren los fenómenos. Po­
demos explicar las correlaciones observadas en las mediciones de es­
pín de las partículas distantes por referencia a su origen como
componentes de un sistema compuesto en estado singlete. Pero a di­
ferencia de la habitual explicación clásica de dichas correlaciones, no
podemos explicar esta correlación mostrando cómo el origen históri­
co de las partículas proporciona para cada una, independientemente
de la otra, una probabilidad definida de ocurrencia, siendo la correla­
ción la consiguiente distribución de probabilidades compuestas para
un par de resultados, cada uno de los cuales es descrito probabilísti-
camente. En lugar de ello, la correlación es un hecho «irreducible», y
la explicación de ello es directa y no a través de semejantes probabi­
lidades independientes, pues sabemos que cualquier asignación de
las mismas sería incompatible con las correlaciones que se dan efecti­
vamente.
Finalmente, aunque más indirectamente, los resultados de «varia­
bles no ocultas» refuerzan las afirmaciones de que un entendimiento
total del m undo descrito por la mecánica cuántica requerirá una re­
valuación radical de nuestra imagen metafísica del mundo. Para algu­
nos, esto significa pasar de la presuposición de la imagen mecanicista
clásica de un único mundo material a una en la que suposiciones
idealistas, bastante anticuadas, sobre la existencia de estados menta­
les ontológicamente independientes de los soportes físicos desempe­
ñan un papel. Para otros, significa la negación, mucho más radical, de
un mundo físico unitario, y su sustitución por una versión u otra de
una ontología de «muchos mundos» en la que, en cada momento, ca­
da uno de una diversidad de resultados posibles de un proceso se
realiza en los diferentes «universos derivados». Para otros, el cambio,
todavía más radical, sería la negación absoluta de cualquier noción
de un m undo objetivo que exista con independencia de nuestras ten­
tativas de llegar a conocerlo, sustituyendo esta tradicional concep­
ción objetivista por algún tipo de versión de una imagen bohriana, en
la que el m undo está descrito por estados cuánticos, pero estos
estados son de suyo relativos a la elección de una medición a rea­
lizar.
Una vez más, el lector debería reflexionar sobre los fenómenos fí­
Í 24 Filosofía de la física

sicos que. condujeron a estas osadas especulaciones en primer lugar.


Es importante recordar que tales fenómenos como la naturaleza dual
de la luz como una onda mostrando fenómenos de interferencia y
como una partícula mostrando transferencia de energía en una forma
sumamente localizada; la presencia de fenómenos de interferencia
para las partículas materiales fundamentales del m undo tal y como se
revela, pongamos, en la dispersión de electrones por un cristal; la
aparición de interferencia en otros aspectos del mundo además del
espacial, como en los experimentos de espín que muestran la reten­
ción de memoria del espín original de una partícula en una dirección
incluso después de que el haz de partículas haya sido dividido en ha­
ces puros de partículas con espines arriba y abajo en alguna otra di­
rección; los resultados correlacionados de posibles mediciones simul­
táneas sobre un sistema no compatibles con el hecho de estar
determinados por cualquier variable oculta no contextual para el sis­
tema, por razones geométricas muy elementales; y la existencia de co­
rrelaciones distantes cuya explicación no descansa en una interacción
local pretérita de los sistemas separados, pero que no puede ser re­
construida como explicable por parámetros locales portados por ca­
da uno de los sistemas separados individualmente. Estas característi­
cas del mundo, demostrables experimentalmente, no son parte de
ningún formalismo esotérico, sino características totalmente distinti­
vas reproducibles en el laboratorio. Cuanto más se reflexiona sobre
ellas, más difícil es dar con una explicación unitaria plausible que no
recurra a una redefinición absolutamente radical de la naturaleza del
mundo.

Lecturas complementarias

Tres introducciones básicas a la filosofía de la mecánica cuántica que


son fácilmente accesibles son Pagels (1982), Squires (1986) y Rae
(1986). Gibbins (1987) estudia también, con alguna sofisticación filo­
sófica, el material básico. Heisenberg (1930) sigue siendo un clásico
de una exposición elemental brillante. Hughes (1989) contiene una
exposición del formalismo de la teoría, con una explicación cuidado­
sa de por qué desempeña el papel que desempeña. D ’Espagnat (1971)
es un tratamiento sofisticado de muchos problemas centrales que ha­
ce uso de una mayor cantidad de aparato formal que las obras más
La imagen cuántica del m undo

sencillas. Jammer (1974) es de una envergadura enci?fót^édigtfijwgj|


trando la mayor parte de las líneas más importantes de interpretados
a través de la historia de la disciplina.
Jammer (1966) es una historia comprehensiva de los orígenes de
la teoría cuántica que hace hincapié en el desarrollo de los principa­
les conceptos. Ludwig (1968) contiene traducciones de los artículos
originales en el campo de la teoría cuántica. Bohm (1951) contiene
también capítulos con una exposición clara sobre la base experimen­
tal de la teoría y sobre su desarrollo temprano.
Hay numerosos textos introductorios sobre la teoría cuántica.
Bohm (1951), Dicke y Wittke,(1960), y Gottfried (1960) son todos ex­
celentes. Presentaciones formales clásicas de la teoría son Dirac
(1930) y von Neumann (1955). Introducciones a las matemáticas ne­
cesarias para formular la teoría pueden encontrarse en Hughes (1989)
y Jordán (1969). El material más avanzado es examinado en Jauch
(1968).
Sobre las interpretaciones tempranas de la teoría, Jammer (1974),
capítulos 2 al 6, es comprehensiva. Heisenberg (1930) es también una
lectura esencial. Una introducción al debate, junto con muchos de
los importantes artículos originales, se encuentra en Wheeler y Zurek
(1983).
Sobre la medición, la lectura de los capítulos 2 y 4-6 de Wheeler
y Zurek (1983) es vital. D ’Espagnat (1971), parte 4, es exhaustiva y cla­
ra. Jammer (1974), capítulo 11, abarca las principales teorías.
La formulación del «estado relativo» en la teoría por Kochen
puede encontrarse en Kochen (1985). Una exposición y una discu­
sión completas de este enfoque se encuentra en Healy (1989). Una
interpretación relacionada puede encontrarse en van Fraassen (1991).
Propuestas que vinculan la medición cuántica al tipo de irreversibili-
dad discutida en el capítulo 3 del presente libro pueden encontrarse
en el capítulo 5 de Wheeler y Zurek (1983). La concepción según la
cual la medición es el resultado de «puntapiés aleatorios» al sistema
desde un nivel físico «más profundo» pueden encontrarse en Ghirar-
di, Rim ini y Weber (1986). Una crítica de esta concepción y de la
concepción de Kochen puede encontrarse en Albert y Loewer (1990).
La interpretación de «muchos mundos» de la teoría cuántica se dis­
cute en la sección 11.6 de Jammer (1974) y 2.3 de Wheeler y Zurek
(1983), así como en el capítulo 20 de D ’Espagnat (1971).
La versión de Reichenbach de la «lógica cuántica» se encuentra
326 Filosofía de la física

en Reichenbach (1944). Un estudio de los principales temas de la ló­


gica cuántica se encuentra en el capítulo 8 de Jammer (1974). Los ca­
pítulos 9 y 10 de Gibbins (1987) exponen ambos la naturaleza de la
pretendida lógica cuántica y ofrecen una crítica de esas posturas filo­
sóficas que consideran a la «lógica» cuántica como una revisión de la
lógica propiamente dicha. Hughes (1989) es también una buena fuen­
te sobre este tópico.
Para una variedad de teorías de variables ocultas véase Jammer
(1974), capítulo 7, y Belinfante (1973). Sobre la inseparabilidad de los
sistemas, Düspagnat (1971), parte 3, es excelente. Importantes artícu­
los originales de Bell se encuentran en Bell (1987).
Capítulo 5
REFLEXIONES SOBRE LA INTERDEPENDENCIA
DE LA FILOSOFÍA Y LA CIENCIA

Acabamos de explorar una abundante variedad de tópicos a los


que pueden aplicarse tanto los recursos de la física contemporánea
como los de la filosofía de la ciencia. La profusión de ejemplos y la
forma en que la física y la filosofía juegan un papel intrincadamente
entrelazado en su intento por llegar al fondo de las cuestiones plan­
teadas deberían convencer al lector de que la física y la filosofía son
dos formas sumamente interdependientes de tratar de entender el
mundo y nuestro lugar como conocedores del mismo.
Tradicionalmente, la filosofía ha intentado describir la naturaleza
del m undo en términos de máxima generalidad. Eludiendo la des­
cripción pormenorizada y la clasificación del gran número de fenó­
menos de la naturaleza, dejando esto como cometido a las ciencias
especiales, la filosofía se ha preocupado por la naturaleza del ser a
los niveles de máxima abstracción. ¿Existen particulares solamente, o
debemos postular universales, propiedades, como dotados de una
existencia propia? ¿Se agota la sustancia del universo en el ser mate­
rial, o debemos también tolerar un reino de existencia no material a
fin de dar cuenta de los fenómenos de la mente? Éstas son las clases
de preguntas que esperamos que planteen los filósofos.
La filosofía también ha considerado de su incumbencia el exa­
men crítico de las ciencias específicas. Aunque la ciencia infiere la
naturaleza del futuro y de lo inobservado a partir de los datos limita­
327
328 Filosofía de la física

dos de que disponemos por las observaciones realizadas hasta el mo­


mento, la filosofía se interesa por la justificación del razonamiento in­
ductivo que permite la proyección de un supuesto conocimiento más
allá del reino de lo observado. La ciencia reúne los resultados de ob­
servaciones, resultados gestados en los términos derivados en último
término del lenguaje de la experiencia cotidiana. Después explica
estos resultados haciendo referencia a un dominio de entidades teóri­
cas inobservadas y de propiedades de las mismas. La filosofía, por
contraste, inquiere sobre la legitimidad de dicha extrapolación allen­
de el reino de lo observable al reino de lo inobservable. ¿Cómo pue­
den racionalizarse o justificarse dichas inferencias? Profundizando
aún más, ¿cómo pueden los conceptos que pretenden hacer referen­
cia a lo inobservable tener siquiera un significado para nosotros, da­
do el papel que supuestamente juega la asociación de un concepto
con la experiencia en la fundamentación del significado?
La filosofía de la ciencia es a menudo caracterizada por reservar
para sí cuestiones en el reino de la metodología. Mientras la acumu­
lación real de resultados observacionales y su asimilación en teorías
explicativas generales ha de ser la tarea del científico en su disciplina
especial, es el filósofo de la ciencia quien ha de explorar los métodos
con los que la ciencia acomete su tarea. ¿Cómo se formulan, com­
prueban, aceptan y recusan las teorías en la ciencia? ¿Qué papel jue­
ga la confrontación con los datos? ¿Qué papel juegan elementos tales
como la simplicidad ontológica o la elegancia formal en el proceso
continuo de construcción y selección de teorías? ¿Cuáles son los me­
dios con los que el científico ofrece un entendimiento del mundo so­
bre la base de observaciones y teorización? ¿Cómo son las explicacio­
nes formuladas por el científico? ¿Cuáles son los recursos tras los
esquemas explicativos, y de qué manera la existencia de una explica­
ción científica nos aporta un mayor entendimiento de la naturaleza
del mundo? Pero, como hemos visto, la necesidad de teorías revolu­
cionarias en la física que traten de los fenómenos de la naturaleza a
los niveles de mayor generalidad y de mayor profundidad ha obliga­
do a los propios científicos a confrontar cuestiones del tipo justamen­
te que han sido tradicionalmente reservadas a los filósofos.
Cuando estamos tratando con las cuestiones más fundamentales
concernientes al espacio y el tiempo y al lugar que ocupan en la na­
turaleza, las cuestiones concernientes al tipo de ser que puede existir
y que puede ser invocado en nuestras descripciones explicativas pa­
Reflexiones sobre la interdependencia de la filosofía y la ciencia 329

san a un primer plano. Esto era ya obvio en el siglo xvn cuando,


como hemos visto, pensadores de la talla de Newton y Leibniz force­
jearon con las cuestiones metafísicas que parecían inextricables des­
de sus concepciones sobre la naturaleza del espacio y el tiempo. Aho­
ra, con las revoluciones en nuestras concepciones del espacio y el
tiempo a las que nos hemos visto forzados por la teoría especial de la
relatividad y la teoría general de la relatividad, estas viejas cuestiones
sobre la substantividad del espacio y el tiempo han resurgido. Pro­
fundizando aún más, como hemos visto, pensadores tales como Bohr,
confrontados con los extraños fenómenos a los que la mecánica
cuántica debe hacer justicia, han encontrado necesario ocuparse de
cuestiones concernientes a la objetividad misma del m undo como
una entidad supuestamente independiente de las acciones acometi­
das por quienes intentan llegar a conocer su naturaleza. Las viejas
cuestiones filosóficas de la autonomía del m undo respecto a nuestra
comprensión sensible e intelectual del mismo, cuestiones con las que
se debatió, por ejemplo, Kant, pasan a formar parte de una tentativa
de entender el formalismo de la teoría diseñado para tratar los insóli­
tos hechos sobre la interacción de la materia con la radiación de los
que la mecánica cuántica debe ocuparse.
Hemos visto asimismo que el enfoque epistemológico crítico de
la filosofía ha jugado un papel en los fundamentos de algunas de
estas teorías físicas contemporáneas. Aunque los espacio-tiempos re­
volucionarios de las teorías especial y general de la relatividad surgen
en parte de la necesidad de nuevas descripciones del espacio y el
tiempo que hagan justicia a los hechos experimentales recientemente
descubiertos acerca del comportamiento de la luz, el movimiento de
las partículas, y los resultados de mediciones con relojes y varas de
medir, un papel igualmente importante en la formulación de estas
teorías es jugado por el examen crítico de los conceptos desde el
punto de vista epistémico. Este programa crítico alcanza su culmina­
ción en el trabajo de Einstein. Einstein nos incita una y otra vez a la
discusión teórica pidiéndonos que reflexionemos sobre el significado
de nuestros términos básicos referentes al espacio y al tiempo. Nos
pide que consideremos el funcionamiento de estos términos en nues­
tras teorías, haciendo especial hincapié en el grado en que nuestras
teorías aceptadas están fundamentadas en hechos del mundo que
nos son verdaderamente accesibles epistémicamente. Haciendo uso
de un examen crítico de los términos e hipótesis que depende de
330 Filosofía de la física

una exploración de los límites de nuestra conciencia epistémica del


mundo, Einstein revigoriza las teorías físicas a nuestra disposición
para tratar de la estructura espacial y temporal del mundo. En la ten­
tativa de resolver las características aparentemente paradójicas del
m undo que nos describe la mecánica cuántica, encontramos de nue­
vo pensadores como Bohr y Heisenberg intentando convencernos de
que un entendimiento correcto de la teoría, y del m undo que ésta
describe, nos exige dar marcha atrás y reflexionar sobre nuestra capa­
cidad de llegar a conocer el mundo. Esta reflexión se hace desde una
perspectiva crítico-epistemológica.
A modo de ejemplo de cómo los resultados de la física requieren
un replanteamiendo de algunas cuestiones metodológicas, podríamos
considerar la forma en que la mecánica estadística muestra que hay
modos de explicación de los fenómenos que parecen requerir mode­
los de explicación estadística de sorprendente originalidad. El papel
de las probabilidades en la mecánica estadística, la razón de su atri­
bución a los microestados de ciases particulares de sistemas, su papel
en dar cuenta de los fenómenos macroscópicos de los que se ocupa
la termodinámica, y la relación de estas probabilidades con las conse­
cuencias de tipo estadístico derivadas de las leyes de la dinámica
subyacentes, todo esto muestra la pertinencia de un replanteamiento.
Debemos pensar enérgicamente sobre la relación de las condiciones
iniciales con las leyes, y sobre el papel que ambas juegan en la expli­
cación de por qué sucede lo que sucede en el mundo. Hemos visto
también cómo las consecuencias de la mecánica cuántica, como las
pruebas de imposibilidad de variables ocultas locales, sugieren que la
ciencia nos ha impuesto una nueva actidud hacia lo que constituye
una explicación completa de las correlaciones descubiertas entre
unos fenómenos y otros cuando estos fenómenos no están en interac­
ción causal en el momento en que ocurren. De hecho, la naturaleza
mism j de la causalidad y cómo ésta ha de ser buscada e invocada en
la ciencia adquieren una apariencia diferente en el contexto cuántico.
No podemos esperar, pues, hacer filosofía sin referencia a los re­
sultados de la física. Que esto es cierto para la metafísica, la investiga­
ción en la naturaleza del m undo a los niveles de la mayor generali­
dad, parece de lo más obvio. Es evidente que nuestro entendimiento
de las clases fundamentales de cosas y propiedades que debemos
postular para abarcar la naturaleza del m undo debe tomar en cuenta
lo que la ciencia nos dice sobre el mundo. Repetidas veces la filoso­
Reflexiones sobre la interdependencia de la filosofía y la ciencia 331

fía que intenta razonar a priori,


con independencia de los datos de la
observación y el experimento, y llegar a conclusiones sobre cómo
debe ser el mundo, se ha visto turbada por las revelaciones de la
ciencia. Esto nos ha hecho ver lo limitada que ha sido la imaginación
de los filósofos aprioristas al pretender delimitar el reino de las posi­
bilidades para la naturaleza del mundo. Sin los resultados de la física,
¿qué filósofo habría considerado la amplia variedad de posibilidades
para la naturaleza del espacio y el tiempo, de la causalidad, y de las
clases de objetividad y su carencia que las recientes teorías radicales
de la física han postulado como posibilidades para nuestra considera­
ción?
Pero no es la metafísica la única que debe prestar atención a los
resultados de la ciencia. Muchos filósofos de la teoría del conoci­
miento han argumentado en los últimos años que la esperanza en
una teoría racionalizada y apriorísticamente formulada de la inferen­
cia a la verdad es también una proposición dudosa. Al decidir cuáles
son las reglas razonables para ser utilizadas en desentrañar la verdad,
han argumentado, debes valerte de tus mejores intuiciones sobre la
naturaleza del mundo cuyas verdades estás intentado desvelar. Pero,
si esto es así, sin duda debemos tomar en consideración esas teorías
de las ciencias, sea la física fundacional o la neuropsicología y las
ciencias cognitivas de la percepción y el pensamiento, que nos dicen
lo que sabemos sobre la naturaleza del mundo que estamos intentan­
do descubrir y sobre nuestra relación con el mismo como percepto­
res y teorizadores. Como hemos visto, nuestra misma noción de lo
que significa comprender ese mundo, entender sus mecanismos y
aportar descripciones explicativas de lo que sucede en él dependerá
mismamente de la propia naturaleza de ese mundo. Así, en sus come­
tidos epistemológicos y metodológicos, la filosofía necesitará referirse
continuamente a lo que las ciencias avanzadas, incluyendo la física
fundacional, nos dicen sobre el mundo.
Es importante observar que esta dependencia respecto a las cien­
cias no es una mera dependencia de las mismas como fuentes de
datos básicos solamente. Por supuesto, los resultados observacionales
que empujan a la ciencia de la física a la invención de las radicales y
noveles teorías que hemos estado examinando son cruciales en lo
que a su impacto sobre la filosofía respecta. Pero también la capaci­
dad de los practicantes de estas ciencias de imaginar nuevos esque­
mas conceptuales que toman en cuenta los nuevos datos proporciona
332 Filosofía de la física

a la filosofía un espectro de incomparable riqueza de nuevas formas


conceptuales de tratar con el mundo. Las imaginaciones de científi­
cos como Boltzmann, Einstein y Bohr son la fuente de formas de
pensamiento completamente nuevas acerca de la naturaleza de la rea­
lidad, nuestro conocimiento de ella y nuestra capacidad para dar una
descripción explicativa de la misma. Ellas proporcionan una fuente in­
comparablemente fértil de enriquecimiento al filósofo que busca
nuevas formas de tratar los problemas tanto viejos como nuevos, pre­
sentados por el mundo de la experiencia.
Pero si la filosofía debe prestar una atención detenida a los resul­
tados de la física fundacional, está claro que la física fundacional pre­
senta a su vez una dependencia de la filosofía. Al explorar las raíces
de las teorías fundacionales en el corazón de la física moderna, he­
mos visto una y otra vez que la formulación de estas teorías no se re­
duce a una extrapolación trivial por un razonamiento obvio de los
datos observacionales. Antes bien, la formulación de una teoría apro­
piada y la justificación suministrada por esa elección, cuando se
adopta una postura teórica particular y se defiende contra las críticas,
depende de los tipos de razonamiento que los filósofos han explora­
do y debatido. Esto puede verse claramente, por ejemplo, en las justi­
ficaciones tras las teorías especial y general de la relatividad ofrecidas
por Einstein y en las tentativas de Bohr por proporcionar un enten­
dimiento coherente del formalismo de la mecánica cuántica. Aquí
cuestiones filosóficas tales como la indistinción entre las consecuen­
cias de una teoría comprobables por la observación y aquellas inm u­
nes a la confrontación; el papel del examen crítico de los significados
de los conceptos no observacionales de las teorías; la justificación de
principios para la elección de teorías que descansan en consideracio­
nes como la de simplicidad ontológica; la conveniencia de generaliza­
ciones para proporcionar explicaciones auténticas de los fenómenos;
y la cuestión de cuándo una explicación puede ser considerada defi­
nitiva, juegan todas ellas un papel crucial en el seno de la dialéctica
científica que lleva a la formulación y aceptación de teorías. Es como
si cuestiones tradicionalmente filosóficas tuviesen que pasar a formar
parte del pensamiento científico mismo cuando las teorías científicas
bajo consideración son de una generalidad y fundamentalidad tan
notables como las que hemos discutido en los capítulos precedentes.
En cierta época, los físicos teóricos recibían normalmente una
formación en filosofía y su historia. En aquellos tiempos, podía en­
Reflexiones sobre la interdependencia de la filosofía y la ciencia 333

contrarse referencia explícita al tipo de razonamiento filosófico que


respaldaba el razonamiento físico en los trabajos de algunos de los
grandes científicos. Einstein y Bohr proporcionan dos ejemplos no­
tables. Aunque la especialización de la formación académica en las
décadas recientes ha hecho que dicha familiaridad con la filosofía
tradicional sea menos habitual entre los científicos, incluidos los
científicos más teóricos, la necesidad del tipo de pensamiento filosó­
fico que hemos venido discutiendo como parte del pensamiento
científico se ha hecho ahora clara. Esto es así independientemente de
que el científico quiera o no afrontar el hecho. Evidencia de ello
puede verse en el tipo de pensamiento cuasi-filosófico que ha pasado
a formar parte de la especulación cosmológica y la teorización sobre
elbig bang en la cosmología científica.
El hecho de que las teorías científicas mismamente estén basadas
en un pensamiento de tipo filosófico, ya se haga esto explícito en la
historia científica o sólo implícito y esperando a ser desenterrado por
el historiador y el filósofo, significa también que uno debe estar aler­
ta ante la tentativa demasiado ingenua de resolver cuestiones filosófi­
cas tradicionales haciendo referencia a los resultados de la ciencia.
Los argumentos en el sentido de que un resultado dado de la ciencia
resuelve conclusivamente una cuestión filosófica tradicional en una
dirección u otra pierden de vista con demasiada frecuencia la forma
en que ciertas presuposiciones filosóficas implícitas se han insertado
en la teoría que está siendo utilizada para resolver el debate. Si se h u ­
bieran hecho otras elecciones filosóficas en la ciencia misma, las im ­
plicaciones de la ciencia para la filosofía podrían parecer de hecho
muy diferentes.
En cualquier caso, está bastante claro que en sus niveles de máxi­
ma generalidad y en sus tentativas de tratar a la naturaleza en su ni­
vel más fundamental, la ciencia es una disciplina que en su naturale­
za no puede ser diferenciada radicalmente de la filosofía. Y la mejor
forma de hacer filosofía es utilizar un método que, como la ciencia,
siempre remita en su teorización a la naturaleza de las cosas según
nos es revelada por esa refinada experiencia que llamamos observa­
ción científica y experimento.
BIBLIOGRAFÍA

Albert, D., y B. Loewer (1990), «W anted Dead or Alive: Two Attempts to


Solve Schródinger’s Paradox», en Fine, M. Forbes y L. Wessels eds.,
PSA-1990, vol. 1. East Lansing, M I, Philosophy of Science Association.
Alexander, H., ed. (1956), The Lebtiiz-Clarke Correspondence, Manchester,
Manchester University Press.
Anderson, J. (1967), Principies of Relativity Pbysics, Nueva York, Academic
Press (*).
Arnold, V., y A. Avez (1968), Ergodic Problems of Classical Mechanics, Nueva
York, Benjamín (**).
Barbour, J. (1989), Absolule or Relative Motion?, vol. 1, The Discovery of Dyna­
mics, Cambridge, Cambridge University Press.
Batterman, R. (1990), «Irreversibility and Statistical Mechanics: A New Ap-
proach?», Philosophy ofScience, 57, 395-419.
— (1991), «Randomness and Probability in Dynamical Theories: O n the
Proposals of the Prigogine School», Philogophy ofScience, 57, 241-263.
Belinfante, F. (1973), A Survey of Hidden Variable Theories, Nueva York, Per-
gamon (*).
Bell, J. (1987), Speakable and Wnspeakable in Quantum Mechanics, Cambridge,
Cambridge University Press.
Bohm, D. (1951), Quantum Theory, Englewood Cliffs NJ, Prentice-Hall (*)•
— (1989), The Epecml Theory ofRelativity, Reading, MA, Addison-Wesley.

Las obras que requieren algún conocimiento previo de matemáticas y física teóri­
ca (por ejemplo, en un nivel de estudiante universitario) van señaladas con un asteris­
co (*). Lo s textos que precisan de una mayor familiaridad con conceptos técnicos y
métodos se señalan con dos asteriscos (**).

335
336 Bibliografía

Brush, S. (1965), Kinetic Theory, Oxford, Pergamon Press.


— (1976), TheKindofMotion Tbat WeCallHeat, Amsterdam, North-Holland.
Buchdahl, H. (1966), The Concepts of Classical Thermodynamics, Cambridge,
Cambridge University Press (*).
Cramér, H. (1955), The Elements of Probabihty Theory and Some of Its Applica­
tions, Nueva York, John Wiley.
Davies, P. (1974), The Physics of Time Asymmetry, Berkeley, University o f Cali­
fornia Press.
D ’Espagnat, B. (1971), Conceptual Foundations of Quantum Mechanics, Menlo
Park, CA, Benjamín (**).
Devaney, r. (1986), An Introduction to Chaotic Dynamical Systems, Menlo Park,
CA, Benjamin-Cummings (**).
Dicke, R., y J. Wittke (1960), Introduction to Quantum Mechanics, Reading,
MA, Addison-Wesley (*).
Dirac, P. (1930), The Principies of Quantum Mechanics, Oxford, Oxford U ni­
versity Press (*).
Earman, J. (1974), «An Attempt to A dd a Little Direction to 'The Problem of
the Direction of Time’», Phylosophy ofScience, 41, 15-47.
— (1986), A Primer ofDeterminism, Dordrecht, D. Reidel.
— (1989), World-Enough andSpace-Time, Cambridge, MA, M IT Press.
Eddington, A. (1920), Space, Time and Gravitation, Cambridge, Cambridge
University Press.
Ehrenfest, P., y T. Ehrenfest (1959), The Conceptual Foundations of the Statisti-
calApproach in Mechanics, Ithaca, N Y , Cornell University Press (*).
Einstein, A., et al. (1923), The Principie ofRelativity, Nueva York, Dover.
Farquhar, I. (1964), Ergodic Theory in Statistical Mechanics, Nueva York, John
Wiley (*).
Feller, W . (1950), An Introduction to Probability Theory and Its Applications,
Nueva York, John Wiley (*).
Friedman, M. (1983), Foundations of Space-Time Theories, Princeton, Princeton
University Press (*).
Geroch, R. (1978), General Relativity from A to B, Chicago, University of C hi­
cago Press.
Ghirardi, G., A. Rm ini y M. W eber (1986), «Unified Dynamics for Microsco­
pio and Macroscopic Systems», Physical Review, D 34, 470-479 (*).
Gibbins, P. (1987), Particles and Paradoxes, Cambridge, Cambridge University
Press.
Gibbs, J. (1960), Elementary Principies in Statistical Mechanics, Nueva York,
Dover (*).
Gleick, J. (1987), Chaos: Mabinga New Science, Nueva York, Penguin Books.
Gottfried, K. (1960), Quantum Mechanics, Nueva York, Benjamín (*).
Graves, J. (1971), The Conceptual Foundations of General Relativity Theory,
Cambridge, MA, M IT Press.
Bibliografía 337

Grünbaum , A. (1973), Philosophical Problems of Space and Time, 2d ed., Dor-


drecht, Reidel.
Hawking, S., y G. Ellis (1973), The Large Scale Structure of Space-Time, Cam­
bridge, Cambridge University Press (**).
Healy, R. (1989), The Philosopby of Quantum Mecbanics, Cambridge, Cambrid­
ge University Press.
Heisenberg, W . (1930), The Physical Principies of the Quantum Theory, Nueva
York, Dover.
Hobson, A. (1971), Concepts in Statistical Mecbanics, Nueva York, G odon and
Breach.
Horwich, P. (1983), Asymmetries in Time, Cambridge, Massachusetts, M IT
Press. , ,
Hughes, R. (1989), The Structure and Interpretation of Quantum Mecbanics, Cam­
bridge, Massachusetts, Harvard University Press.
Humphreys, P. (1989), The Chances of Explanation, Princeton, Princeton U n i­
versity Press.
Jammer, M. (1954), Concepts ofSpace, Cambridge, Cambridge University Press.
— (1966), The Conceptual Development of Quantum Mecbanics, Nueva York,
McGraw-Hill.
— (1974), The Philosopby ofQuantum Mechanics, Nueva York, John Wiley.
Jancel, R. (1963), Fundatíons of Classical and Quantum Statistical Mechanics, O x ­
ford, Pergamon Press (*).
Jauch, J. (1968), Foundations of Quantum Mechanics, Reading, Massachusetts,
Addison-Wesley (**).
Jaynes, E. (1983), Papers on Probability, Statistics and Statistical Pbysic, Dor-
drecht, Reidel.
Jordán, R. (1969), Linear Operators for Quantum Mechanics, Nueva York, John
Wiley (*).
Kant, I. (1929), The Critique of Puré Reason, trad. de M. Kemp Smith, Nueva
York, Macmillan.
— (1950), Prolegomenon to Any Future Metaphysic, Nueva York, Liberal Arts
Press.
Katz, A. (1967), Principies ofStatisticalMechanics, San Francisco, Freeman (*).
Kochen, S. (1985), «A New Interpretation of Q uantum Mechanics». En P.
Lahti y P. Mittelstaedt, eds. Symposium on the Foundations of Modem
Physics, Teaneck, NJ, W orld Scientific Publishing (*).
Kolmogorov, A. (1950), Foundations of the Theory of Probability, Nueva York,
Chelsea (*).
Krylov, N. (1979), Works on the Foundations of Statistical Physics, Princeton,
Princeton University Press.
Kyburg, H. (1970), Probability and Inductive Logic, Londres, Macmillan.
Lucas, J., y P. Hodgson (1990), Spacetime and Electromagnetism, Oxford, O x ­
ford University Press.
338 Bibliografía

Luwig, G. (1968), W'aveMechanics, Oxford, Pergamon Press.


Mehlberg, H. (1980), Time, Causality and the Quantum Theory, Dordrecht, D.
Reidel.
Mellor, D. (1981), Real Time, Cambridge, Cambridge University Press.
Misner, C., K. Thorne y J. Wheeler (1973), Gravitation, San Francisco, Free-
man (**).
Moller, C. (1952), The Theory of Relativity, Oxford, O x ford University
Press (*)•
Nerlich, G. (1976), The Shape of Space, Cambridge, Cambridge University
Press.
Newton-Smith, W . (1980), The Structure ofTime, Londres, Routledge and Ke-
gan-Paul.
Pagels, J. (1982), TheCosmicCode, Nueva York, Bantam Books,
Pensorse, R. (1979), «Singularities and Time Asymmetry». En S. Hawking y
W . Israel, eds., General Relativity: An Einstein Centenary Survey, Cambridge,
Cambridge University Press.
Pippard, A. (1961), The Elements of Classical Thermodynamics, Cambridge,
Cambridge University Press.
Poincaré, J. (1952), Science and Hypothesis, Nueva York, Dover.
Prigogine, I. (1980), Frotn Being to Becoming, San Francisco, Freeman.
— (1984), Oder Out ofChaos, Nueva York, Bantam Books.
Putnam, H. (1967), «Time and Physical Geometry», Journal of Philosophy, 64,
240-247.
Rae, A. (1986), Quantum Physics: IIlusión or Reality?, Cambridge, Cambridge
University Press.
Reichenbach, H. (1944), Philosophic Foundations of Quantum Mechanics, Berke-
ley, University of California Press.
— (1956), TheDirection ofTime, Berkeley, University of California Press.
— (1958), The Philosophy ofSpace and Time, Nueva York, Dover.
Rietdijk, C. (1966), «A Rigorous Proof of Determinism from the Special
Theory o f Relativity», Philosophy ofScience, 33, 341-344.
Ridnler, W . (1977), EssentialRelativity, Nueva York, Springer-Verlag (*).
Salmón, W . (1984), Scientific Explanation and the Causal Structure of the World,
Pripceton, Princeton University Press._
Schoroeder, M. (1991), Fractals, Chaos, Power Laws, Nueva York, Freeman (*).
Sinai, Y. (1976), Introduction to Ergodic Theory, Princeton, Princepton Univer­
sity Press (**).
Sklar, L. (1974), Space, Time, and Spacetime, Berkeley, University of California
Press.
— (1985), Philosophy and SpacetimePhysic, Berkeley, University California Press.
— De próxima publicación, The Physics of Chance, Cambridge, Cambridge
University Press.
Smart, J., ed. (1964), ProblemsofSpace and Time, Nueva York, Macmillan.
Bibliografía 339

Squires, E. (1986), The Mystery ofthe Quantum World, Bristol, Adam Hilger.
Stein, J. (1991), «O n Relativity Theory and Openness of the Future», Philo-
sophy ofScience, 57, 147-167.
Synge, J. (1956), Relativity: the Special Theory, Amsterdam, North-Holland (*).
Taylor, E., y J. Wheeler (1963), Spacetime Physics, San Francisco, Freeman.
Tolman, R. (1934), Relativity, Thermodynamics and Cosmology, Oxford, Oxford
University Press.
— (1938), The Principies of Statistical Mechanics, Oxford, Oxford University
Press (*).
Toretti, R. (1978), The Philosopby of Geometry from Riemann to Poincaré, Dor-
drecht, Reidel.
— (193), Relativity and Geometry, Oxford, Pergamon Press (*).
Van Fraasen, B. (1970), An Introduction to the Philosopby of Time and Space,
Nueva York, Random House.
— (1991), Quantum Mechanics: An Empiricist View, Oxford, Oxford Univer­
sity Press (*).
Von Neumann, J. (1955), Mathematical Foundations of Quantum Mechanics,
Princeton, Princeton University Press (**).
W ald, R. (1984), General Relativity, Chicago, University of Chicago Press (*).
Wheeler, J., y W . Zurek, eds. (1983), Quantum Theory and Measurement, Prin­
ceton, Princeton University Press (*).
Winnie, J. (1977), «The Causal Theory of Space-Time», en J. Earman, C.
Glymour y J. Stachel, eds., Foundations of Space-Time Theories, Minnesota
Studies in the Philosopby of Science, vol. 8, Minneapolis, University o f M in ­
nesota Press.
ÍNDICE ANALÍTICO

Aceleración y teoría cuántica de campos, 193, 194,


y espacio-tiempo de M inkowski, 60, 195
62 (figura), 64, 115-116 y teoría de K rylo v, 207
y espacio-tiempo neo-newtoniano, 66 en termodinámica, 167-168, 174-176,
y gravedad, 67, 68, 69, 70, 71, 99-1003 180-181, 191, 192, 193, 224
teoría de Newton, 42, 67, 115-116 Astronomía, 28, 50, 67-68. Véase también
y teorías de la relatividad, 44-45. 47, movimiento planetario
60, 61 (figura), 64-65 Átomos, 233-240. Véase también mecánica
Véase también movimiento cuántica, teoría cuántica
y velocidad de la luz, 47-50, 52, 94, 98 Agustín, san, 36
Véase también luz, naturaleza de la
Aditividad contable, 142
Agujeros negros, 82, 83 Bacon, F., 168
Albert, D., 282 Banda de Mobius, 81 (& figura)
Antirrelacionism o, 42-47 Bell, J., 314
Aristóteles, 13, 14, 39, 152,219 Bernoulli, J., 168
Aritmética, 29, 30, 31, 32 Birkhoff, G „ 285, 286
Asim etría temporal Bohr, Niels, 29, 259, 260, 329, 330
y aproximación al equilibrio, 196-197, acerca de la descripción cuántica, 262,
2 0 1 ,2 0 2 ,2 0 3 263, 298, 299, 307
y asimetría entrópica, 217-219, 224- y naturaleza del átomo, 236, 237, 238
227 Véase también Interpretación de C o ­
y cosmología, 209-214, 215 penhague
y macróentropía, 221-222 Boltzmann, L . Véase ecuación de Boltz
y mezcla, 202-203 mann
y preparación, 206-207 B o ly a iJ., 72, 73
y modelo de Prigogine, 206, 208 Born, M., 238, 241-242, 261, 275-276

341
342 Indice analítico

Calor. VVa.it- termodinámica Corrim iento al rojo gravitacional, 71 (fi­


Carnot, S., 165 gura)
Causalidad Críticas epistemológicas, 19-20, 134-136,
asimetría de, 222-225 329. Véase tambiénmetodología
y asimetría entrópica, 217-218, 221- Curva de concentración, 172-174, 173
222 (figura), 191
y condicionales contrafactuales, 222- Cosmología, 16-17, 79-83, 209-214, 333
224 Véase tambiénteoría del big bang
y curvatura del espacio-tiempo, 79- Condicionantes contrafactuales, 222-
82 224
y determinismo, 293-296, 322-323 Curvatura del espacio-tiempo, 55
y espacio-tiempo, 134-137 y conservadurismo metodológico, 96-
y explicación, 152-155, 157-161 97
y espacio-tiempo de Minkowslci, 64- y cosmología, 79-83
65, 133(figura) y universos vacíos, 120
y mecánica cuántica, 24, 293-296, 322, y gravedad, 70-71, 75-81, 78 (figura),
329-330 83-85
y metafísica, 31-32 y geometrías no-euclídeas, 72-81
y teoría cuántica, 19, 250 y hechos observables, 94-95
teorías del espacio-tiempo de Robb, y simplicidad teórica, 98-99
127-131 Véase también relatividad, teoría gene­
y topología del espacio-tiempo, 131- ral de la
134, 132 (figura), 133 (figura), 135
Church, A., 147
Cinemática, 45-46 D e Broglie, L ., 234
Clausius, R., 165, 168 De Laplace, P. S., 123-124, 125, 293
Clifford, W „ 76 Descartes, René, 226
Complementariedad, 252-254 Determinismo
Conjuntos, 175-177 argumento de inseparabilidad de
Conocimiento, 14-15, 331 Einstein-Podolsky-Rosen, 307-314,
en la filosofía griega clásica, 27-29 310 (figura)
asimetría de, 222 y causalidad, 293-295, 222-223
e Interpretación de Copenhague, 251- y física clásica, 292, 293, 294
255 e Interpretación de Copenhague, 297-
equivalencia estructural, 102-107 300, 307-309, 321
geometría como paradigma de, 28-30, Teorema de Bell, 314-323
31, 32, 33, 85-87, 106-109 y teoría general de la relatividad, 123-
y metodología, 31, 95-97 127
pragmatismo, 105-107 y mecánica cuántica, 126, 295-306,
y teoría cuántica, 261-263, 270 305 (figura), 307-309, 321-324
teorías positivistas, 99-103 teoría de von Neumann, 299-301,
y escepticismo, 30, 31, 32, 95, 99, 101, 302-303
105-106 Dinámica, 21, 46, 169, 249-253, 263,
simplicidad teórica, 61-63, 64-65 264
Véase también explicación; medida; tó­ Dios, 4 1 ,42
picos específicos Dirac, P., 249-250, 256, 285-286
Conos de luz, 57-58 Distribución de materia, 121-122
Contracción de longitudes, 50-52, 59 Distribuciones compuestas, 284
Indice analítico 3-43

Ecuación de Boltzmann, 168-173, 173 y teoría general de la relatividad, 24,


(figura), 182 328, 329
y cosmología, 209, 210, 212 y gravedad, 68-69
y curva de concentración, 173-174, teoría de Leibniz, 38-42
173 (figura), 191 y metafísica, 110-112
y dirección del tiempo, 172, 173, 214, teoría de Newton, 42, 44, 45, 46, 54,
216-227 58, 61, 64, 115, 116
clarificación por los Ehrenfest, 170, no orientabilidad, 81-82
189, 191, 202 teoría de Poincaré, 88-89, 91-92
y concepción ergódica, 175-180 y posibilidad, 40, 41, 42, 43
derivación rigurosa de la, 201, 202- y teoría especial de la relatividad, 19,
203 47-55, 328-329
e Hipótesis Relativa a los Núm eros de Véase también entradas a geometría; mo­
Colisión, 179-180, 191-192 vimiento; entradas a relatividad; es­
y naturaleza de la luz, 233-234 pacio-tiempo
y Ley de W ien , 233-234 Espacio-tiem po, 55-65, 56 (figura)
Eddington, A., 226-227 y asimetría entrópica, 210-211, 216-
Efecto Doppler, 70 219
Efecto fotoeléctrico, 234 y causalidad, 64-65, 80-81, 127-137,
Ehrenfest, P , 170, 189, 191, 202 132 (figura), 133 (figura)
Ehrenfest, T „ 170, 189, 191, 202 y cuestiones epistemológicas, 329,
Einstein, Aibert, 20, 21, 46, 47, 70, 224, 330,331
234, 259, 260 y metafísica, 111-138
acerca de la Interpretación de C o pen­ neo-newtoniano, 65-67, 82-83
hague, 251, 254 y debate sustantivista-relacionista,
acerca del determinismo, 297, 307, 123-127
308, 309 y teoría machiana, 118-122
argumento de inseparabilidad, 307- topología de, 130-134, 132 (figura),
314, 310 (figura) 133 (figura), 134-135
Véase también entradas a relatividad; es­ Véase también curvatura del espacio-
pacio-tiempo tiempo; entradas a relatividad
Electromagnetismo, 21, 118, 123-124, Espacio-tiem po de M inkow ski, 55-64, 56
218-219, 2 2 5,23 3 (figura)
Ellio t, T . S., 293 y aceleración, 61, 62 (figura), 64, 115-
Energía de conservación, Véase Prim era 117
Ley de la Term odinám ica y causalidad, 63-64, 133 (figura)
Entropía, 195,210, 220, 221 y determinismo, 125
asimetría de la, 210, 211, 213, 216- y espacio-tiempo neo-newtoniano, 65,
220, 222, 226-228 82-83
véase también asimetría temporal y geometría, 57-58, 66, 78
Equivalencia estructural, 102-105 y teoría general de la relatividad, 121
Equivalencia masa-energía, 61, 123 Espacio-tiempo galileano. Véase espacio-
Escepticism o, 30, 31, 32, 33, 95-96, 99- tiempo neo-newtoniano
101, 105-106 Espacio-tiempo neo-newtoniano, 64-67,
Espacio, 22-23, 32-34 83
como continente de la materia, 34-35, Espectroscopia, 309-310
39-41, 43-44, 45-47 Estados de equilibrio, 165-167
y estados de equilibrio, 174-176 y cosmología, 209-214
344 índice analítico

concepciones ergódicas, 175-181, 177 y física moderna, 16-22


(figura), 181-185, 186 (figura), 187, y ciencia, 13-16, 327-333
188 Véase también tópicos específicos
explicación de, 146-147 Filosofía griega clásica, 13, 14, 27-29, 292.
Teorema K A M , 186 (figura), 186-189, Véase también filósofos específicos
200 Fuerzas inerciales, 43, 45-47, 115-117,
y teoría cinética del calor, 168-176, 118-120. Véase tambiénaceleración;
170 (figura), 171 (figura), 172 (figu­ movimiento
ra)
Véase también estados de equilibrio,
aproxim ación a los G alilei, G alileo, 42, 47, 53, 61, 67, 68, 87
Estados de equilibrio, aproximación a Gato de Schródinger, 268 (figura), 268-
los, 189-191, 190 (figura) 270, 271
y aislamiento de sistemas, 191-193 Gauss, K .F., 72, 73, 74, 82
experimento del eco-espín, 192-193, G eneralización, 160-162, 180, 295. Véase
194 (figura) también conocim iento; metodología,
y cosmología, 209-214 reducción
problema de la distribución inicial de Geodésicas, 77, 78 (figura), 79-80, 82-84,
probabilidad, 202-210, 204 (figura) 94, 101-102
mezcla, 198-203, 199 (figura), 206-207 Geometría. Véasegeometría euclídea; geo­
teorías no estándar, 191-196 metría no-euclídea; conocimiento
Postulado de Caos M olecular, 179, Geom etría euclídea
181, 191, 197 como paradigma del conocimiento,
modelo de Prigogine, 206, 207, 208 29-30,31-33,85-87, 107-108
teorías estándar, 195-203 y espacio-tiempo de M inkowski, 56,
Véase también estados de equilibrio 57, 58, 64, 65, 66
Euclides, 72, 73 Véase también
geometría y naturaleza del espacio, 34-35, 41-42,
Everett, H ., 280, 281 45-46
Experim ento de la doble trayectoria, teoría de Poincaré, 88-91
242-244, 245 (figura) Geom etría no-euclídea, 70-83
Experim ento de las dos rendijas, 242- y conocim iento, 85-87, 107-109
243, 244 (figura), 247, 260-261, 265- teoría de Poincaré, 88-96, 100
266, 290-291 y teoría especial de la relatividaár'7’8-
y lógica, 284-285, 289-290 79, 107-108
Experim ento de Michelson-M orley, 49, G ib b s J ., 176, 189, 190, 197
(figura) Gleason, A., 303
Experim ento del eco-espín, 193, 194 (fi­ G ódel, K., 121, 122 (figura)
gura) Gravedad
Experim ento de Stern-Gerlach, 246, 248 y aceleración, 67, 68, 69, 98-100
(figura), 263, 2 7 1,27 8 V curvatura del espacio-tiempo, 70,
Explicación, 155-163, 187, 214-215. Véa­ 75-80, 78 (figura), 82-84
se también
conocimiento y entropía, 210, 211, 217-219
y hechos observables, 92-93, 95-97
y mecánica estadística, 191-192
Filosofía y dilatación del tiempo, 72-73, 79-80
historia de, 13-16, 21, 27-31 Véase también relatividad, teoría gene­
importancia de la física para, 21-24, ral de
331-334 G recia. Véase filosofía griega clásica
Indice analítico 345

Hechos observables, 22-23, 47, 108-109, Intervalo temporal coordenado, 60-61


254, 331 Irreversibilidad, 215-217
y conocimiento, 27, 29-30, 31, 87, 88, y enfoques ergódicos, 182-185
89-92 y teorema K A M , 185, 186, 187, 198
y estados de equilibrio, 172-174 y teoría cuántica de campos, 192-194
y gravedad, 92, 95-97 Véase también estados de equilibrio,
y lenguaje, 99-102 aproximación a; asimetría temporal.
teoría de Poincaré, 88-91, 93-96, 98
y Principio de incertidumbre, 21-22,
205 Jordán, P., 238
Véase tambiénconocimiento; medida;
tópicos específicos
Heisenberg, W „ 237, 238, 239, 249, 256, Kant, Immanuel, 14, 30, 31, 46, 329
257, 258, 285, 330. Véase también acerca de la causalidad, 31, 294-295
P r in c ip ió le Incertidum bre y geometrías no-euclídeas, 85-87, 88,
Herepath, J., 168 89, 107-108
Hipótesis ergódica, 176-178, 177 (figura), Kepler, Johannes, 67, 68, 80
183-184 Kochen, S„ 277, 279, 283, 303
Hipótesis Relativa a los Números de C o ­ Krónig, A., 168
lisión, 179, 191-192 Krylov, N , 204, 205
Hume, David, 30, 31, 153, 159, 294
Huyghens, C., 232
Lenguaje, 100-103, 104-106
Ley Cero, 167
Inferencia, reglas de. Véase
generaliza­ Ley de irreversibilidad. Véase Segunda
ción; conocimiento; metodología; Ley de la Term odinám ica
hechos observables; reducción Ley de Planck, 234, 236
Interacción mente-cuerpo, 270, 274, 275, Ley de un gas ideal, 168-169
282 L ey distributiva, 286-287
Interferencia, 241-249, 262, 269, 273, L e y de Rayleigh-Jeans, 234
275, 276, 290-291,324 L e y de W ien, 233, 234
Interpretación de Copenhague, 21, 251 - Leyes de los Grandes Números, 143,
255, 283, 291 144, 145, 183
y argumento de inseparabilidad de Leibniz, Gottfried W ilhelm von, 14, 46,
Einstein-Podolsky-Rosen, 307-308, 125, 294, 329
311,312-315 y causalidad, 128, 129, 130, 131, 135,
y determinismo, 297-299, 307-309, 322
320-321 y espacio-tiempo, 38-42, 115-117
y distribuciones compuestas, 284-285 Lew is, D , 222, 223
e interpretación por interacción de Lím ite de G rado de Boltzmann, 201,
Kochen, 277, 279 202, 203
e interpretaciones de «muchos mun­ Lobachevsky, N .I., 72, 90
dos», 280, 281 Locke, John, 277
y la medición como interacción física, Loewer, B., 282
271-272, 274-275, 276 Lógica, 14, 283-289
Respuesta de Schródinger, 266-269 Lógica booleana, 286-289
Interpretación de las «muchas mentes», Lorentz, H ., 20
282 Loschmidt, J., 171 (figura)
346 índice analítico

Luz interpretación de los «muchos mun­


naturaleza de la, 231-241, 236 (figura), dos», 279-280, 323-324
323-324 interpretación por interacción de K o ­
velocidad de la, 46-53, 62-63, 94, 98-99 chen, 277-279, 282
interpretaciones idealistas, 267-270,
282-283
Mach, E , 45, 118 y el gato de Schródinger, 267-269
Macroentropía, 220-222 y Principio de Incertidum bre, 256-258
Matemáticas, 14, 29, 30, 31, 32, 46, 238, Véase también Interpretación de C o ­
239, 278, 279 penhague; mecánica cuántica; teo­
M axwell, J. C „ 47, 99, 168, 169, 175, 233, ría cuántica
234 Metafísica, 38, 108-110, 328-329, 331
M ecánica cuántica, 20-21, 180-181, 329- y espacio-tiempo, 84-85, 109-138
330 y debate sustantivista-realista, 114-119
Teorema de Bell, 314-322 rechazo por Hum e de,' 30, 31, 32, 33
argumento de inseparabilidad de y teoría cuántica, 277, 280-283
Einstein-Podolsky-Rosen, 307-314, Metodología, 14, 15, 31, 95-97, 328, 329
310 (figura) Véase también críticas epistemológicas;
y asimetría temporal, 193 conocimiento
y causalidad, 24, 294-295, 322, 323, M ili, J. S„ 32
330 Modelo deductivo-nomológico, 153-155,
y determinismo, 124-125, 294-306, 157
305 (figura), 307-309, 321-324 Momento, 170-172
y distribuciones compuestas, 284 Mónadas, 38-39
e interpretación de Kochen, 277-279 Movimiento, 42, 44-52, 49 (figura). Véase
y lógica, 285-286 también aceleración;entradas a rela­
medida, 193, 262-264 tividad
Principio de Incertidumbre, 21,205,321 Movimiento planetario, 68, 80, 87. Véase
Véase también teoría cuántica también
astronomía
Mecánica estadística, 160-164, 187-188,
191-192, 215, 329. Véase también
estados de equilibrio; estados de Newton, Isaac, 21, 66, 67, 68, 231, 329
equilibrio, aproximación a y determinismo, 123-124, 292, 293,
Medida, 248-255, 260-265 294
Teorema de Bell, 314-323 acerca de la gravedad, 67, 77-78, 82-
argumento de inseparabilidad de 83, 87, 94, 95, 97, 98
Einstein-Podolsky-Rosen, 307-314, acerca del espacio, 43, 44, 45, 46, 47.
3,10 (figura) 53-55, 57-59, 61, 64, 115-117
y asimetría temporal, 192-193 debate Leibniz-, 38, 42-47
como interacción física, 255-256, 271- N o orientabilidad, 81 (& figura)
277, 282
como interacción mente-mundo, 270-
271,274-275 O rden temporal, 62-63, 63 (figura)
y determinismo, 293, 296-299
e interferencia, 262, 268, 273-276,
277-278, 323-324 Paradoja de los gemelos, 61, 62 (figura)
interpretación de las «muchas men­ Planck, M„ 234, 236
tes», 282-283 Platón, 14, 34
índice analítico 347

Podolsky, B., 308 y termodinámica, 169-170


Poincaré, H e n ri, 88-92, 90 (figura), 216 Véase también estados de equilibrio;
respuestas a, 91-109 estados de equilibrio, aproximación
y termodinámica, 169, 170 (figura) a; mecánica estadística
Posiciones de sucesos-puntuales, 55-56 Problema mente-cuerpo, 224-225
Positivismo, 99-105, 108-109 Probabilidad condicionada, 143-144
Posibilidad, 40, 42, 43 Problema del «agujero», 126-127
Postulado de aditividad, 142*143 Putnam, H ., 287
Postulado de Caos M olecular, 179, 181-
182, 191, 197
Postulado de las paralelas, 70-73 Q uine, W . V., 15
Postulado de linealidad, 94-95
Postulado de proyección, 250-251, 254,
261,264, 265, 277, 280 Red de mezcla, 212-214
Prigogine, I., 206-209 Redes modulares, 287
Prim era Ley de la Term odinám ica, 164- Reducción, 160-163, 217-219
165 Véase también generalización
Principia (Newton), 67 Reichenbach, H ., 212, 220, 221, 224, 285
Principio de equivalencia, 70 Relacionism o, 38-43, 45-46, 114-118,
P rincipio de Incertidum bre, 21, 205-206, 123-127
255-260, 257 (figura), 321, 322, 323 Relatividad, teoría general de, 19-20, 44*
P rincipio de indiferencia, 150-151, 175, 46, 96-98
195 y debate sustantivista-relacionista,
Principio G I G O , 24 122-127
Probabilidad y determinismo, 124-128
Teorema de B ell, 314-323 y geometrías no-euclídeas, 77-78, 87*
y argumento de inseparabilidad de 88, 106-107
Einstein-Podolsky-Rosen, 310, 311- y naturaleza del espacio, 24-25, 328-
312 329
y estados de equilibrio, 179-180, 195- orígenes de, 69-84
196 y sim plicidad teórica, 98-100
y explicación, 155-161, 187-188 y teoría machiana, 118-122
e Interpretación de Copenhague, 251- teoría de Gódel, 121, 122 (figura)
253, 266 Relatividad, teoría especial de, 17-19, 20-
e interpretación de los «muchos m un­ 21,44-46, 328-329
dos», 281-282 y causalidad, 128-130, 135
interpretaciones objetivistas, 144-148 espacio-tiempo neo-newtoniano, 65-69
interpretaciones subjetivistas, 148-152 y geometrías no-euclídeas, 107-108
y lógica, 283-284, 285-286 y hechos observables, 93-95
y mecánica cuántica, 180, 181, 309- e Interpretación de Copenhague, 254
310, 311, 313-322 orígenes de, 47-55
y medida, 260, 261-262 y simplicidad teórica, 97-99
y P rincipio de Incertidum bre, 256 y tiempo, 17-19, 47-55, 62, 63 (figura),
y reducción, 163-164 328-329
y sistemas caóticos, 216 Véase también espacio-tiempo
teoría formal de, 141-144 Revoluciones conceptuales, 18-20, 85,
y teoría cuántica, 241-242, 255-256, 235-36
260-261,262 Riemann, B., 72, 74, 77, 82, 84
348 índ ice analítico

Robb, A., 129, 130, 131, 136 base experimental de, 231-241, 236
Rosen, N., 308 (figura)
Rotación de la materia, 118-120, 121, y conocimiento, 261-262, 270
122 (figura) y determinismo, 294-295
Russel, B „ 124, 125, 295 e interferencia, 242-249, 244 (figura),
245 (figura), 324
y lógica, 283-289
Saccheri, G ., 72 medida, 249-255, 260-283
Schródinger, E „ 236, 238, 239, 249, 256, y metafísica, 277, 279-282
264, 285, 296 P rincipio de Incertidum bre, 255-260,
e Interpretación de Copenhague, 266, 257 (figura)
267, 268 (figura), 271-272 y probabilidad, 240-242, 247
Segunda Ley de la Termodinámica, 164- Véase también teoría de campos cuánti­
166, 179-181, 192, 205, 211-212, 214 ca; mecánica cuántica
Ser. Véase
metafísica Teoría cuántica de campos, 193-194
Sim plicidad teórica, 97-100, 101-103 Teoría de partículas. Véaseteoría cuán­
Simultaneidad, 51-54, 53 (figura), 57-59, tica
66 Teoría del big bang, 16, 17, 82, 125, 143,
y causalidad, 127, 128, 129 214, 333
y hechos observables, 93. 94, 95 T eoría del big crunch, 211
y metafísica, 111, 112, 113, 114 T eoría de campos, 21, 122-124
Singularidades, 125-126 Teoría del éter, 59, 97-98, 232-233
Sistemas de Bernoulli, 198 T eoría especial de la relatividad. Véase
Sistemas caóticos, 215-216 relatividad, teoría especial de
Sistemas K , 198, 199, 207 Teoría general de la relatividad. Véase
re­
Specker, E ., 303 latividad, teoría general de
Sueños, 37 Teoría ondulatoria. Véase
teoría cuántica
Superficies de Cauchy, 293 £ Térm inos. Véase lenguaje
Sustantivismo, 24, 46-47, 114-118, 123- Term odinám ica, 160, 162-163, 164-167,
127 180-181
y asimetría causal, 223-225
incertidum bre en, 205-206
Taquiones, 64-65 teoría cinética del calor, 167-175, 170
Temporalidad. Véase tiempo (figura), 171 (figura), 172 (figura)
Tensor de energía-momento, 78-79 Véase también estados de equilibrio,
Teorema de B ell, 314-3 22 aproxim ación a; asimetría temporal
Teorema ergódico, 183-187, 184 (figura) Tercera L e y de la Term odinám ica, 167-
Teorem a de Kolm ogorov-Arnold-M o- 168
ser (K A M ), 186 (figura), 185-189, Tiem po, 23-24, 34, 35, 36, 44, 45, 46,
198 183, 185
Teorema de Recurrencia, 201-203 dilatación de, 50, 51, 59, 60, 61, 62 (fi­
Teorema K A M . Véase Teorema de Kol- gura), 70, 80-81
mogorov-Arnold-Moser (KA M ) dirección de, 174-175, 213-214, 216-
Teoría cinética del calor, 168-175, 170 227
(figura), 171 (figura), 172 (figura) espacio-tiempo neo-newtoniano, 65-67
Teoría cuántica, 18-19, 289-292 y gravedad, 68-70, 71 (figura)
Interpretación de Copenhague, 251- y mecánica cuántica, 180-181
255,266-271 y metafísica, 110-112
Indice analítico 349

no orientabilidad, 81-82 y Teorema de Bell, 314, 318, 320, 321,


teoría de Aristóteles, 36, 37, 38 322
teoría de Leibniz, 39-42 teoría de von Neumann, 299, 300,
y teoría especial de la relatividad, 17- 302
18, 44-55, 62-64, 63 (figura), 328 Velocidad de la luz. Véase
luz
Véase también irreversibilidad; espacio- V o n Mises, L ., 147
tiempo; asimetría temporal Von Neumann, J., 249, 250, 256, 285,
Timeo (Platón), 34 299, 300, 302
Transformaciones de Lorentz, 55

Waterston, J., 168


Universos de Robertson-Walker, 82 W heeler,]., 245, 280, 281
Universos vacíos, 118-122 W igner, E , 269, 270

Variables ocultas, 295-305, 305 (figura) Zenón de Elea, 36

También podría gustarte