Fundamentos Matemáticos de La Mecánica Cuántica, 2018, (3. Edición) - John Von Neumann PDF

CSIC
Fundamentos matemáticos
de la mecánica cuántica de la mecánica
cuántica
John von Neumann
John von Neumann

Textos Universitarios • 50
Publicado en alemán en 1932, Fundamentos matemáticos de la mecánica cuántica (1932), del po-
John von Neumann
livalente matemático húngaro John von Neumann (1903-1957), uno de los cerebros más pode-
rosos del siglo xx, contiene la presentación matemática más acabada y rigurosa de la mecánica Estudio preliminar de
cuántica, desarrollada en 1925-1926 por Werner Heisenberg, Erwin Schrödinger y Paul Dirac.
Es todo un clásico de la literatura científica. Pero, al contrario de lo que su título puede sugerir, José M. Sánchez Ron
no es solo un magnífico tratado de física matemática, con aportaciones seminales a la teoría de
los espacios de Hilbert, sino que también constituye una de las contribuciones más lúcidas al 3.ª edición
de la mecánica cuántica
problema del significado físico de la mecánica cuántica, en particular al problema de la medida.
Cuestiones como el colapso de la función de ondas, la posibilidad de una versión causal de la
teoría cuántica (variables ocultas) o el papel del observador fueron analizadas en estas páginas por
John von Neumann con una maestría difícilmente superable, independientemente de que en
algún caso (como el de las variables ocultas) sus conclusiones fuesen matizadas más de dos déca-
das después.
ISBN: 978-84-00-10335-4
Consejo Superior de
Investigaciones Científicas
50 © Calamar Edición & Diseño.
Cub_50_TXT_Universitarios.indd 1 21/5/18 10:15

Fund_MAT_00a.indd 1 9/5/18 10:11
Fund_MAT_00a.indd 2 9/5/18 10:11
Textos Universitarios
50
Fund_MAT_00a.indd 3 9/5/18 10:11

Fund_MAT_00a.indd 4 9/5/18 10:11
John von Neumann
Fundamentos
matemáticos
Estudio preliminar de
José Manuel Sánchez Ron
3.ª edición
CONSEJO SUPERIOR DE INVESTIGACIONES CIENTÍFICAS

Madrid, 2018
Fund_MAT_00a.indd 5 9/5/18 10:11

Reservados todos los derechos por la legislación en materia de
Propiedad Intelectual. Ni la totalidad ni parte de este libro, inclui-
do el diseño de la cubierta, puede reproducirse, almacenarse o trans-
mitirse en manera alguna por medio ya sea electrónico, químico,
óptico, informático, de grabación o de fotocopia, sin permiso previo
por escrito de la editorial.
Las noticias, los asertos y las opiniones contenidos en esta obra

son de la exclusiva responsabilidad del autor o autores. La editorial,
por su parte, solo se hace responsable del interés científico de sus
publicaciones.
Primera edición: CSIC, Instituto de Matemáticas Jorge Juan, 1949

Segunda edición: CSIC, 1991
Tercera edición: CSIC, 2018
Catálogo general de publicaciones oficiales:

http://publicacionesoficiales.boe.es
Editorial CSIC: http://editorial.csic.es (correo: publ@csic.es)
© CSIC
© Herederos de Ramón Ortiz Fornaguera y Esteve Terradas
© Del estudio preliminar, José Manuel Sánchez Ron
© De la revisión técnica, José Luis Sánchez Gómez
© De las imágenes, las fuentes mencionadas a pie de figura
ISBN: 978-84-00-10335-4
e-ISBN: 978-84-00-10336-1
NIPO: 059-18-062-3
e-NIPO: 059-18-063-9
Depósito Legal: M-14.900-2018
Maquetación, impresión y encuadernación: Gráficas Blanco, S. L.

Impreso en España - Printed in Spain
En esta edición se ha utilizado papel ecológico sometido a un proceso de

blanqueado ECF, cuya fibra procede de bosques gestionados de forma
sostenible.
Fund_MAT_00a.indd 6 9/5/18 10:11

Índice
Estudio preliminar a la tercera edición: «John von Neumann, el científico uni-

versal»............................................................................................................................................... 9
Los inicios de su carrera.................................................................................................. 11
Fundamentos de matemáticas: Von Neumann y Gödel....................................... 15
Física y matemáticas en Gotinga.................................................................................. 21
Mathematische Grundlagen der Quantenmechanik.................................................. 25
Variables ocultas................................................................................................................. 28
Einstein-Podolsky-Rosen................................................................................................. 31
El gato de Schrödinger y el entrelazamiento............................................................ 33
David Bohm y John Bell................................................................................................. 35
El problema de la medida en Mathematische Grundlagen der Quantenme-
chanik............................................................................................................................ 40
Mathematische Grundlagen der Quantenmechanik, un texto complicado....... 42
La edición española de Mathematische Grundlagen der Quantenmechanik..... 43
Lógica cuántica................................................................................................................... 49
Von Neumann en Estados Unidos.............................................................................. 50
Matemáticas aplicadas...................................................................................................... 56
Von Neumann y las fuerzas armadas.......................................................................... 57
Von Neumann y Alan Turing........................................................................................ 67
Von Neumann y los «asuntos nucleares»................................................................... 71
Ulam, Von Neumann, el diseño de la bomba de hidrógeno y el método de
Monte Carlo............................................................................................................... 78
Von Neumann, la AEC y el caso Oppenheimer..................................................... 81
Matemáticas y economía................................................................................................. 86
Teoría de juegos.................................................................................................................. 92
Theory of Games and Economic Behavior.................................................................... 96
Von Neumann y la RAND............................................................................................ 106
Computadoras, autómatas y cerebro: Turing, Wiener y Von Neumann........ 107
Final....................................................................................................................................... 116
FUNDAMENTOS MATEMÁTICOS
DE LA MECÁNICA CUÁNTICA
Introducción................................................................................................................................... 121
I. Consideraciones preliminares....................................................................................... 123

1. La génesis de la teoría de las transformaciones............................................... 123
2. Métodos y fórmulas primeros de la Mecánica cuántica............................... 124
Fund_MAT_00b.indd 7 3/5/18 13:20

Índice
3. Equivalencia de las dos teorías: la teoría de las transformaciones............. 129

4. Equivalencia de las dos teorías: el espacio de Hilbert................................... 136
II. Generalidades acerca del espacio de Hilbert abstracto....................................... 141

1. Caracterización del E. H........................................................................................ 141
2. Geometría del E. H................................................................................................. 148
3. Digresión acerca de las condiciones A-E........................................................... 156
4. Variedades lineales cerradas................................................................................... 166
5. Operadores en el espacio de Hilbert.................................................................. 175
6. El problema de valores propios............................................................................ 184
7. Continuación.............................................................................................................. 187
8. Consideraciones generales relativas al problema de valores propios........ 195
9. Digresión acerca de la unicidad y existencia de la solución del problema
de valores propios...................................................................................................... 209
10. Operadores permutables......................................................................................... 224
11. La traza......................................................................................................................... 230
III. La estadística de la Mecánica cuántica...................................................................... 241

1. Los enunciados estadísticos de la Mecánica cuántica................................... 241
2. La interpretación estadística.................................................................................. 248
3. Mensurabilidad simultánea y mensurabilidad en general............................ 250
4. Relaciones de indeterminación............................................................................. 262
5. Los operadores de proyección como enunciados........................................... 272
6. Teoría de la luz........................................................................................................... 277
IV. Construcción deductiva de la teoría.......................................................................... 307

1. Establecimiento sistemático de la teoría estadística....................................... 307
2. Demostración de las fórmulas estadísticas........................................................ 317
3. Consecuencias de la experimentación................................................................ 324
V. Consideraciones generales............................................................................................. 337

1. Medición y reversibilidad....................................................................................... 337
2. Consideraciones termodinámicas........................................................................ 344
3. Problemas de reversibilidad y equilibrio............................................................ 356
4. La medición macroscópica..................................................................................... 367
VI. La medición........................................................................................................................ 379

1. Formulación del problema..................................................................................... 379
2. Sistemas compuestos................................................................................................ 381
3. Discusión del proceso de medición.................................................................... 391
Notas................................................................................................................................................. 397
Fund_MAT_00b.indd 8 3/5/18 13:20

ESTUDIO PRELIMINAR a la tercera edición
John von Neumann, el científico universal

José Manuel Sánchez Ron
La historia de la ciencia no es parca en científicos cuyos nombres permanecen

en nuestra memoria gracias a sus contribuciones, pero la inmensa mayoría de esos
grandes de la ciencia sobresalieron en un apartado de ella, en una única disciplina.
Raros son los que, como Isaac Newton, destacaron en más de una ciencia (en el
caso del Lucasian professor de Cambridge, en física —dinámica, gravitación, ópti-
ca— y matemáticas). Y ¡qué decir si ampliamos el número de disciplinas!; enton-
ces nos enfrentamos a lo que es casi un desierto. John von Neumann (28-12-1903/
8-2-1957) fue una excepción a esa aparentemente regla universal, un frondoso
oasis rodeado del desierto de la especialización. Su nombre figura, en efecto, en
los libros de historia de la matemática, física, ordenadores e inteligencia artificial,
neurociencias y economía. «Incluso en la presente edad de la especialización», es-
cribieron Herman Goldstine y Eugene Wigner en el obituario que le dedicaron,
«pocas personas han contribuido de forma más significativa a varias ramas de la
ciencia, y en todas dejado una huella permanente en los anales de la historia de la
ciencia. John von Neumann realizó contribuciones fundamentales a la matemáti-
ca, física y economía. Más aún, sus contribuciones no son disgregados y separados
apuntes en estos campos, sino que surgen de un punto de vista común. La mate-
mática fue siempre la que estuvo más cerca de su corazón y fue a esta ciencia a la
que contribuyó de manera más fundamental».1 De hecho, olvidaron mencionar
otros campos, especialmente la computación y la teoría cerebral.
1
H. H. Goldstine, «The scientific work of John von Neumann», Science 125, 683-684 (1957),
reproducido en The Collected Papers of Eugene Paul Wigner, vol. VII, Parte B, Jagdish Mehra, ed.
(Springer-Verlag, Berlín, 2001), pp. 123-126; cita en p. 123. De entre la numerosa bibliografía que
trata de la vida y obra de Von Neumann citaré los siguientes: Steve J. Heims, J. von Neumann y N.
Wiener, 2 vols. (Salvat, Barcelona 1986; originalmente publicado por The MIT Press bajo el título
de John von Neumann and Norbert Wiener. From Mathematics to the Technologies of Life and Death;
John von Neumann 1903-1957); S. Ulam, G. Birkhoff, F. J. Murray, R. V. Kadison, P. R. Halmos,
L. van Hove, H. W. Kuhn, A. W. Tucker y C. E. Shannon, «John von Neumann, 1903-1957», Bu-
lletin of the American Mathematical Society, 64 (mayo de 1958), reproducido también en Donald
Fleming y Bernard Bailyn, eds., The Intelectual Migration. Europa and America, 1930-1960 (Belknap
Press of Harvard University Press, Cambridge, Mass. 1969), pp. 235-269; E. P. Wigner, «John von
Neumann (1903-1957)», The American Philosophical Society. Year Book 1957 (The American Philo-
sophical Society, Filadelfia, 1958), pp. 149-153, reproducido en The Collected Papers of Eugene Paul
Wigner, vol. VII, pp. 127-130; Jean Dieudonné, «von Neumann, Johann (or John)», Complete Dic-
tionary of Scientific Biography, Charles C. Gillispie, ed. (Charles Scribner’s Sons, Detroit, 2008), vol.
14, pp. 88-92; Salomon Bochner, «John von Neumann», National Academy of Sciences (Biographical
Memoirs) 32, 438-457 (1958), Giorgio Israel y Ana Millán Gasca, El mundo como un juego matemá-
tico. John von Neumann, un científico del siglo xx (Nivola, Madrid 2001); P. R. Halmos, «The legend
Fund_MAT_00c.indd 9 3/5/18 16:13

Fundamentos matemáticos de la mecánica cuántica
John von Neumann (1903-1957) (foto de Alan W. Richards, cortesía de AIP Emilio Segrè
Visual Archives).
10
Fund_MAT_00c.indd 10 3/5/18 16:13

Introducción a la tercera edición
Aunque es imposible hacer justicia a un científico de semejante calibre, es

conveniente recordar quién fue y algo de lo que hizo, no limitándonos únicamen-
te al libro reproducido aquí.
Los inicios de su carrera

John von Neumann nació en Budapest. Fue el mayor de los tres hijos de un
banquero judío ennoblecido por el emperador Francisco José (entonces Hungría
era parte del imperio austrohúngaro).2 Al ser el título que obtuvo hereditario, su
nombre completo era, en húngaro, Margittai Neumann János; literalmente, pero
en orden inverso y utilizando la versión anglosajona de János, John Neumann de
Margitta (el von alemán corresponde en húngaro a la i final de «Margittai»).
Antes de referirme a su educación, es necesario explicar algo de la situación
política en la Hungría de su juventud. Para ello utilizaré lo que el propio Von
Neumann manifestó cuando tuvo que declarar en la investigación que la Junta de
Seguridad del Personal (Personnel Security Board) de la Atomic Energy Commis-
sion estableció en 1954 para juzgar si Robert Oppenheimer, el director del Labo-
ratorio de Los Álamos del Proyecto Manhattan —para el que, como veremos más
adelante, trabajó Von Neumann—, constituía un riesgo para la seguridad en asun-
tos nucleares. Las declaraciones de Von Neumann se produjeron el 27 de abril de
1953. Interrogado sobre «si su familia estaba en Hungría cuando se estableció el
gobierno comunista», Von Neumann respondió:3
Abandonamos Hungría muy poco después que los comunistas alcanzaran el poder.
El régimen comunista en Hungría duró únicamente 130 días. Esto fue en 1919. Sali-
mos tan pronto como fue posible, lo que ocurrió 30 o 40 días después, y regresamos
alrededor de 2 meses después de que los comunistas hubiesen sido derrotados. Yo
abandoné Hungría después de todo esto, para ser exactos 2 años después para ir a es-
tudiar una carrera.
of John von Neumann», American Mathematical Monthly, 80, 382-394 (1973), existe una versión al
castellano de este artículo («La leyenda de Von Neumann») en John von Neumann, El ordenador y
el cerebro (Antoni Bosch, Barcelona, 1980), pp. 9-26; J. Ildefonso Díaz, «John von Neumann: de la
matemática pura a la matemática aplicada», Boletín de la Sociedad Española de Matemática Aplicada,
n.º 32, 149-169 (2005). Dos perfiles biográficos interesantes son los de Stanislaw Ulam en conver-
saciones con Gian-Carlo Rota, «John von Neumann», en From Cardinal to Chaos, Necia Grant
Cooper, ed. (Cambridge University Press, Cambridge, 1989), pp. 303-306, y Freeman Dyson, «A
walk through Johnny von Neumann’s garden», en Freeman Dyson, Birds and Frogs. Selected Papers,
1990-2014 (World Scientific, Singapur, 2015), pp. 71-84.
2
Al contrario que en otros casos, el hecho de proceder de una familia de origen judío apenas
influyó en el conjunto de la biografía de John Von Neumann.
3
El testimonio de Von Neumann se reproduce, junto a todos los demás, en In the Matter of
J. Robert Oppenheimer. Transcript of Hearing before Personnel Security Board and Texts of Principal
Documents and Letters. United States Energy Commission (The MIT Press, Cambridge, Mass., 1971),
pp. 643-656; cita en p. 654.
11
Fund_MAT_00c.indd 11 3/5/18 16:13

Foto familiar, junio de 1945 (Von Neumann es el tercero por la izquierda) (AIP Emilio Segrè
Visual Archives).
Samuel J. Silverman, quien le estaba tomando declaración en ese momento,

quiso saber también si «cuando creció, usted y su familia consideraban a Rusia como
una especie de enemigo natural de Hungría», a lo que Von Neumann respondió:
Tradicionalmente, Rusia era un enemigo de Hungría. Hubo un intento de guerra

entre Hungría y Rusia en 1948 [sic; debe referirse a 1848], en la que, según la versión
húngara, que es la que conozco, los húngaros derrotaron al ejército ruso. Después de
esto, no fueron amigos. Este trauma duró hasta después de la Primera Guerra Mundial
[…] Pero yo era un niño de 9 años cuando comenzó la Primera Guerra Mundial. De
manera que Rusia tradicionalmente era el enemigo. Después de la Primera y Segunda
Guerras Mundiales se puede observar un cierto esquema. Hablando en general, pienso
que se encontrará entre los húngaros un miedo emocional y rechazo de Rusia.
La conclusión de todo esto es que tanto la historia previa de Hungría como las
experiencias que Von Neumann y su familia tuvieron con el régimen comunista,
que ciertamente no veía con buenos ojos a personas con los medios económicos
de los Von Neumann, ayudan a comprender sus actitudes y decisiones posteriores,
especialmente durante la Segunda Guerra Mundial.
La educación de János (o Jancsi, como le llamaba su familia entonces) comen-
zó en casa, e incluía el alemán, que le enseñaron de niño y que fue, hasta que dejó
paso al inglés, su primera segunda lengua. En 1914 entró en la selecta, y cara,
Escuela Luterana masculina de Budapest, o Minta Gymnasium (Escuela Modelo).
Pronto el profesor de Matemáticas del colegio, László Rátz, advirtió la extraordi-
naria capacidad del nuevo alumno y recomendó a su padre que hiciera que Jancsi
12
Fund_MAT_00c.indd 12 3/5/18 16:13

recibiera una educación adicional a cargo de matemáticos profesionales. Max von

Neumann siguió el consejo y Jancsi recibió clases particulares de un profesor ayu-
dante de la Universidad de Budapest, Michael Fekete, con el que publicó, en 1922,
su primer artículo de investigación.4
En la Minta estudiaba otro futuro gran científico, Eugene Wigner (1902-
1995). En sus memorias, Wigner se refirió a Von Neumann; merece la pena citar
lo que escribió allí, pues ofrece una buena imagen del jovencísimo Jancsi:5
Von Neumann era verdaderamente un prodigio y ya había hecho de las matemáti-

cas su primer amor. Ser un prodigio matemático requiere no sólo gran talento sino
también una inusual dedicación. Cuando Rátz vio lo inteligente que era Jancsi y su
devoción a las matemáticas, comenzó a darle lecciones particulares […] Rátz se sintió
tan privilegiado siendo tutor de un fenómeno como Jancsi que rechazó cualquier dine-
ro por ello […]
Cuando conocí a Jancsi, yo tenía 13 años y él cerca de 12. Estaba un curso por
debajo de mí, pero en matemáticas dos clases por encima. Ya poseía un sorprendente
conocimiento de matemáticas avanzadas. Budapest tenía una fuerte comunidad mate-
mática, y Jancsi se hizo bien conocido en aquel círculo antes incluso de dejar la escuela.
Nunca sentí conocer bien a Von Neumann en la escuela. Acaso, nadie lo hizo; siem-
pre se mantuvo algo aparte. Amaba a su madre y se sinceraba con ella, pero difícilmen-
te con otros. Sus hermanos le admiraban mucho, pero no eran íntimos […]
Jancsi amaba el dinero y las cosas materiales. Era feliz teniendo un padre banquero.
Aparte del dinero, sus intereses eran casi enteramente intelectuales.
Regresaba con él a casa desde la escuela aproximadamente una vez al mes. La pro-
fundidad de sus conocimientos matemáticos me maravillaba. La forma en que describía
la teoría de conjuntos y la teoría de números era arrebatadora. La belleza del tema, su
intensidad y facilidad de descripción me hacía sentir que éramos amigos próximos […]
He conocido en mi vida muchas personas de gran inteligencia: Max Planck, Max von
Laue y Werner Heisenberg; Paul Dirac fue mi cuñado; Leo Szilard y Edward Teller han
figurado entre mis amigos más íntimos; y Albert Einstein también fue un buen amigo.
Y he conocido muchos de los más brillantes jóvenes científicos. Pero ninguno de ellos
tenía una mente tan rápida y aguda como Jancsi von Neumann […] Uno veía inmedia-
tamente la rapidez y poder de la mente de Von Neumann. Comprendía los problemas
matemáticos no sólo en su aspecto inicial, sino en toda su complejidad. Suavemente,
sin esfuerzo, analizaba con profundidad los detalles de los problemas científicos más
complejos. Retenía todo. Su mente parecía un instrumento perfecto.
Es oportuno mencionar que en el campo de las ciencias físico-matemáticas,

Hungría produjo en aquella época, además de a Von Neumann y Wigner, a Leo
Szilard (1898-1964) y Edward Teller (1908-2003), Georg von Hevesy (1885-
1966), George Pólya (1887-1985) y Michael Polanyi (1891-1976). Se da la cir-
cunstancia, de que, salvo Pólya, todos, Polanyi, Hevesy, Szilard y Teller, estudiaron
4
Michael Fekete y John von Neumann, «Über die Lage der Nullstellen gewisser Minimumpo-
lynome», Jahresbericht der Deutschen Mathematiker Vereinigung 31, 125-138 (1922).
5
The Recollections of Eugene P. Wigner as Told to Andrew Szanton (Plenum Press, Nueva York,
1992), pp. 51, 57-58.
13
Fund_MAT_00c.indd 13 3/5/18 16:13

en la Minta. Asimismo, todos, antes o después, abandonaron Hungría. Von Neu-

mann, Teller, Wigner y Szilard terminaron en Estados Unidos, desarrollando ca-
rreras muy distinguidas (es imposible no mencionar que todos contribuyeron a los
trabajos del Proyecto Manhattan; Szilard fue, de hecho, uno de sus principales
promotores). Aunque fue más un ingeniero que un científico, también habría que
añadir a esta lista el nombre de Theodore von Kármán (1881-1963). Especialmen-
te Von Neumann, Teller, Wigner y Von Kármán compartieron ideologías políticas
parecidas, en la que destacaba el rechazo al comunismo, consecuencia, más que
probablemente, de las mismas experiencias y situaciones familiares que he citado
anteriormente en el caso de Von Neumann.
La extraordinaria inteligencia de este grupo de húngaros instalados en Estados
Unidos hizo que algunos colegas americanos acuñasen para ellos el mote de The
Martians (Los marcianos) porque su inteligencia no era propia de seres terrestres,
sino de marcianos.
Después de obtener su Matura en 1921, Von Neumann estudió Ingeniería Quí-
mica dos años (1921-1923) en la Universidad de Berlín y otros dos (1923‑1925)
en Zúrich, en cuya Eidgenössische Technische Hochschule —la célebre ETH,
donde estudió y enseñó Albert Einstein— obtuvo el correspondiente título. El que
siguiese estos estudios fue una especie de seguro ante las incertidumbres de una
carrera en matemáticas: Max von Neumann pidió a Von Kármán que disuadiera
a su hijo, por motivos económicos, de convertirse en matemático. En sus memo-
rias, Von Kármán recordó este episodio:6
Un día, durante mi primer año en Aquisgrán, un conocido banquero de Budapest

vino a verme con su hijo de diecisiete años, Johnny. Tenía una poco habitual petición.
Quería que disuadiera al joven Johnny de convertirse en matemático. «Las Matemáticas»,
dijo, «no dan dinero».
Hablé con el chico. Era espectacular. Con diecisiete años ya estaba estudiando por
su cuenta los diferentes conceptos de infinito, que es uno de los problemas más profun-
dos de la matemática abstracta, y estaba desarrollando teorías interesantes. Pensé que
sería una pena influirle para que se desviase de su inclinación natural. Por otra parte,
me vino a la mente el papel de mi propio padre en mantenerme alejado de las matemá-
ticas cuando yo era joven. No recordaba haber sufrido por ello, ni que me impidiese
terminar aprendiendo matemáticas.
Sin embargo, en el caso de Johnny al final sugerí que el padre llegase a un compro-
miso con su hijo y dejase a Johnny ir a Zúrich a estudiar ingeniería química. Esto per-
mitiría al chico estudiar algo de matemáticas y al mismo tiempo prepararse para lo que
entonces era una profesión razonable. La revolución industrial, señalé, estaba requirien-
do cada vez más y más habilidades técnicas, especialmente en Hungría, donde la manu-
factura de metales estaba aumentando.
El padre estuvo de acuerdo y Johnny fue a Zúrich, pero después de graduarse volvió
a las matemáticas. Esto fue afortunado para el mundo, porque John von Neumann se
6
Theodore von Kármán con Lee Edson, The Wind and Beyond: Theodore von Kármán (Little,
Brown and Co., Boston, 1967), pp. 106-107.
14
Fund_MAT_00c.indd 14 3/5/18 16:13

convirtió en uno de los mejores matemáticos y llegó a impulsar la computadora digital,

un instrumento que está revolucionando todas las formas de vida.
Al mismo tiempo Von Neumann seguía estudios de Química, no solo en Zú-

rich, sino también en Berlín, y se matriculó en la carrera de Matemáticas en la
Universidad de Budapest. No asistía a las clases, pero sí a los exámenes semestrales,
y consiguió el título de doctor en Matemáticas poco después (1926) que el de in-
geniero químico. De hecho, durante su estancia en Zúrich se ocupó con bastante
intensidad de problemas matemáticos y entró en contacto con Hermann Weyl y
George Pólya. En un libro en el que mezclaba recuerdos con fotografías, Pólya
recordó una anécdota que muestra la extraordinaria inteligencia del joven Von
Neumann:7
[John von Neumann] es mi único estudiante que llegó a intimidarme. Era tan rá-
pido. Existía en Zúrich un seminario para estudiantes avanzados en el que yo enseñaba
y Von Neumann estaba en la clase. Llegué a cierto teorema, y dije que no estaba demos-
trado y que debía de ser difícil. Von Neumann no dijo nada pero después de cinco
minutos levantó su mano. Cuando le llamé fue a la pizarra y procedió a escribir la de-
mostración. Después de aquello, tenía miedo de Von Neumann.
En Berlín siguió cursos de, entre otros, Erhard Schmidt, un antiguo alumno
de David Hilbert que había realizado aportaciones importantes a la teoría de ecua-
ciones integrales, campo cultivado por su maestro. Habida cuenta de la íntima
relación existente entre la mecánica cuántica y las ecuaciones integrales, las ense-
ñanzas que recibió de Schmidt debieron de constituir una magnífica preparación
para las investigaciones que llevó más tarde a cabo en la teoría cuántica.
Fundamentos de matemáticas: Von Neumann y Gödel

Vemos, por consiguiente, que circunstancias académico-profesionales aparte,
los inicios, y los amores, de la carrera de John von Neumann estuvieron situados
en el campo de la matemática. Es preciso, por tanto, decir algo de sus aportaciones
a la matemática pura, dominio en el que sus primeros intereses se centraron en la
lógica matemática y la axiomática de la teoría de conjuntos. Su primer trabajo
importante en este campo, el segundo que publicó, data de una fecha tan tempra-
na como 1923. Se trata de un artículo titulado «Sobre la introducción de los nú-
meros transfinitos», en el que resolvía algunos problemas relacionados con la teo-
ría de conjuntos de Cantor.8 Ahora bien, si se desea entender bien las aportaciones
de Von Neumann a la matemática pura, es necesario tener en cuenta sobre todo
7
George Pólya, The Pólya Picture Album. Encounters of a Mathematician (Birkhäuser, Boston,
1987), p. 154.
8
John von Neumann, «Zur Einführung der transfiniten Zahlen», Acta Szeged 1, 199-208
(1923). En 1928 publicó otro trabajo sobre estas cuestiones: «Über die Definition durch transfinite
Induktion und verwandte Fragen der allgemeinen Mengenlehre», Mathematische Annalen 99, 373-
15
Fund_MAT_00c.indd 15 3/5/18 16:13

David Hilbert (1862-1943).
la obra de David Hilbert (1862-1943). Importante en este sentido es la célebre

conferencia que el matemático de Gotinga pronunció en el Segundo Congreso
Internacional de Matemáticos (París, 6-12 de agosto de 1900), en particular el
segundo de los 23 problemas que enumeró entonces («La compatibilidad de los
axiomas de la aritmética»):9 «Demostrar que los axiomas no son contradictorios;
es decir demostrar que basándose en los axiomas no se podrá llegar jamás a resul-
tados contradictorios mediante un número finito de deducciones lógicas».
Un cuarto de siglo después (1925), Von Neumann publicó un artículo sobre
la axiomatización de la teoría de conjuntos, en el que mediaba en la polémica
391 (1928). Jesús Mosterín analizó estos y otros trabajos lógicos de Von Neumann (de algunos de
los cuales trato más adelante) en Los lógicos (Espasa, Madrid, 2000), pp. 181-217.
9
David Hilbert, «Problèmes futures des Mathématiques», en Compte Rendu du Deuxième
Congrès International des Mathématiciens tenu a Paris du 6 au 12 Août 1900 (Gauthier-Villars, Paris,
1902), pp. 58-114; p. 72. En 1899, recordemos, Hilbert había publicado Grundlagen der Geometrie
(Fundamentos de Geometría), en el que axiomatizó la geometría.
16
Fund_MAT_00c.indd 16 3/5/18 16:13

entre Hilbert y los intuicionistas (Brouwer y Weyl, principalmente).10 Es intere-

sante citar la frase final de este artículo, el tercero que publicó, ya que en él incidía
en las dificultades que rodeaban a la teoría de conjuntos: «No podemos, por el
momento, hacer nada más que señalar que existen objeciones en contra de la pro-
pia teoría de conjuntos, y que no se conoce actualmente ningún medio de evitar
tales dificultades». Dos años más tarde, apareció su trabajo más importante en
axiomática: «Sobre la teoría de la prueba de Hilbert».11 En este artículo definió un
subsistema de análisis clásico y demostró rigurosamente por medios finitos que
estaba libre de contradicciones.12 Incorrectamente, conjeturó que se podía demos-
trar la consistencia de todo el análisis con los mismos métodos.
En 1928, Hilbert volvió al tema que había considerado en 1900. Esta vez fue
durante el Octavo Congreso Internacional de Matemáticos, celebrado en Bolonia
(fue entonces cuando los matemáticos alemanes decidieron volver a participar en
aquellos congresos, a los que no habían asistido desde después de la Primera Gue-
rra Mundial). Allí Hilbert presentó una comunicación en la que trató del deno-
minado Entscheidungsproblem o «problema de la decisión»: «Demostrar si existe
un algoritmo para decidir si una proposición matemática es una consecuencia
lógica de otras». Es interesante citar algo de lo que dijo entonces Hilbert:13 «En
matemáticas no existe ignorabimus; más bien, siempre somos capaces de contestar
a preguntas con sentido, y está bien establecido, como acaso anticipó Aristóteles,
que nuestra razón no incluye ningún tipo de misterioso arte, sino que procede de
acuerdo a reglas que podemos formular, que están definidas de manera completa
y que garantizan la objetividad absoluta de sus juicios».
Sí, nuestra mente es objetiva, pero lo que no esperaba Hilbert es que se pu-
diese llegar a conclusiones como la que obtuvo solo tres años después un lógico
natural de Brünn, entonces parte del Imperio Austrohúngaro (en la actualidad
pertenece a la República Checa), de nombre Kurt Gödel (1906-1978): que en
10
John von Neumann, «Eine Axiomatisierung der Mengenlehre», Journal für reine und an-
gewandte Mathematik 154, 219-240 (1925).
11
John von Neumann, «Zur Hilbertschen Beweistheorie», Mathematische Zeitschrift, 26, 1-46
(1927).
12
No debe pasar desapercibido la expresión «por medios finitos». La matemática intuicionista
hacía hincapié en tales medios, compatibles con la capacidad operacional del ser humano. La incli-
nación de Von Neumann por este elemento intuicionista representó, en cierto sentido, una buena
preparación para sus trabajos con las computadoras, ya que los algoritmos en la base de las compu-
tadoras son finitos por naturaleza. Según Herman Goldstine («The role of John von Neumann in
the computer field», en Springs of Scientific Creativity, R. Aris, H. T. Davis, R. H. Stuewer, eds.,
University of Minnesota Press, Minneapolis, 1983, pp. 308-327; p. 314), Von Neumann solía decir
que las computadoras hicieron que la matemática intuicionista pasase de ser teología a ser realidad.
Sobre la relación de Von Neumann con el intuicionismo, véase Dirk van Dalen, Mystic, Geometer,
and Intuicionist. The Life of L. E. J. Brouwer, vol. 2 («Hope and Desillusion») (Clarendon Press,
Oxford, 2005), especialmente pp. 636-638.
13
David Hilbert, «Probleme der Grundlegung der Mathematik», Atti del Congresso Interna
zionale dei Matematici. Bologna 3-10 Settembre 1928, tome I (Nicola Zanichelli, Bologna, 1929),
pp. 135-141; publicado también en Mathematische Annalen 102, 1-9 (1930); pp. 3, 9.
17
Fund_MAT_00c.indd 17 3/5/18 16:13

Kurt Gödel (1906-1978).
matemáticas sí existen ignorabimus, esto es, proposiciones que son indecidibles;

más específicamente, que los sistemas formales aritméticos establecidos por Al-
fred North Whitehead y Bertrand Russell en su seminal Principia Mathematica
(1910, 1912, 1913) son, aun siendo consistentes, incompletos, o, en otras pala-
bras, que en la aritmética existen proposiciones cuya verdad o falsedad no se pue-
de demostrar.14
La primera presentación pública de este resultado tuvo lugar durante la Segun-
da Conferencia sobre Epistemología de las Ciencias Exactas que se celebró en Kö-
nigsberg del 5 al 7 de septiembre de 1930. El primer día, Von Neumann habló
sobre los puntos de vista «finitistas» de Hilbert, mientras que Rudolf Carnap y Arend
Heyting abordaron las, respectivamente, posiciones logicistas e intuicionistas. El día
7 le tocó al turno a Gödel y fue entonces cuando presentó parte de los resultados
que le harían famoso (estrictamente, lo que presentó fue una versión de su primer
teorema de incompletitud). Von Neumann entendió inmediatamente el significado
de la presentación de Gödel y el 20 de noviembre escribía a este lo siguiente:15
14
Kurt Gödel, «Über formal unentscheidbare Sätze der Principia Mathematica und verwandter
Systeme I», Monantshefter für Mathematik und Physik 38, 173-198 (1931).
15
Esta carta, al igual que la que cito a continuación, se reproducen (en su original alemán y
traducidas al inglés) en Kurt Gödel, Collected Works, vol. V («Correspondence H-Z»), S. Feferman,
J. W. Dawson, jr., W. Goldfarb, Ch. Parsons y W. Sieg, eds. (Clarendon Press, Oxford, 2003), pp. 336-
340. También se hallan en Miklós Rédei, ed., John von Neumann: Selected Letters (London Mathema-
tical Society-American Mathematical Society, 2005), pp. 123-125. La relación entre Gödel y Von
Neumann, que se extendió a cuando ambos vivían en Estados Unidos, se detalla en John W. Dawson,
jr., Logical Dilemmas. The Life and Work of Kurt Gödel (A. K. Peters, Wellesley, Mass., 1997).
18
Fund_MAT_00c.indd 18 3/5/18 16:13

Querido Sr. Gödel,

Recientemente he estado ocupándome de nuevo de la lógica, utilizando métodos
que usted ha empleado con tanto éxito para mostrar propiedades indecidibles. Al hacer
esto, he obtenido un resultado que me parece notable. A saber, he sido capaz de demos-
trar que no se puede demostrar la consistencia de las matemáticas.
A continuación le explicaba lo que había hecho, para pasar después a decirle

que «estaría muy interesado en conocer su opinión sobre esto […] ¿Cuándo apa-
recerá su artículo, y cuándo estarán disponibles las pruebas de imprenta? Esto
tiene también un interés técnico para mí, ya que querría seguirle lo más cerca que
fuese posible, tanto en sustancia como en notación, y por otra parte me gustaría
publicar tan pronto como fuese posible».
Sabemos que Gödel le respondió, pero su carta no se conserva, aunque todo
indica que en ella comentaba que había demostrado el gran resultado por el que
es recordado (segundo teorema de incompletitud). Sí se conserva lo que Von Neu-
mann respondió, el 29 de noviembre, a esa carta perdida; en ella decía:
Muchas gracias por su separata.16 Como usted ha establecido el teorema de la inde-

mostrabilidad de la consistencia como una continuación natural y profundización de
sus anteriores resultados, está claro que yo no publicaré sobre este asunto […]
Por consiguiente, creo que su resultado ha resuelto negativamente la cuestión fun-
damental: no existe justificación lógica para la matemática clásica. Qué sentido debemos
atribuir a nuestra esperanza, según la cual es de facto consistente, es algo que no sé, pero
en mi opinión esto no cambia el hecho completado.
Estoy deseando con gran interés recibir sus pruebas de imprenta.
Por lo que decía en esta carta, no es imposible pensar que Von Neumann tam-
bién había logrado demostrar el segundo teorema de incompletitud, lo que da idea
de su estatura como matemático puro. Lo que está claro es que los resultados ob-
tenidos por Gödel le impresionaron; a Rudolf Carnap, miembro entonces del
Círculo de Viena (en 1935 emigró a Estados Unidos) le escribía unos meses des-
pués, el 7 de junio de 1931:17
He sabido de Gödel (¿al que usted tal vez también conoce?) sobre sus resultados en
Königsberg y después mediante correspondencia. Estos teoremas (que desde entonces
ya se han publicado) demuestran que ciertas afirmaciones lógicas y matemáticas, tales
como, por ejemplo, la consistencia del análisis, no se pueden demostrar en ciertos siste-
mas formales lógicos […] Por consiguiente, hoy mi opinión es que:
Gödel ha demostrado que el programa de Hilbert es irrealizable.18
16
Se debe referir a K. Gödel, «Einige metamathematische Resultate über Entscheidungsdefinitheit
und Widerspruchsfreiheit», Anzeiger der Akademie der Wissenschaften in Wien, 67, 214-215 (1930).
17
Citada en Rédei, ed., John von Neumann: Selected Letters, op. cit., pp. 85-86.
18
Aquí Von Neumann añadía la siguiente nota a pie de página: «Querría hacer hincapié en que
nada es falso en los propósitos de Hilbert. Si se pudiesen llevar adelante, se seguiría de ellos absolu-
tamente lo que sostiene. Pero no pueden llevarse adelante, algo que sólo he sabido desde septiembre
de 1930».
19
Fund_MAT_00c.indd 19 3/5/18 16:13

No existen más razones para rechazar el intuicionismo (si uno no toma en cuenta
el tema estático, que en la práctica para mí también será el factor decisivo).
En 1931 parece que Von Neumann consideraba a Carnap lo suficiente para

mantener alguna correspondencia con él sobre el importante asunto de los resul-
tados de Gödel. Si era así, en 1939 la situación había cambiado, como demuestra
el contenido de una carta que escribió el 18 de julio de aquel año al físico húnga-
ro (fue catedrático de Física Teórica en la Universidad Pazmany Peter de Budapest),
amigo de la familia de Von Neumann, Rudolf Ortvay:19
Yo también pienso que los resultados de Gödel significan que no existe un sistema
axiomático «completo», ni siquiera en matemáticas, y creo que actualmente no hay nin-
guna otra interpretación consistente de esta compleja cuestión. Desde el punto de vista
de la discusión y evaluación de lo verdaderamente matemático; esto es, de las cuestiones
lógico-matemáticas que hay que discutir y evaluar, considero que las cosas de Carnap son
naifs y débiles. Sencillamente, Carnap no posee el conocimiento mínimamente necesario
para considerar estos asuntos, menos aún para decir algo nuevo. Así, por ejemplo, expre-
sa con un aire de terrible auto-importancia puntos de vista totalmente naifs y simplistas
sobre la cuestión de la «completitud» de la axiomática de la matemática («categoricidad»).
Si las cosas fuesen tan sencillas como él imagina, entonces no se necesitaría la «investiga-
ción en los fundamentos de la matemática» («Grundlagenforschung»), ¡al menos desde el
punto de vista de la matemática! ¿Piensa que Carnap tiene algo nuevo o científicamente
interesante que decir sobre la estructura de los lenguajes; o, más generalmente, que lo que
hace acaso pueda ser considerado como preparando el terreno para trabajos posteriores
más serios? Yo soy totalmente incapaz de juzgar si Carnap merece algún crédito para que
su influyente «escuela» de filósofos pueda abordar con seriedad cuestiones filosóficas en
las ciencias naturales y exactas. Obviamente, muchos aquí piensan que la respuesta es «sí».
De cualquier manera, es una pena que tengamos que informarnos sobre un asunto muy
sólido por una fuente tan confusa. N. b. Me entristece especialmente que mientras que
el nombre de Gödel está constantemente en los labios de Carnap, es obvio que él no
comprende en absoluto el significado real de los resultados de Gödel.
El resultado de Gödel, recordemos, figura entre los más importantes de toda

la historia de la ciencia, con implicaciones que van más allá de la matemática,
afectando profundamente a la filosofía y teoría del conocimiento. Ahora bien, sus
consecuencias prácticas para la investigación matemática no fueron lo devastadoras
que podían haber sido, dado su desmoralizador fondo. Von Neumann recalcó este
hecho en un artículo de carácter general titulado «The mathematician»:20
Al desaparecer [debido a los resultados de Gödel] la principal esperanza de una

justificación de la matemática clásica —en el sentido de Hilbert o de Brouwer y Weyl—,
19
Citada en Rédei, ed., John von Neumann: Selected Letters, op. cit., pp. 203-204.
20
John von Neumann, «The mathematician», en R. B. Heywood, ed., The Works of the Mind
(University of Chicago Pres, Chicago, 1947), pp. 180-196; reimpreso en The Neumann Compendium,
F. Bródy y T. Vámos, eds. (World Scientific, Singapur, 1995), pp. 618-626; cita en p. 623.
20
Fund_MAT_00c.indd 20 3/5/18 16:13

entonces la mayor parte de los matemáticos decidieron utilizar de todas maneras ese
sistema [el «clásico»]. Después de todo, la matemática clásica estaba produciendo resul-
tados que eran tanto elegantes como útiles, e incluso aunque uno no pudiese estar
completamente seguro de su certidumbre, se apoyaba en una base tan razonable al me-
nos como, por ejemplo, la existencia del electrón. En consecuencia, si se está dispuesto
a aceptar las ciencias, se debe aceptar también el sistema clásico de matemáticas. Este
punto de vista fue aceptado incluso para algunos de los protagonistas más originales del
sistema intuicionista. En la actualidad, la controversia sobre los «fundamentos» no está
ciertamente cerrada, pero parece muy improbable que el sistema clásico se abandone
salvo por una pequeña minoría.
Como señalaba Von Neumann, la controversia sobre los fundamentos de la

matemática no estaba cerrada, pero después de los resultados obtenidos por Gödel
él abandonó la metamatemática. Pero he avanzado demasiado, y es preciso retro-
ceder en el tiempo.
Física y matemáticas en Gotinga

Inmediatamente después de obtener el doctorado, John von Neumann se tras-
ladó a Gotinga con una beca de la Fundación Rockefeller, para trabajar como
ayudante de David Hilbert, cuyos intereses no se limitaban a la matemática pura,
incluyendo también la física teórica.21 Entre esos intereses físicos, se encontraba la
física cuántica. Según Walter Elsasser, quien en 1926 era estudiante en Gotinga,
durante una larga discusión en una de las sesiones del seminario de «Estructura
de la materia», al que Hilbert asistía regularmente, este mencionó los rápidos pro-
gresos que había realizado, en colaboración con Von Neumann, en la aplicación
de los operadores lineales a la mecánica cuántica, a la vez que señalaba que no era
la primera vez que se ocupaba de cuestiones de ese tipo:22
Mucho antes, hacia comienzos del siglo, había colaborado con un físico (y si la
memoria no me engaña, se trataba de Rydberg, el espectroscopista), siendo entonces el
21
Ya en 1900, en el citado discurso que pronunció en el Segundo Congreso Internacional de
Matemáticos celebrado en París, Hilbert había seleccionado «El tratamiento matemático de los axio-
mas de la Física», como uno de los 23 problemas más importantes de la matemática de la época. Tal
interés por la física se plasmó de maneras diferentes: por un lado, con aportaciones concretas, como
en 1915, cuando participó activamente en la búsqueda de las ecuaciones del campo de una teoría
relativista de la gravitación, siguiendo el enfoque que Einstein había adoptado y que culminó con
la formulación de la relatividad general. Otra forma fue a través de seminarios y cursos: en los últi-
mos años del siglo xix, ofreció con Felix Klein varios seminarios avanzados dedicados a la mecánica
(en 1905 organizó, junto a Hermann Minkowski, Emil Wiechert y Gustav Herglotz, un seminario
dedicado a la teoría del electrón, y durante la Primera Guerra Mundial fundó con Peter Debye un
seminario sobre la «Estructura de la materia»). Más información en Leo Corry, David Hilbert and
the Axiomatization of Physics (1898-1918) (Kluwer, Dordrecht, 2004).
22
Walter M. Elsasser, «Philosophical dissonances in quantum mechanics», en W. Yourgrau y
A. van der Merwe, eds., Perspectives in Quantum Theory (The MIT Press, Cambridge, Mass., 1971),
pp. 199-218; cita en pp. 200-201.
21
Fund_MAT_00c.indd 21 3/5/18 16:13

problema encontrar un operador lineal cuyos autovalores representasen las líneas espec-
trales. El proyecto fracasó y fue abandonado por razones muy concretas: Hilbert fue
capaz de demostrar que dado un problema lineal con una sucesión infinita de valores
característicos [autovalores] discretos, E1, E2, …, su punto de convergencia debe ser
necesariamente En → 0, o En → ∞. Si se supone que los En son energías (o funciones
monótonas de la energía), se llega fácilmente a una contradicción con la experiencia lo
que, para Hilbert, era fatal para ese esquema: del teorema precedente se concluye que
en una serie de líneas espectrales no puede darse convergencia hacia un punto dentro
del espectro observado, lo que está en flagrante contradicción con la experiencia, en
donde se observan esos puntos. Sólo algunos años después, Ritz descubrió el hecho de
que la frecuencia de las líneas espectrales y sus correspondientes energías no son propor-
cionales a los niveles de energía de átomos o moléculas, sino que son proporcionales a
la diferencia entre niveles de energía. Esto eliminó inmediatamente la paradoja de Hil-
bert, pero por entonces —señaló Hilbert— hacía mucho que había pasado a ocuparse
de otros problemas, habiendo olvidado todo acerca de la espectroscopía.
Al trabajar en este tipo de problemas físicos, Hilbert se beneficiaba de una de

sus especialidades como matemático: la teoría de ecuaciones integrales. Su princi-
pal aportación en este campo fue reducir la solución de ciertas ecuaciones integra-
les, y también de algunas ecuaciones diferenciales, a un problema en teoría de
invariantes. Trató esas ecuaciones como límites de sistemas con un número infini-
to de ecuaciones lineales, utilizando determinantes infinitos para resolverlas. Al
hacer esto, se introdujo en el dominio del análisis de infinitas variables indepen-
dientes, que conduciría posteriormente, formalizado por Von Neumann, a lo que
se denomina espacio de Hilbert. En el obituario de Hilbert preparado por Hermann
Weyl, encontramos un buen resumen de estos trabajos:23
Una casualidad, una conferencia que el matemático sueco E. Holmgren pronunció

en 1901 en el seminario de Hilbert sobre el entonces recientemente publicado, ahora
clásico, artículo de Fredholm sobre ecuaciones integrales, suministró el impulso para que
Hilbert comenzase sus investigaciones en este tema, investigaciones que absorbieron su
atención hasta 1912. Fredholm se había limitado a establecer el análogo de la teoría de
ecuaciones lineales, mientras que Hilbert se dio cuenta de que el análogo de la transfor-
mación de formas cuadráticas en ejes principales proporciona la teoría de autovalores y
autofunciones para los problemas de vibraciones en física. Desarrolló el paralelismo
entre ecuaciones integrales y la suma de ecuaciones de infinitas incógnitas, procediendo
subsiguientemente a desarrollar la teoría espectral de formas «totalmente continuas» al
mucho más general de formas cuadráticas «acotadas». En la actualidad, todas esas cosas
se nos presentan en el esquema de una teoría general del espacio de Hilbert. De hecho,
es sorprendente la variedad de aplicaciones interesantes que tienen las ecuaciones inte-
grales en diversas ramas de la matemática y la física.
23
Hermann Weyl, «David Hilbert 1862-1943», Obituary Notices of Fellows of the Royal Society 4,
547-553; reproducido en K. Chandrasekharan, ed., Hermann Weyl, 1885-1985 (Springer-Verlag,
Berlín, 1968), vol. IV, pp. 121-129; cita en p. 126.
22
Fund_MAT_00c.indd 22 3/5/18 16:13

En Gotinga estaba Max Born (antiguo asistente de Hilbert), del que Werner
Heisenberg era ayudante cuando formuló en 1925 su mecánica de matrices, la
primera formulación de una mecánica cuántica. No es extraño, por consiguiente,
que Heisenberg presentase pronto sus ideas en Gotinga; lo hizo en una serie de
conferencias dictadas durante el invierno de 1925. A partir de entonces, Hilbert
comenzó a estudiar de manera sistemática los fundamentos matemáticos de la nue-
va mecánica del microcosmos. Sus ayudantes entonces eran Lothar Nordheim, otro
antiguo pupilo de Born, y, como vimos, Von Neumann, que acaba de llegar a Go-
tinga. Durante el semestre de invierno del curso 1926-1927, Hilbert dio un curso
consistente en dos clases semanales de dos horas cada una, titulado «Mathematische
Methoden der Quantentheorie». Fruto de aquel curso fue la primera publicación
de Von Neumann dedicada a la mecánica cuántica: un artículo, firmado conjunta-
mente con Hilbert y Nordheim.24 En este artículo, los autores intentaban resolver
un problema relacionado con la teoría de las transformaciones (que se ocupaba,
básicamente, de la equivalencia entre las formulaciones —«representaciones»— de
la mecánica cuántica producidas por Heisenberg y, en 1926, Erwin Schrödinger),
tal y como la había desarrollado Paul Dirac. El problema era que la presentación
de Dirac dependía de un objeto mal definido matemáticamente —la función d—,
pero a lo más que llegaron es a una teoría de las transformaciones no muy diferen-
te de las de Dirac y Pascual Jordan, en tanto que sus resultados dependían de trans-
formaciones que, de hecho, no podían completarse si no se utilizaba la d de Dirac.
Sin embargo, el mismo año que publicó el artículo con Hilbert y Nordheim, Von
Neumann resolvió el problema.25 En lugar de relacionar las funciones continuas y
discretas que caracterizan a las versiones matricial y ondulatoria de la teoría cuán-
tica, hizo hincapié en los espacios en que estaban definidas tales funciones. Pudo
así recurrir a un teorema producido en 1907 por el matemático húngaro Frigyes
Riesz y el austríaco Ernst Fischer para definir un espacio (de Hilbert) lo suficiente-
mente general como para superar el problema de la d de Dirac.26
Es posible intuir algo del malestar que debía experimentar Von Neumann al
tener que trabajar con semejantes objetos matemáticos, además de conocer la exi-
gencia matemática con que afrontaba los problemas de la física, leyendo el libro
reproducido aquí, Mathematische Grundlagen der Quantenmechanik (1932), en
cuya introducción se afirma:
24
David Hilbert, John von Neumann y Lothar Nordheim, «Über die Grundlagen der Quan-
tenmechanik», Mathematische Annalen 98, 1-30 (1927). Este artículo, como todos los suyos, se re-
produce, en John von Neumann, Collected Works, A. H. Taub, ed., 6 vols. (Pergamon Press, Oxford,
1961-1963).
25
John von Neumann, «Mathematische Begründung der Quantenmechanik», Nachrichten der
Koniglichen Gesellschaft der Wissenschqften zu Gottingen, Math.Phys. Kl., 1-57 (1927). Este trabajo
se analiza en Max Jammer, The Conceptual Development of Quantum Mechanics, segunda edición
(Tomash Publishers-American Institute of Physics, 1989), pp. 329-335.
26
Frigyes Riesz, «Sur les systèmes orthogonaux de fonctions, Comptes rendus de l’Académie des
Sciences 144, 615-619 (1907); Ernst S. Fischer, «Sur le convergence en moyenne», Comptes rendus
de l’Académie des Sciences 144, 1022-1024 (1907).
23
Fund_MAT_00c.indd 23 3/5/18 16:13

El método de Dirac, seguido hoy por su claridad y elegancia en gran parte de la

literatura relativa a la Mecánica cuántica, no cumple en modo alguno con las exigencias
del rigor matemático, ni aun cuando, por ser justos, se reducen éstas a la medida por lo
demás habitual en la Física teórica. Así, por ejemplo, mantiene constantemente la ficción
de que todo operador autoadjunto puede reducirse a la forma diagonal, pero para aque-
llos operadores en los que de hecho esto no es posible, se hace indispensable la intro-
ducción de funciones «impropias» que muestran propiedades intrínsecamente contra-
dictorias.
Problemas y cuestiones como los anteriores debieron de animar a Von Neu-

mann a dedicarse con más energía que la que entonces había empleado a las que
serían probablemente sus contribuciones más importantes a la matemática: el ál-
gebra de operadores y los operadores no acotados (más concretamente: extensión de
operadores acotados en espacios de Hilbert a operadores no acotados y álgebras
de operadores acotados en espacios de Hilbert). Sus principales publicaciones en
estos dominios, que incluye la creación de la noción de espacio de Hilbert, tal y
como se utiliza en la actualidad, aparecieron en, sobre todo, la década de 1930.27
En estos trabajos utilizó la terminología de «anillos de operadores», conocidos más
tarde como «álgebras de Von Neumann». El primer artículo en el que empleó ese
término, publicado junto a Francis J. Murray, es considerado un clásico. Gian-
Carlo Rota se refirió a él de la siguiente manera:28 «Muchos de nosotros recordamos
el sentimiento de éxtasis que experimentamos cuando leímos por primera vez la
serie de artículos de Von Neumann sobre anillos de operadores en espacios de Hil-
bert. Es un paraíso del que uno nunca puede escaparse (como Hilbert dijo de la
teoría de conjuntos de Cantor)».
Al ocuparse de los anillos de operadores, Von Neumann se dio cuenta de que
era posible generalizar las geometrías ordinarias, de un número discreto de dimen-
siones, y construir geometrías continuas, tema del que se ocupó entre 1936 y 1937.
En efecto, un modo de caracterizar la dimensión de un espacio es mediante el
grupo de rotaciones que admite. El grupo de rotaciones asociado con el anillo de
todos los operadores da como resultado las dimensiones familiares. Sin embargo,
otros grupos, asociados con anillos diferentes, asignan a espacios dimensiones cu-
yos valores pueden variar de manera continua. A partir del caso concreto de los
anillos de operadores, Von Neumann formuló los axiomas que hacen posible es-
pacios de dimensión continua. Las exposiciones más completas sobre este tema,
27
John von Neumann, «Allgemeine Eigenwerststheorie Hermitescher Funktionaloperstoren»,
Mathematische Annalen 102, 49-131 (1929); «Zur Algebra der Funktionaloperatoren und Theo-
rie der normalen Operatoren», Mathematische Annalen 102, 370-427 (1929); F. J. Murray y J. von
Neumann, «On rings of operators», Annals of Mathematics 37, 116-229 (1936); «On rings of ope-
rators, II», American Mathematical Society Transactions 41, 108-248 (1937); «On rings of operators,
IV», Annals of Mathematics 44, 716-808 (1943); John von Neumann, «On rings of operators»,
Annals of Mathematics 41, 94-161 (1940). También, por supuesto, Mathematische Grundlagen der
Quantenmechanik (1932). Sobre las contribuciones de Von Neumann a la teoría de operadores,
véase Rédei, ed., John von Neumann: Selected Letters, op. cit., pp. 9-15.
28
Gian-Carlo Rota, Indiscrete Thoughts (Birkhäuser, Boston, 1977), p. 70.
24
Fund_MAT_00c.indd 24 3/5/18 16:13

vinculado, por cierto, al de sus contribuciones a la teoría de redes, fueron publi-

cadas inicialmente como notas multicopiadas de cursos que dio en el Instituto for
Advanced Study.29 Aparentemente, una de las motivaciones que le llevaron a ocu-
parse de las geometrías continuas y de la teoría de redes fue la de creer que podían
ser instrumentos matemáticos adecuados para ser utilizados en la teoría cuántica.30
Mathematische Grundlagen der Quantenmechanik

Fue en el contexto descrito en la sección precedente en el que Von Neumann
escribió un libro que estableció definitivamente su reputación, ya no solo entre los
matemáticos, sino también entre los físicos. Se trata de Mathematische Grundlagen
der Quantenmechanik (Fundamentos matemáticos de la mecánica cuántica). Publi-
cada en 1932 por Springer Verlag, editorial especializada en publicaciones cientí-
ficas, en esta obra quedaron establecidas firmemente las bases matemáticas de la
mecánica cuántica. Como explicaba Max Born a Einstein en un carta del 10 de
mayo de 1943:31
[En Mathematische Grundlagen der Quantenmechanik] se encuentra la justificación

rigurosa de los conceptos y métodos que Heisenberg, Jordan y yo mismo empleamos; y
en particular el uso, introducido por mí, de matrices como operadores en un espacio de
un número infinito de dimensiones: el «espacio de Hilbert». Yo utilicé para hacer esto
resultados de Hilbert, pese a ser consciente de que las condiciones operacionales impues-
tas por la física eran más restringidas que las planteadas hasta entonces en el tratamien-
to matemático de este espacio. Von Neumann logró establecer demostraciones rigurosas
entre las numerosas hipótesis.
Al comentario de Born habría que añadir que, aunque Von Neumann mantu-
vo la esencia de lo que se denominó interpretación de Copenhague, desarrollada
especialmente por Niels Bohr, dio a la mecánica cuántica una formulación que
evitaba las, en general bastantes oscuras y no demasiado precisas, presentaciones
de Bohr, a quien se puede caracterizar como el ideólogo de la mecánica cuántica.
Antes de pasar a tratar de este libro, citaré algo que el matemático Saunders
Mac Lane recogió en su autobiografía sobre su origen:32
Marshall Stone era un estudiante de George Birkhoff [en Harvard], con una tesis
sobre ecuaciones diferenciales; por ejemplo, ay'' - by' - cy - f (x) = 0. En tales ecuaciones,
29
Véase Garret Birkhoff, «Von Neumann and lattice theory», Bulletin of the American Mathe-
matical Society 64, 50-56 (1958).
30
Otra contribución destacada de Von Neumann en aquella época fue la demostración de que
todo grupo topológico dimensional es continuamente isomorfo a un grupo cerrado de matrices
unitarias de un espacio euclidiano de dimensión finita: «Die einführung analytischer parameter in
topologischen gruppen», Annals of Mathematics 34, 170-190 (1933).
31
The Einstein-Born Letters, 1916-1955 (Macmillan, Nueva York, 2005), p. 140.
32
Saunders Mac Lane, A Mathematical Autobiography (A. K. Peters. Wellesley, Mass., 2005),
p. 70.
25
Fund_MAT_00c.indd 25 3/5/18 16:13

las funciones y y f de x podían ser consideradas como puntos en un espacio de infinitas

dimensiones, conocidos como espacios de Hilbert. Simultáneamente a los estudios de
Stone en Cambridge, Von Neumann estaba explorando estos espacios en Berlín. Cuan-
do Von Neumann envió uno de sus manuscritos a Stone, éste advirtió que se aplicaba
la noción clásica de una ecuación diferencial adjunta, proporcionando operadores ad-
juntos en el espacio. Escribió a Von Neumann, que vio este punto y quiso modificar sus
artículos, que ya estaban en prensa, dispuestos a ir a la imprenta. Su editor, Springer,
aceptó hacer los cambios sólo si él aceptaba escribir un libro sobre la aplicación de los
espacios de Hilbert a la mecánica cuántica, libro que Von Neumann preparó en 1932.
El mismo año, Stone publicó un grueso libro sobre transformaciones lineales en espacios
de Hilbert.
Pasando ya al propio libro, disponemos también de un resumen de su conte-

nido debido al propio Von Neumann, que este incluyó en una carta que envió el
3 de octubre de 1949 a H. Cirker, fundador y presidente de la editorial Dover, que
había publicado en 1943 una reimpresión de Mathematische Grundlagen der Quan-
tenmechanik. En 1949, Von Neumann estaba negociando con Dover la publicación
de una traducción al inglés del libro.33 Junto a comentarios acerca de derechos de
autor, Von Neumann señalaba:34
El contenido [del libro] es, en parte, una muy compleja crítica conceptual de
los fundamentos lógicos de varias disciplinas (teoría de probabilidad, termodinámica,
mecánica clásica, mecánica estadística clásica, mecánica cuántica). Esta discusión filosó-
fico-epistemológica tiene que estar ligada continuamente y de forma bastante crítica
sincronizada con la discusión matemático-física paralela. Es, por cierto, una de las jus-
tificaciones esenciales del libro, cuyo contenido no está cubierto por otros tratados sobre
la mecánica cuántica, escritos por físicos o por matemáticos.
Aunque no hubiese mencionado la relación de Von Neumann con Hilbert, el

título que eligió para su libro ya revela una cierta influencia del catedrático de
Gotinga, que en 1899 había publicado su célebre texto (que ya mencioné) sobre
los fundamentos de la geometría: Grundlagen der Geometrie. En este sentido, el
texto de Von Neumann forma parte de un grupo de obras célebres que incluye,
además del libro de Hilbert, a Die Grundlagen der Arithmetik (1884), de Gottlob
Frege; Fundamenti di Geometria (1891), de Giuseppe Veronese; y Principia Mathe-
matica (1910-1913), de Alfred N. Whitehead y Bertrand Russell.
La primera mitad de Mathematische Grundlagen der Quantenmechanik consis-
te, esencialmente, de una reelaboración de los artículos que ya había dedicado a
los aspectos matemáticos de la mecánica cuántica, mientras que la segunda se
ocupa de la teoría de la medida y de la cuestión de si es posible o no una descrip-
ción causal de la teoría cuántica. Considerado desde un punto de vista esencial-
33
Finalmente, no fue hasta 1955 cuando se publicó esa traducción. Y no lo hizo Dover, sino
Princeton University Press.
34
Esta carta se reproduce en Rédei, ed., John von Neumann: Selected Letters, op. cit., pp. 91-92.
26
Fund_MAT_00c.indd 26 3/5/18 16:13

mente matemático, y aun a costa de repetir cosas que ya mencioné, diré que las
principales aportaciones de Von Neumann fueron: la creación de la noción de
espacio de Hilbert tal y como la conocemos en la actualidad, dentro del contexto
del análisis funcional, del que también fue uno de sus creadores; la formulación
de manera general del problema de autovalores para operadores autoadjuntos,
basándose en la teoría espectral y sin recurrir a la noción de la función delta de
Dirac; y el establecimiento de la teoría de operadores no acotados. El mismo año,
1932, en el que se publicó Mathematische Grundlagen der Quantenmechanik, apa-
recieron otros dos libros que, junto con el de Von Neumann, fueron decisivos para
establecer el análisis funcional como uno de los campos más importantes del aná-
lisis moderno: Théorie des opérations linéaires, del polaco Stefan Banach, y Linear
Transformations in Hilbert Space and their Applications to Analysis, del estadouni-
dense Marshall H. Stone.35
El capítulo I es, en realidad, una introducción de ideas muy generales respec-
to a la estructura básica de la mecánica cuántica, mientras que el II se parece más
a un tratado puramente matemático que a un texto dedicado a analizar un tema
de física, aunque esta se va introduciendo en apartados como los que se dedican
a operadores lineales en el espacio de Hilbert E∞ (transformaciones lineales de E∞
sobre sí mismo) y al problema de valores propios (o autovalores).
Es en el capítulo III («La estadística de la mecánica cuántica») donde la mecá-
nica cuántica hace su aparición de manera explícita. Prácticamente de entrada se
introduce (p. 140) un elemento esencial en la interpretación clásica de la mecánica
cuántica: «∣Φ(q1, …, qk)∣2 define la densidad de probabilidad del sistema en los
puntos q1, …, qk del espacio de los estados». Uno de los puntos más importantes
que trataba allí Von Neumann, el que consideraba «el más general enunciado pro-
babilísticamente posible» —denominado a veces en la literatura «postulado de pro-
yección» (P en la terminología de Von Neumann)— era el de la probabilidad de
que las magnitudes de los operadores, R1, …, Ri, asociados a un estado Φ tomen
determinados valores. En un contexto altamente matemático, en la sección 3 Von
Neumann señalaba que cuando los operadores correspondientes a las magnitudes
en cuestión son permutables, P indica las probabilidades de que, en un mismo
estado Φ, varias magnitudes tomen simultáneamente ciertos valores prefijados. Sin
embargo, P no daba ninguna información acerca de la interdependencia estadística
entre las magnitudes cuando los operadores no son permutables, caso en el que solo
se obtiene información relativa a la distribución de probabilidad para cada una de
las magnitudes. «Lo más sencillo», apuntaba Von Neumann (p. 150), «será admitir
que esto no es sino una imperfección de P y que debe haber una fórmula más ge-
neral que abarque también estos casos. Porque aun cuando la mecánica cuántica
35
Para más información sobre la historia de los orígenes del análisis funcional, incluyendo el
papel de estos tres libros, cabe consultar G. Birkhoff y E. Kreyszig, «The establishment of functional
analysis», Historia Mathematica 11, 258-321 (1984), y Reinhard Siegmund-Schultze, «The origins
of functional analysis», en Hans Niels Jahnke, ed., A History of Analysis (American Mathematical
Society/London Mathematical Society, Providence, 2003), pp. 385-407.
27
Fund_MAT_00c.indd 27 3/5/18 16:13

proporciona tan solo informaciones de carácter estadístico tocante a la Naturaleza,

con todo lo menos que podemos esperar de ella es que describa, no únicamente las
estadísticas entre magnitudes por separado, sino que incluya asimismo las correla-
ciones entre varias de ellas. Sin embargo, en contra de esa concepción que a prime-
ra vista parece razonable, veremos desde luego que una tal generalización de P no
es posible, y que junto a motivos formales (que descansan en la propia estructura
del instrumento matemático de la teoría), los cuales hablan en favor de semejante
limitación, los hay también, y de mucho peso, de índole física».36
Dentro del contexto de explorar las consecuencias de P, Von Neumann llega-
ba en esa sección III.3 al denominado «colapso de la función de onda», una de las
características más acusadas de la interpretación canónica de la mecánica cuánti-
ca.37 Interrumpiendo su riguroso discurso matemático, señalaba (p. 154), demos-
trando una notoria sensibilidad física:
Cierto es que el «cómo» queda sin aclarar: ese tránsito discontinuo a modo de salto
desde Φ hasta uno de los estados Φ1, Φ2…, con seguridad es de una muy otra índole que
el descrito por la ecuación temporal de Schrödinger: ¡ésta da lugar siempre a un cambio
continuo de Φ, cuyo resultado final está unívocamente determinado y depende de Φ!
Volveré al problema implícito en este comentario cuando trate del problema

de la medida según se aborda en Mathematische Grundlagen der Quantenmechanik.
Pero antes, respetando el orden seguido por Von Neumann, es preciso detenerse
en el problema de las variables ocultas.38
Variables ocultas
La idea de si existieran variables, denominadas variables ocultas, aún sin deter-
minar, en mecánica cuántica que pudieran restituir la causalidad ya fue conside-
36
El uso que Von Neumann daba al postulado de proyección en su tratamiento recibió críticas;
véase, por ejemplo, Jeffrey Bub, «The measurement problem of quantum mechanics», en Problems
in the Foundations of Physics (North-Holland, Ámsterdam, 1979), pp. 71-124.
37
El concepto de «colapso de la función de onda» fue introducido por Werner Heisenberg en
1927, en el mismo artículo que presentó su principio de incertidumbre; más concretamente en la
sección 3, titulada «La transición de la micro- a la macromecánica», aunque es cierto que la presen-
tación no es demasiado clara, especialmente si la comparamos con la que terminaría imponiéndose.
Allí nos encontramos con expresiones como: «Creo que se puede formular satisfactoriamente el
origen de la “órbita” clásica de la siguiente manera: la “órbita” se hace realidad solamente cuando la
observamos», y «la segunda determinación de la posición selecciona un determinado q [posición] de
entre todas las posibilidades y limita las opciones para todas las medidas subsiguientes». Werner
Heisenberg, «Über den anschaulichen Inhalt der quantentheoretischen Kinematik und Mechanik»,
Zeitschrift für Physik 43, 172-198 (1927); cita en pp. 185-186.
38
Para más información acerca de los contenidos de Mathematische Grundlagen der Quanten-
mechanik, véase Miklós Rédei y Michael Stöltzner, eds., John von Neumann and the Foundations of
Quantum Physics (Kluwer, Dordrecht, 2001); Max Jammer, The Conceptual Development of Quantum
Mechanics, op. cit., pp. 390-397, y Max Jammer, The Philosophy of Quantum Mechanics (John Wiley
& Sons, Nueva York, 1974), pp. 474-482.
28
Fund_MAT_00c.indd 28 3/5/18 16:13

rada en 1926. En el mismo artículo que introdujo la interpretación estadística de

la función de onda, Born aludió de manera indirecta a esta cuestión en los siguien-
tes términos:39
Desde el punto de vista de nuestra mecánica cuántica no existe ninguna cantidad

que fije causalmente en un caso individual la consecuencia de la colisión; pero experi-
mentalmente tampoco disponemos hasta el momento de ninguna razón para creer que
existan algunas propiedades intrínsecas del átomo que condicionen un resultado defini-
do de la colisión. ¿Debemos esperar descubrir en el futuro algunas propiedades (como
fases o movimientos atómicos internos) y determinarlas en casos individuales? ¿O debe-
mos creer que el acuerdo entre teoría y experimento —con respecto a la imposibilidad
de prescribir condiciones para una evolución causal— constituye una armonía preesta-
blecida fundada en la no existencia de tales condiciones? Yo me siento inclinado a aban-
donar el determinismo en el mundo de los átomos. Pero esta es una cuestión filosófica
para la que los argumentos físicos solos no son decisivos.
En Mathematische Grundlagen der Quantenmechanik, Von Neumann negaba la

posibilidad de una versión causal de la mecánica cuántica. Y daba gran importan-
cia a este resultado: en la «Introducción» escribió:
Se discute, además, con todo detalle la cuestión de si es posible reducir el carácter

estadístico de la mecánica cuántica a un aspecto equívoco, esto es, incompleto, de nues-
tra descripción de la Naturaleza: esta explicación estaría exactamente de acuerdo con el
principio general según el cual todo enunciado probabilístico nace de la no integridad
de nuestros conocimientos. Repetidas veces ha sido propuesta esta explicación que recu-
rre a «parámetros ocultos», al igual que otra, afín con ella, que atribuye los «parámetros
ocultos» al observador y no al sistema observado. Con todo, se demuestra que difícil-
mente se puede esto conseguir de modo satisfactorio; más exactamente: una tal explica-
ción es incompatible con ciertos postulados fundamentales de la mecánica cuántica.
La demostración de Von Neumann fue aceptada por la gran mayoría de la

comunidad de físicos durante al menos veinte años. Un ejemplo, entre los muchos
posibles, de las opiniones de los físicos sobre los resultados que había obtenido lo
proporciona Max Born, quien en las conferencias Waynflete que dictó en Oxford
en 1948 señaló:40
Yo nunca esperaría que estas dificultades [autoenergías, integrales divergentes en

secciones eficaces] se resolviesen regresando a los conceptos clásicos. Espero más bien lo
contrario, que tengamos que sacrificar algunas de nuestras ideas actuales y utilizar mé-
todos todavía más abstractos. Sin embargo, esto son sólo opiniones. Una contribución
más concreta a esta cuestión ha sido realizada por J. v. Neumann en su brillante libro,
Mathematische Grundlagen der Quantenmechanik. Allí pone la teoría en base axiomática
39
Max Born, «Zur Quantenmechanik der Stossvorgänge. (Vorläufige Mitteiling)», Zeitschrift
für Physik 37, 863-867 (1926); p. 866.
40
Max Born, Natural Philosophy of Cause and Chance (Clarendon Press, Oxford, 1949), p. 109.
29
Fund_MAT_00c.indd 29 3/5/18 16:13

deduciéndola de unos pocos postulados de carácter muy plausible y general [...] El re-
sultado es que el formalismo de la mecánica cuántica está determinado de manera uní-
voca por estos axiomas; en particular, no se pueden introducir parámetros ocultos que
sirvan para permitir convertir la descripción indeterminista en una determinista. Por
consiguiente, en el caso de que una teoría futura sea determinista, no puede ser una
modificación de la actual, sino que debe ser esencialmente diferente. El cómo puede ser
esto posible sin sacrificar todo un tesoro de resultados bien establecidos es algo que dejo
a los deterministas para que se preocupen de ello.
Participantes en la Shelter Island Conference, junio de 1947 (Von Neumann es el undéci-

mo por la derecha) (Fermilab Photograph, cortesía de AIP Emilio Segrè Visual Archives,
Marshak Collection).
Que yo sepa, ningún físico cuestionó explícitamente la validez del resultado

de Von Neumann antes de 1952, año en que David Bohm, un físico estadouni-
dense que acababa de dejar la Universidad de Princeton corno consecuencia de la
cruzada anticomunista lanzada por el senador Joseph McCarthy, publicó un artí-
culo (dividido en dos partes) en el que construyó un sencillo modelo de variables
ocultas que coincidía, en su dominio de aplicación, con la mecánica cuántica en
todos los aspectos estadísticos de esta.41 Pero antes de comentar la aportación de
41
David Bohm, «A suggested interpretation of the quantum theory in terms of “hidden varia-
bles”, I and II», Physical Review 85, 166-193 (1952). Con anterioridad, Bohm había sido un segui-
dor estricto de la interpretación de Copenhague, como se comprueba en el magnífico, y muy exito-
so, texto general que publicó sobre la mecánica cuántica: David Bohm, Quantum Theory (Prentice
Hall, Englewood Cliffs, N. J., 1951), en el que ofrecía una prueba de que la mecánica cuántica era
inconsistente con las variables ocultas.
30
Fund_MAT_00c.indd 30 3/5/18 16:13

Bohm es necesario detenerse en un artículo que Einstein publicó en 1935 junto

a dos colaboradores.
Einstein-Podolsky-Rosen
Es bien sabido que Albert Einstein fue un pertinaz crítico de la mecánica
cuántica, al menos interpretada como una teoría probabilista. Famosas son las
discusiones que mantuvo con Niels Bohr. Una vez instalado en Estados Unidos,
en el Institute for Advanced Study, Einstein dio un paso más en sus críticas a la
teoría cuántica en un artículo publicado en 1935 junto a Boris Podolsky y Nathan
Rosen. Se titulaba: «¿Puede considerarse completa la descripción mecánico-cuán-
tica de la realidad física?».42
El texto de Einstein, Podolsky y Rosen (EPR) se refiere a la relación lógica
entre dos afirmaciones, la de que la descripción de la realidad en mecánica cuán-
tica mediante una función de onda es incompleta, y el que magnitudes incompa-
tibles (dos magnitudes físicas cuyos operadores no conmutan, como la posición y
el momento) no pueden tener un valor real, perfectamente definido, de manera
simultánea. Su conclusión era que solo se puede mantener una de estas dos afir-
maciones, la que sostiene que la descripción mecano-cuántica de la realidad física
mediante la función de onda es incompleta.
Lo que demostraron es que la suposición de que la función de onda contiene
una descripción completa de la realidad física de un sistema, junto con el criterio
de realidad que introdujeron, conduce a una contradicción. Para ello proponían
un experimento mental, con dos sistemas, cuyos estados iniciales son conocidos,
que interaccionan durante un cierto tiempo y luego se separan. Su argumentación
se basaba en que se puede conocer el estado del sistema conjunto en cualquier
instante posterior (resolviendo la ecuación de Schrödinger), pero no el estado de
cada sistema por separado, porque la realización de una medición en uno de los
sistemas produce una «reducción del paquete de onda» que conduce a que el
segundo sistema se deje en un estado con dos funciones de onda distintas, de
donde concluían que la teoría cuántica no era completa. Prosiguiendo con el
experimento mental, demostraban que si la función de onda proporciona una
descripción completa, y si las dos funciones de onda se corresponden a dos mag-
nitudes físicas cuyos operadores no conmutan, el experimento conduce a que las
dos magnitudes se pueden medir en cualquiera de las partículas sin perturbarlas;
esto es, que eran elementos de la realidad física. Para conocer el estado de uno
cualquiera de los dos subsistemas tendría que realizarse una medida de alguna
magnitud física (un observable en la terminología cuántica) en este subsistema,
lo que daría lugar a un estado definido por el colapso de la función de onda. El
punto importante es que, si se mide un observable en el subsistema 1, por ejem-
plo, obteniéndose cierto valor a1, la función de onda (o estado en general) de
42
Albert Einstein, Boris Podolsky y Nathan Rosen, «Can quantum.mechanical description of
physical reality be considered complete?», Physical Review 47, 777-780 (1935).
31
Fund_MAT_00c.indd 31 3/5/18 16:13

Encabezamiento del artículo de Einstein, Podolsky y Rosen, Physical Review, 47 (1935).
A. Einstein B. Podolsky N. Rosen
Albert Einstein (1879-1955), Boris Podolsky (1896-1966) y Nathan Rosen (1909-1995).
este subsistema queda determinado, lo que a su vez determina el estado del sub-
sistema 2 y el correspondiente valor del observable en este subsistema, a2, sin
necesidad de medir en él y por tanto sin perturbarlo ya que ambos subsistemas están
separados. De acuerdo con la definición de elemento de realidad física, puede
decirse que la cantidad a2 es un elemento de realidad perteneciente al segundo
subsistema. Pero podría haberse medido otro observable B en el subsistema 1 y
aplicar el mismo razonamiento para llegar que habría una cantidad b2 que sería
igualmente un elemento de realidad física del subsistema 2. Ahora bien, eso no
es posible según la mecánica cuántica si los operadores cuánticos correspondien-
tes a los observables A y B no conmutan. De ahí, Einstein, Podolsky y Rosen
concluían que la mecánica cuántica no es una teoría completa, pues sería posible
en principio hallar elementos de realidad que no tendrían contrapartida en esta
teoría.
32
Fund_MAT_00c.indd 32 3/5/18 16:13

Una posibilidad era que existiesen variables, ocultas, que la formulación canó-
nica de la mecánica cuántica no hubiera considerado. No obstante, Einstein, Po-
dolsky y Rosen finalizaban su artículo con cautela:43 «Mientras que hemos demos-
trado que la función de onda no proporciona una descripción completa de la
realidad física, dejamos abierta la cuestión de si existe o no semejante descripción.
Creemos, sin embargo, que tal teoría es posible».
El gato de Schrödinger y el entrelazamiento

Nadie entendió mejor el significado profundo del artículo de Einstein-Podols-
ky-Rosen que Erwin Schrödinger. El mismo año en que apareció el trabajo de
EPR, Schrödinger publicó, en tres partes, un artículo en la revista Die Naturwis-
senschaften, titulado «La situación actual de la mecánica cuántica», en general más
conocido porque en él se presentaba el experimento ideal denominado como el
«gato de Schrödinger».44 Aunque no es esa parte de su artículo la que más me
interesa destacar aquí, no la puedo dejar de lado —es, en cualquier caso, muy
importante—, así que citaré la explicación de Schrödinger:45
Se mete un gato en una cámara de acero, junto con el siguiente dispositivo diabó-
lico (que debe asegurarse contra cualquier interferencia directa del gato): en un contador
Geiger existe un pequeño trozo de sustancia radiactiva, tan pequeña que acaso en el
curso de una hora uno de los átomos se desintegrará, pero también, con igual probabi-
lidad, tal vez ninguno lo hará; si sucede esto [que se produzca la desintegración], el tubo
del contador genera una descarga y mediante un relé se pone en acción un martillo que
rompe un pequeño frasco de ácido cianhídrico. Si hemos dejado el sistema completo
durante una hora, sin intervenir en él de ninguna manera, podríamos decir que el gato
todavía vive si en ese intervalo no se ha desintegrado ningún átomo. El primer átomo
que se hubiera desintegrado lo habría envenenado. La función Ψ del sistema completo
expresaría esto al estar compuesta por el gato muerto y el gato vivo (perdón por la ex-
presión) mezclados o esparcidos en partes iguales.
Lo que Schrödinger estaba señalando es el papel que desempeña la superposi-

ción de estados en la mecánica cuántica. El colapso de la función de onda de la
interpretación de Copenhague de la mecánica cuántica decía, recordemos, que
cuando el observador (que obedece a las leyes de la física clásica, algo, por cierto,
no fácil de aceptar, en la medida en que implica una mezcla poco natural entre
física clásica y cuántica) realiza una medida, esta se concreta, con una cierta pro-
babilidad, en un estado de todos los posibles que alberga la función de onda
completa original. Pero, ¿qué sucede mientras tanto, cuando no se ha hecho la
medida? Parece que la respuesta inmediata no plantea problemas cuando se trata
43
Ibidem, p. 780.
44
Erwin Schrödinger, «Die gegenwärtige Situation in der Quantenmechanik», Die Naturwis-
senschaften 23, 807-812, 823-828, 844-849 (1935).
45
Ibidem, p. 812.
33
Fund_MAT_00c.indd 33 3/5/18 16:13

Erwin Schrödinger (1887-1961).
de átomos, pero ¿y cuando, como ponía en evidencia Schrödinger, se trata de

objetos macroscópicos?
En su artículo, Schrödinger denominó la propiedad que EPR habían puesto
de manifiesto, «Verschränkung» («entrelazamiento»):46
Cualquier «entrelazamiento de predicciones» [«Verschränkung der Voraussagen»] que

tenga lugar, obviamente sólo puede remontarse al hecho de que en un momento anterior
los dos cuerpos formaban en un sentido verdadero un sistema, esto es, que estuvieron
interaccionando y dejaron atrás trazas el uno en el otro. Si dos cuerpos separados, cada
uno de ellos conocidos en sí mismo de forma máxima, entran en una situación en la
que se influyen entre sí, y se separan de nuevo, entonces tiene lugar de manera regular
lo que acabo de llamar entrelazamiento [Verschränkung] de nuestro conocimiento de los
dos cuerpos.
Con mayor claridad, más adelante (tercera entrega, sección 11) explicaba la
característica del entrelazamiento cuántico:47
Supongamos que dos cuerpos, A y B, se han entrelazado durante una interacción

transitoria. Dejemos ahora que los cuerpos se separen de nuevo. Entonces puedo tomar
46
Ibidem, p. 827.
47
Ibidem, p. 844.
34
Fund_MAT_00c.indd 34 3/5/18 16:13

uno de ellos, digamos B, y mediante medidas sucesivas […] obtener un conocimiento

máximo de él. Sostengo que tan pronto como logre esto, y no antes, entonces, primero,
el entrelazamiento se habrá deshecho inmediatamente y, segundo, que también habré
obtenido el máximo conocimiento de A a través de las medidas sobre B.
Para Schrödinger, que se esforzaba en enmarcar el entrelazamiento cuántico en

un contexto de correlaciones, mezclas estadísticas y teoría de la probabilidad, esa
no localidad era una característica inevitable de la teoría cuántica, una manifes
tación, de hecho, de acción a distancia no retardada:48 «Basándose en su innegable
carácter no relativista, la mecánica cuántica ordinaria solamente trata realmente
con el caso de actio in distants». Ahí estaba para él la clave, que resaltaba en la
conclusión:49 «Estas conclusiones, inevitables dentro de la actual teoría, pero re-
pugnantes para algunos físicos, incluyendo al autor, se deben a la aplicación de la
mecánica cuántica no relativista más allá de su rango legítimo».
En ese segundo artículo, Schrödinger hacía referencia a Mathematische Grund-
lagen der Quantenmechanik, concretamente al capítulo VI («La medición»), y a
cómo se trataban allí las mezclas estadísticas. Von Neumann supo del contenido
del artículo gracias a que Einstein, miembro como él del Institute for Advanced
Study de Princeton, le enseñó el manuscrito que Schrödinger le había enviado. Tras
leerlo, Von Neumann escribió una carta a Schrödinger el 11 de abril de 1936. En
ella, y tras agradecer la mención a su método de «mezclas», manifestaba:50 «No
puedo aceptar completamente su § 4 [en el que Schrödinger trataba de las acciones
a distancia en la mecánica cuántica; véase cita anterior]. Creo que las dificultades a
las que alude son “pseudo-problemas”. La “acción a distancia” en el caso conside-
rado, únicamente dice que incluso si no existe interacción dinámica entre dos sis-
temas (p. ej., porque están muy alejados entre sí), los sistemas pueden manifestar
correlaciones estadísticas. Esto no es en absoluto específico de la mecánica cuántica,
sucede también en la clásica». Y a continuación le mostraba algunos ejemplos.
El entrelazamiento que explícitamente sacó a la palestra Schrödinger, la no
localidad de la teoría cuántica, es ciertamente una característica extremadamente
contraintuitiva, ya que viene a decir que elementos que han formado parte de un
sistema cuántico común continúan «informados sobre sus devenires» con inde-
pendencia de cuánto tiempo haya pasado y de cuánta distancia les haya separado.
David bohm y John bell

Volviendo a David Bohm, tenemos que en su artículo de 1952 definía las va-
riables ocultas como aquellas que «en principio determinan el comportamiento
preciso de un sistema individual, pero que en la práctica son promedios sobre los
48
Erwin Schrödinger, «Probability relations between separated systems», Proceedings of the Cam-
bridge Philosophical Society 32, 446-452 (1936), p. 451.
49
Ibidem, p. 452.
50
Reproducida en Rédei, ed., John von Neumann: Selected Letters, op. cit., pp. 210-213.
35
Fund_MAT_00c.indd 35 3/5/18 16:13

David Bohm (1917-1992).
tipos de medidas que se pueden realizar».51 Aunque señalaba que su teoría condu-
cía a «precisamente a los mismos resultados, para todos los procesos físicos, que la
interpretación habitual», añadía que «sin embargo, la interpretación que se sugie-
re proporciona un marco conceptual más amplio que la interpretación habitual,
porque hace posible una descripción precisa y continua de todos los procesos,
incluso en el nivel cuántico». Nótese lo de «continua», que significa que se trataba
de una teoría local.
El artículo de Bohm no pasó desapercibido, pero no modificó demasiado la
consideración en que se tenía a lo que Von Neumann había mantenido en Mathe-
matische Grundlagen der Quantenmechanik (incluso se llegaron a proponer demos-
traciones más generales). Un buen ejemplo en este sentido es el artículo con el que
Wolfgang Pauli contribuyó a un volumen publicado en 1953 en homenaje a Louis
de Broglie.52 Allí, Pauli mantenía que Von Neumann había «demostrado de ma-
nera general» que no es posible reproducir todos los enunciados estadísticos de la
mecánica cuántica de sistemas cerrados por una teoría determinista, y acusaba al
determinismo introducido por Bohm de verse «substraído por principio a la ob-
servación (es decir, es “metafísico”)».53
En 1957, mientras trabajaba en Haifa, Bohm y Yakir Aharonov desarrollaron
una versión no local (esto es, que tenía muy en cuenta el entrelazamiento) más
51
Bohm, «A suggested interpretation of the quantum theory in terms of “hidden variables”»,
op. cit., p. 166.
52
Wolfgang Pauli, «Remarques sur le problème des paramètres cachés dans la mécanique quan-
tique et sur la théorie de l’onde pilote», en Louis de Broglie, physicien et penseur (Albin Michel, París,
1953), pp. 33-42. En sentido parecido al de Pauli se expresaba Leon Rosenfeld en esta misma obra:
«L’évidence de la complémentarité», pp. 43-65). Otro ejemplo es P. Destouches-Février, «Une nou-
velle preuve du caractère essentiel de l’indéterminisme quantique», Comptes rendus 220, 535-555
(1945).
53
Pauli, «Remarques sur le problème des paramètres cachés dans la mécanique quantique et
sur la théorie de l’onde pilote», op. cit., p. 40.
36
Fund_MAT_00c.indd 36 3/5/18 16:13

sólida, también de variables ocultas.54 Básicamente, se trataba de una reformula-

ción más sencilla del escenario diseñado por Einstein, Podolsky y Rosen, pero
sustituyendo la base «posición-momento» por una centrada en el espín. Sin em-
bargo, esto no modificó la opinión general entre los físicos de que Von Neumann
había demostrado la imposibilidad de teorías cuánticas de variables ocultas.
Entre los escasos físicos que repararon en la reformulación del trabajo de
Einstein-Podolsky-Rosen que había producido Bohm, se encuentra John Stewart
Bell (1928-1990), un personaje esencial en la clarificación de las cuestiones que
Einstein y Schrödinger sacaron a la luz. Natural de Belfast, entre 1949 y 1960
Bell trabajó en Inglaterra, la mayor parte del tiempo en el Centro de Investiga-
ción Atómica de Harwell, en física nuclear y cuestiones relacionadas con acele-
radores.55 En 1953-1954, con permiso de ausencia de Harwell, realizó estudios
graduados en la Universidad de Birmingham bajo la dirección de Paul Matthews
y Rudolf Peierls. Fue entonces cuando se familiarizó con la situación en la física
teórica y preparó su tesis doctoral, que defendió en 1956, después de haber re-
gresado a Harwell. Insatisfecho, sin embargo, con el tipo de trabajo que realiza-
ba en Harwell, en 1960 abandonó su puesto permanente allí y aceptó uno
temporal en el CERN, él en la División de Física Teórica. En el CERN pronto
comenzó a dedicar parte de su tiempo libre a los fundamentos de la mecánica
cuántica, dedicación que, junto con la libertad que le proporcionó el año sabá-
tico, 1963-1964, que pasó en Estados Unidos (SLAC, universidades de Wiscon-
sin y Brandeis), dio origen a dos artículos fundamentales. Escribió ambos en
1964, aunque la publicación de uno de ellos se demoró hasta 1966. Se titularon
«Sobre la paradoja de Einstein-Podolsky-Rosen» y «Sobre el problema de las
variables ocultas en la mecánica cuántica».56
En el segundo —el primero conceptualmente y probablemente también el
primero en ser escrito—, Bell demostró que el teorema de Von Neumann tenía
fallos y explicaba cómo Bohm había podido evitarlo construyendo su modelo. La
introducción del artículo explica con claridad las intenciones y resultados de Bell:57
El conocimiento del estado cuántico de un sistema implica, en general, sólo restric-

ciones estadísticas sobre los resultados de las medidas. Parece interesante preguntarse si
este elemento estadístico debe considerarse que surge, como en la mecánica estadística
clásica, porque los estados en cuestión son promedios sobre estados mejor definidos en
54
David Bohm y Yakir Aharonov, «Discussion of experimental proof for the paradox of Eins-
tein, Rosen, and Podolsky», Physical Review 108, 1070-1076 (1957).
55
Sobre John Bell, ver Andrew Whitaker, John Stuart Bell and Twentieth-Century Physics. Vision
and Integrity (Oxford University Press, Oxford, 2016).
56
John S. Bell, «On the Einstein-Podolsky-Rosen paradox», Physics 1, 195-200 (1964), y «On
the problem of hidden variables in quantum mechanics», Reviews of Modern Physics 38, 447-452
(1966).
57
Bell, «On the problem of hidden variables in quantum mechanics», op. cit. Utilizo la traduc-
ción al castellano incluida en John S. Bell, Lo decible y lo indecible en mecánica cuántica (Alianza
Editorial, Madrid, 1990), pp. 25-26.
37
Fund_MAT_00c.indd 37 3/5/18 16:13

John Stewart Bell

(1928‑1990).
los que los resultados estarían completamente determinados de modo individual. Estos
hipotéticos estados «sin dispersión» vendrían especificados no sólo por el vector estado
mecano-cuántico sino además por «variables ocultas» adicionales; «ocultas» porque si
pudieran prepararse estados con valores prescritos de esas variables, entonces la mecáni-
ca cuántica sería inadecuada a nivel observacional.
Ha sido objeto de debate si esta cuestión es verdaderamente interesante. El presen-
te artículo no contribuye a ese debate. Está dirigido a los que encuentran interesante
dicha cuestión y más particularmente a aquellos, de entre ellos, que piensan que «la
cuestión concerniente a la existencia de tales variables ocultas recibió una respuesta
pronta y bastante decisiva en base a la prueba de Von Neumann de la imposibilidad
matemática de tales variables en la teoría cuántica». Se intentará clarificar lo que real-
mente demostraron Von Neumann y sus continuadores […] Se hará hincapié en que
esos análisis dejan intacta la cuestión real. Se verá, de hecho, que esas demostraciones
requieren de los hipotéticos estados sin dispersión, no sólo de que conjuntos apropiados
de ellos hayan de tener todas las propiedades medibles de los estados cuánticos, sino
además algunas otras propiedades. Estas exigencias adicionales parecen razonables cuan-
do se identifican vagamente con propiedades de sistemas aislados. Se ve que no lo son
cuando se recuerda con Bohr «la imposibilidad de cualquier distinción neta entre el
comportamiento de los objetos atómicos y la interacción con los instrumentos de me-
dida que sirven para definir las condiciones bajo las cuales aparecen los fenómenos».
La conciencia de que la demostración de Von Neumann es de relevancia limitada
ha ido ganando terreno desde el trabajo de Bohm de 1952. Sin embargo, se halla lejos
de ser universal. Además, quien escribe no ha encontrado en la literatura ningún análi-
sis adecuado de qué era incorrecto en dicha demostración. Como todos los autores de
artículos de revisión no hechos por encargo, él cree poder hacer una nueva exposición
38
Fund_MAT_00c.indd 38 3/5/18 16:13

del tema con una claridad y simplicidad tales que todas las discusiones previas quedarán
eclipsadas.
Es en la sección 3 («Von Neumann») de este artículo de Bell donde se encuen-

tra por qué la demostración de Von Neumann no era válida en general. «Considé-
rese ahora», se lee allí, «la demostración de Von Neumann de que los estados sin
dispersión, y asimismo, las variables ocultas, son imposibles. Su hipótesis esencial
es: toda combinación real de dos operadores hermíticos cualesquiera representa un
observable y la misma combinación lineal de valores esperados es el valor esperado
de la combinación. Esto es cierto para los estados cuánticos; Von Neumann requie-
re que lo sea también para los hipotéticos estados sin dispersión».58 El problema
(para el teorema de Von Neumann) era que la versión de mecánica cuántica ela-
borada por Bohm no cumplía ese requisito.
En el primer artículo, «Sobre la paradoja de Einstein-Podolsky-Rosen», Bell
demostró que existían unas relaciones (desigualdades) que se podían emplear para
decidir experimentalmente qué tipo de teoría era correcta, si una «completa» (que
incluyese unas variables «ocultas» para la formulación cuántica) que obedeciese a
los requisitos que Einstein, Podolsky y Rosen habían planteado en 1935, o la me-
cánica cuántica tradicional. Como explicaba en la introducción:59
La paradoja de Einstein, Podolsky y Rosen se propuso como un argumento de que

la mecánica cuántica no podía ser una teoría completa, sino que debía ser completada
con variables adicionales. Estas variables adicionales restaurarían la causalidad y localidad
en la teoría. En esta nota se formulará matemáticamente esa idea y se mostrará que es
incompatible con las predicciones estadísticas de la mecánica cuántica. Es el requisito
de localidad, o más precisamente el que el resultado de una medida sobre el sistema no
se vea afectado por operaciones sobre un sistema distante con el cual haya interacciona-
do en el pasado, lo que crea la dificultad esencial. Ha habido intentos de demostrar que
incluso sin tal requisito de separabilidad o localidad no es posible ninguna interpretación
de «variables ocultas». Se han examinado estos intentos en otro lugar [Bell, 1966] y han
sido encontrados defectuosos. Más aún, ha sido explícitamente construida una interpre-
tación de variables ocultas de la teoría cuántica elemental. Esta interpretación particular
tiene ciertamente una marcada estructura no-local. De acuerdo con el resultado que se
demostrará aquí, esto es característico de cualquier teoría de ese tipo que reproduzca con
exactitud las predicciones de la teoría cuántica.
Provistos del análisis de Bell, en 1969 John Clauser, Michael Horne, Abner
Shimony y Richard Holt, de las universidades de Columbia, Boston y Harvard,
propusieron un experimento concreto para aplicar en él la prueba de las desigual-
dades de Bell.60 Sin embargo, los resultados experimentales que obtuvieron no
58
Ibidem, p. 29.
59
Bell, «On the Einstein-Podolsky-Rosen paradox», op. cit.; Lo decible y lo indecible en mecáni-
ca cuántica, op. cit., pp. 41-42.
60
John F. Clauser, Michael A. Horne, Abner Shimony y Richard A. Holt, «Proposed experiment
to test local hidden-variable theories», Physical Review Letters 23, 880-884 (1969).
39
Fund_MAT_00c.indd 39 3/5/18 16:13

fueron concluyentes. Sí lo fueron los que llevó a cabo en 1982 en el Instituto de

Óptica Teórica y Aplicada de Orsay, en las cercanías de París, un equipo dirigido
por Alain Aspect. Y el resultado favoreció a la mecánica cuántica.61 Será rara, con-
traintuitiva, con variables que no se pueden determinar simultáneamente, socava-
rá nuestra idea tradicional de lo que es la realidad, pero es cierta, o no se ha de-
mostrado lo contrario. El análisis de Bell y el experimento de equipo de Aspect
muestran con especial claridad la existencia del ya señalado entrelazamiento, la no
localidad que tanto disgustaba a Einstein.
El problema de la medida en Mathematische Grundlagen

der Quantenmechanik
Otro de los contenidos destacados de Mathematische Grundlagen der Quanten-
mechanik es la teoría de la medida que contiene, un apartado este central en la
interpretación de Copenhague de la mecánica cuántica, al que Niels Bohr dedicó
numerosos esfuerzos y ensayos, no siempre lo suficientemente claros. Von Neu-
mann dedicó a esta cuestión dos capítulos de su libro (el V y el VI). Para intro-
ducir esta faceta de Mathematische Grundlagen der Quantenmechanik es apropiado
recurrir a un artículo de David Bohm:62
Von Neumann no sólo desarrolló un formalismo nuevo, también desarrolló lo que

en ciertos sentidos fue un modo todavía más novedoso de considerar la situación «cuán-
tica» informal (esto es, la forma de las condiciones experimentales y el contexto de los
resultados experimentales). Lo que hizo en este sentido fue proponer una separación
neta entre objeto observado y aparato observador. Se suponía que el primero obedece
las leyes «cuánticas» y que el segundo obedece las leyes «clásicas». Entre los dos existía
un cierto tipo de «corte», pero Von Neumann dio argumentos tendentes a sugerir que
los resultados netos de la teoría dependían de manera crítica de donde se situase.
Pero veamos lo que decía realmente Von Neumann.

De entrada, lo primero que hacía en el capítulo V era distinguir entre los dos
procesos de evolución temporal que se pueden dar en la mecánica cuántica. Uno
caracterizado por cambios arbitrarios provocados por mediciones (el colapso de la
función de onda), en el que el acto de observación «reduce» la función de onda a
una —con cierta probabilidad— de las autofunciones que la forman. Y el otro
debido a «los cambios automáticos que resultan del tiempo», asociado a la causa-
lidad de la función de onda subyacente en la ecuación de Schrödinger. Para Von
Neumann, la situación no dejaba lugar a dudas: el segundo proceso era aquel con
el que la mecánica cuántica «describe los sucesos que tienen lugar en la parte ob-
servada del mundo en tanto que no esté en interacción con la parte que se obser-
61
Alain Aspect, Jean Dalibard y Gérald Dalibard, «Experimental test of Bell’s inequalities using
time-varying analyzers», Physical Review Letters 49, 1804-1807 (1982).
62
David Bohm, «Science as perception-communication», en Frederick Suppe, ed., The Structu-
re of Scientific Theories (University of Illinois Press, Urbana, 1977), pp. 374-391; cita en pp. 383-385.
40
Fund_MAT_00c.indd 40 3/5/18 16:13

va»; tan pronto como se da una interacción entre observador y suceso, es decir,
al producirse una medición, es el primer tipo de suceso el que rige la realidad
cuántica.
La interacción asociada a la medición, el cómo el aparato o el observador afec-
tan al suceso, es algo que en principio se puede definir; Von Neumann lo hacía
diciendo que es la «inserción durante un cierto lapso de tiempo de un cierto aco-
plamiento energético con el sistema que se considera; esto es, la introducción de
una adecuada dependencia temporal de H [operador de energía] impuesta por el
observador». Ahora bien, el auténtico problema residía en el papel del observador
y en el límite entre este y el sistema observado.
Para ilustrar este problema, consideraba el caso de la medición de una tempe-
ratura. Se puede utilizar el termómetro, pero también se puede ir más allá: la
longitud de la columna de mercurio es vista por el observador. Ahora bien, decía,
«¿qué es ver?». En la reflexión de los cuantos de luz de la columna de mercurio
hacia la retina del observador, es donde se registra la imagen. Y en este punto,
manifestaba: «Y si nuestros conocimientos fisiológicos fuesen más exactos de lo
que son hoy, podríamos ir aún más allá, seguir las reacciones químicas que esta
imagen provoca en la retina, en los nervios y en el cerebro, y sólo al final se podría
decir: el observador percibe estos cambios químicos en las células de su cerebro.
Pero por lejos que llevemos los cálculos, hasta el depósito de mercurio, hasta la
escala del termómetro, hasta la retina o hasta el cerebro, llega un momento en el
que hay que decir: y esto es percibido por el observador. Con otras palabras, siem-
pre hemos de dividir el Universo en dos partes: una es el sistema observado, la otra
el observador».
Como señalaba Bohm en el artículo que mencioné anteriormente, el trata-
miento del problema de la medida dado por Von Neumann en Mathematische
Grundlagen der Quantenmechanik se diferenciaba del ofrecido por Heisenberg y
Bohr. En efecto, estos estudiaban con cuidado y meticulosidad las condiciones
experimentales en las que se producía una medición, proceso en el que intervenía
un aparato que ellos trataban como un objeto sujeto a las leyes de la física clásica.63
De esta manera, el observador con su mente o consciencia, en la que tiene lugar
la reducción de la función de onda, no goza del protagonismo que le concedía
Von Neumann, que, al entender que el aparato de medida debe obedecer también
a las leyes cuánticas, se veía conducido a un círculo vicioso del que podía salir
gracias a un planteamiento basado en unas condiciones experimentales extrema-
damente idealizadas y en el reconocimiento de que siempre se llega a una situación
en la que la mente del observador (clásico) hace las veces de un operador (cuánti-
63
Véase, por ejemplo, Werner Heisenberg, The Physical Principles of the Quantum Theory (The
University of Chicago Press, Chicago, 1930) y Niels Bohr «The quantum postulate and the recent
developments of atomic theory», en Atti del Congresso Internazionale dei Fisici, 11-20 Settembre 1927
Como-Pavia-Roma, 2 vols. (Nicola Zanichelli, Bolonia, 1928), vol. II, pp. 565-588; especialmente
la sección 3 («Measurement in the quantum theory»). Hay que considerar, asimismo, los comenta-
rios que sobre los planteamientos de Bohr y Von Neumann se hacen en Edward M. MacKinnon,
Scientific Explanation and Atomic Physics (The University Press, Chicago, 1982), p. 366.
41
Fund_MAT_00c.indd 41 3/5/18 16:13

co) con el que en mecánica cuántica se obtienen los resultados de las medidas. En
realidad, el procedimiento de Von Neumann era consistente con su enfoque ma-
temático-axiomático: la mente del observador generaliza, «abstrae», la situación en
la que se produce la medida. Desde su punto de vista, la reducción, el colapso de
la función de onda era una necesidad para completar la estructura formal y con-
ceptual de la mecánica cuántica.64
Mathematische Grundlagen der Quantenmechanik,

un texto complicado
Mathematische Grundlagen der Quantenmechanik es un libro importante y que
aportó mucho a la mecánica cuántica. Ahora bien, se trataba de un texto de gran
complejidad matemática, accesible a pocos y, dentro de estos pocos, a los que po-
dían comprender el alemán (ya señalé que la traducción al inglés no apareció
hasta 1955). John Bell, por ejemplo, no se atrevió durante muchos años a someter
a crítica la posibilidad de encontrar una teoría de variables ocultas porque sabía
del teorema de Von Neumann, pero no podía juzgarlo porque no sabía alemán.
Freeman Dyson, entonces un joven matemático británico que iba a trasladar
sus habilidades e intereses a la física, trabajando en Estados Unidos, donde con-
tribuyó de manera importante al desarrollo de la electrodinámica cuántica, trató de
la recepción del texto de Von Neumann en la comunidad de físicos estadouniden-
ses en una conferencia que pronunció en mayo de 2010 en la Brown University:65
El libro de Johnny [John von Neumann] fue la primera exposición de la mecánica

cuántica que hizo a la teoría respetable matemáticamente. Los conceptos se definían de
manera rigurosa y las consecuencias se deducían de igual forma. Una gran parte del libro
era original, especialmente los capítulos dedicados a la estadística cuántica y la teoría de
la medida. Leí el libro en 1946, cuando todavía era un matemático puro, pero ya inten-
taba desplazar mi atención a la física. Lo encontré enormemente útil. Me dio lo que
necesitaba, una presentación matemáticamente precisa de la teoría, explicando los pun-
tos delicados que los físicos habían sido demasiado poco rigurosos como para mencionar.
Aprendí del libro la mayor parte de lo que sé de la mecánica cuántica. Pero después, una
vez que realicé la transición a la física y hube comenzando a leer las revistas de físicas
normales, me sorprendió descubrir que en las revistas de física nadie se refería jamás al
libro de Johnny. En lo referente a los físicos, Johnny no existía. Por supuesto, su igno-
rancia del libro de Johnny era en parte un problema de lenguaje. El libro estaba en
64
La introducción de la consciencia humana como parte integrante de la formulación de la
mecánica cuántica, propuesta por Von Neumann, fue seguida por otros después de él. Eugene Wigner
ha sido, probablemente, quien con más acierto, frecuencia y claridad se ha ocupado de estas cuestio-
nes: E. P. Wigner, «Remarks on the mind-body question», en I. J. Good, ed., The Scientist Speculates
(Heinemann, Londres, 1961), pp. 284-302, y Symmetries and Reflections (Indiana University Press,
Bloomington, 1967), cap. III. Cabe consultar, asimismo, Fritz London y Edmond Bauer, La théorie
de l’observation en mécanique quantique (Hermann, París, 1939), y John A. Wheeler y Wojciech Hu-
bert Zurek, eds., Quantum Theory and Measurement (Princeton University Press, 1983), sección III.
65
Dyson, «A walk through Johnny von Neumann’s garden», op. cit., pp. 76-77.
42
Fund_MAT_00c.indd 42 3/5/18 16:13

alemán y la primera traducción al inglés sólo se publicó en 1955. Pero creo que, inclu-
so si el libro hubiese estado disponible en inglés, los físicos de la década de 1940 no lo
habrían encontrado interesante. Aquella era una época en la que la cultura de la física y
la cultura de las matemáticas estaban en general muy separadas. La cultura de la física
estaba dominada por personas como Oppenheimer, que establecía amistad con poetas
e historiadores del arte y no con matemáticos puros. La cultura de los matemáticos es-
taba dominada por los absolutistas de Bourbaki, que trataban de expurgar de la mate-
mática todo lo que no fuese puramente abstracto.
La edición española de Mathematische Grundlagen

der Quantenmechanik
La versión al castellano de Mathematische Grundlagen der Quantenmechanik,
Fundamentos matemáticos de la mecánica cuántica, se publicó en 1949, dentro de
la colección Monografías de Matemática promovida por el Instituto de Matemá-
ticas Jorge Juan del Consejo Superior de Investigaciones Científicas.66 Apareció tres
años después de la versión francesa, debida a Alexandre Proca, y mucho antes que
la inglesa (1955), traducida por Robert Beyer.67 El traductor fue Ramón Ortiz
Fornaguera (1916-1974), quien se había licenciado en Ciencias Exactas en Barce-
lona en 1942 y en Físicas en 1944.68 En 1946, Ortiz Fornaguera se trasladó a
Madrid, donde un año después leyó su tesis doctoral, que, dirigida por José María
Otero Navascués, realizó en el Instituto de Óptica Daza de Valdés del Consejo
Superior de Investigaciones Científicas.69 Se tituló Los espacios métricos en óptica
electrónica. En Madrid entró en contacto con Esteban Terradas, catedrático de Fí-
sica Matemática, quien, en una carta que escribió a Julio Rey Pastor en enero de
1948, le consideraba «el mejor alumno que he tenido» en Física Matemática.70
66
En 1991 el Consejo Superior de Investigaciones Científicas reeditó el libro, con un estudio
preliminar («John von Neumann y los Fundamentos matemáticos de la mecánica cuántica», pp. xi-lix)
mío, que he reescrito completamente, muy ampliado, para la presente edición. El texto de Von
Neumann ha sido revisado y corregido por el profesor José Luis Sánchez Gómez.
67
Les fondements mathématiques de la mécanique quantique (París, 1946), Mathematical Foun-
dations of Quantum Mechanics (Princeton, 1955). Al italiano se tradujo mucho más tarde: I fonda-
menti matematici della meccanica quantistica (Padua, 1998).
68
Sobre Ortiz Fornaguera, se puede consultar Pablo Soler Ferrán, «La obra científica de Ramón
Ortiz Fornaguera (1916-1974): un capítulo de la física matemática, teórica y nuclear en la dictadu-
ra franquista», en Actes d’Història de la Ciència i de la Tècnica. Nova època, vol. 8 (2015), pp. 9-55.
Sobre la traducción del libro de Von Neumann, M. Baig, G. Gimeno y M. Xipell, «La introducción
de la mecánica cuántica en España: las primeras lecciones y los primeros textos» y «Von Neumann
traducido por Ortiz: una obra pionera en la enseñanza de la cuántica», en Néstor Herrán y Xavier
Roqué, eds., La física en la dictadura. Físicos, cultura y poder en España (1939-1975) (Universitat
Autònoma de Barcelona, Bellaterra, 2012), pp. 161-176 y 177-192. También Gonzalo Gimeno
Valentín-Gamazo, La matemática de los quanta en España, tesis doctoral, Universidad Autónoma de
Barcelona, mayo de 2015, pp. 202-212.
69
Sobre Otero Navascués, véase Ana Romero de Pablos y José Manuel Sánchez Ron, Energía
nuclear en España. De la JEN al CIEMAT (CIEMAT, Madrid, 2001).
70
Terradas a Julio Rey Pastor, 17 de enero de 1948; reproducida en Eduardo Ortiz, Antonio
Roca i Rosell y José M. Sánchez Ron, «Ciencia y técnica en Argentina y España (1941-1949), a
43
Fund_MAT_00c.indd 43 3/5/18 16:13

Entre septiembre de 1948 y junio de 1949, esto es, en el periodo en que apareció
la traducción del libro de Von Neumann, Ortiz estuvo en Italia, primero en Roma
y después en Milán, formándose en aspectos teóricos de reactores nucleares bajo la
dirección del físico nuclear Bruno Ferreti. Todo apunta en la dirección de que fue
de Terradas de quien partió la idea de traducir al castellano el libro de Von Neu-
mann.71 En el «Prólogo» que Terradas añadió a aquella edición de 1949 indicaba
que el proyecto de traducir el libro se había iniciado «mucho antes de aparecer la
edición francesa, con el objeto de que nuestros estudiantes dispusieran de una re-
lación matemática de la teoría de los quanta como fundamento lo más riguroso
posible de las aplicaciones de la misma a los diversos problemas de la física atómi-
ca y como necesaria educación del pensamiento para aplicar concienzudamente los
principios generales en que se apoya». La idea era comentar el libro «durante cursos
sucesivos en el Seminario de Física Matemática» que dirigía el propio Terradas.
Parece que inicialmente se pensó en publicar el libro con la editorial Espasa-Calpe
de Argentina. Así, en la carta que Terradas escribió a Julio Rey Pastor, y que ya cité,
se lee: «[La traducción de Ortiz] del Neumann, recomendada a Olarra [editor de
Espasa-Calpe Argentina] es muy cuidada y corrige algunos defectillos del original».
Sin embargo, finalmente fue el Instituto de Matemáticas Jorge Juan del Consejo
Superior de Investigaciones Científicas el que publicó el libro.
En el Dipòsit Digital de Documents de la UAB (Universitat Autònoma de
Barcelona) se pueden consultar una serie de cartas que Ramón Ortiz intercambió
con el propio Von Neumann, Terradas, Otero Navascués, Tomás Rodríguez Ba-
chiller y el Alian Property Custodian, el departamento federal estadounidense que
se ocupaba de los derechos de propiedades alemanas y austriacas que se habían
confiscado en calidad de reparaciones de guerra. El 18 de marzo de 1947, Ortiz
escribía a Von Neumann informándole de que había terminado la traducción del
libro, pero que, naturalmente, era necesaria la autorización del poseedor del co-
pyright. Le pedía, por consiguiente, que le indicara quién poseía los derechos. En
su respuesta, del 31 de marzo, Von Neumann decía a Ortiz que «estaba muy con-
tento de saber que se planea traducir Mathematische Grundlagen der Quantenme-
chanik al español», lo que indica que Ortiz había realizado la traducción sin con-
tar con la autorización de Von Neumann. En cuanto a quién tenía los derechos,
le decía: «En consideración a la parte que pertenece a la firma de Julius Springer
(Berlín), el copyright ha pasado a la U.S. Alien Property Custodian. Como yo soy
un ciudadano americano, no estoy haciendo nada para recuperar los derechos. En
consecuencia, su carta debe dirigirse a Alien Property Custodian, Washington,
D.C. Como ya estoy tratando con esta oficina, puedo ahorrarle algún tiempo ob-
teniendo desde aquí los papeles necesarios y enviándoselos a usted. Lo haré du-
rante la semana que viene y se los enviaré».
través de la correspondencia de Julio Rey Pastor y Esteban Terradas», Llull 12, 33-150 (1989);
pp. 140-141.
71
Sobre Terradas, véase Antoni Roca i Rosell y José Manuel Sánchez Ron, Esteban Terradas,
1883-1950. Ciencia y técnica en España (El Serbal, Barcelona, 1990).
44
Fund_MAT_00c.indd 44 3/5/18 16:13

Pero el tiempo pasaba y Ortiz no recibía los documentos ofrecidos, de mane-

ra que el 7 de mayo escribió al matemático español Tomás Rodríguez Bachiller,
que estaba entonces en la Universidad de Urbana, Illinois:
Estimado profesor,
Supongo que estará Vd. ya al corriente de que, por lo menos de momento, la pu-
blicación de la versión española del libro de Von Neumann, ha caído en saco roto. El
Consejo, en efecto, se niega en absoluto a autorizarla hasta tanto no se haya conseguido
el permiso de quién pueda concederlo.
Dado que, al parecer, nadie se disponía a gestionarlo, hace algo más de un mes
decidí escribir yo mismo a Von Neumann, el cual me contestó muy atentamente con-
forme podrá Vd. advertir en la copia que de su carta le mando adjunta. Hasta hoy no
he sabido aún nada más de él y he creído que quizás fuera conveniente que Vd. le es-
cribiese interesándose por el asunto. Hace ya tres meses que la traducción está lista para
la imprenta y es una lástima que por una mera cuestión de trámite la cosa lleve camino
de eternizarse. Estoy plenamente convencido que de haber estado Vd. aquí todo hubie-
ra ocurrido muy de otro modo; pero ya que esto no ha sido posible, le ruego que vea
de hacer ahí las gestiones que estime oportunas.
Reciba el testimonio de mi mayor consideración y mis más afectuosos saludos.
Rodríguez Bachiller respondió enseguida, el 19 de mayo. Su carta, manuscrita,

llevaba el membrete del Departamento de Matemáticas de la Universidad de
Princeton:72
Querido amigo: Recibí su carta y me alegra que me haya Vd. informado sobre el
asunto del v. Neumann. Como no se esté encima está visto que nada marcha.
72
Tomás Rodríguez Bachiller estudió en la Facultad de Ciencias de la Universidad de Madrid,
a la que siempre estuvo asociado: ocupó desde octubre de 1932 la cátedra vacante de «Análisis ma-
temático 3.º (Ecuaciones diferenciales)» de la Facultad de Ciencias. En propiedad obtuvo en junio
de 1935 la cátedra de «Análisis matemático 4.º (Teoría de funciones)», que pasó a desempeñar el 29
de agosto, dos días después de haber leído su tesis doctoral (Axiomática de la dimensión), condición
indispensable para ser catedrático. En agosto de 1922 entró a formar parte del Laboratorio Semina-
rio Matemático de la Junta para Ampliación de Estudios e Investigaciones Científicas, posiblemen-
te el centro de investigación matemática más activo en España. Aunque no se distinguió por activi-
dades políticas —como otros muchos era, simplemente, un liberal—, después de la Guerra Civil, el
10 de octubre de 1939, se le abrió un expediente administrativo, pero dos meses más tarde, el 22
de octubre, se le permitió reincorporarse al servicio activo, aunque descalificado para ocupar puestos
administrativos. Hombre y científico cosmopolita, pasó algunas temporadas en Puerto Rico, en 1941
viajó a Roma, al Istituto Nazionale di Alta Matematica; en 1947, el año en el que Ortiz le escribió,
después de obtener una beca, pasó cinco meses en los Estados Unidos, primero en la Universidad
de Illinois (Urbana), trabajando con Oscar Zarinski, y después en Princeton, con Solomon Lefschetz,
Emil Artin y Claude Chevalley. Participó en actividades del Instituto Jorge Juan del Consejo, en una
de cuyas colecciones se publicó Fundamentos matemáticos de la mecánica cuántica. Dio varios cursos
sobre topología a partir de 1942, y sobre lógica y fundamentos de matemática desde 1951. Sobre
Rodríguez Bachiller, véase María Ángeles Martínez García y Luis Español González, «The biography
of the Spanish mathematician Tomás Rodríguez Bachiller (1899-1980)», en A. Roca-Rosell, ed., The
Circulation of Science and Technology: Proceedings of the 4th International Conference on the ESHS
(SCHCT-IEC, Barcelona, 2012), pp. 715-722.
45
Fund_MAT_00c.indd 45 3/5/18 16:13

Yo estoy ya en relación con la entidad que dice Von Neumann y al mismo tiempo
gestiono, y va por buen camino, otras traducciones. Yo enviaré comunicación oficial de
todo a Albareda [José María Albareda, secretario general del Consejo Superior de Inves-
tigaciones Científicas] para que se metan todas ellas (las que están traducidas ya) en la
imprenta, este verano. Como llevo pocos días aquí, aún no he hablado personalmente
con v. Neumann, pero lo haré un día de estos. He gestionado, de editoriales y entidades
científicas, de aquí, los derechos de varias obras, de modo que pienso regresar con la
cartera bastante provista de publicaciones.
De Urbana salí el 21 de abril, pasé varios días en Chicago y otros tantos en New
York, aprovechando sendas reuniones de la American Math. Society. Después me vine
aquí, pero por la dificultad de alojamientos, después de cambiar 3 veces de Hotel, a cual
más caro, me volví a New York un par de días: entretanto logré acomodo aquí, muy
conveniente y casi al lado del Fine Hall que es el Departamento de Matemáticas.
Recibí carta de [Armando] Durán; hágame el favor de decírselo y que le escribiré
pronto.
Salude a los amigos, y Vd. reciba un cordial apretón de manos.
El 1 de noviembre, y visto que la gestión con Rodríguez Bachiller no producía

ningún resultado, Ortiz decidió escribir de nuevo a Von Neumann. Como si no
hubiesen trascurrido casi ocho meses, le agradecía su respuesta del 31 de marzo y
le preguntaba si creía que durante 1948 se podría obtener la autorización requeri-
da. Aprovechaba también para mencionar que había identificado varias erratas, que
no se habían corregido en la traducción francesa; en unos «pocos casos», añadía,
«se dan cambios de notación, en ocasiones en el curso de una misma demostración,
lo que abre la posibilidad de que el lector se confunda». Se ofrecía a enviárselas,
aunque incluía una que le parecía particularmente importante.73 Por último, Ra-
món Ortiz se atrevía a plantearle unas cuestiones, no relacionadas directamente
con el texto traducido:
Finalmente, y si ello no significa demasiada imposición para el tiempo de que dis-

pone, querría pedirle un favor. Estoy acumulando materiales para un ensayo sobre el
concepto de física matemática, y agradecería mucho tener sus opiniones sobre las si-
guientes cuestiones:
¿Existe alguna diferencia entre física matemática y física teórica?
¿Es la física matemática meramente una metodología, un simple estudio de métodos
matemáticos empleados en la física teórica?
¿Cuáles son los propósitos de la física matemática?
Me estoy tomando la libertad de escribir al profesor Einstein con la esperanza de
que pueda encontrar posible darme sus respuestas a estas cuestiones, y no es necesario
que le diga que estaría más que agradecido si usted tuviese la ocasión y lo considerase
apropiado manifestarle la seriedad de mis intenciones.74
73
Esta errata, que corresponde al capítulo VI («El proceso de medida»), se analiza en Gimeno
Valentín-Gamazo, La matemática de los quanta en España, op. cit., pp. 297-302.
74
Según Gimeno Valentín-Gamazo, La matemática de los quanta en España, op. cit., p. 207, el
ensayo al que se refería Ortiz en esta carta era la memoria de 197 páginas que presentó a las oposi-
46
Fund_MAT_00c.indd 46 3/5/18 16:13

El 10 de diciembre Von Neumann contestaba. Sobre los derechos, señalaba que

había contactado con la Alien Property Custodian de Estados Unidos, pero sin un
resultado concluyente. Como posible solución, le decía que suponía que «Alien
Property Custodian solamente poseía los derechos de las propiedades de J. Springer
en Estados Unidos. Puede o puede no existir un acuerdo internacional entre Espa-
ña y los Aliados relativo a las propiedades alemanas, pero probablemente usted
podrá averiguar esto más fácilmente en Madrid».
Con respecto a las preguntas que le hacía, Von Neumann escribía:75
Sus preguntas sobre la naturaleza de la física matemática y la física teórica son in-
teresantes, pero en mi opinión un poco difíciles de contestar con precisión. Siempre he
trazado una línea de demarcación algo vaga entre los dos campos, pero realmente era
más una diferencia en la distribución del énfasis. Creo que en la física teórica el énfasis
principal está en la conexión con la física experimental y con aquellos procesos meto-
dológicos que conducen a nuevas teorías y nuevas formulaciones, mientras que la física
matemática trata de la solución y ejecución matemática de una teoría que se supone es
correcta per se, o que se supone que lo es en beneficio de la discusión.
En otras palabras, yo diría que la física teórica se ocupa más bien de la formulación
y la física matemática de la explotación de las teorías físicas. Sin embargo, cuando se
tiene que evaluar una nueva teoría y compararla con la experiencia, ambos aspectos
se mezclan.
Ortiz Fornaguera siguió el consejo de Von Neumann y el 24 de diciembre es-

cribió a los representantes en España del Allied Control Concil for Germans (si-
tuada en la Avenida del Generalísimo, 4). Por fin, el 15 de enero de 1948 esta
oficina contestaba accediendo a que se publicase la traducción, mediante un con-
trato con sus derechos (royalties). El 4 de febrero, Ortiz contestaba pidiendo que
el contrato le otorgase el permiso de traducción a él personalmente, que los dere-
chos de autor serían del 5 %, más 25 ejemplares, y que la primera edición sería de
2.000 ejemplares. Las condiciones fueron aceptadas y el 28 de enero Ortiz escribía
a Von Neumann informándole; añadía que Esteban Terradas, «a quien Weyl dedi-
có Mathematische Analyse des Raumproblems» (J. Springer, Berlín, 1923), escribiría
el prólogo.76 La respuesta de Von Neumann llegó el 25 de febrero. En ella expre-
saba su satisfacción por el resultado final del proceso y también «porque se incluya
ciones a las cátedras de Física Matemática de la Universidad de Madrid (1952) y Barcelona (1955):
Sobre el concepto y los métodos de la Física Matemática.
75
Esta carta también se reproduce en Rédei, ed., John von Neumann: Selected Letters, op. cit.,
pp. 118-119.
76
El libro de Weyl procedía de unas conferencias que dio en los «Cursos Monogràfics d’Alts
Estudis i d’Intercanvi» que el Consejo de Pedagogía de la Mancomunitat de Catalunya fundó en
1914 y que luego desarrolló en Madrid. De hecho, el libro lleva el título de Mathematische Analyse
des Raumproblems. Vorlesungen gehalten in Barcelona und Madrid. Entre 1920 y 1923, y bajo la di-
rección de Terradas, varios científicos extranjeros dieron cursos en Barcelona: el italiano Tullio Levi-
Civita (enero de 1921), el francés Jacques Hadamard (abril de 1921), Hermann Weyl (marzo de
1922), el alemán Arnold Sommerfeld (marzo de 1922), Albert Einstein (febrero-marzo de 1923) y
el húngaro, especialista en topología, Szerkeszti Bèla Kérékjártó (mayo-junio de 1923). Para más
47
Fund_MAT_00c.indd 47 3/5/18 16:13

una introducción escrita por el profesor Esteban Terradas Illa, a quien tuve el pla-
cer de conocer una vez. Su nombre, por supuesto, es bien conocido por mí». Es-
taba, asimismo, agradecido por el cuidado con que Ortiz había realizado la traduc-
ción y por los errores-erratas que había encontrado, con los que estaba de acuerdo.
En un texto con tantas, y no triviales, expresiones matemáticas, no es sorpren-
dente que el proceso de edición resultase complicado. Una carta que Ramón Or-
tiz dirigió el 14 de mayo de 1948 a la industria gráfica Aleu & Domingo, Ltda.,
encargada de la edición, lo refleja:
Muy Sres. Míos:

El Sr. Vizcaíno me entregó ayer los pliegos de la Introducción a la mecánica cuán-
tica. Ya suponía que, debido a las dificultades de composición de un opúsculo de estas
características, habría algunas erratas, pero la realidad ha superado de mucho, desgra
ciadamente, mis temores. Es imposible, por lo tanto, que se encuaderne y lance al mer-
cado sin una fe de erratas que, aun limitándonos a las más esenciales, será bastante ex-
tensa. Además, antes de la impresión definitiva de dicha fe de erratas y del índice
bibliográfico, es indispensable que me manden Vds. las pruebas —no fuese el caso que
hubiera que hacer una fe de erratas de la fe de erratas—. Es verdaderamente lamentable
que un opúsculo que, por sus cualidades materiales y de presentación, podía haber re-
sultado excelente, se haya visto afeado en cambio por tantas y tantas erratas. Pero, en
fin, ya que la cosa no tiene fácil remedio, demos la oportunidad al lector de que corrija
acudiendo a la fe de erratas aquéllas de que no hacerse constar podrían anular casi por
completo el contenido del opúsculo.
Próximamente les mandaré la lista de las mismas —mejor dicho, de las que forzo-
samente es menester corregir—. Por ella verán Vds. que hay una página que es imposible
salga con la errata que contiene. Vean Vds. que solución cabe y comuníquenmelo cuan-
to antes.
La imprenta aceptó cambiar la página (era la 29), lo que obligaba a modificar

cuatro, e incluir una fe de erratas, que apareció en una hoja aparte al principio del
libro.
De la traducción de Ramón Ortiz Fornaguera se debe decir que es muy com-
petente, incluyendo numerosas notas de él mismo destinadas a clarificar algunos
puntos concretos. Tal vez se le pueda poner el reparo de que algunos modismos
de uso común en 1949 ya son poco frecuentes.
Con respecto a la biografía posterior de Ramón Ortiz, únicamente diré que,
finalizada su estancia en Italia, viajó a Estados Unidos, a la Universidad de Chica-
go, donde estuvo desde septiembre de 1949 hasta noviembre de 1950, para tra-
bajar en el Institute for Nuclear Studies dirigido por Samuel K. Allison. Parece
que aprovechó su estancia en Chicago para visitar a Von Neumann en Princeton;
esto es lo que se desprende de una carta que la secretaria de este dirigió a Ortiz el
6 de noviembre de 1950, en la que le decía que «el profesor Von Neumann podrá
información sobre estos cursos, véase Roca i Rosell y Sánchez Ron, Esteban Terradas. Ciencia y téc-
nica en la España contemporánea, op. cit., pp. 148-169.
48
Fund_MAT_00c.indd 48 3/5/18 16:13

verle el jueves 9 de noviembre, probablemente por la tarde, si le viene bien a Vd.

¿Podría decirme la hora aproximada de su llegada?». No sabemos, sin embargo, si
la visita llegó a concretarse.
Posteriormente, 1953-1954, amplió estudios en Gotinga. Llegó a dirigir la
División de Física Teórica de la Junta de Energía Nuclear en Madrid. Y repitió su
experiencia de traductor, esta vez con algunos volúmenes del famoso curso de Fí-
sica Teórica de L. D. Landau y E. M. Lifshitz, que tradujo directamente del ruso.
Lógica cuántica
La aparición de Mathematische Grundlagen der Quantenmechanik no significó
que Von Neumann abandonase completamente la física cuántica, aunque sí es
cierto que su actividad decayó en este campo. En 1934, por ejemplo, colaboró con
Jordan y Wigner, inventando una nueva álgebra con la esperanza, manifestada
explícitamente, de que fuese útil para la comprensión de los fenómenos nucleares
y la desintegración β.77 Otro trabajo importante fue el que publicó en colaboración
con Garret Birkhoff sobre la lógica de la mecánica cuántica. El objetivo de este
artículo era descubrir qué estructura lógica puede uno esperar encontrar en teo-
rías que, como la mecánica cuántica, no obedecen a la lógica clásica. En este sen-
tido fue uno de los primeros trabajos en un campo que experimentó posterior-
mente un desarrollo significativo: el de la lógica no distributiva.78 Cito de su
«Introducción»:79
Uno de los aspectos de la teoría cuántica que más ha atraído la atención general es
el de la novedad de las nociones lógicas que presupone. Asume que incluso una descrip-
ción matemática completa de un sistema físico ζ no permite en general predecir con
certidumbre el resultado de un experimento sobre ζ, y, en particular, que nunca se pue-
de predecir con seguridad tanto la posición como el momento de ζ (Principio de incer-
tidumbre de Heisenberg). Afirma, además, que la mayor parte de parejas de observacio-
nes son incompatibles y no pueden efectuarse en ζ simultáneamente (Principio de No
Conmutatividad de Observaciones).
El objeto del presente artículo es descubrir qué estructura lógica se puede esperar
encontrar en teorías físicas que, como la mecánica cuántica, no se ajustan a la lógica
clásica. Nuestra conclusión principal, que admitimos se basa en argumentos heurísticos,
es que se puede esperar razonablemente encontrar un cálculo de proposiciones que for-
malmente es indistinguible del cálculo de subespacios lineales con respecto a productos
77
P. Jordan, J. von Neumann y E. Wigner, «On the algebraic generalization of the quantum
mechanical formalism», Annals of Mathematics 35, 29-64 (1934).
78
Acerca de esta lógica, véase Max Jammer, The Philosophy of Quantum Mechanics. The Inter-
pretations of Quantum Mechanics in Historical Perspective (Wiley-Interscience, Nueva York, 1974),
sección 8.2; Josef-Maria Jauch, «Foundations of quantum mechanics», en Fondamenti di meccanica
quantistica (Academic Press, Nueva York, 1971), pp. 20-55, y Bernard D’Espagnat, Conceptual
Foundations of Quantum Mechanics, 2.ª ed. (Addison-Wesley, Redwood City, 1989).
79
Garrett Birkhoff y John von Neumann, «The logic of quantum mechanics», Annals of Mathe-
matics 37, 823-843 (1936), p. 823.
49
Fund_MAT_00c.indd 49 3/5/18 16:13

de conjuntos, sumas lineales y complementos ortogonales y que se asemeja al cálculo de

proposiciones habitual con respecto a y, o y no [and, or y not].
Von Neumann en Estados Unidos

Algunos de los trabajos que he mencionado aparecieron en publicaciones de
Estados Unidos, ya que Von Neumann no permaneció mucho tiempo en Ale
mania.
En 1927 consiguió el título de privatdozent de Matemáticas en la Universidad
de Berlín, un puesto que no llevaba asociado más salario que el que consiguiera
con las matrículas de los alumnos que escogían los cursos que ofreciera.80 Estuvo
allí algo menos de tres años, durante los cuales adquirió prestigio dentro de la
comunidad de matemáticos por sus trabajos en teoría de conjuntos, álgebra y teo-
ría cuántica. En 1929 pasó, también como privatdozent, a la Universidad de Ham-
burgo, aunque tampoco permaneció mucho tiempo allí, ya que enseguida recibió,
al mismo tiempo que Eugene Wigner, una invitación de la Universidad de Prin-
ceton para pasar un semestre como profesor visitante (Hermann Weyl había esta-
do antes un año). Su obligación era pronunciar dos o tres clases por semana sobre
algún aspecto de la teoría cuántica (seleccionó el tema de la estadística cuántica).
La iniciativa, que formaba parte de una ambiciosa política de atraer a los mejores
matemáticos europeos a Princeton, corrió a cargo de Oswald Veblen, profesor de
la Universidad de Princeton. La opinión que Veblen tenía de Von Neumann que-
da clara en la carta que escribió el 21 de agosto de 1929 a Luther P. Eisenhart,
decano de la Facultad de Ciencias de Princeton y director del Departamento de
Matemáticas:81
Estoy convencido de que Von Neumann sería un buen candidato al que intentar
atraer. En mi última conversación con Weyl me recomendó fuertemente a Neumann
como su sucesor, de manera que los dos principales hombres, Dirac y Weyl, evidente-
mente tienen buena opinión de él. He estado siguiendo a Von Neumann desde hace tres
años o más, como el mejor joven en Alemania. Me encontré con él el verano pasado en
Bolonia y hablamos de la posibilidad de que viniese aquí con una beca internacional.
Después me escribió diciéndome que no le sería posible por haber aceptado un puesto
especial de algún tipo en Hamburgo. Es privadotzent en Berlín, pero es húngaro de
nacimiento. Personalmente ofrece una muy buena impresión.
En enero de 1930, le ofrecieron un puesto permanente, que sin embargo re-

chazó. Sí aceptó otra oferta menos comprometida en principio: desempeñar du-
rante cinco años, un semestre al año, la cátedra Jones de Física Matemática, que
80
Su solicitud para adquirir el rango de Privatdozent fue revisada y apoyada por E. Schmidt e
I. Schur, y evaluada por L. G. E. M. Bieberbach, E. Hopf, M. von Laue, R. von Mises, W. Nernst,
M. Planck y W. Schottky.
81
Citada en Steve Batterson, Pursuit of Genius. Flexner, Einstein, and the Early Faculty at the
Institute for Advanced Study (A. K. Peters, Wellesley, Mass., 2006), p. 140.
50
Fund_MAT_00c.indd 50 3/5/18 16:13

ocuparía la otra mitad del año Eugene Wigner. La idea era que diese durante un
semestre un curso de mecánica cuántica a partir de febrero de 1930, con un salario
de 3.000 dólares más 1.000 para viajes. Al recibir la invitación, Von Neumann
escribió a Veblen desde Berlín señalando que tendría que «resolver algunos asuntos
personales [...] antes de dar una respuesta definitiva».82 Cinco días más tarde volvía
a escribirle, ahora desde Budapest: «Puesto que he podido solucionar satisfactoria-
mente el asunto familiar del que me ocupaba (pretendo casarme en diciembre), me
encuentro en la agradable situación de poder aceptar su muy amable ofrecimiento».
Su situación familiar era, efectivamente, algo complicada: su padre había fallecido
recientemente y su madre y hermanos menores le tomaron en adelante como ca-
beza de familia (una vez instalado en Estados Unidos, terminó llevándose allí a
toda su familia). La boda que anunciaba a Veblen fue con Marietta Kovesi, hija de
un médico de Budapest, viejo amigo de la familia. Fruto de aquella unión fue una
hija, Marina, nacida en Princeton en 1935. Sin embargo, el matrimonio terminó
con un divorcio: en 1937, el mismo año en que adoptó la ciudadanía estadouni-
dense. Pronto, 1938, Von Neumann volvió a casarse, de nuevo con una húngara,
Klara Dan, divorciada como él. Klara, o Klari como la llamaban, se convirtió en
una magnífica programadora de problemas matemáticos en las primeras computa-
doras electrónicas.
Y así, durante los siguientes años Von Neumann pasó la mitad del año en
Princeton y la otra mitad en Berlín (fue en aquella época, recordemos, cuando
escribió Mathematische Grundlagen der Quantenmechanik). De época es un tra-
bajo que se apartaba algo de lo que había hecho hasta entonces, pero que no
obstante pasó a formar parte de la bibliografía básica del campo del que se ocu-
paba: la teoría ergódica. Recordemos que la teoría ergódica tiene sus orígenes en
la sugerencia, debida a Maxwell y Boltzmann, de que una condición suficiente
para que un sistema mecánico esté en equilibrio térmico es que, al evolucionar,
obedeciendo las leyes de la mecánica, pase por todo microestado antes de regresar
a su microestado inicial. En el capítulo sobre «Los fundamentos conceptuales a
la aproximación estadística en mecánica» que Paul y Tatiana Ehrenfest publicaron
en 1912 en la Encyklopädie der mathematischen Wissenschaft dirigida por Felix
Klein, denominaron a esta conjetura la «hipótesis ergódica».83 En 1913, dos ma-
82
Citado en Heims, J. von Neumann y N. Wiener, op. cit., vol. I, p. 155.
83
Paul y Tatiana Ehrenfest, «Begriffliche Grundlagen der statistichen Auffassung in der Mecha-
nik», Encyklopädie der mathematischen Wissenschaft, vol. IV, parte 4. Yo he utilizado la traducción al
inglés: The Conceptual Foundations of the Statistical Approach in Mechanics (Cornell University Press,
Ithaca, 1959). La expresión «hipótesis ergódica» aparece ahí por primera vez en la p. 23. Justo antes,
en la sección 10.ª (p. 22), los Ehrenfest escribían: «La existencia de sistemas ergódicos (esto es, la
consistencia de su definición) es dudosa». Boltzmann había utilizado el término ergoden en 1884:
L. Boltzmann, «Über die Eigenschaften monozyklischer und anderer damit verwandter Systeme»,
Journal für die reine und angewandte Mathematik 98, 68-94 (1884-1885); véanse los comentarios
que sobre este punto realizó Stephen G. Brush en la traducción al inglés de Vorlesungen über Gastheo-
rie, 2 vols. (1896, 1898) de Boltzmann: Lectures on Gas Theory (University of California Press, Ber-
keley, 1964), p. 297, nota a pie de página.
51
Fund_MAT_00c.indd 51 3/5/18 16:13

Klara Dan y John von Neumann hacia 1952.
temáticos, Artur Rosenthal y Michel Plancherel, demostraron que no pueden

existir tales sistemas ergódicos.84 Surgió entonces una hipótesis más débil, la de
que existen sistemas cuasi-ergódicos, definidos como aquellos en los que todo
84
Véase Stephen G. Brush, «Proof of the Impossibility of Ergodic Systems: The 1913 Papers
of Rosenthal and Plancherel», Transport Theory and Statistical Physics 1, 287-311 (1971).
52
Fund_MAT_00c.indd 52 3/5/18 16:13

microestado pasa infinitesimalmente cerca de todo microestado antes de regresar

a su microestado inicial. Esta hipótesis cuasi-ergódica es la que demostró Von
Neumann en 1932.85
En enero de 1933, Von Neumann recibió otra oferta de trabajo, esta vez del
recientemente creado Institute for Advanced Study, también en Princeton, pero
una institución privada, en la que no tendría obligaciones docentes. La aceptó.
Fue el cuarto profesor nombrado de la, hasta entonces única establecida, Escuela
de Matemáticas; los tres restantes habían sido Oswald Veblen, Albert Einstein y
James W. Alexander (especialista en topología), a los que pronto se unió, en 1935,
Marston Morse. El Instituto sería su hogar profesional a partir de entonces.86
Como muchos otros científicos centroeuropeos que, por una razón u otra, habían
emigrado (muchos por razones políticas ligadas a la llegada en 1933 al poder en
Alemania de Adolf Hitler), Von Neumann, es preciso recalcar este punto, se sin-
tió enseguida feliz con el estilo de vida y las oportunidades que existían en Esta-
dos Unidos. Y cuando llegó el momento de colaborar en la Segunda Guerra
Mundial, no lo dudó, lo mismo que pasó con sus compatriotas Szilard, Teller y
Wigner.
En 1933, el año en que se instaló definitivamente en Estados Unidos, Von
Neumann produjo un importante trabajo matemático, uno en el que demostró el
5.º problema de los 23 que David Hilbert había propuesto en su conferencia en
el Congreso de París de 1900, al que ya me he referido. El enunciado de aquel 5.º
problema era, en los términos utilizados por Hilbert, el siguiente: «El concepto de
Lie de grupo continuo de transformaciones sin la hipótesis de la diferenciabilidad
de las funciones que definen el grupo». Con los desarrollos posteriores de la ma-
temática, este problema terminó estando estrechamente relacionado con los deno-
minados grupos topológicos, del que un subgrupo importante son los grupos de Lie.
Su enunciado pasó de esta forma a ser: «¿Es un grupo topológico euclideo un
85
John von Neumann, «Proof of the quasi-ergodic hypothesis», Proceedings of the National
Academy of Sciences 18, 70-82 (1932). Véanse también las contribuciones de George D. Birkhoff,
«Proof of the ergodic theorem», Proceedings of the National Academy of Sciences 17, 656-660 (1931);
Bernard O. Koopman, «Hamiltonian Systems and Transformations in Hilbert Space», Proceedings of
the National Academy of Sciences 17, 135; y George D. Birkhoff y Bernard O. Koopman, «Recent
contributions to ergodic theory», Proceedings of the National Academy of Sciences 18, 279-282 (1932).
Sobre los trabajos de Von Neumann en la teoría ergódica, véase Paul Halmos, «Von Neumann on
measure and ergodic theory», Bulletin of the American Mathematical Society 64, 86-94 (1958). Con
Halmos, que fue ayudante suyo en Princeton, escribió otro artículo sobre la teoría ergódica: John
von Neumann y Paul R. Halmos, «Operator methods in classical mechanics, II», Annals of Mathe-
matics 43, 332-350 (1942). En su autobiografía, Halmos comentó este trabajo y su colaboración
con Von Neumann: Paul R. Halmos, I Want to Be a Mathematician (Springer-Verlag, Nueva York,
1985), pp. 100-101.
86
El impulsor del Instituto fue Abraham Flexner, su primer director. Entre 1930 y 1932, Flex-
ner viajó por Europa y Norteamérica discutiendo sus planes con líderes científicos, ayudado sobre
todo por Veblen, entonces catedrático en la Universidad de Princeton. La historia del Instituto y los
detalles de la incorporación a él de Von Neumann se detallan en Batterson, Pursuit of Genius, op.
cit. Véase, asimismo, la autobiografía de Flexner, I Remember (Simon and Schuster, Nueva York, 1940).
53
Fund_MAT_00c.indd 53 3/5/18 16:13

grupo de Lie?». En 1953, Von Neumann resolvió el problema para el caso de gru-
pos bicompactos.87
Contrariamente a lo que a veces se supone, Von Neumann no abandonó Eu-
ropa por miedo a las persecuciones políticas surgidas del régimen establecido en
Alemania por Adolf Hitler, quien, recordemos, se convirtió en canciller de Alema-
nia el 30 de enero de 1933, cuando Von Neumann ya había establecido su resi-
dencia en Estados Unidos. Él mismo hizo hincapié en este hecho; el 3 de mayo
de 1946 escribió lo siguiente al sociólogo, especialista en temas de emigración de
Yale, Maurice Davie:88 «Llegué por primera vez a Estados Unidos en enero de 1930
y, como las condiciones en Europa entonces eran, en lo principal, normales, yo
no me consideraría un científico refugiado». Aun así, entre las razones por las que
decidió abandonar Europa se encontraban las políticas, como se comprueba en lo
que declaró en una comparecencia en el Congreso estadounidense relacionada con
su nombramiento como miembro de la Comisión de Energía Atómica (lo que
implicaba acceso a todo tipo de documentos clasificados):89 «Las condiciones en
Hungría eran bastante limitadas […] lo que yo estaba haciendo tenía mejores
posibilidades en América […] Estaba mucho más en sintonía con las instituciones
de América […] Esperaba la Segunda Guerra Mundial y tenía miedo de que Hun-
gría estuviese en el lado nazi y no quería quedar atrapado allí».
Aunque lo importante en un científico es lo que piensa, lo que hace y, en me-
nor aunque no despreciable medida, las relaciones que establece, tampoco está mal
ofrecer una imagen de su apariencia física. En el caso de Von Neumann contamos
con una descripción que el matemático polaco Stanislaw Ulam —quien nos vol-
verá a aparecer más adelante— incluyó en sus memorias. Refiriéndose a Von Neu-
mann tal y como era en el otoño de 1935, escribió:90
Por lo que me había dicho Kuratowski, le había imaginado delgado, como, al pare-
cer lo era en 1927. En lugar de eso estaba bastante regordete, aunque todavía no tan
corpulento como luego llegaría a estar. Lo primero que me llamó la atención de él fue-
ron sus ojos, oscuros, grandes, vivaces y expresivos. Su cabeza impresionaba por su gran
tamaño. Se balanceaba al caminar […]
Von Neumann me pareció muy joven, aunque tenía treinta y tantos, unos cinco o
seis mayor que yo (siempre he tenido un sentimiento ambivalente hacia la gente mayor
que yo: por una parte, algo así como respeto; por otra un ligero sentimiento de supe-
rioridad por disponer de más futuro por delante). Congeniamos inmediatamente. Su
87
John von Neumann, «Die Einführung analytischer parameter in topologischen Gruppen»,
Annals of Mathematics 34, 170-190 (1933). En 1934, Lev Pontrjagin lo demostró para el caso de
grupos conmutativos localmente bicompactos; en 1952, tres estadounidenses —Andrew Gleason,
por un lado, y Deane Montgomery y Leo Zippin, por otro— encontraron la demostración para el
caso de todos los grupos localmente bicompactos: A. Gleason, «Groups without small subgroups»,
Annals of Mathematics 56, 193-212 (1952); D. Montgomery y L. Zippin, «Small subgroups of fini-
te-dimensional groups», Proceedings of the National Academy of Sciences 38, 440-442 (1952).
88
Reproducida en Rédei, ed., John von Neumann: Selected Letters, op. cit., p. 94.
89
Ibidem, p. 2.
90
Stanislaw M. Ulam, Aventuras de un matemático (Nivola, Madrid, 2002), p. 94.
54
Fund_MAT_00c.indd 54 3/5/18 16:13

John von Neumann a mediados de la década de 1930 (foto de Alan W. Richards, cortesía
de AIP Emilio Segrè Visual Archives).
costumbre de intercalar comentarios divertidos, chistes, anécdotas paradójicas u obser-

vaciones sobre gente en la conversación le hacía cercano y accesible.
También se refirió Ulam a otros aspectos de la personalidad de Von Neumann,

entre ellos su extensa cultura —«sabía bastante de historia, en especial la del Im-
perio Romano, cuyo poder y organización le fascinaban»— y que «era muy dado
a encontrar analogías entre los problemas políticos del pasado y del presente».
Destacaba, asimismo, que «en general tendía a estar de acuerdo con la gente. No
contradecía o disuadía cuando le pedían consejo sobre cosas que estaban decididas
a hacer. En cuestión de asuntos humanos su tendencia era seguir la corriente, in-
cluso se anticipaba y decía aquello que esperaban oír».91
Ulam fue, probablemente, el mejor amigo que tuvo Von Neumann (veremos
más adelante que también Oskar Morgenstern mantuvo una gran amistad con él),
pero en cuanto a su personalidad existen versiones diferentes. Hay consenso en
que era un magnífico anfitrión y que le gustaba organizar reuniones sociales en su
casa. «Su casa», se señalaba en uno de los obituarios que se escribieron a raíz de
su fallecimiento y refiriéndose a Princeton, «continuó siendo un lugar de reunión
para científicos. Sus amigos recordarán la inagotable hospitalidad y la atmósfera
de inteligencia y alegría que se encontraba allí».92 Diferente, aunque no necesaria-
91
Ibidem, p. 104.
92
Ulam et al. en Fleming y Bailyn, eds., The Intellectual Migration, op. cit., p. 238.
55
Fund_MAT_00c.indd 55 3/5/18 16:13

mente contradictoria con lo que decía Ulam, es la imagen que dio de él Gian
Carlo Rota:93
Von Neumann era un hombre solitario con serios problemas personales. Su prime-
ra mujer se marchó con un estudiante graduado. Tenia dificultades para relacionarse con
otros, salvo en un nivel estrictamente formal. Todo aquel que hablaba con él advertía
un cierto alejamiento, una distancia que nunca se podría superar. Siempre iba vestido
de manera impecable con trajes de hombre de negocios, y nunca se quitaba la chaqueta
(incluso cuando montaba a caballo), como para protegerse del mundo.
Matemáticas aplicadas
Una de las características más destacadas de John von Neumann fue la de su
interés por lo que podríamos denominar matemática aplicada, aunque física mate-
mática, con su énfasis en la física, también sería apropiado en algunas ocasiones.
En una entrevista que le hizo, en húngaro, un tal Louis Halász para el programa
Voice of Free Hungary, publicado posteriormente, traducido al inglés, con el título
de Voice of America, y ante la pregunta de «¿Cómo es que usted, un matemático,
ha llegado a tener un contacto tan estrecho con la investigación atómica?», Von
Neumann respondió:94
Existen dos categorías de matemáticos: los llamados puros y los llamados matemá-
ticos aplicados. Sin embargo, como suele suceder, esta separación no está definida con
demasiada claridad y muchas veces ocurre que la misma persona trabaja en ambos cam-
pos. Supongo que yo podría llamarme a mí mismo un matemático puro, pero también
he tenido mucho que ver con las matemáticas aplicadas, especialmente con la teoría
cuántica o la física atómica, y con la hidrodinámica, que es la teoría del movimiento de
líquidos y gases. La transición entre estos campos es fácil.
Como señalaba aquí Von Neumann, los trabajos que dedicó a la mecánica cuán-
tica de la segunda mitad de la década de los años veinte en adelante constituyen
muestra de su interés por la matemática aplicada, en este caso la física teórica, pero
se podría argumentar que se involucró en ese problema debido a la influencia de
Hilbert y a la atracción que ejerció sobre él el tema de los fundamentos, entonces
en boga en la matemática. No es difícil, sin embargo, ofrecer otros ejemplos que
revelan su genuino interés por la física-matemática aplicada, además de la hidrodi-
námica que mencionaba. El astrofísico Subrahmanyan Chandrasekhar, que mantu-
vo una prolongada relación con él, dejó testimonio de este hecho.95 Von Neumann
93
Rota, Indiscrete Thoughts, op. cit., p. 71. Recuérdese lo que escribió, y ya cité, sobre él Euge-
ne Wigner: «Nunca sentí conocer bien a Von Neumann en la escuela. Acaso, nadie lo hizo; siempre
se mantuvo algo aparte».
94
The Neumann Compendium, op. cit., pp. 695-699; p. 697.
95
«Subrahmanyan Chandrasekhar. Transcript of an interview by Spencer Weart (May 17,
1977)», Sources for History of Modern Astrophysics (American Institute of Physics, Center for History
of Physics, Nueva York).
56
Fund_MAT_00c.indd 56 3/5/18 16:13

pasó los meses de enero a julio de 1935 en Cambridge (Inglaterra), dando con
ferencias de matemáticas en la Universidad. Allí se encontraba Chandrasekhar, en-
tonces fellow del Trinity College, y al que el ya profesor del Instituto de Princeton
sugirió que colaboraran en problemas de esferas de gases relativistas. Según Chan-
drasekhar, Von Neumann dijo: «Si hay objetos que colapsan, lo deben hacer hacia
dimensiones más pequeñas. Debemos por consiguiente considerar el problema des-
de la perspectiva de la relatividad general». Así lo hicieron, pero sin demasiado
éxito, aunque el problema físico que se plantearon, a instancias de Von Neumann,
tenía un gran interés; fue resuelto varios años más tarde por Robert Oppenheimer
y sus estudiantes George Volkoff y Hartland Snyder, en unos artículos que se con-
sideran como precursores de la actualmente en boga teoría relativista de los agujeros
negros, a la que el propio Chandrasekhar contribuiría muchos años después.96
Von Neumann y las fuerzas armadas

En la década de 1930 Von Neumann se mostró muy interesado por la turbu-
lencia hidrodinámica, dándose cuenta entonces realmente de la gran riqueza que
desde el punto de vista tanto de la matemática como de la física esconden las
ecuaciones no lineales en derivadas parciales. Fue, sin embargo, a partir de la dé-
cada de 1940 cuando su producción se centró en la matemática aplicada, dejando
al margen a la matemática pura. Como señaló Paul Halmos:97
El año 1940 se sitúa a mitad de camino de la carrera científica de Von Neumann,

y sus publicaciones muestran a partir de entonces un cambio de orientación. Hasta
entonces era un matemático puro de altos vuelos que sabía física; después de 1940 se
dedicó a las matemáticas aplicadas sin olvidar sus trabajos teóricos. Se interesó por las
ecuaciones diferenciales en derivadas parciales, el instrumento clásico fundamental de la
aplicación de las matemáticas al mundo de la física. Ya fuese la guerra lo que hizo de él
un matemático aplicado o bien que su interés por las matemáticas aplicadas haya sido
especialmente valioso para fines bélicos, el hecho es que se convirtió en un consejero
muy solicitado por las fuerzas armadas y por las instituciones civiles relacionadas con los
problemas de la guerra. Sus trabajos a partir de ese momento tratan principalmente de
estadística, de ondas de choque, de problemas de flujos, de hidrodinámica, de aerodi-
námica, de balística, de problemas de detonación, de meteorología y, aunque en último
lugar no de menor importancia, de dos nuevos aspectos no clásicos de la aplicación de
la matemática al mundo real: los juegos y las computadoras.
La Segunda Guerra Mundial fue, efectivamente, lo que disparó la dedicación

de Von Neumann a la matemática aplicada, un hecho que a la postre él consideró
que benefició a su obra matemática. Así lo manifestó a Lewis Strauss, un banque-
96
J. Robert Oppenheimer y George Volkoff, «On massive neutron cores», Physical Review 55,
374-381 (1939); J. Robert Oppenheimer y Hartland Snyder, «On continued gravitational contrac-
tion», Physical Review 56, 455-459 (1939).
97
Halmos, «La leyenda de John von Neumann», op. cit., p. 21.
57
Fund_MAT_00c.indd 57 3/5/18 16:13

ro que desarrolló importantes tareas relacionadas con la ciencia y la tecnología

durante la guerra asociado a la Marina (el presidente Truman le nombró almiran-
te), en una carta que le escribió el 9 de diciembre de 1946, después de haber reci-
bido la Medalla del Mérito:98
Querido Lewis:
Muchas gracias por tu muy amable nota relativa al galardón de la Medalla del Mé-
rito que he recibido.
No necesito decirte que me siento altamente honrado por este reconocimiento,
aunque no puedo dejar de pensar que, al margen del normal conocimiento de mi inca-
pacidad personal, todo lo que hice durante la guerra eran per se muy interesantes y es-
timulantes empresas intelectuales. De hecho, la guerra me introdujo en grandes partes
de la física matemática y aplicada que antes había desatendido y pienso que he recibido
bastante más de lo que he dado.
Por la época en que se afincó en Princeton, Von Neumann comenzó a interesar-

se seriamente por la hidrodinámica (escogió este tema para sus conferencias en la
universidad en 1931), una de las ramas de la física clásica que mayores problemas
matemáticos (de cálculo en particular) puede presentar. Entre las consecuencias de
su nombramiento en 1937 —año en que adoptó la ciudadanía estadounidense— de
asesor de una sección, los Ballistic Research Laboratories, del Army Ordnance De-
partment en Aberdeen, Maryland, figura el que allí aprendió de Robert H. Kent, el
líder del grupo de matemáticos, lo que se sabía de la teoría de choques y detonación,
cuestiones de evidente interés militar. Al producirse el ataque japonés a Pearl Harbor
el 7 de diciembre de 1941, Von Neumann se había convertido en un experto en esos
temas, lo que hizo que se relacionase durante la guerra con un cierto número de
centros militares de investigación: miembro (1941) del National Defense Research
Committee, asesor (1942-1955) del Navy Bureau of Ordnance, Washington, D.C.,
y, a partir de 1943, activo participante en el Proyecto Manhattan en Los Álamos.99
98
Reproducida en Rédei, ed., John von Neumann: Selected Letters, op. cit., p. 240. Cuando en
enero de 1947 Truman decidió crear una Atomic Energy Commission, que pasó a monopolizar
todos los asuntos relacionados con la energía nuclear una vez desaparecido el Proyecto Manhattan,
nombró a Strauss uno de los cinco comisionados, puesto que mantuvo hasta 1953, momento en
que pasó a ser su chairman (esto es, director), nombrado por el presidente Eisenhower. La historia
de la Atomic Energy Commission se encuentra en Richard G. Hewlett y Oscar E. Anderson, jr., The
New World. A History of the United States Atomic Energy Commission, Volume I: 1939-1946 (Univer-
sity of California Press, Berkeley, 1990) y Richard G. Hewlett y Francis Duncan, Atomic Shield. A
History of the United States Atomic Energy Commission, Volume II: 1947-1952 (University of Califor-
nia Press, Berkeley, 1990).
99
Véanse los informes que preparó en 1942 y 1943 para el National Defense Research Com-
mittee of the Office of Scientific Research and Development (OSRD): «Theory of shock waves»,
Progress Report, Division B National Defense Research Committee of the OSRD (1943), U.S. Dept.
Comm. Off. Tech. Serv. No. PB32719 (reproducido en Von Neumann, Collected Works, vol. 6,
pp. 178-202, y en The Neumann Compendium, op. cit., pp. 378-402); «Theory of detonation waves»,
A Progress Report to April, 1942 Division B National Defense Research Committee of the OSRD Section
B-1 OSRD 549 (reproducido en Collected Works, vol. 6, pp. 203-218).
58
Fund_MAT_00c.indd 58 3/5/18 16:13

Su contribución más importante al Proyecto Manhattan fue en los trabajos del

programa de implosión (colapso hacia un estado crítico de materiales fisionables,
plutonio-239 o uranio-235). La idea básica era utilizar potentes explosivos que
impulsasen dos partes del material fisionable de manera que estas se reuniesen
formando una masa crítica que produjese la explosión (reacción en cadena). Pero
existían problemas. Uno, el del transporte del mecanismo «de disparo» en el avión
desde el que se debían lanzar las bombas. Otro, que la implosión sería demasiado
asimétrica y turbulenta como para tener la energía necesaria.100 Muy preocupado
por estos problemas, en julio de 1943, Robert Oppenheimer, el director de Los
Álamos escribió a Von Neumann:101 «Estamos en lo que únicamente se puede
describir, como necesidad desesperada de su ayuda […] Tenemos a muchos buenos
teóricos trabajando aquí, pero pienso que si su habitual sagacidad es una buena
guía para identificar la verdadera naturaleza de nuestros problemas, verá por qué
incluso nuestro staff es en algunos aspectos críticamente inadecuado». Y le invita-
ba a «venir, si es posible como permanente, y déjeme asegurarle, honorable miem-
bro de nuestro staff ». Finalmente, se llegó al acuerdo de que Von Neumann tra-
bajaría en los problemas teóricos en la oficina que el destacado físico teórico del
California Institute of Technology Richard Tolman tenía en Washington D.C. y
que realizaría visitas esporádicas a Los Álamos (la primera la efectuó entre el 20
de septiembre y el 4 de octubre).
Unos meses más tarde, los problemas se agravaron. En el verano de 1944 se
recibieron en Los Álamos las primeras muestras del plutonio fabricado en un re-
actor nuclear y se comprobó que producían un mayor número de neutrones que
el plutonio que se había «fabricado» en los aceleradores de Berkeley. El motivo era
que en un reactor el plutonio producido era el isótopo Pu-240. Este se producía
en una reacción secundaria: en la primera reacción, un neutrón interaccionaba con
el núcleo del U-238, originando Pu, mientras que en la segunda, otro neutrón era
capturado por el Pu dando lugar a Pu-240. El problema era que se descubrió que
el Pu-240 experimentaba una fisión espontánea más elevada que el U-238. El
problema era serio, ya que la fisión espontánea produciría un número elevado de
neutrones, que podrían hacer que la reacción en cadena comenzara antes de que
se hubiesen reunido las dos partes del material nuclear. En el caso de uranio, el
problema sería despreciable si la cantidad de uranio-238 que hubiera junto al ura-
nio-235 (el fisionable) fuese lo suficientemente pequeña, pero en el caso del plu-
tonio no era válida tal solución, ya que los dos isótopos se fisionaban espontánea-
mente. La necesidad de encontrar mecanismos de implosión más eficaces se hacía,
por consiguiente, más perentoria.
100
Véanse los comentarios que hacía Robert Serber en The Los Alamos Primer, un documento
(en su momento secreto) que recogía las notas de un curso de cinco conferencias que Serber dio en
las dos primeras semanas de abril de 1943 en Los Álamos. Robert Serber, The Los Alamos Primer,
Richard Rhodes, ed. (University of California Press, Berkeley, 1992), pp. 56-63.
101
Citado en Lillian Hoddeson, Paul W. Henriksen, Roger A. Meade y Catherine Westfall,
Critical Assembly. A Technical History of Los Alamos during the Oppenheimer Years, 1943-1945 (Cam-
bridge University Press, Cambridge, 1993), pp. 130-131.
59
Fund_MAT_00c.indd 59 3/5/18 16:13

Von Neumann dio con la idea de utilizar ondas de choque para impulsar las
piezas de material fisionable, empleando para ello unos explosivos, llamados «len-
tes», a los que se daba la forma necesaria para dirigir, para enfocar, las dos partes
hacia un mismo punto.102 Ahora bien, Von Neumann se encontró con que le era
imposible obtener soluciones numéricas para su modelo matemático de implosión;
los grupos de calculadoras (habitualmente mujeres) con instrumentos de cálculo
manuales no podían manejar las grandes cantidades de operaciones que era preci-
so realizar. Para progresar era necesario mejorar la capacidad de cálculo y Von
Neumann se dedicó a recorrer las instalaciones que en este dominio existían en la
Universidad de Harvard y en los Laboratorios Bell, pero las máquinas que vio no
satisfacían sus necesidades. En agosto de 1944 coincidió en una estación de ferro-
carril con Hermann Goldstine, que más tarde se convertiría en un estrecho cola-
borador suyo; a través de él, se enteró de que en la Escuela Moore de Ingeniería
Electrónica de la Universidad de Pensilvania se estaba construyendo un computa-
dor electrónico, el ENIAC (Electronic Numerical Integrator And Computer), preci-
samente para los Ballistic Research Laboratories. Cuando Von Neumann se puso
en contacto con los miembros de la Moore School ya estaba claro que no existían
serios obstáculos para finalizar la construcción de ENIAC, un instrumento enorme
que contenía 18.000 válvulas (su predecesor, Collossus, construido en Inglaterra,
tenía 1.500); de hecho, ya se estaba pensando en la siguiente máquina de la fami-
lia, EDVAC (Electronic Discrete Variable Arithmetic Computer). Von Neumann se
sumó a este proyecto, dedicándose al estudio de los problemas de su organización
lógica (volveré a este punto en la sección siguiente, cuando trate de la relación
entre él y Turing).103 De hecho, muchas de las cuestiones con las que Von Neu-
mann se encontró durante la guerra (dinámica de medios continuos, electrodiná-
mica clásica, hidrodinámica, elasticidad) eran intratables mediante métodos ana-
líticos. En un informe que preparó en 1946 en colaboración con Hermann
Goldstine, se hacía hincapié en este problema:104
102
Se pueden encontrar más detalles sobre estos problemas y la contribución de Von Neumann
en la autobiografía de Teller: Edward Teller, con Judith Shoolery, Memoirs (Perseus Publishing, Cam-
bridge, Mass., 2001), pp. 174-177. Von Neumann escogió este tema para la conferencia que pro-
nunció en el Congreso Internacional de Matemáticos celebrado en Cambridge, Massachusetts, en
1950. La tituló «Shock interaction and its mathematical aspects». En el siguiente congreso, que tuvo
lugar en Ámsterdam en 1954, pronunció otra conferencia, esta una de las dos plenarias (que no
coincidían con otras actividades), la inaugural: «Unsolved problems in Mathematics» (la otra, la que
cerró el congreso, la dio A. Kolmogorov). Desgraciadamente, no proporcionó el texto de su confe-
rencia en Ámsterdam; véase Proceedings of the International Congress of Mathematicians, vol. I (Erven
P. Noordhoff N. V.-North-Holland Publishing Co., Groningen-Ámsterdam, 1957), donde en la
p. 348 aparece el nombre de Von Neumann y el título de su conferencia junto a la nota: «No ma-
nuscript of this lecture was available».
103
Sobre Von Neumann y las computadoras, véase W. Aspray, John von Neumann and the Ori-
gins of Modern Computing (MIT Press, Cambridge, Mass., 1990).
104
Hermann H. Goldstine y John von Neumann, «On the principles of large scale computing
machines». Este trabajo no se publicó hasta que apareció en Papers of John von Neumann on Com-
puting and Computer Theory, W. Aspray y A. Burks, eds. (MIT Press, Cambridge, Mass., 1986),
60
Fund_MAT_00c.indd 60 3/5/18 16:13

Los métodos analíticos de que disponemos en la actualidad parecen inadecuados para

la solución de problemas importantes que surgen en conexión con ecuaciones no lineales
en derivadas parciales y, de hecho, con virtualmente todos los tipos de problemas no li-
neales de la matemática pura. Lo cierto de esta afirmación es particularmente notorio en
el dominio de la dinámica de fluidos. Solamente se han resuelto analíticamente en este
campo los problemas más elementales. Más aún, parece que en casi todos los casos en los
que se tuvo algún pequeño éxito con métodos analíticos, éstos fueron puramente fortui-
tos [...] El avance del análisis se encuentra en este momento detenido en todo el frente
de los problemas no lineales. Que este fenómeno no es de naturaleza transitoria, y que
nos encontramos ante una importante dificultad conceptual, se ve claramente en el hecho
de que aunque las principales dificultades matemáticas en la dinámica de fluidos se han
conocido desde el tiempo de Riemann y Reynolds, y a pesar de que un físico matemáti-
co tan brillante como Rayleigh ha pasado la mayor parte de su vida esforzándose por
resolverlos, todavía no se ha dado ningún paso decisivo en contra de ellos.
Cuando la Segunda Guerra Mundial ya se encaminaba a su final, Von Neu-

mann dio un paso más en su dedicación a este campo: quería disponer de su pro-
pia computadora en Princeton. Lewis Strauss explicó en un libro de recuerdos, Men
and Decisions, los movimientos de Von Neumann:105
A finales del verano de 1945, después del final de la guerra en Europa y en Asia,
John von Neumann, un gran matemático de su tiempo y de cualquiera, y Vladimir
Zworykin, un auténtico genio electrónico del equipo de la Radio Corporation of Ame-
rica, vinieron a verme al Departamento de la Marina de Guerra [Navy Department].
Me presentaron una idea que habían desarrollado para la construcción de un dispositi-
vo que, si funcionase, sería el precursor de un aparato para predecir el tiempo a lo
largo de periodos bastante largos con la misma precisión que los dispositivos mecánicos
para predecir mareas. Estos predictores de mareas, me explicó Von Neumann, sólo ne-
cesitaban trabajar con unas pocas variables. Sería posible, continuó, ensamblar tubos
electrónicos de memoria (que habían sido desarrollados por Zworykin y Reichman y
sus asociados) en un circuito de manera que contendría una cantidad enorme de infor-
mación. Esta información consistiría de observaciones de temperatura, humedad, di-
rección y fuerza del viento, presiones barométricas y muchos otros datos meteorológicos
en muchos puntos de la superficie terrestre y en alturas seleccionadas sobre ésta. Tal
información podría almacenarse en las «memorias» de estos tubos. A partir de los re-
sultados observados del tiempo, se podría desarrollar un patrón o sistema armónico que
pudiese en semejante dispositivo de almacenamiento de datos predecir con precisión el
tiempo en un rango extremadamente extenso. Propusieron que el Institute for Advanced
Study, la Radio Corporation of America y la Navy participasen en este desarrollo cons-
truyendo el primero de estos dispositivos, que ahora constituyen la creciente familia de
computadoras.
pp. 317-348. Yo lo he tomado de The Neumann Compendium, op. cit., pp. 494-525; la cita aparece
en las pp. 494-495 de esta obra.
105
Lewis Strauss, Men and Decisions (Doubleday, Nueva York, 1962), pp. 232-234. En aquel
momento Strauss formaba parte de la Oficina del Secretario de la Marina de Guerra.
61
Fund_MAT_00c.indd 61 3/5/18 16:13

Von Neumann y Robert Oppenheimer, delante de la computadora del Institute for Advanced
Study (foto de Alan W. Richards, cortesía de AIP Emilio Segrè Visual Archives).
Señalaron las ventajas militares de conocer el tiempo con mucha antelación, y esto
parecía justificar el coste de tal aventura, estimado en unos 200.000 dólares. Natural-
mente, había personas que tenían que ser consultadas, que pensaban la guerra que aca-
baba de finalizar sería la última guerra mundial y que era mejor que la petición de se-
mejante dispositivo procediera del Departamento de Agricultura o de la Agencia del
Tiempo [Weather Bureau]. Afortunadamente, su punto de vista no prevaleció.
Se tomó finalmente una decisión, siendo el Ejército [Army] el principal interesado,
y la computadora se construyó al lado del Institute for Advanced Study de Princeton,
del que Von Neumann era miembro. La visión de Herbert Maass, entonces presiden-
te del Instituto, y de Samuel Leidesdorf, su tesorero, fue importante en el lanzamiento
de esta empresa; de igual manera, el apoyo del almirante Harold G. Bowen, director de
la Oficina de Investigación Naval, que vio sus posibilidades en otras áreas. Se convirtió
en el prototipo de instrumentos que demostraron ser útiles en campos muy alejados de
su propósito original, que, incidentalmente, todavía tiene que ser realizado. Los trabajos
comenzaron en 1946, pero los problemas de construir una máquina tan nueva y que
comenzase a funcionar exigieron casi cinco años. Es interesante señalar que el primer
gran problema que se le puso fue para el programa del arma termonuclear [la bomba de
hidrógeno]. Si la decisión de construir la computadora no se hubiese tomado en 1945,
el programa termonuclear podría haberse retrasado lo suficiente como para que los so-
viéticos hubiesen tenido las primeras bombas. Esto estaba fuera del pensamiento de
todos cuando Von Neumann inició el proyecto.
62
Fund_MAT_00c.indd 62 3/5/18 16:13

Von Neumann, en la inauguración del Institute for Advanced Study, 1952 (© Nicholas A.
Vonneuman).
Freeman Dyson fue testigo directo en el Institute for Advanced Study del in-
terés de Von Neumann por la predicción del tiempo, como recordó en uno de sus
escritos:106
Soy lo bastante viejo como para haber estado presente casi en la creación de la tec-
nología informática. Estaba en Princeton cuando, a finales de los años cuarenta y prin-
cipios de los cincuenta, John von Neumann construía nuestra famosa computadora
JOHNNIAC. Von Neumann era un gran matemático, y en ese momento tenía la repu-
tación de ser el hombre más inteligente del mundo. Era supuestamente la fuerza inte-
lectual que movía todo el desarrollo de los ordenadores. Von Neumann fue un gran
pensador y un gran empresario; a pesar de ello erró completamente en su apreciación
del papel que las computadoras habrían de tener en los negocios humanos.
Recuerdo una charla que dio Von Neumann en Princeton hacia 1950 y que descri-
bía el glorioso futuro que él entonces vislumbraba para sus computadoras. La meteoro-
logía era el gran objeto de su horizonte. Decía que en cuanto tuviéramos buenas com-
putadoras, podríamos dividir los fenómenos de la meteorología claramente en dos
categorías: los estables y los inestables. Los fenómenos inestables son aquellos que sufren
106
Freeman Dyson, «Los sueños de los ingenieros», en El infinito en todas direcciones (Tusquets,
Barcelona, 1991), pp. 175-194; cita en pp. 176-177.
63
Fund_MAT_00c.indd 63 3/5/18 16:13

desajustes por perturbaciones pequeñas; los fenómenos estables son aquellos que son
elásticos ante las pequeñas perturbaciones. Decía que en cuanto tuviéramos algunas
computadoras grandes trabajando, los problemas de la meteorología se resolverían. Se-
ríamos capaces de predecir todos los procesos estables, y de controlar en el espacio y el
tiempo los puntos en los cuales se originaron, y entonces, unos pocos aeroplanos con
generadores de humo podrían volar hasta esos puntos e introducir las pequeñas pertur-
baciones necesarias para conseguir que los procesos inestables se dirigiesen en la dirección
deseada. Una comisión central de expertos en computadoras y meteorólogos indicaría a
los aeroplanos hacia dónde dirigirse para estar seguros de que el 4 de julio no llovería
durante el «picnic». Este era el sueño de Von Neumann. Este, y la bomba de hidrógeno,
eran los principales beneficios prácticos que él veía originarse del desarrollo de los orde-
nadores.
A continuación, Dyson señalaba que los meteorólogos que trabajaron con Von
Neumann no creían en su sueño, que no pretendían controlar el clima, únicamen-
te entenderlo. Y continuaba:107
¿Por qué el sueño de Von Neumann fue un fracaso total? El sueño se basaba en una
incomprensión fundamental de la naturaleza de los movimientos de los fluidos. No es
cierto que los movimientos de los fluidos puedan dividirse de forma tajante entre aque-
llos que son predecibles y aquellos que son controlables. Generalmente, la naturaleza es
más imaginativa que nosotros. Hay una clase muy grande de sistemas dinámicos clásicos,
incluyendo tanto los circuitos eléctricos no lineales como los fluidos, que caen fácilmen-
te en un comportamiento que se describe con la palabra «caótico». Generalmente, un
movimiento caótico no es ni predecible ni controlable. Es impredecible porque una
pequeña alteración producirá una perturbación del movimiento en forma exponencial-
mente creciente.
Lo que Dyson estaba diciendo en realidad es que Von Neumann no predijo la

existencia de los sistemas caóticos, que el meteorólogo teórico estadounidense Ed-
ward Lorenz presentó en un artículo, «Deterministic nonperiodic flow», publicado
en 1963 en el Journal of the Atmospheric Sciences. No podemos culpar a Von Neu-
mann, evidentemente, por ello.
Dyson también mencionaba que «al final de su vida, Von Neumann pensaba
todavía en las computadoras como objetos grandes, caros y raros, cuidados por
grupos de expertos y pertenecientes solamente a prestigiosas instituciones como
Princeton o Los Álamos […] Jamás imaginó la flexibilidad y versatilidad que po-
drían lograr las computadoras una vez que fueran pequeñas y baratas». De nuevo,
tampoco hay que culparlo por no ser lo suficientemente visionario.
A pesar de lo que tanto Strauss como Dyson señalaron sobre el interés de Von
Neumann en la utilización de las computadoras electrónicas para la predicción
meteorológica, este también supo ver otras posibilidades. Reveladoras en este sen-
tido son dos cartas que escribió a Strauss el 20 y 24 de octubre de 1945.108 En la
107
Ibidem, p. 178.
108
Reproducidas en Rédei, ed., John von Neumann: Selected Letters, op. cit., pp. 234-239.
64
Fund_MAT_00c.indd 64 3/5/18 16:13

primera comenzaba señalando que «en nuestra conversación del martes, 16 de

octubre, en el Departamento de la Marina de Guerra, y del jueves, 18 de octubre,
en la casa del Dr. Aydelotte, expresó usted el deseo de que le proporcionase una
descripción más detallada por escrito del asunto que tratamos: el deseo de desa-
rrollar en el Instituto un programa para construir una computadora de alta velo-
cidad, como una empresa puramente científica, y el interés que el Gobierno pue-
de tener en tal proyecto». Y continuaba:
Como usted sabe, actualmente es posible acelerar la capacidad automática de las

operaciones aritméticas elementales (suma, multiplicación, etc.) por un factor de alre-
dedor de 10.000 con respecto a lo que es la práctica ordinaria hoy, y por un factor de
1.000 con respecto a los dispositivos más avanzados de que se dispone en la actualidad.
Esto puede hacerse con métodos electrónicos de cálculo y utilizando varias técnicas de
televisión y radar que han sido desarrolladas en el curso de los últimos cinco o diez años;
y esto puede hacerse sin inventar nada muy nuevo desde el punto de vista de la inge-
niería, simplemente combinando y «organizando» adecuadamente los componentes exis-
tentes.109
A continuación explicaba que ya se estaban construyendo «máquinas electró-

nicas de tal velocidad» por varias agencias gubernamentales, en particular por la
División de Acústica del Laboratorio de Artillería Naval y en la Escuela Moore de
Ingeniería Electrónica, con un contrato con la Marina de Guerra. «Anticipo», aña-
día, «que estos proyectos conducirán a resultados satisfactorios en unos dos años,
y no existe duda de que las máquinas que proyectan construir serán extremada-
mente útiles en una amplia variedad de problemas: balística, aerodinámica, hidro-
dinámica, y muchos otros campos de la ingeniería». Como vemos, Von Neumann
no se refería aquí a la predicción meteorológica, en la que Strauss hacía tanto
hincapié. De hecho, en la segunda carta, la del 24 de octubre, explicaba con deta-
lle las aplicaciones que se podrían dar, dividiéndolas en: a) Aerodinámica; b) Hi-
drodinámica; c) Elasticidad y plasticidad; d ) Óptica; e) Electrodinámica; f ) Diná-
mica meteorológica, y g) Clasificación de problemas.
Pero Von Neumann era no solo un científico alerta, interesado y dedicado a
servir a su país de adopción, utilizando para ello cualquier tipo de conocimientos
científicos, también era pura y simplemente un científico, que no olvidaba que la
búsqueda de nuevos conocimientos constituía una tarea irrenunciable en sí misma,
aunque, por supuesto, también pudiera conducir a aplicaciones político-militares.
Así, en la primera de sus cartas a Strauss escribió:
Estoy convencido de que una máquina electrónica del tipo más avanzado que se
pueda imaginar debería ser construida, no para emplearla en problemas específicos de
matemática aplicada, de física y de ingeniería, sino con el propósito de experimentar
109
La frase «combinando y “organizando” adecuadamente los componentes existentes» se debe
entender desde el punto de vista de la arquitectura lógica, de la que me ocupo en la sección siguien-
te, «Von Neumann y Alan Turing».
65
Fund_MAT_00c.indd 65 3/5/18 16:13

con la propia máquina para así desarrollar nuevos métodos de computación y de apro-
ximación, y para, en general, adquirir formas de pensamiento lógicas y matemáticas que
son necesarias para utilizar de forma realmente eficiente tal máquina [...] No tengo
ninguna duda, por consiguiente, de que nos encontramos en el umbral de desarrollos
muy importantes tanto en matemática pura como en sus aplicaciones, y que un institu-
to dedicado a la investigación pura debería emplear varios años para construir una má-
quina y experimentar con ella. Si dedicamos varios años a experimentar con semejante
máquina, sin necesidad de preocuparnos por aplicaciones inmediatas, estaremos al final
de ese período en una posición mucho mejor en todos los aspectos, incluyendo las apli-
caciones.
Inicialmente las autoridades y miembros del Institute for Advanced Study no

recibieron con agrado la propuesta; al fin y al cabo, el Instituto había sido conce-
bido como un centro apartado de las investigaciones experimentales. Sin embargo,
Von Neumann manejó con habilidad ofertas de trabajo de otras universidades
(Massachusetts Institute of Technology, Chicago, California, Columbia) para con-
seguir el apoyo del Instituto.110 La máquina, popularmente conocida como JO-
HNNIAC, se construyó finalmente con el apoyo de la Army, Navy y Atomic Ener-
gy Commission y entró en funcionamiento en 1952. Con la nueva computadora
se abordaron diversos problemas; mencionaré algunos: conjetura de Kummer de los
ideales (Artin, Goldstine, Von Neumann), solución de grandes sistemas de ecua-
ciones lineales (Bargmann, Montgomery, Von Neumann), soluciones de ecuaciones
integrales (Birkhoff, Von Neumann), campo gravitacional producido por una dis-
tribución aleatoria de estrellas (Chandrasekhar, Von Neumann), inversión de ma-
trices (Goldstine, Von Neumann), teoría de números (E. y D. Lehmer), invarian-
tes fundamentales de secciones cónicas en espacios n-dimensionales sometidas a
rotaciones (Murray, Goldstine, Von Neumann), ondas de choques (Richtmyer, Von
Neumann), estructura interna de estrellas (Schwarzschild).
Posibilidades de cálculo aparte, no es difícil imaginar por qué las computado-
ras atrajeron el interés de Von Neumann. Eran unos instrumentos con unas carac-
terísticas muy de su gusto: complicación y precisión, por ejemplo. Es interesante
citar en este sentido los siguientes párrafos de uno de sus trabajos:111
110
En una carta fechada el 20 de noviembre de 1945 al decano del MIT, George B. Harrison,
en la que respondía (negativamente) a la oferta de una cátedra de Matemáticas, Von Neumann se-
ñalaba: «Ahora se ha manifestado que existe una muy excelente oportunidad para [acometer nuevos
proyectos en el campo de la computación automática a alta velocidad] en Princeton. El Institute for
Advanced Study y la Radio Corporation of America (cuyo laboratorio de investigación está situa-
do, como sabe, en Princeton), con la ayuda de la Universidad de Princeton, me han ofrecido apo-
yar el desarrollo de este Proyecto. Por lo que sé, están suministrando financiación adecuada y
mano de obra […] En estas circunstancias creo que mi primera responsabilidad es permanecer en
Princeton y dirigir este Proyecto. Debo, por consiguiente, declinar su muy halagadora oferta, aunque
lo hago con gran pesar»; reproducida en M. Rédei, ed., John von Neumann: Selected Letters, op. cit.,
pp. 138-139.
111
John von Neumann, «The general and logical theory of automata», en Cerebral Mechanisms
in Behavior. The Hixon Symposium, L. A. Jeffress, ed. (John Wiley, Nueva York, 1951), pp. 1-31;
reimpreso en Papers of John von Neumann on Computing and Computer Theory, op. cit., pp. 391-431;
66
Fund_MAT_00c.indd 66 3/5/18 16:13

La computadora es un artefacto excepcional. No solamente tiene que ejecutar mil

millones, o más, de pasos en un tiempo breve, sino que en gran parte del procedimien-
to (y ésta es una parte que se especifica rigurosamente por adelantado) no se le permite
ni un solo error. En realidad, para asegurarse de que toda máquina es operativa y que
no han de intervenir malfuncionamientos potencialmente degenerativos, la práctica ac-
tual requiere generalmente que no ocurra ningún error en ninguna parte de todo el
procedimiento.
Este procedimiento pone a las grandes máquinas de gran complejidad ante un pun-
to de vista totalmente nuevo. Produce en particular una comparación entre las compu-
tadoras y la operación de los organismos naturales no enteramente desproporcionada.
Volveré más adelante a la cuestión de «computadoras» y «organismos naturales».
Von Neumann y Alan Turing

Alan Turing (1912-1954) es uno de los grandes nombres de la matemática del
siglo xx. Especialmente importante fue el artículo que publicó en 1937, «Sobre
números computables, con una aplicación al problema de la decisión», en el que
respondía a las cuestiones que Hilbert había planteado en el Congreso Internacio-
nal de Matemáticos celebrado en Bolonia en 1928, con el que ya nos encontra-
mos.112 Para resolver la cuestión de si existe algún procedimiento automático capaz
de decidir cualquier cuestión matemática, en lugar de utilizar instrumentos como
los lenguajes formales universales basados en la aritmética, como había hecho Gö-
del, Turing recurrió a unos instrumentos formales mucho más intuitivos y pro-
ductivos: una máquina digital de calcular abstracta —una «máquina universal»,
posteriormente conocida como máquina de Turing—, que a la postre proporcionó
la base teórica para el funcionamiento de los modernos computadores. Básicamen-
te, una máquina de Turing consiste de un escáner y una cinta de memoria sin lí-
mite, dividida en cuadrados, cada uno de los cuales puede estar vacío o llevar un
solo símbolo, por ejemplo, 1 o 0; en otras palabras, es la realización de la idea
teórica de la digitalización Boole.
Provisto de semejante instrumento conceptual y operativo, Turing demostró
que ciertas tareas matemáticas no se pueden automatizar, o que algunas funciones
cita en p. 395. Existe versión castellana: «Teoría general y lógica de los autómatas», en H. Aiken y
otros, Perspectivas de la revolución de los computadores (Alianza, Madrid, 1975), pp. 131-163; en esta
obra también se encuentra reproducido (traducido al castellano) un informe que preparó en 1946
junto con Arthur W. Burks y Herman H. Goldstine para el Ejército estadounidense (U.S. Army
Ord. Dept., contract W-36-034-0RD-7481): «Discusión preliminar del proyecto lógico de un ins-
trumento de cómputo electrónico», pp. 69-80.
112
Alan Turing, «On computable numbers, with an application to the Entscheidungsproblem»
Proceedings of the London Mathematical Society 42, 230-265 (1937), «On computable numbers, with
an application to the Entscheidungsproblem. A correction», Proceedings of the London Mathematical
Society 43, 544-546 (1937). Aunque fue recibido en la redacción de Proceedings of the London Mathe-
matical Society el 28 de mayo de 1936, y leído el 12 de noviembre, se publicó en 1937; este es el
motivo por el que a veces se dice que se publicó en 1936.
67
Fund_MAT_00c.indd 67 3/5/18 16:13

matemáticas no son computables. Expresado

de otra forma, que no es posible decidir
algorítmicamente si una máquina de Tu-
ring dada se detendrá o no alguna vez
(para que una de estas máquinas pue-
da calcular, o computar, algo, debe
detenerse).113 Unidos a los de Gö-
del, estos resultados mostraron de-
finitivamente que no era posible
establecer si la matemática es un
sistema completo, que el sueño
de hallar un algoritmo que per-
mitiese determinar la verdad o
falsedad de todas las proposicio-
nes matemáticas era, eso, un sue-
ño, pero un sueño imposible.
Las ideas introducidas por
Turing constituyeron una autén-
tica pieza maestra conceptual en el
posterior desarrollo de las computa
doras. Y es que su máquina es el
equivalente lógico exacto de una com-
putadora-ordenador, instrumento que,
por otra parte, no existía aún en 1936.
En otras palabras, el ordenador, sin el cual
la segunda mitad del siglo xx habría sido
muy distinta, se concibió primero bajo una for-
Alan Turing (1912-1954).
ma ideal, antes de reflejarse en un aparato real. Es
cierto que la máquina de Turing no es ni siquiera, en un
sentido mínimamente práctico, el boceto de una computadora, pero sí que fue su
«substrato teórico-conceptual».
El mismo año que se publicó «Sobre números computables», Turing dejó Cam-
bridge, donde disponía de una fellowship del King’s College, del que había sido
elegido fellow en 1935, y se trasladó a la Universidad de Princeton, donde enseña-
ba Church. Esperaba encontrar a Gödel, pero este no estaba allí. Aun así, no que-
113
El resultado de Turing había sido obtenido unos meses antes, bajo otros planteamientos, por
Alonzo Church, «An unsolvable problem of elementary number theory», American Journal of Mathe-
matics 58, 345-363 (1936), «A note on the Entscheidungsproblem», Journal of Symbolic Logic 1,
40-41 (1936), «A note on the Entscheidungsproblem, Correction», Journal of Symbolic Logic 1, 101-
102 (1936). Para más detalles, tanto de las diferencias entre las aportaciones de Church y Turing,
como sobre los trabajos de este, véase José Manuel Sánchez Ron, «Alan Turing: Person of the xxth
century», Arbor 189, n.º 764 (noviembre-diciembre 2013), 14 pp. Una referencia notable para la
historia del origen de las computadoras es Martin Davis, The Universal Computer. The Road from
Leibniz to Turing (CRC Press, Boca Raton, Florida, 2011).
68
Fund_MAT_00c.indd 68 3/5/18 16:13

dó defraudado. «El departamento de matemáticas de aquí», escribió a su familia el

6 de octubre de 1936, «cumple con lo que esperaba. Aquí está un gran número de
los matemáticos más distinguidos. J. V. Neumann, Weyl, Courant, Hardy, Einstein,
Lefschetz, y acoge también a un número más pequeño de pececillos. Desgraciada-
mente, no están tantos lógicos como había aquí el año pasado. Church, por supues-
to, está aquí, pero Gödel, Kleene, Rosser y Bernays, que estaban el año pasado se
han marchado. Creo que no me importa mucho no encontrar a estos, excepto por
Gödel. Kleene y Rosser son, imagino, simplemente discípulos de Church y no tie-
nen mucho que ofrecer que yo no pueda obtener de Church. Bernays, pienso, está
dedicándose más bien a “vieux jeu”: esta es la impresión que saco de sus escritos,
pero si me encontrase con él tal vez obtendría una impresión diferente».114
El primer año en Princeton lo pasó Turing utilizando el dinero de su fellowship
inglesa, 300 libras anuales, pero quería continuar otro año allí y para ello necesi-
taba una beca. Consiguió una más generosa (2.000 dólares anuales), la Procter
Visiting Fellowship, y uno de los que apoyaron su solicitud fue, precisamente, Von
Neumann. En su carta, fechada el 1 de junio de 1937, decía:115
Señor,
Mr. A. M. Turing me ha informado que está solicitando una Proctor [sic] Visiting
Fellowship para la Universidad de Princeton desde Cambridge [Turing estaba pasando
el verano en Inglaterra] para el año académico 1937-1938. Querría apoyar su solicitud
e informarle que conozco muy bien a Mr. Turing de años anteriores: durante el último
semestre de 1935, cuando yo era profesor visitante en Cambridge, y durante 1936-1937,
que Mr. Turing pasó en Princeton. Tuve la oportunidad de observar su trabajo científi-
co. Ha realizado buen trabajo en ramas de la matemática en las que estoy interesado; a
saber: teoría de funciones casi periódicas, y teoría de grupos continuos.
Creo que es un muy meritorio candidato para la Proctor [sic] Fellowship y me agra-
daría si fuese posible concederle una.
Sorprendentemente, en su carta Von Neumann no mencionaba el trabajo de

Turing sobre la computabilidad ni su demostración de que el Entscheidungsproblem
de Hilbert no tenía solución. Es sorprendente porque Von Neumann había traba-
jado en el mismo problema, lo que hace difícil pensar que no conociese lo que
había hecho Turing. Y si no lo conocía, lo aprendió durante la estancia de este en
Princeton; de hecho, en 1938 le ofreció que continuase allí como su ayudante, con
un salario de 1.500 dólares, pero Turing decidió regresar a Inglaterra, una vez que
presentó su tesis doctoral, bajo la supervisión de Church: Systems of Logic Based on
Ordinals (1938).116
114
Reproducido en The Essential Turing, B. Jack Copeland, ed. (Clarendon Press, Oxford,
2004), p. 127.
115
Citada en Andrew Hodges, Alan Turing: The Enigma (Simon & Schuster, Nueva York, 1983),
p. 131.
116
La tesis de Turing fue publicada con el mismo título en Proceedings of the London Mathema-
tical Society 2, 161-228 (1939). El manuscrito de Princeton se ha publicado: Alan Turing’s System
of Logic. The Princeton Thesis, Andrew W. Appel, ed. (Princeton University Press, Princeton, 2012).
69
Fund_MAT_00c.indd 69 3/5/18 16:13

El físico Stanley Frankel, responsable con Von Neumann en Los Álamos de

los cálculos para diseño de las bombas de fisión y de hidrógeno, recordó la impor-
tancia que el polivalente húngaro daba al artículo de Turing «Sobre números com-
putables», en los siguientes términos:117
Sé que hacia 1943 o 1944, Von Neumann conocía bien la importancia fundamen-
tal del artículo de Turing de 1936 «On computable numbers…», que describe en prin-
cipio la «Computadora Universal» del que todas las modernas computadoras (probable-
mente no ENIAC al ser la primera completada, pero ciertamente todas las posteriores)
son una realización. Von Neumann me introdujo en aquel artículo y a petición suya lo
estudié con cuidado. Muchas personas han aclamado a Von Neumann como el «padre
de la computadora» (en el sentido moderno del termino), pero estoy seguro de que él
nunca habría cometido ese error. Tal vez pueda ser denominado la comadrona, pero
él me hizo hincapié, y estoy seguro que a otros también, que el concepto fundamental
se debía a Turing —en tanto que no fue anticipado por Babbage, Lovelace y otros—.
En mi opinión, el papel esencial de Von Neumann consistió en hacer a todos conscien-
tes de estos conceptos fundamentales introducidos por Turing y del trabajo desarrollado
en la escuela de Moore y en otras partes.
Efectivamente, ENIAC no utilizaba el tipo de «cinta de memoria» à la Turing:

su programación era en realidad un conjunto de cables e interruptores. Fue con la
anteriormente citada EDVAC donde Von Neumann introdujo una organización
lógica que hacía realidad la máquina de Turing: poseía un sistema —que Von Neu-
mann denominó «memoria»— que almacenaba tanto datos como instrucciones.
Mientras que ENIAC realizaba sus operaciones aritméticas mediante números re-
presentados en término de los diez dígitos decimales, EDVAC utilizaba el más
sencillo sistema binario. La demostración de que, efectivamente, Von Neumann
pensaba en estos términos se halla en un informe de 101 páginas con fecha de 30
de junio de 1945, titulado First Draft of a Report on the EDVAC (Primer borrador
de un informe sobre el EDVAC) que Von Neumann preparó como parte de un con-
trato entre el United States Army Ordinance Department y la Escuela Moore de
Ingeniería Electrónica de la Universidad de Pensilvania; contiene la primera des-
cripción completa del diseño lógico de una computadora utilizando el concepto
de un programa almacenado en su memoria.118 Es lo que posteriormente se deno-
minó software, frente al hardware, la parte «material» de la computadora, en la que
se centraron los esfuerzos de la Escuela Moore hasta la llegada de Von Neumann.
El destino inicial de Turing fue Cambridge, donde aún podía disponer de su fellowship en el King’s
College. Llegó allí en el verano, pero en septiembre de 1939, ya con la Segunda Guerra Mundial en
marcha, se trasladó al cuartel general de la Escuela de Códigos gubernamental (Code and Cypher
School) en Bletchley Park, donde participó en los trabajos de descifrado de los mensajes alemanes
enviados a través de la famosa máquina Enigma. La contribución de Turing en esa tarea, finalmente
exitosa, fue decisiva.
117
Citado en The Essential Turing, Copeland, ed., op. cit., p. 22.
118
Este informe, que se puede encontrar fácilmente en Internet, fue publicado en IEEE Annals
of the History of Computing 15, n.º 4, 27-43 (1993).
70
Fund_MAT_00c.indd 70 3/5/18 16:13

Von Neumann y los «asuntos nucleares»

Como vimos, la relación de Von Neumann con el Proyecto Manhattan se ini-
ció a través de Oppenheimer. Podría pensarse que la petición del director del
Laboratorio de Los Álamos forzó a aquel a involucrarse en el proyecto; que, de
alguna manera, violentó sus ideas. No fue así, en absoluto. Una carta que Von
Neumann escribió el 9 de noviembre de 1943 a Stanislaw Ulam muestra cuán
profundamente se involucró no solo en los trabajos, sino también en espíritu del
proyecto destinado a fabricar bombas atómicas:119
Querido Stan,
Me alegra que Mr. Hughes «y todo lo que él representa» hayan dado señales de vida.
Les hablé de ti, porque tú me habías escrito varias veces antes que definitivamente que-
rías un trabajo para la guerra y porque ésta es una posibilidad muy real, donde podrías
desarrollar un trabajo muy eficaz y útil.
El proyecto en cuestión es extremadamente importante, probablemente más allá de
todos los adjetivos que podrían añadírsele. Además, es muy interesante, y los físicos
teóricos (y otros) relacionados con él son probablemente el mejor grupo que en este
momento existe en cualquier parte. Requiere algún trabajo computacional, pero no
existe duda de que todos estarán muy contentos y te darán todo el ánimo que puedas
desear para realizar investigación original en el tema, para la que existe una amplia opor-
tunidad. También puedo asegurarte mi cooperación en este aspecto.
Los requisitos de secreto de este proyecto son bastante extremos y probablemente
necesitarán que tú y tu familia permanezcan esencialmente en las instalaciones (excepto
en las vacaciones) mientras que decidas estar asociado con él.
Repitiendo: si quieres trabajo para la guerra, esta es probablemente una oportunidad
excepcional.
Podré darte una idea mejor oralmente y estaría feliz de hacerlo si pudiésemos en-
contrarnos en algún lugar antes de que contestes, pero supongo que no hay tiempo.
(Estaré en Princeton del 13 al 15 y en Washington el 16 y el 17 de este mes.)
¿De manera que cuentas con una guerra bastante corta? Yo lo veo así desde un
punto de vista puramente técnico. Alemania tiene que ser derrotada antes del próximo
otoño. Por supuesto, un colapso puede llegar cualquier día a partir de ahora por razones
morales y políticas, pero no puedo juzgar esto sin saber más sobre el estado actual y
eficiencia de la maquinaria política nazi.
Y después de esto, todavía quedará un año de guerra asiática. De todas manera, qui
vivra verra...
119
Reproducida en Cooper, ed., From Cardinals to Chaos, op. cit., p. 14. La relación de Von
Neumann con Ulam comenzó en 1943; en palabras del propio Ulam: «No fue sino hacia finales de
1934 cuando establecí correspondencia con Von Neumann. Él estaba entonces en Estados Unidos,
donde era uno los profesores más jóvenes del Institute for Advanced Study de Princeton. Yo le había
escrito acerca de unos problemas de la teoría de la medida. Él había oído hablar de mí a [Solomon]
Bochner, y en su respuesta me invitó a pasar unos meses en Princeton y me comunicó que el Insti-
tuto podía ofrecerme una beca de 300 dólares»; Ulam, Aventuras de un matemático, op. cit., p. 93.
Ulam llegó a Princeton en diciembre de 1935.
71
Fund_MAT_00c.indd 71 3/5/18 16:13

Von Neumann, Richard Feynman y Stan Ulam en Frijoles Canyon, Nuevo México, hacia
1949 (AIP Emilio Segrè Visual Archives, Ulam Collection).
Con sus conocimientos tan excepcionales como amplios, Von Neumann llegó
a ser bastante influyente en el Proyecto Manhattan; participó, por ejemplo, en las
discusiones acerca de cuáles deberían ser los objetivos en Japón para lanzar sobre
ellos las primeras bombas atómicas. En sus memorias, Now It Can Be Told, el ge-
neral Leslie Groves, director del Proyecto Manhattan, explicó la participación de
Von Neumann en este apartado. Cito sus palabras:120
En la primavera de 1945, otro trabajo cayó en el MED [Manhattan Engineer District;

el nombre oficial del Proyecto Manhattan]. El primer atisbo de esa responsabilidad aña-
dida llegó durante una conversación con el general Marshall. Habíamos estado tratando
el progreso de los trabajos y, habiendo mencionado la fecha que anticipábamos en que
120
Leslie R. Groves, Now It Can Be Told (Harper & Brothers, Nueva York, 1962), pp. 266-268.
En otro lugar de su libro (p. 343), Groves se refería a la importancia que tenía para él la opinión de
Von Neumann: «Como sucede a menudo, se producían constantemente interferencias de varias
personas en asuntos que caían fuera de sus esferas de responsabilidad. A lo largo de la vida del Pro-
yecto, se tomaron decisiones vitales solamente después de la más cuidadosa consideración con los
hombres que yo pensaba que eran capaces de ofrecer el consejo más correcto. En general, para esto,
se trataba de Oppenheimer, Von Neumann, [William G.] Penney, [William S.] Parsons y [Norman
F.] Ramsey». Sobre Groves, véase Robert S. Norris, Racing for the Bomb. General Leslie R. Groves, the
Manhattan Project Indispensable Man (Steerforth Press, South Royalton, Vermont, 2002).
72
Fund_MAT_00c.indd 72 3/5/18 16:13

todo estaría dispuesto, sugerí que se estaba acercando rápidamente el momento en que
deberíamos hacer planes para la propia operación del bombardeo, incluso aunque todavía
no estuviésemos seguros de que la bomba funcionara. Le pedí que designase a algún ofi-
cial de la División de Planificación de Operaciones con el que yo podría estar en contac-
to de forma que la planificación pudiese comenzar. Después de un momento de duda, el
general Marshall respondió: «No quiero que haya mucha gente en este asunto. ¿Hay al-
guna razón por la que usted no puede encargarse de esto?». Mi «No, señor, lo haré» ter-
minó la conversación, que constituyó la única instrucción que jamás recibí o necesité […]
Inmediatamente, informé al general [Henry H.] Arnold [jefe del Estado Mayor de
las Fuerzas Aéreas de Estados Unidos entre 1938 y 1945] y juntos consideramos los
principales problemas a los que nos enfrentábamos. Nuestra tarea más urgente era se-
leccionar los objetivos de las bombas. Esta sería responsabilidad mía.
Antes de esto, durante muchos meses se habían discutido, una y otra vez, los crite-
rios para los objetivos con y entre los miembros del Comité de Política Militar. Fina-
mente, tales criterios se establecieron solamente después de minuciosas discusiones con
Oppenheimer y sus asesores seniors en Los Álamos, en particular con el Dr. John von
Neumann.
Finalmente, se estableció un comité especial para recomendar los objetivos.

Estaba formado por tres miembros de la oficina del general Arnold, el coronel
William P. Fisher, el Dr. J. C. Stearns y D. M. Dennison, mientras que los restan-
Von Neumann; la hija de Stan Ulam, Claire; y Stan Ulam en Los Álamos (AIP Emilio Segrè
Visual Archives, Ulam Collection).
73
Fund_MAT_00c.indd 73 3/5/18 16:13

Von Neumann y Manley en Los Álamos (AIP Emilio Segrè Visual Archives, Segre Collection).
tes pertenecían al Proyecto Manhattan: Thomas F. Farrell, Von Neumann, R. B.

Wilson y W. G. Penney, este miembro del grupo británico en Los Álamos.
Y así, llegó el momento, agosto de 1945, en el que Hiroshima y Nagasaki tu-
vieron la desgracia, que no el honor, de ser los objetivos de las dos primeras bom-
bas atómicas. El 6 de agosto, un bombardero B-29 estadounidense —el famoso
Enola Gay— despegaba de la isla de Tinian con una carga mortífera, que lanzó
sobre Hiroshima. Se trataba de Little boy, una bomba atómica de uranio, de unos
4.500 kilogramos de peso y unas 13.000 toneladas de TNT de potencia. Su efec-
to fue terrible. Virtualmente todo en un radio de 500 metros de la explosión fue
incinerado. Los edificios situados hasta 3 kilómetros de distancia, destruidos. Un
espeso hongo de humo ascendió hasta 12 kilómetros de altura. A fines de año se
estimaba el número de víctimas en 145.000 personas. Muchos otros llevaban, en
74
Fund_MAT_00c.indd 74 3/5/18 16:13

forma de radiación, la muerte en su seno. Tres días más tarde le tocaba el turno a
una bomba de plutonio: Fat man. Pesaba algo más que Little boy, unos 5.000 ki-
logramos, pero tenía la misma potencia. Su objetivo fue Nagasaki. Las víctimas
fueron 70.000, menos que en Hiroshima debido a errores en el lanzamiento.
Mostrando no sé si ignorancia o un orgullo que nublaba la capacidad crítica,
seguramente la mayoría de los dirigentes estadounidenses pensaron que la Unión
Soviética tardaría mucho tiempo en disponer de armamento nuclear. Sin embargo,
el 3 de septiembre de 1949, en una de las muestras que uno de los aviones B-29
que la Fuerza Aérea estadounidense recogía para analizar el aire sobre Japón, Alas-
ka y el Polo Norte, se encontraron, sobre el Pacífico Norte, cerca de Japón, evi-
dencias de que se había producido la primera explosión nuclear soviética. Había
tenido lugar el 29 de agosto (Joe 1, la denominaron los norteamericanos). La
ciencia, ciertamente, había podido sobrevivir bajo el implacable régimen de Stalin.
La explosión de la primera bomba atómica soviética significó el comienzo real
de la carrera atómica. En Estados Unidos, Ernest Lawrence y Edward Teller defen-
dieron la idea de que había que contraatacar desarrollando una nueva arma que
pudiese contrarrestar la de los soviéticos; fabricar una superbomba, mucho más
poderosa que las de 1945, una bomba de hidrógeno, esto es, de fusión, que utili-
zase procesos similares a las reacciones termonucleares que tienen lugar en el in-
terior de las estrellas, en las que partiendo de elementos ligeros se producen otros
más pesados, emitiendo al mismo tiempo grandes cantidades de energías.121 Aun-
que la idea de tal bomba se remontaba a los primeros tiempos del proyecto ató-
mico durante la guerra, no se había avanzado en su desarrollo al no establecerse
un programa adecuado (sin embargo, los soviéticos ya se habían embarcado en el
proyecto desde 1948).122
Sin embargo, en 1949 la comunidad científica norteamericana no estaba tan
unida como lo había estado diez años antes. Se produjo una clara división de opi-
niones. Oppenheimer se opuso, lo que a la postre terminaría llevando a que la
Atomic Energy Commission (AEC) le declarase un riesgo para la seguridad en
1953-1954, negándole, como veremos enseguida, acceso a secretos atómicos. Por
el contrario, Lawrence desarrolló una intensa campaña en favor de la nueva bom-
ba y visitó personalmente la AEC, el Comité Conjunto de Energía Atómica, el
121
La principal reacción de fusión que tiene lugar en la bomba de hidrógeno es la siguiente
(H3 = deuterio; H3 = tritio; He4 = núcleo de helio-partícula alfa; n = neutrón):
H3 + H2 → He4 + n1 + 17,6 MeV
La energía de fusión de 1 kilogramo de deuterio es suficiente para elevar 600 barcos de 50.000
toneladas cada uno, a 1 kilómetro de altura.
122
En un seminario sobre la teoría de la bomba atómica, celebrado en julio de 1942, Teller
aventuró la posibilidad de que se podría utilizar una bomba de fisión como detonante de otra de
fusión. En 1944 defendía la idea de que sería posible fabricar una bomba de implosión que utiliza-
se deuterio y tritio como combustible. Acerca del desarrollo de la superbomba, véase Peter Galison
y Barton Bernstein, «In any light: scientists and the decision to build the Superbomb, 1952-1954»,
Historical Studies in the Physical and Biological Sciences 19, 267-347 (1989).
75
Fund_MAT_00c.indd 75 3/5/18 16:13

El general Groves y Oppenheimer después de la primera prueba nuclear (Trinity), septiem-

bre de 1945 (Digital Photo Archive, Department of Energy [DOE], cortesía de AIP Emilio
Segrè Visual Archives).
76
Fund_MAT_00c.indd 76 3/5/18 16:13

Departamento de Defensa y hasta el Congreso. A partir de la posguerra, y espe-

cialmente en Estados Unidos, la gran ciencia (mucha con aplicaciones militares)
era ya una cuestión de Estado y como tal debatida en todo tipo de foros. Lejos
estaban los tiempos en que prácticamente todo quedaba a merced de las iniciativas
de los propios científicos, o de sus mecenas, los Carnegie o Rockefeller. Por su
parte, Teller realizó en 1950 un agresivo llamamiento a sus colegas con el título
de «Vuelta a los laboratorios», en el que comparaba la situación internacional pro-
ducida por la bomba nuclear soviética con la existente en 1939.123 Para el físico
húngaro la decisión de utilizar una bomba como la de hidrógeno era responsabi-
lidad de los políticos, no de los científicos. En su opinión, el hombre de ciencia
no era «responsable de las leyes naturales. Su trabajo es averiguar cómo operan esas
leyes. El trabajo del científico consiste en encontrar la manera en que estas leyes
pueden servir a la voluntad del hombre. En cambio, no es su tarea determinar si
una bomba de hidrógeno debe construirse, ni cuándo o cómo debe usarse». En
una clara alusión a las actividades en las que se ocupaban entonces otros físicos
(como Pauli), Teller añadía que «nuestra comunidad científica ha estado en luna
de miel con los mesones. Las vacaciones se han terminado. Las bombas de hidró-
geno no se construyen por sí solas».
Edward Teller y Enrico Fermi en Chicago, 1951 (AIP Emilio Segrè Visual Archives, donada
por Carlo Wick).
123
Edward Teller, «Back to the laboratories», Bulletin of the Atomic Scientists 6, 71-72 (1950).
77
Fund_MAT_00c.indd 77 3/5/18 16:13

Para entender mejor la situación reinante en aquel momento, además de las re-
laciones de Estados Unidos con la Unión Soviética hay que tener en cuenta también
que en 1949 los comunistas se hacían con el poder en China, bajo el liderazgo de
Mao Tse Tung. Estos acontecimientos llevaron al Consejo de Seguridad Nacional
estadounidense a defender la tesis de que Estados Unidos se enfrentaba a un periodo
de máximo peligro y que para su seguridad debía procederse a un completo rearme,
recomendando al presidente que se aprobase un presupuesto de entre 100 y 200
millones de dólares para la fabricación de la superbomba. El 31 de enero de 1950
Truman aprobaba la propuesta. Dos años y nueve meses después, Estados Unidos
hacía explotar una bomba (Mike) 1.000 veces más potente que las de 1945. Tres años
y pocas semanas después, los soviéticos hacían estallar su Mike, en Asia central.
John von Neumann estuvo desde el principio entre los que apoyaban que se
estableciese un programa para producir, lo más rápidamente posible, una bomba
de hidrógeno; de hecho, junto a Teller y Lawrence fue uno de sus principales de-
fensores.124 En sus memorias, Teller mencionó que «a partir de 1943, nuestro prin-
cipal tema de conversación [entre él y Von Neumann] fue el diseño de explosivos
nucleares. Johnny se dio cuenta rápidamente que una bomba atómica podría in-
ducir una explosión termonuclear de varias formas, y desde el comienzo compartió
mi deseo de que tales investigaciones se investigasen cuidadosamente».125 Detrás de
tal interés estaba el anticomunismo de Von Neumann, como explicaba Ulam:126
Tras la guerra, por supuesto, se planteaba la posibilidad de nuevas guerras y la cues-

tión del armamento del futuro. Yo era partidario de continuar con una política arma-
mentística fuerte, aunque sólo fuera para no correr el riesgo de ser adelantados por otras
naciones. A Johnny y a otros les inquietaba la capacidad de Rusia para obtener o desa-
rrollar bombas nucleares, y desconfiaban de sus intenciones hacia Europa Occidental.
Por aquel entonces él era bastante halcón (aunque la terminología halcones y palomas aún
no se usaba). Pensaba según las viejas líneas históricas de rivalidades, luchas por el poder
y coaliciones: era partidario de una Pax Americana más que otros físicos amigos nuestros.
También vaticinó pronto que los problemas militares esenciales pasarían de las propias
bombas y sus tamaños a cómo llevarlas a sus objetivos, esto es, a los misiles.
Ulam, Von Neumann, el diseño de la bomba de hidrógeno

y el método de Monte Carlo
Una de las principales contribuciones efectivas —esto es, no limitadas a ase-
sorar— de Von Neumann tuvo que ver con una cuestión importante. Teller había
propuesto un diseño concreto para la bomba de hidrógeno, pero en marzo de 1950
Ulam y Cornelius Everett demostraron, para frustración de Teller, mediante largos
y tediosos cálculos, que con ese diseño sería muy difícil que se iniciase la fusión.
124
Más información en Herbert F. Yok, The Advisors. Oppenheimer, Teller and the Superbomb
(Stanford University Press, Stanford, 1976).
125
Teller y Shoolery, Memoirs, op. cit., p. 408.
126
Ulam, Aventuras de un matemático, op. cit., p. 191.
78
Fund_MAT_00c.indd 78 3/5/18 16:13

Pronto, utilizando la nueva computadora de Princeton, Von Neumann obtuvo

resultados que apoyaban a Ulam-Everett. Fue el propio Ulam quien resolvió el
problema. Su idea, que se le ocurrió en diciembre de 1950, y que denominó «hy-
drodynamic lensing» («lente hidrodinámica»), aunque finalmente fue conocida
como «super-compresión», era, básicamente, utilizar una bomba atómica para
comprimir un trozo pequeño de material fisionable, creando entonces una segun-
da explosión, más poderosa.127 Este fue el diseño que se usó.
Otra contribución destacada de Von Neumann en aquella época tuvo que ver
con una nueva idea de Ulam: la del método de Monte Carlo. Lo mejor es utilizar
lo que el propio Ulam explicó en su autobiografía:128
La idea de lo que se llamaría luego el método de Monte-Carlo se me ocurrió cuan-

do estaba haciendo un solitario durante mi enfermedad [un tipo de encefalitis vírica que
padeció en la primera mitad de 1946]. Me di cuenta de que para tener una idea de la
probabilidad de que salga un solitario era mucho más práctico ir echando las cartas, o
experimentando con el proceso y observar cuántas veces sale, que tratar de calcular todas
las combinaciones, que crecen exponencialmente de tal manera que, salvo en casos muy
elementales, no pueden estimarse. Esto es intelectualmente sorprendente y, aunque no
exactamente humillante, sí que proporciona un sentimiento de modestia sobre los lími-
tes del pensamiento tradicional o racional. En un problema lo suficientemente compli-
cado, un muestreo es mejor que un examen de todo el árbol de posibilidades.
Se me ocurrió que esto también podría ser cierto para todos los procesos que invo-
lucrasen ramificaciones de sucesos, como en la producción y reproducción de neutrones
en un material que contuviese uranio u otro elemento fisionable. En cada etapa del
proceso hay muchas posibilidades que determinan el destino de un neutrón. Puede
desviarse con un cierto ángulo, cambiar su velocidad, ser absorbido, o producir más
neutrones al fisionar el núcleo objetivo, y así sucesivamente. Las probabilidades elemen-
tales para cada una de estas posibilidades quedan determinadas, hasta cierto punto, por
las secciones eficaces. Pero el problema es saber qué pasará en una sucesión de tal vez
cientos de miles o millones de ramificaciones. Podrían escribirse ecuaciones diferenciales
o integrales para los valores esperados, pero resolverlas o llegar a conseguir una idea aunque
sea aproximada de las propiedades de la solución es otra cuestión.
La idea consistía en intentar probar miles de tales posibilidades y seleccionar en cada
etapa, mediante un número aleatorio con probabilidad prefijada, uno de los posibles
destinos. En otras palabras, en lugar de considerar todo el árbol, considerar sólo una
ramificación. Después de haber examinado tan solo unos pocos miles de destinos, se
tendrá un buen muestreo y una solución aproximada del problema. Lo que se necesita-
ba eran los medios para producir tal muestra de destinos. El caso era que estaban na-
ciendo las computadoras y aquí había algo apropiado para calcularlo con máquinas.
127
Para una descripción más detallada véase Ulam, ibidem, capítulo 11. También, Ulam et al.,
en Fleming y Bailyn, eds., The Intellectual Migration, op. cit., pp. 249-254.
128
Ibidem, pp. 197-199. Sobre la historia del método de Monte Carlo, cabe consultar George
Temple, «The beginnings of the Monte Carlo method» y Roger Eckhardt, «Stan Ulam, John von
Neumann and the Monte Carlo method», en Cooper, ed., From Cardinals to Chaos, op. cit., pp. 125-
130 y 131-137.
79
Fund_MAT_00c.indd 79 3/5/18 16:13

Y en este punto entraba en escena John von Neumann:
El método de Monte Carlo, junto con sus correlativos rudimentos de teoría, se

concretó después de que en 1946 le propusiera a Johnny las posibilidades de los esque-
mas probabilistas. Fue durante una conversación particularmente larga en un coche del
Gobierno, mientras íbamos de Los Álamos a Lamy. Hablamos durante todo el viaje y
todavía hoy recuerdo lo que dije en ciertas curvas o cerca de ciertas rocas […] Tras esta
conversación, desarrollamos juntos las matemáticas del método. Creo que el nombre de
Monte Carlo contribuyó mucho a la popularización del procedimiento. Se llamó Mon-
te Carlo por su elemento de azar, la producción de números aleatorios con los que
ejecutar los juegos apropiados.
Que Von Neumann entendió perfectamente las posibilidades del nuevo méto-
do, y que se esforzó por publicitarlo, queda claro en una carta que dirigió el 11 de
marzo de 1947 desde Princeton a Robert Richtmyer, entonces director de la Divi-
sión de Física Teórica de Los Álamos, cargo en el que había sucedido a Hans Bethe,
que decidió regresar a la Universidad de Cornell. En ella le decía que había «estado
pensando bastante en la posibilidad de utilizar métodos estadísticos para resolver
problemas de la multiplicación y difusión de neutrones, de acuerdo con el princi-
pio sugerido por Stan Ulam. Cuanto más pienso en esto, más convencido estoy
que la idea tiene gran mérito».129 Y a continuación le resumía las conclusiones a
las que había llegado. Junto a la carta, Von Neumann enviaba una «hoja de com-
putación» (computing sheet) para utilizar en los cálculos: «Todavía no puedo afirmar
esto con seguridad», añadía, «pero me parece probable que las instrucciones que se
dan en esta «hoja de computación» no excede la capacidad lógica de ENIAC. Dudo
que el procesamiento de 100 «neutrones» tome mucho más tiempo que la lectura,
agujerado y (algún) tiempo de salida de 100 tarjetas; esto es, alrededor de 3 minu-
tos. Por consiguiente, tomando 100 «neutrones» a través de 100 de estos pasos
debería tomar unos 300 minutos; esto es, 5 horas». Finalmente, le pedía que le
dijese lo que él y Ulam pensaban sobre todo ello.130 Fue precisamente con Richt-
myer con quien Von Neumann preparó enseguida, 1947, un informe, Statistical
Methods in Neutrón Diffusion, en el que se presentaron por primera vez las ideas
del método de Monte Carlo.131
El método ideado por Ulam demostraría una versatilidad extraordinaria, apli-
cándose a una gran variedad de problemas en muy diversas disciplinas. Un buen
resumen de él es el que dio el historiador de la ciencia Peter Galison en su libro
Image & Logic:132
129
Una transcripción mecanográfica del manuscrito original se reproduce en Cooper, ed., From
Cardinals to Chaos, op. cit., p. 132.
130
En mayo de 1946, Ulam se había reincorporado a Los Álamos, al que estuvo asociado has-
ta 1967.
131
John von Neumann y Robert Richtmyer, Statistical Methods in Neutron Diffusion, Los Ala-
mos Sci. Lab. Rept. LAMS-551, 9 de abril, reproducido en Von Neumann, Collected Works, vol. 5.
132
Peter Galison, Image & Logic (The University of Chicago Press, Chicago, 1997), pp. 690-691.
80
Fund_MAT_00c.indd 80 3/5/18 16:13

Mirando retrospectivamente a los anales de la historia de la matemática, muchos de

los elementos del método de Monte Carlo se pueden encontrar en esfuerzos particulares.
Se utilizaron técnicas parecidas al Monte Carlo para, por ejemplo, determinar π, y exis-
te un rico legado de métodos numéricos para estimar áreas que se extiende tan lejos
como a Arquímedes. Pero sólo durante y poco después de la Segunda Guerra Mundial,
con la llegada de la computadora, se creó un modo generalizado de investigación para
resolver una amplia clase de problemas, demasiado complejos para la teoría y demasiado
remotos para el experimento. Utilizando números aleatorios (escogidos à la roulette), los
diseñadores de armas nucleares podían simular procesos estocásticos demasiado difíciles
para calcular analíticamente. Pero los físicos e ingenieros pronto elevaron el Monte Car-
lo por encima del bajo estatus de un mero esquema de cálculo numérico: llegó a ser una
realidad alternativa —en algunos casos, la preferida— en el que se podía desarrollar la
«experimentación». Probado en el problema físico más complejo que jamás se haya aco-
metido en la historia de la ciencia —el diseño de la primera bomba de hidrógeno—, el
Monte Carlo llevó la física a un lugar alejado de los polos sociointelectuales tradiciona-
les de experimento y teoría. Monte Carlo formó un tertium quid, una realidad simulada
que tomaba prestada tanto del dominio experimental como del teórico, fusionándolos.
Efectivamente, el método de Monte Carlo resultó imprescindible para poder

disponer de la bomba de hidrógeno, ya que en esta empresa no existía el equiva-
lente a los reactores nucleares que, siguiendo el ejemplo del primero diseñado por
Enrico Fermi, se construyeron, ni de los aceleradores de partículas de Berkeley,
instrumentos con los que se pudo estudiar las propiedades de la fisión del uranio
y plutonio. Para sustituirlos, Fermi, Ulam, Von Neumann y otros como Nicholas
Metroplis construyeron un mundo artificial en el que se podía experimentar utili-
zando computadoras en las que métodos como el Monte Carlo resultaron e senciales.
Von Neumann, la AEC y el caso Oppenheimer

Mencioné antes que, debido a su oposición a iniciar un programa dedicado a
fabricar una bomba de hidrógeno, Oppenheimer terminó teniendo graves proble-
mas. Es el momento de profundizar algo más en este punto y ver cuál fue la par-
ticipación de Von Neumann en aquel desgraciado asunto.
Convertido en un héroe nacional después de agosto de 1945, comenzó enton-
ces una nueva etapa en la vida de Oppenheimer. Una etapa que finalmente le
convertiría en víctima de luchas políticas. En su caso, sus enemigos fueron todos
aquellos que en Estados Unidos deseaban beneficiarse, frente a la Unión Soviética,
del poder nuclear con el que inesperadamente se habían visto dotados. Los mili-
tares del Pentágono, por supuesto, formaban parte de ese grupo, pero no solo
ellos, también personajes tan poderosos como el director del FBI, Edgard Hoover,
el senador Joseph McCarthy y el influyente Lewis Strauss, miembro, como vimos,
y luego, nombrado por el presidente Eisenhower, director de la Comisión de
Energía Atómica, agencia que, recordemos, monopolizaba todo lo referente a la
energía nuclear, así como científicos, entre los que ninguno sobresalió más que
Edward Teller.
81
Fund_MAT_00c.indd 81 3/5/18 16:13

El problema fue que Oppenheimer llegó a la convicción de que no tenía sen-

tido embarcarse en una carrera de armamento nuclear, buscando más y más po-
derosas bombas, como era la de hidrógeno. Y su opinión no era la de cualquiera,
sino la del padre de la bomba atómica, de alguien que figuraba en los comités más
importantes que aconsejaban sobre asuntos nucleares. Cuál era su opinión apare-
ce expresada claramente en un informe que, en nombre del Comité Asesor Gene-
ral [General Advisory Commitee; GAC] de la AEC que dirigía, envió el 17 de
agosto de 1947 al secretario de Guerra:133 «Creemos que la seguridad de nuestra
nación —como algo opuesto a su habilidad para infligir daño a una potencia ene-
miga— no puede residir completamente o incluso fundamentalmente en su capa-
cidad científica o técnica. Debe basarse sólo en hacer que las guerras futuras sean
imposibles. Es nuestra unánime y urgente recomendación [...] que se lleven a cabo
todos los acuerdos internacionales necesarios para lograr tal fin». Cuando en 1949
la Unión Soviética hizo estallar su primera bomba atómica, fueron muchos en
Estados Unidos los que vieron en el desarrollo de la bomba de hidrógeno la única
medida para combatir a los soviéticos. Como chairman del GAC, recaía en Op-
penheimer encabezar las deliberaciones para aconsejar qué hacer a la AEC y, por
consiguiente, al Gobierno federal. Se inició entonces una serie de reuniones, en
las que Edward Teller, Ernest Lawrence y Louis Alvarez se esforzaron por conseguir
aliados para que se decidiese establecer un programa intensivo para desarrollar la
bomba de hidrógeno. Finamente, Oppenheimer convocó una reunión del GAC
el 28-29 de octubre de 1949, que finalizó con la recomendación de que no se
debía proceder con un programa acelerador para fabricar la super. Teller, especial-
mente, siempre argumentó que aquella decisión se tomó a insistencia de Oppen-
heimer cuando, de hecho, este se vio muy influido por las opiniones de James B.
Conant, miembro del GAC, quien era desde 1941 chairman del Comité de Inves-
tigación para la Defensa Nacional [National Defense Research Committee].134
Por entonces, por cierto, Oppenheimer ya era director del Institute for Advan-
ced Study de Princeton, puesto que se le ofreció a comienzos de 1947 y que acep-
tó, contento de instalarse en un lugar cercano a la capital federal, donde continua-
ba desempeñando tareas organizativas.
La influencia que Oppenheimer ejercía, o podía ejercer, hicieron que a partir
de 1950 se intensificasen los esfuerzos para apartarlo del escenario político nuclear.
El anuncio en febrero de que Klaus Fuchs acababa de confesar que había pasado
secretos atómicos a la Unión Soviética ayudó en este sentido. Inmediatamente, el
9 de febrero, el senador McCarthy declaraba que poseía una lista con más de dos-
cientos nombres de comunistas que se habían infiltrado en el Departamento de
Estado, e iniciaba su famosa caza de brujas política. En marzo, Oppenheimer de-
claraba ante un Comité Conjunto que ahora era «un decidido anticomunista,
133
Citado en G. Herken, Brotherhood of the Bomb. The Tangled Lives and Loyalties of Robert
Oppenheimer, Ernest Lawrence, and Edward Teller (Henry Holt and Co., Nueva York, 2002), p. 141.
134
Este episodio se describe en Ray Monk, Inside the Centre. The Life of J. Robert Oppenheimer
(Jonathan Cape, Londres, 212), pp. 543-551.
82
Fund_MAT_00c.indd 82 3/5/18 16:13

cuyas antiguas simpatías por causas comunistas le había inmunizado contra más
infecciones».135
No bastó con esto, sin embargo. Ni tampoco con que el 1 de noviembre de
1952 se llevase a cabo con éxito la primera explosión termonuclear estadouniden-
se. La persecución a la que fue sometido tanto por Strauss como por Hoover dio
como fruto que el 3 de diciembre de 1953 el presidente Eisenhower ordenase que
se estableciese una barrera entre Oppenheimer y los secretos atómicos. Ahí podía
haber terminado todo, más aún habida cuenta de que el último vinculo que unía
a Oppenheimer con la Administración en asuntos atómicos expiraba en junio de
1954. Habría bastado con no renovárselo. Sin embargo, esto no parecía suficiente:
era preciso demostrar a otros el riesgo que asumían si se enfrentaban a ellos, a los
que solo podían imaginar un futuro seguro bajo el escudo de miles y miles de
bombas nucleares. Y así fue como Oppenheimer terminó ante una Junta de Segu-
ridad de Personal de la AEC, ante la que fue interrogado, al igual que otros, ami-
gos y enemigos, entre el 12 de abril y el 6 de mayo de 1954 para juzgar sobre su
lealtad. El 27 de mayo una mayoría (2 frente a 1) de esa Junta emitió su recomen-
dación. Merece la pena recordar uno de sus pasajes centrales:136
No creemos que lo que hemos encontrado [...] proporciona una completa y auto-
mática respuesta a la cuestión que se nos planteó [...] Por una parte, no existe evidencia
de deslealtad. De hecho, tenemos delante de nosotros muchas responsables y positivas
evidencias de la lealtad y amor a su país del individuo concernido. Por otra parte, no
creemos que se haya demostrado que el Dr. Oppenheimer esté libre de sospecha en lo
que se refiere a conducta, carácter y asociación. Podemos en conciencia, creemos, concluir
nuestra difícil tarea con una breve, concisa, recomendación: No pueden existir obstáculos
para la seguridad nacional, que en tiempos de peligro debe ser absoluta, y sin concesiones
a razones de admiración, gratitud, recompensa, simpatía o caridad. Cualquier duda que
surja debe resolverse a favor de la seguridad nacional. El material y evidencia presentados
a esta Junta deja dudas razonables con respeto al individuo al que concierne. No podemos,
por consiguiente, recomendar que se le devuelva la autorización de acceder a secretos.
No es sorprendente que, con semejante recomendación, el 29 de junio la AEC

decidiese retirar a Oppenheimer el permiso a acceder a secretos atómicos, justo un
día antes de que tal permiso expirase.
John von Neumann fue uno de los que tuvieron que testificar en el caso. La
transcripción del testimonio de Von Neumann —que tuvo lugar el 27 de abril de
1954— ocupa las páginas 643-656 del texto publicado con todas las declaracio-
nes.137 El interrogatorio comenzó recordando que Von Neumann había sido pre-
sidente de la American Mathematical Society durante dos años y que era miembro
135
Citado en Herken, Brotherhood of the Bomb, op. cit., p. 219.
136
Reproducida, al igual que las transcripciones de todas las declaraciones en el juicio, en In
the Matter of J. Robert Oppenheimer, op. cit., p. 1011. Sobre el juicio a Oppenheimer, véase Barton
Bernstein, «In the matter of J. Robert Oppenheimer», Historical Studies in the Physical Sciences 12,
195-252 (1982).
137
In the Matter of J. Robert Oppenheimer, op. cit., pp. 643-656.
83
Fund_MAT_00c.indd 83 3/5/18 16:13

de la National Academy of Sciences desde 1937 y professor de Matemáticas en el

Institute for Advanced Study desde 1933, tras lo cual se le pidió que especificara
los cargos gubernamentales que ocupaba en aquel momento, a lo que respondió:
«Soy miembro del Comité Asesor General de la Atomic Energy Commission. Y
lo he sido desde 1952. He sido asesor del Laboratorio de Los Álamos desde 1943.
Al margen de la Comisión, soy miembro de la Junta Asesora Científica de las
Fuerzas Aéreas. También tengo algunos otros puestos en asesorías gubernamenta-
les». Ante la pregunta de qué pensaba del informe del GAC de octubre de 1959
(que ya he mencionado) «con respecto a la bomba de hidrógeno y el programa
termonuclear» y «si estaba de acuerdo con el informe del GAC y sus recomenda-
ciones», Von Neumann respondió: «No. Yo estaba a favor de un programa muy
acelerado. En este punto el GAC recomendó que no debería producirse esa acele-
ración». Enseguida, su interrogador le preguntó si «consideraba que las recomen-
daciones del GAC y en particular del Dr. Oppenheimer se hicieron de buena fe»,
contestó: «Sí. No tengo ninguna duda sobre eso». Y continuaba:
Pregunta: ¿Tiene alguna duda ahora?.

Respuesta: No.
P.: ¿Usted sabe, por supuesto, que el Dr. Oppenheimer no era la única persona que
se oponía al programa?
R.: No, todo el grupo de científicos y militares que estaban preocupados por este
asunto; por supuesto, se habían producido muchas discusiones y prácticamente todos
nosotros sabíamos con bastante precisión que defendían todos. De manera que cono-
cíamos las opiniones de los demás y muchos de nosotros habíamos discutido el asunto
con otros. El Dr. Oppenheimer y yo lo habíamos discutido entre nosotros y conocíamos
con precisión la opinión del otro.
Mi impresión de este asunto era, como la de todo el mundo, que habría sido feliz
si todos hubieran estado de acuerdo conmigo. Sin embargo, evidentemente era un asun-
to que tendría graves consecuencias para el resto de nuestras vidas y más allá. De mane-
ra que se produjeron animadas controversias sobre el asunto. Y duraron meses.
Que durasen meses no es algo que me sorprendiera. Creo que es perfectamente
normal que existiese controversia sobre ello. Era perfectamente normal que las emocio-
nes fuesen fuertes.
P.: ¿Ha participado usted en el programa de desarrollo de las armas termonucleares
y la bomba de hidrógeno?
R.: Sí.
P.: ¿Después de la decisión del Presidente de enero de 1950, piensa que el GAC y
en particular el Dr. Oppenheimer intentaron retrasar los esfuerzos para desarrollar la
bomba?
R.: Mi impresión es, en primer lugar, que todo el mundo que yo conocía, y esto
incluye al Dr. Oppenheimer, aceptó esta decisión con buena disposición y que coope-
raron. Las cosas concretas que yo conozco fueron varias acciones que fueron necesarias
en 1951. Entonces había una serie de decisiones técnicas que tenían que tomarse sobre
el programa técnico. Conozco con considerable detalle lo que hizo entonces el Dr. Op-
penheimer y ciertamente fue muy constructivo.
[…]
84
Fund_MAT_00c.indd 84 3/5/18 16:13

P.: ¿Intentó el Dr. Oppenheimer disuadirlo de trabajar en el proyecto de la bomba

de hidrógeno?
R.: No. Tuvimos una discusión. Por supuesto, intentó persuadirme de que aceptase
sus ideas. Igualmente, yo intenté persuadirle para que aceptase mis ideas y esto se hizo
por dos personas que se encontraron en este periodo. Aparte de que es absolutamente
normal discutir sobre una cuestión sobre la que disientes, yo diría que no hubo nada
más. Jamás se me ocurrió la idea de que aquello pudiera constituir una presión.
P.: ¿Piensa ahora que aquello era una presión?
R.: No. Pienso que era el deseo perfectamente normal de convencer a otra persona.
P.: ¿Cuándo tuvo lugar aquella discusión?
R.: Fue en 1949. Diciembre de 1949. Recuerdo con claridad dos discusiones, una
de media hora cuando vi la opinión del GAC y la discutimos.
Tras muchas otras preguntas, finalmente se le preguntó si consideraba que Op-

penheimer era «un riesgo para la seguridad debido a sus actuales asociaciones», a
lo que Von Neumann respondió: «No, no lo pienso».
El 23 de octubre de 1954, esto es, no mucho después de que testificase en el
caso Oppenheimer, la Casa Blanca anunció que el presidente Eisenhower nom-
braba a Von Neumann para uno de los cinco puestos de miembro de la AEC,
sustituyendo a Eugene M. Zuckert, que había dimitido en junio.138 Como este
trabajo era a tiempo completo, Von Neumann se mudó a Washington D.C, mien-
tras que el Institute for Advanced Study le concedió permiso de excedencia a par-
tir de la primavera de 1955. Su puesto como comisionado debería finalizar en
junio de 1959. Como veremos, no pudo completar su mandato.
En sus memorias, Stanislaw Ulam incluyó algunos detalles de cómo tomó Von
Neumann la decisión de aceptar el puesto:139
Justo después [del fallecimiento de Fermi], también en 1954, a Johnny le ofrecieron

el puesto de comisionado de la AEC y, antes de aceptar, tuvimos una larga conversación.
Tenía serias reservas sobre su aceptación debido a las ramificaciones de caso Oppenhei-
mer. Sabía que a la mayoría de los científicos ni les gustaba la formar de trabajar del
vicealmirante Strauss, ni compartían las opiniones extremas de Teller. A algunos de los
miembros más liberales de la comunidad científica no les gustaban ni las opiniones
pragmáticas y más bien pro-militares de Johnny ni su asociación con los trabajos de
energía atómica en general y con Los Álamos en particular, sobre todo sus contribucio-
nes al desarrollo de las bombas atómicas y de hidrógeno. Era consciente de ese senti-
miento incluso entre algunos de sus colegas de Princeton y temía que aumentase si se
unía a la Comisión de Energía Atómica. Esto a pesar de que aunque en lo personal
Oppenheimer no le gustase especialmente, lo defendió de sus acusaciones con gran ob-
jetividad y dio un testimonio muy correcto, valiente e inteligente.
138
Al mismo tiempo que Von Neumann, fue elegido el químico Willard F. Libby, futuro premio
Nobel de Química por el descubrimiento de las técnicas de datación mediante carbono-14, este
como sustituto de Henry D. Smyth. Sobre Eisenhower y la AEC, véase Richard G. Hewlett y Jack
M. Holl, Atoms for Peace and War, 1953-1961. Eisenhower and the Atomic Energy Commssion (Uni-
versity of California Press, Berkeley, 1989).
139
Ulam, Aventuras de un matemático, op. cit., pp. 230-231.
85
Fund_MAT_00c.indd 85 3/5/18 16:13

La decisión de formar parte de la AEC, me dijo Johnny, le había costado muchas

noches sin dormir, y una tarde, en una visita de dos horas al cañón de Frijoles, me des-
veló sus dudas y me preguntó qué me parecía. Bromeando me dijo: «Me convertiré en
un commissionnaire» (la palabra francesa significa el chico de los recados). Pero le hala-
gaba y estaba orgulloso de que a pesar de su nacimiento extranjero se le encomendase
un cargo gubernamental de alto nivel y de gran influencia en la dirección de grandes
áreas de la tecnología y la ciencia. Sabía que esto podía ser una actividad de gran im-
portancia nacional. De hecho, con su suprema inteligencia, podría haber hecho mucho
bien viendo qué había de bueno en algunos programas e iniciando otros nuevos. Como
amigo suyo, y habiéndole presionado para aceptar la oferta, Strauss estaría obligado a
apoyar sus ideas y opiniones. Además, Johnny tenía algo del rasgo teutónico de dejarse
impresionar fácilmente por lo oficial. En cualquier caso, estaba desgarrado entre dos
extremos, por un lado un sentimiento de orgullo y la esperanza de hacer algo bueno y
útil, y por otro lado, el miedo a que sus colegas lo asociaran mentalmente con una pe-
queña minoría de la comunidad científica y con la formada por los anhelantes de as-
censo. El aceptar requería pedir la excedencia en el Instituto así como algún sacrificio
financiero.
En el convulso y novedoso escenario político-militar que surgió con el final de

la Segunda Guerra Mundial, Von Neumann desempeñó algunas funciones impor-
tantes, aparte de apoyar el programa destinado a fabricar la bomba de hidrógeno.
Una de esas funciones fue encabezar un Comité de Evaluación de Misiles Estra
tégicos establecido dentro del organigrama de la Fuerza Aérea. El motor de parti-
da de la creación de ese comité tuvo que ver con las pruebas realizadas en el otoño
de 1952 en el atolón de Eniwetok, que demostraron que era posible disponer de
bombas de hidrógeno de un tamaño tal que pudiesen ser transportadas en un mi-
sil intercontinental. La Fuerza Aérea recomendó entonces que se ampliasen y ace-
lerasen los trabajos destinados a desarrollar Misiles Balísticos Intercontinentales
(Intercontinental Ballistic Missile, ICBM), pero ante la tímida respuesta recibida
en 1953 se decidió crear el comité encabezado por Von Neumann, cuya recomen-
dación fue que la Fuerza Aérea continuase con el programa ICBM, pero no con el
cohete-misil gigante que se estaba planeando entonces y cuyo desarrollo se había
asignado a la compañía aeronáutica Convair, sino con uno más pequeño que pu-
diese transportar una carga de unos 690 kilogramos, suficientes para transportar
una bomba de hidrógeno, en lugar de los 4.000 kilogramos planeados.140
Matemáticas y economía
Además de sus muchas y plurales contribuciones a la ciencia, John von Neu-
mann también es recordado por el papel que desempeñó en llevar la matemática
a la economía, tarea en la que sobresale el libro que escribió en colaboración con
140
Este proyecto, denominado Atlas, comenzó en 1954. Se encuentra más información sobre
el Comité Von Neumann en George B. Kistiakowsky, A Scientist at the White House (Harvard Uni-
versity Press, Cambridge, Mass., 1976), especialmente en el capítulo IV.
86
Fund_MAT_00c.indd 86 3/5/18 16:13

el economista Oskar Morgenstern, Theory of Games and Economic Behavior (Teoría

de juegos y comportamiento económico). Pero antes de pasar a comentar esa faceta
de la actividad de Von Neumann, es conveniente decir algo sobre los inicios de lo
que se podría denominar economía matemática.
En la actualidad parece evidente que uno de los instrumentos más importan-
tes para la economía es la matemática, pero no siempre fue así. Y por supuesto
existen buenas razones para ello. Pensemos, por ejemplo, en el economista más
importante de los dos primeros tercios del siglo xx, John Maynard Keynes, autor
de un libro significativamente titulado Treatise on Probability (1921), pero que
apenas aplicó sus conocimientos matemáticos a sus estudios sobre la economía:
pensaba que esta última está basada en la acción humana y sujeta a lo que él llamó
«animal spirits», es decir, «estados de ánimo», acciones mentales inconscientes,
dominadas por la emotividad, que nunca podrían responder a expectativas mate-
máticas.141 Al fin y al cabo, no hay que olvidar que la ciencia económica no es una
ciencia exacta, sino social, que, aunque maneje modelos desarrollados en la mate-
mática y la física, no tiene como fin las regularidades de la materia sino el com-
portamiento humano, que puede ser (casi o a veces) irracional o incierto, lo que
significa que no permite ofrecer demasiadas seguridades, siendo las conclusiones
fiables y definitivas más excepción que norma. Los modelos son meras simplifica-
ciones de una realidad en la que los equilibrios, los cambios en los comportamien-
tos y las estrategias de los agentes económicos son múltiples.
El primer matemático economista en utilizar el acervo matemático existente
en su momento fue un francés que estudió en la École Normal Superieure: Antoi
ne Augustin Cournot (1801-1877), conocido como el iniciador del análisis eco-
nómico moderno. En su libro Recherches sur les principes mathématiques de la théo-
rie des richesses, publicado en 1838, Cournot utilizó las ideas de funciones y
probabilidades por primera vez en economía, obtuvo las primeras fórmulas sobre
demanda, oferta y precio, dibujó curvas de oferta y demanda y desarrolló la teoría
de la competencia, el monopolio, el duopolio y los beneficios del monopolio.
Más completo y complejo, en lo que a la utilización de la matemática se refie-
re fue la obra del francés Léon Walras (1834-1910), que estuvo muy influenciado
por Cournot ya que este fue compañero de escuela de su padre, Auguste Walras, que
también fue economista. Joseph Schumpeter, al que influyó mucho Walras, carac-
terizó la obra de este de la siguiente manera:142
Para Walras, el conjunto de la economía teórica se apoya sobre dos únicas condi-
ciones: por una parte, que toda unidad económica tiende a maximizar su utilidad, y, por
otra, que la demanda de cada bien debe igualar a su oferta. Todos sus teoremas se de-
ducen de estos dos supuestos. Puede admitirse que su obra ha sido complementada por
141
Relacionado con esto está el hecho de que la influencia de Keynes ha sido sobre todo en la
macroeconomía, mientras que es en la microeconomía donde se aplican sobre todo las técnicas y los
modelos matemáticos, y donde se buscan leyes matemáticas exactas.
142
Joseph Schumpeter, Diez grandes economistas: de Marx a Keynes (Alianza Editorial, Madrid,
1997; edición original en inglés de 1951), pp. 142-143.
87
Fund_MAT_00c.indd 87 3/5/18 16:13

algunos economistas, como Edgeworth y Barone, y que otros, como Pareto, la han su-
perado en algunos puntos particulares. Pero su significado permanece intacto. Todo
aquel que conozca el mecanismo y los orígenes de las ciencias naturales exactas sabrá
también que, en el método y en la esencia, las grandes realizaciones en el campo de
éstas son del mismo género que la de Walras. Encontrar formas exactas para los fenó-
menos cuya interdependencia nos viene dada experimentalmente, reducir unas a otras,
derivar tales formas unas de otras; esto es lo que los físicos hacen, y esto es lo que hizo
Walras. Pero, además, Walras lo hizo en un campo nuevo de la ciencia en el que no
existían los antecedentes de siglos enteros de trabajo. Y lo hizo en poco tiempo, a pesar
de las dificultades internas y externas, obteniendo resultados muy favorables. Trabajó,
además, sabiendo —o al menos debería haberlo sabido— que no podía esperar que los
economistas y los matemáticos de su generación reconocieran el mérito de su obra. Re-
corrió un camino solitario, sin el apoyo moral que suelen tener tanto el hombre prácti-
co como el científico. Su retrato muestra, pues, todas las características que distinguen
a la mentalidad verdaderamente creadora. Todo esto, en lo que se refiere al hombre. Su
obra, más pronto o más tarde, encontrará el reconocimiento que merece.
En el mismo sentido, Robert Loring Allen, uno de los biógrafos de Schumpe-

ter, señaló:143 «Como la presentación walrasiana de la economía era matemática,
los economistas por regla general la ignoraron. Pocos economistas del último cuar-
to del siglo xix comprendían las matemáticas, y tenían problemas con la idea del
equilibrio incluso en casos simples, como el del equilibrio de mercado en precios
y cantidades. La dificultad del equilibrio general, en su forma literaria o matemá-
tica, impidió que la obra de Walras fuera ampliamente conocida».144 Revisando
la edición de la correspondencia de Walras no es difícil encontrar evidencias de la
soledad que sentía y la ayuda que necesitaba para la empresa en la que se encon-
traba empeñado. Así, el 6 de mayo de 1886 escribía a Jean Jacques Emile Cheysson,
ingeniero y economista, profesor de Economía Política en la École des Sciences
Politiques y de la École des Mines de París:145 «Creo haber reconocido en la apli-
cación del método matemático a la economía política pura, además de a las gran-
des cuestiones de la economía política aplicada y a la economía política práctica,
un campo de explotación científica muy amplio y muy bello. No me siento con
fuerzas para [desarrollarlo] yo solo y desearía que me acompañasen y ayudasen
algunos hombre de espíritu lo suficientemente receptivos y fuertes».
Existían dificultades, sí, pero, como escribía el 30 de julio de 1886 al econo-
mista y estadístico alemán Wilhelm Lexis, no creía que «esta circunstancia nos
143
Robert Loring Allen, Joseph Schumpeter (Alfons El Magnànim, Valencia, 1995; edición ori-
ginal en inglés de 1991), p. 146.
144
El propio Walras no fue ajeno a estos problemas, los de comprender bien las matemáticas
implicadas. Un ejemplo en este sentido es que no fue capaz de entender las cartas que le envió el
matemático francés Hermann Laurent, que le preguntaba acerca de la naturaleza del factor de inte-
gración en las condiciones de equilibrio de la rentabilidad marginal. Incapaz de entender cuáles eran
las objeciones de Laurent, Walras pensó que aquel formaba parte de un complot en su contra.
145
Correspondence of Léon Walras and Related Papers, William Jaffé, ed., vol. II («1884-1897»)
(North-Holland, Ámsterdam, 1965), p. 119.
88
Fund_MAT_00c.indd 88 3/5/18 16:13

impida absolutamente lograr una teoría exacta, no más que el estado cenagoso o
fangoso de ciertas corrientes de agua impiden desarrollar una hidráulica, o que
la naturaleza compleja de las grasas y de las sustancias proteínicas impiden la
química».146
En lo que se refiere a sus logros, hay que señalar que fue uno de los precurso-
res y líderes de la revolución marginalista, que incluyó a su sucesor en la cátedra de
Economía Política en Lausana, el ingeniero, economista y sociólogo italiano Vil-
fredo Pareto (1848-1923), además de a William Stanley Jevons (1835-1882) y a
Carl Menger (1840-1921), que la desarrollaron de forma independiente ya que
no se conocían entre ellos.147
Con respecto a la visión que Walras tenía del papel de la matemática en la
economía, es instructivo hojear su principal obra, el libro Éléments d’Économie
politique pure ou théorie de la richesse sociale (1874), en el que presentó de manera
precisa su teoría del equilibrio general (desarrollada posteriormente por los premios
Nobel de Economía Maurice Allais, Kenneth Arrow y Gerard Debreu) y el enfo-
que de la utilidad marginal. Ya en la segunda página de esta obra se lee: «[Este
libro] contiene una solución matemática al problema de la determinación de los
precios corrientes, así como una fórmula científica para la ley de la oferta y la de-
manda, en el caso del intercambio de un número arbitrario de mercancías entre
ellas».148 Y más adelante:149
El valor de cambio es, por consiguiente, una magnitud y, como se ve actualmente,
una magnitud apreciable. Y si las matemáticas tienen por objeto, en general, la medida
de magnitudes de este género, es seguro que existe una rama de las matemáticas, olvi-
dada hasta el momento por los matemáticos, y todavía no elaborada, que es la teoría del
valor del cambio.
No digo, lo sabemos suficientemente, que esta ciencia constituya toda la economía
política. Las fuerzas, las velocidades son, también ellas, magnitudes apreciables, y la teo-
ría matemática de las fuerzas y de las velocidades no es toda la mecánica. Es siempre
cierto que esta mecánica pura debe preceder a la mecánica aplicada. De manera análoga,
existe una economía política pura que debe preceder a la economía política aplicada, y esta
economía política pura es una ciencia físico-matemática. Esta afirmación es nueva y pa-
recerá singular; pero acabo de demostrarla, y la demostraré aún mejor en lo que sigue.
146
Ibidem, p. 145.
147
De forma parecida a lo que sucedió con Walras, Pareto no comprendió siempre las críticas
de matemáticos, como las que Vito Volterra hizo a su trabajo (de todas maneras, Volterra no conti-
nuó ocupándose de la matematización de la economía y dejó este campo a otros, uno de ellos el
matemático estadounidense Griffith C. Evans, que estudió con Volterra en Roma entre 1910 y 1912;
en 1930 Griffith publicó una Mathematical Introduction to Economics). Sobre estos puntos, véase
P. Mirowski, More Heat than Light (Cambridge University Press, Cambridge, 1989), Bruna Ingrao
y Giorgio Israel, The Invisible Hand: Economic Theory on the History of Science (MIT Press, Cambrid-
ge, Mass., 1990) y E. Roy Weintraub, How Economics Became a Mathematical Science (Duke Uni-
versity Press, Durham, 2002).
148
Léon Walras, Éléments d’Économie Politique Pure ou Théorie de la Richesse Sociale (Imprime-
rie L. Corbaz, éditeurs, Lausana, 1874), p. vi.
149
Ibidem, p. 31.
89
Fund_MAT_00c.indd 89 3/5/18 16:13

La matemática era, clamaba Walras, como pregonero de un tiempo que ya

estaba llegando, el lenguaje de la economía:150 «En cuanto al lenguaje, ¿por qué
obstinarse en expresar muy penosamente y muy incorrectamente, como a menudo
lo hizo Ricardo, como lo hace a cada instante John Stuart Mill en su Principles of
Political Economy, en el que se sirve de la lengua habitual, cosas que, en el lengua-
je de las matemáticas, pueden enunciarse con muchas menos palabras, de una
manera mucho más exacta y mucho más clara?».
Otro nombre destacado a la hora de hablar de los inicios de la economía ma-
temática fue el del matemático y economista inglés Alfred Marshall (1842-1924),
fundador de la economía neoclásica. Me interesa resaltar que su tratado Principles
of Economics (1890), el libro más difundido de economía durante décadas, mues-
tra una clara influencia del gran Philosophiae Naturalis Principia Mathematica
(1687) de Isaac Newton. Independientemente de otras razones, hay que tener en
cuenta que cuando Marshall estudió en Cambridge, en el sistema educativo, el
Mathematical Tripos, ejercía un peso importante el estudio de los Principia (no era
infrecuente encontrarse en los exámenes con preguntas del tipo de «Demuéstrese X
según la Proposición Y de los Principia»). Inicialmente, en los trabajos de Marshall
dominó la presentación geométrica (axiomática, podríamos también decir), algo
que también favorecía el que otro texto de estudio obligado fuese los Elementos de
Euclides), pero posteriormente esta dejó su lugar a una más acorde con las obras
de Cournot y de Walras, donde la física y los procesos físicos habían ganado in-
fluencia en la economía a través de la búsqueda de fuerzas que se insertasen en los
principios dinámico-geométricos.
Podríamos, en definitiva, concluir que hasta finales del siglo xix la mayor par-
te de los principales economistas de esa época, como fueron Walras, Pareto, Mar-
shall, Francis Edgeworth (1845-1926) e Irving Fisher (1867-1947), empleaban
modelos matemáticos específicos del comportamiento económico asociados a ri-
gurosos modelos basados en procesos físicos de la mecánica racional. Ahora bien,
en la anterior lista falta un nombre importante, el francés Louis Bachelier (1870-
1946), cuya influencia, por diversas razones —entre las que figuran el tipo de
análisis matemático que realizó—, fue durante más de medio siglo prácticamente
despreciable. En la tesis doctoral que Bachelier defendió en 1900, Théorie de la
spéculation, estudiaba la matemática de los movimientos especulativos, en particu-
lar el comercio de bonos en la Bolsa de París. «Las influencias que determinan el
movimiento de la Bolsa son innumerables», comenzaba su exposición, «sucesos
pasados, actuales o incluso descontables, no presentan a menudo ninguna relación
aparente con sus variaciones, aunque es seguro que repercuten sobre su curso».151
Para aquellos familiarizados con el movimiento browniano —el fenómeno descu-
bierto por el botánico Robert Brown, quien con la ayuda de un microscopio ob-
servó en 1827 que partículas de polen de la planta Clarkia pulchella, en suspensión
150
Ibidem, p. 33.
151
Louis Bachelier, «Théorie de la spéculation», Annales Scientifiques de l’École Normale Supé-
rieure 17, 21-86 (1900); p. 21.
90
Fund_MAT_00c.indd 90 3/5/18 16:13

en un fluido en reposo, se movían de manera errática—, la anterior caracterización

de Bachelier les hará pensar inmediatamente en un tipo de movimiento brownia-
no y, efectivamente, en la literatura económica se le consideró como el pionero en
los estudios acerca de la presencia de movimientos estocásticos (o aleatorios) y
brownianos en economía. Incluso se ha llegado a afirmar que «la tesis de Bachelier
contiene, y de tres maneras diferentes, la primera teoría matemática del movimien-
to browniano (cinco años antes que Einstein)».152 La referencia a Albert Einstein
se debe a que fue este quien, en 1905, explicó el porqué del movimiento brow-
niano: aunque en reposo, el fluido está compuesto en realidad por un número
enorme de moléculas que se mueven en todas direcciones chocando entre sí; y
es debido a los impulsos que reciben cuando esas moléculas chocan contra las
partículas en suspensión por lo que estas se mueven, como observó Brown.153 No
sorprendentemente, en el artículo de Einstein no aparece mención alguna de Ba-
chelier.154
Posiblemente, quienes más se distinguieron en recuperar la memoria de los
trabajos y enfoques de Bachelier fueron dos polifacéticos científicos. En primer
lugar, Norbert Wiener, que elaboró en 1921 una formalización rigurosa del mo-
vimiento browniano (hasta el punto de que a veces se habla del «proceso de Wie-
ner» o de «Bachelier-Wiener»), y más tarde Benoît Mandelbrot.155 «El devenir de
152
L. Carraro y P. Crépel, «Louis Bachelier, 11 mars 1870-28 avril 1946», Images des Mathé-
matiques, pp. 48-49 (CNRS, 2006); p. 48.
153
Albert Einstein, «Über die von der molekularkinetischen Theorie der Wärme geforderte
Bewegung von in ruhenden Flüssigkeiten suspendierten Teilchen», Annalen der Physik 17, 549-560
(1905).
154
El tribunal que juzgó la tesis de Bachelier lo formaba un trío distinguido de científicos: Paul
Appel, Joseph Boussinesq y Henri Poincaré. Se sabe que realizaron comentarios favorables sobre el
contenido del trabajo, pero no debieron mostrarse excesivamente entusiasmados en la medida en que
no le dieron la máxima calificación, «très honorable», sino «honorable», con la consecuencia de que,
aunque continuó publicando, su carrera posterior no fue demasiado distinguida: fue «profesor libre»
en la Sorbona entre 1909 y 1914 (recibiendo un salario solo a partir de 1913), y después de la guerra
profesor ayudante en Besançon (1919-1922), Dijon (1922-1925), profesor adjunto en Rennes (1925-
1927) y finalmente profesor en Besançon, donde se jubiló en 1937. Su tesis, eso sí, se publicó en una
revista importante: los Annales Scientifique de l’École Normale Supérieure, pero su influencia en la
economía tardó en manifestarse con la intensidad que merecía. Como señaló Paul Cootner en la re-
copilación de trabajos sobre el carácter aleatorio del mercado de valores que publicó en 1964, en el
que incluyó una traducción al inglés de la tesis de Bachelier: «Louis Bachelier se adelantó a estos es-
tudios hace 60 años, pero su trabajo […] aparece como un suceso aislado»; Paul H. Cootner, «Origins
and justification of the random walk theory. Introduction», en The Random Character of Stock Market
Prices, Paul H. Cootner, ed. (Risk Publications, Londres, 1964), pp. 1-6; cita en p. 1.
155
Norbert Wiener, «The average of an analytical functional and the Brownian movement»,
Proceedings of the National Academy of Sciences U.S.A. 7, 294-298 (1921); Benoît Mandelbrot, «The
variation of certain speculative prices», Journal of Business 36, 394-419 (1963). Es interesante citar
lo que Wiener escribió en uno de sus ensayos: «Desde el mismo principio de este trabajo [el estudio
del movimiento browniano], me vi influido por la investigación contemporánea de Paul Lévy sobre
funciones aleatorias [random]. Fue Lévy quien llamó mi atención sobre el hecho de que mis funcio-
nes sobre el movimiento browniano ya habían sido algo estudiadas por Bachelier. Sin embargo, el
trabajo de Bachelier, aunque representaba una excelente aproximación, había sido escrito en una
91
Fund_MAT_00c.indd 91 3/5/18 16:13

la historia a lo largo del siglo xx», escribió Mandelbrot, «iba a ser mucho más
amable con él [Bachelier] que sus contemporáneos», escribió Mandelbrot en uno
de sus libros, «su tesis puso los cimientos de la teoría financiera y, con mucha más
generalidad, de todas las formas de cambio probabilístico en el tiempo continuo.
Formuló las cuestiones básicas sobre el movimiento de los precios y propuso so-
luciones preliminares para algunas. Murió en el anonimato y tuvo que pasar más
de medio siglo para que su tesis fuera redescubierta y traducida al inglés. Sobre
sus ideas, los economistas construyeron una teoría abarcadora y elaborada de los
mercados, la inversión y las finanzas: cómo varían los precios, cómo piensan los in-
versores, cómo administrar el dinero y cómo definir el riesgo, el alma inquieta de
los mercados».156
Y, establecido esta especie de preámbulo, volvamos a Von Neumann.
Teoría de juegos
Si hubiese sido fiel a la secuencia cronológica, debería haber comentado ya un
artículo que Von Neumann publicó en 1928, titulado «Sobre la teoría de los jue-
gos de sociedad», por el que a veces se le denomina «el padre de la teoría de
juegos».157 Estrictamente, sin embargo, esto no es cierto: la teoría de juegos, en-
tendiendo por ella la búsqueda de patrones (leyes) matemáticas que expliquen lo
que sucede en juegos, posee una historia previa. Dejando al margen la, indudable,
conexión de la teoría de juegos con los estudios dedicados a la probabilidad (don-
de aparecen nombres como los de Cardano, Pascal, Huygens, Jacob Bernoulli y
Condorcet), un momento importante en el tratamiento matemático de los juegos
se debe a Ernst Zermelo, en una contribución que hizo en el V Congreso Inter-
nacional de Matemáticos, celebrado en Cambridge (Inglaterra) del 22 al 28 de
época anterior a que se dispusiera de las ideas de integración de Lebesgue para que pudiera ser de-
sarrollado con una técnica adecuada»; Norbert Wiener, «My connection with cybernetics. Its origins
and its future», Cybernetica 1, 1-14 (1958), reproducido en Norbert Wiener: Collected Works, P. Ma-
sani, ed. (The MIT Press, Cambridge, Mass., 1985), vol. IV, pp. 107-120; cita en p. 109. Los tra-
bajos de Wiener en la teoría del movimiento browniano se analizan en P. R. Masani, Norbert Wiener,
1894-1964 (Birkhäuser, Basilea, 1990), pp. 77-86.
156
Benoît Mandelbrot y Richard L. Hudson, Fractales y finanzas (Tusquets, Barcelona, 2010),
p. 67. Véase también, Benoït Mandelbrot, El fractalista (Tusquets, Barcelona, 2014), pp. 239-242.
En este libro, su autobiografía, Mandelbrot titula uno de sus capítulos, el 16, «Princeton: el último
investigador posdoctoral de John von Neumann»; esto se debió a que pasó el año 1953-1954 en el
Institute for Advanced Study «como último posdoc propuesto por Von Neumann» (pp. 178-179).
157
John von Neumann, «Zur Theorie der Gesellschftsspiele», Mathematische Annalen 100, 295-
320 (1928). Sobre las contribuciones de Von Neumann a la economía, véase Manfred J. Holler,
«What John von Neumann did to Economics,» en Gilbert Faccarello y Heinz Kurz, eds., Handbook
on the History of Economic Analysis, vol. I («Great Economists since Petty and Boisguilbert») (Edward
Elgar Publishing, Cheltenham, 2016), pp. 581-586; E. Roy Weintraub, How Economics Became a
Mathematical Science (Duke University Press, Durham, 2002), pp. 94-97; y las reseñas reproducidas
en la edición de Theory of Games and Economic Behavior publicada para conmemorar los sesenta años
de la primera edición: John von Neumann y Oskar Morgenstern, Theory of Games and Economic
Behavior (Princeton University Press, Princeton, 2004).
92
Fund_MAT_00c.indd 92 3/5/18 16:13

agosto de 1912, y que apareció publicada en las actas del congreso bajo el título
«Sobre una aplicación de la teoría de conjuntos a la teoría del juego de ajedrez».158
Un detalle importante es que Zermelo era un entusiasta del ajedrez, un juego que
en las primeras décadas del siglo xx ocupaba un importante lugar en la vida cul-
tural de muchos países europeos: Alemania, Inglaterra, Francia, Rusia y los que
formaban parte del Imperio Austro-Húngaro. Como sucedía con Zermelo, no es
sorprendente que el juego atrajese la atención de matemáticos. Seguramente nadie
representó mejor semejante relación, aunque con el énfasis en el lado del ajedrez,
que el alemán de origen judío Emanuel Lasker (1868-1941), que mantuvo el tí-
tulo de campeón del mundo durante veinticuatro años, entre 1897 y 1921. Edu-
cado como matemático, Lasker había estudiado con Hilbert y Max Noether y
completado un doctorado en la Universidad de Erlangen en 1902 sobre la teoría
de espacios vectoriales. En algunos de sus escritos, Lasker se hacía preguntas con
evidente dimensión matemática. Así, en 1907 publicó un ensayo de ochenta pá-
ginas, Kampf, en el que se preguntaba: «¿Qué significan lucha y victoria? ¿Obede-
cen leyes que la razón puede capturar y establecer?».159
Von Neumann también era aficionado al ajedrez; de hecho, una de las prime-
ras cosas que hizo cuando llegó a Zúrich en 1925 fue unirse, junto a su amigo
Willy Fellner, al Schachgesellschaft Zürich, uno de los clubs de ajedrez más anti-
guos del mundo y una referencia internacional. Es preciso, asimismo, citar a otros
dos matemáticos húngaros interesados en el ajedrez: Denés König y László Kalmár,
que, como Von Neumann, estaban interesados en la teoría de conjuntos (que des-
empeñaba un papel central en el artículo de Zermelo) y relacionados con Gotinga.
En 1927, König publicó un artículo («Sobre un método de conclusión del finito
al infinito») en el que refinaba las conclusiones de Zermelo, y el año siguiente
158
Ernst Zermelo, «Über eine anwendung der mengenlehre auf die theorie des schaspiels», en
Ernest W. Hobson y A. E. H. Love, eds., Proceedings of the Fifht International Congress of Mathema-
ticians (Cambridge University Press, Cambridge, 1913), vol. II, pp. 501-504. Este artículo significó
una ruptura con los intereses previos de Zermelo. De hecho, en la invitación a participar en el con-
greso que le hizo Bertrand Russell el 16 de marzo de 1912, este le explicaba: «Como representante
de la sección filosófica del próximo congreso matemático le pido urgentemente que venga a Cam-
bridge y nos dé una conferencia. Si pudiese usted hablar, por ejemplo, sobre las razones de su prin-
cipio de elección, esto sería del mayor interés. Además, para mí constituiría un gran placer personal
renovar nuestra amistad»; citado en Heinz-Dieter Ebbinghaus en cooperación con Volker Peckhaus,
Ernst Zermelo. An Approach to His Life and Work (Springer, Berlín, 2015), p. 75. Zermelo aceptó la
invitación de Russell, pero para hablar sobre «la teoría del juego de ajedrez», aunque finalmente
presentó dos comunicaciones: una la que anunciaba sobre el ajedrez y otra titulada «Sobre métodos
algebraicos y genéticos en el fundamento de disciplinas matemáticas». En las actas publicadas úni-
camente apareció el texto del primero. El artículo de Zermelo se analiza en el libro Peckhaus que
acabo de citar pp. 136-139), en Robert Leonard, Von Neumann, Morgenstern and the Creation of
Game Theory (Cambridge University Press, Nueva York, 2010), pp. 16-18, y en Ulrich Schwalbe y
Paul Walker, «Zermelo and the early history of game theory», Games and Economic Behavior 34,
123-137 (2001).
159
Citado en Leonard, Von Neumann, Morgenstern and the Creation of Game Theory, op. cit.,
p. 12. Esta obra analiza la relación del ajedrez con la teoría de juegos, al mismo tiempo que el libro
de Von Neumann y Morgenstern.
93
Fund_MAT_00c.indd 93 3/5/18 16:13

Kalmár («Sobre la teoría de juegos abstractos») generalizaba lo que habían hecho

los dos.160 Ante la muy relevante cuestión de cuál, si existió, fue la influencia de
estos trabajos en Von Neumann —que sin duda conocía a sus colegas húngaros—,
o viceversa, no hay una respuesta clara. En su artículo, König señalaba que fue
Von Neumann quien le sugirió uno de los pasos en su reelaboración de la demos-
tración de Zermelo, pero por otra parte en una carta que König envió a Zermelo
el 13 de febrero de 1925 le decía que Von Neumann no conocía el artículo de este
de 1913 y que fue él quien le informó de su existencia: «Yo fui quien llamó su
atención sobre él. Ahora está trabajando en un artículo sobre juegos que aparece-
rá en el Mathematische Annalen».161 No parece, en cualquier caso, que Von Neu-
mann tuviese en gran consideración el artículo de Zermelo, que no aparece men-
cionado ni en su artículo de 1928 ni en Theory of Games and Economic Behavior.
Lo único que se puede aventurar es que Von Neumann pudo haber comenzado a
pensar en la teoría de juegos por sí mismo, o que se vio influido por König, quien
sí conocía el trabajo de Zermelo y estaba trabajando en problemas parecidos.
Con respecto a las diferencias entre los trabajos de Zermelo, König, Kalmár y
Von Neumann, citaré las conclusiones de Ulrich Schwalbe y Paul Walker:162
Zermelo, König y Kalmár estaban tratando con lo que ahora se denominaría juegos
de suma cero de dos personas con información perfecta. El punto de partida común de
sus análisis era el concepto de una posición ganadora, definida de una forma matemá-
ticamente precisa: si un jugador se halla en una posición ganadora, entonces siempre
puede forzar una victoria, no importa la estrategia que el otro jugador siga. Establecido
esto, querían responder a la siguiente pregunta: ¿Dado que un jugador está en una po-
sición ganadora, existe un límite superior al número de movimientos que debe hacer
para ganar? O, ¿si está en una posición perdedora, durante cuánto tiempo [movimientos]
puede retrasar su derrota? En consecuencia, a Zermelo, König y Kalmár no les preocu-
paban los problemas de interacción estratégica y equilibrio. No se hacían la pregunta:
¿Cómo se debe comportar un jugador para obtener un buen resultado? Esta era la prin-
cipal cuestión que se preguntó Von Neumann en su artículo «Zur Theorie der Gesells-
chaftsspiele» (1928). En contraste a los trabajos de Zermelo, König y Kalmár, el interés
principal de Von Neumann era la interacción estratégica entre los jugadores y el con-
cepto de un equilibrio. Estas dos ideas se han convertido en las piedras angulares de la
teoría de juegos no cooperativos.
Además de a Zermelo, König y Kalmár, es obligado recordar las aportaciones

del matemático francés Émile Borel, comenzando por su libro de carácter general,
Le hasard (1914), siguiendo en el capítulo «Sur les jeux ou interviennent l’hasard
et l’habilité des joueurs», de su Théorie des Probabilités (1924), y continuando por
160
Dénes König, «Uber eine Schlussweise aus dem Endlichen ins Unendliche», Acta Scientiarum
Mathematicorum Szeged 3, 121-130 (1927); László Kalmár, «Zur Theorie der abstrakten Spiele», Acta
Scientiarum Mathematicorum Szeged 4, 65-85 (1928/1929).
161
Citado en Peckhaus, Ernst Zermelo, op. cit., p. 139.
162
Schwalbe y Paul Walker, «Zermelo and the early history of game theory», op. cit., «Conclu-
sions».
94
Fund_MAT_00c.indd 94 3/5/18 16:13

una serie de artículos que publicó en la década de 1929. En uno de estos trabajos
en particular, Borel consideraba un juego en el que la victoria dependía tanto de
suerte como de la habilidad de los jugadores, al contrario de lo que sucedía en
juegos en los que la habilidad no desempeñaba ningún papel (por ejemplo, la
lotería).163 Definía un «método de juego» como «un código que determina lo que
una persona debería hacer en cualquier situación» y se preguntaba «si era posible
determinar un método de juego mejor que todos los demás posibles». Consideran-
do el caso en el que el número de estrategias era 3, Borel llegaba a la conclusión
de que todos los jugadores podían elegir tácticas que les asegurasen la misma pro-
babilidad de victoria. Aunque sus resultados eran menos generales que los que
obtuvo Von Neumann, se le debe considerar como uno de los fundadores de la
teoría matemática de juegos.
Establecidos esos orígenes, vayamos al artículo de Von Neumann de 1928, en
el que se centraba en un juego con dos participantes, dejando a un lado las reglas
particulares del juego concreto para concentrarse en las estrategias que empleaban
ambos, pero de tal manera que la suma total de las ganancias fuese cero (juegos de
suma cero): lo que uno gana, lo pierde el otro. El resultado principal al que llegó
allí es lo que se denomina teorema de máximo-mínimo (max-min o minimax). Este
teorema establece que, para una amplia gama de juegos, en realidad no tiene in-
terés que dos personas jueguen entre sí. Si cada jugador considera, para cada es-
trategia posible, la pérdida máxima que le puede reportar dicha estrategia y en
consecuencia elige la mejor estrategia, la que minimice la máxima pérdida posible,
entonces estadísticamente puede estar seguro de no tener más pérdidas que este
valor minimax. Además, como este valor es el opuesto (negativo) del que su opo-
nente establece para sí, y que define de la misma manera, el resultado a largo
plazo está determinado completamente por las reglas del juego.164
En la necrológica que publicaron conjuntamente Ulam, Kuhn, Tucker y Shan-
non, se hacía hincapié en lo que significó el artículo de Von Neumann de 1928:165
El impacto de la Teoría de Juegos de Von Neumann se extendió mucho más allá de

las fronteras de este tema. Mediante su ejemplo y a través de sus logros, abrió un nuevo
y amplio canal de comunicación en ambos sentidos entre la matemática y las ciencias
sociales. De hecho, estas ciencias fueron afortunadas en que uno de los matemáticos más
creativos del siglo xx se interesase por algunos de sus problemas fundamentales y cons-
truyese modelos llamativamente imaginativos y estimulantes, con los que se podían
atacar cuantitativamente sus problemas. Al mismo tiempo, la matemática recibió una
infusión vital de métodos e ideas frescas que continuaron mostrándose altamente pro-
ductivas durante muchos años venideros. El interés de Von Neumann en «problemas de
complejidad organizada», tan importantes en las ciencias sociales, fueron de la mano con
el desarrollo pionero de sus computadoras de gran tamaño y alta velocidad.
163
Émile Borel, «La théorie du jeu et les équations integrals à noyau symétrique», Comptes
Rendues Académie des Sciences, 173, 1304-1308.
164
He seguido aquí la descripción de Halmos, «La leyenda de Von Neumann», op. cit., p. 23.
165
Ulam et al. en Fleming y Bailyn, eds., The Intellectual Migration, op. cit., p. 247.
95
Fund_MAT_00c.indd 95 3/5/18 16:13

Señalaré por último que en la época en que publicó su artículo de 1928, Von
Neumann comenzó la preparación de otro importante trabajo para la economía
que, sin embargo, se publicó una década más tarde, en 1937: «Un modelo de equi-
librio económico general».166
Theory of Games and Economic Behavior

La culminación de las contribuciones de Von Neumann a la teoría de juegos
llegó dieciséis años después de su artículo de 1928, con la publicación de un libro
que se convirtió en un clásico de la economía, de la economía matemática: Theory
of Games and Economic Behavior (1944). De hecho, si no hubiese sido porque Von
Neumann conoció en Princeton a un economista centroeuropeo, transterrado
como tantos otros en aquel tiempo a Estados Unidos, Oskar Morgenstern (1902-
1977), con quien escribió el libro, seguramente este no hubiese existido. Es, por
consiguiente, necesario, antes de nada, decir algo sobre este economista.
Aunque alemán de origen —nació en Görlitz—, Oskar Morgestern creció y
se formó en Viena, en cuya universidad estudió; se graduó en 1925 y se doctoró
posteriormente en Ciencia Política, aunque se centró sobre todo en Economía,
disciplina en la que existía una «Escuela de Viena», que había tenido como su gran
promotor a Carl Menger, cuya obra continuó Friedrich von Wieser, y a la que se
sumaron posteriormente Ludwig von Mises, Joseph Schumpeter y Friedrich von
Hayeck. Frente a las suposiciones historicistas que caracterizaban a los economistas
alemanes, la escuela austriaca denunciaba toda hipótesis de determinismo históri-
co, argumentando que la historia económica era demasiado compleja. Asimismo,
combatían las tesis de los socialistas, tanto austriacos como alemanes, en cuyo
núcleo figuraba el determinismo hegeliano, tan querido para la teoría marxista,
defendiendo la tradición liberal.
En el obituario que Morgenstern escribió cuando Schumpeter murió, encon-
tramos un pasaje que revela la influencia que este ejerció sobre su pensamiento,
especialmente a través de su libro Das Wesen und der Hauptinhalt der theoretischen
Nationalökonomie (Teoría y esencia de la economía teórica nacional; 1908):167
Es farragoso, demasiado largo, pero no obstante brillante, lleno de vida y totalmen-

te único en la literatura en lengua alemana de la época. Aporta una exposición transpa-
rente de la teoría económica, tal como se conocía entonces, prestando especial atención
a Walras, a quien consideraba su verdadero maestro y el más grande de todos los eco-
nomistas, y combina los puntos de vista y métodos de Walras con los de los austriacos
[…] Este libro, nunca reeditado, ha sido durante muchos años una de las grandes rare-
166
John von Neumann, «Über ein ökonomisches Gleichungssystem und eine Verallgemeine-
rung des Brouwerschen Fixpunktsatzes», en K. Menger, ed., Ergebnisse eines Mathematischen Seminars
8, 73-83 (1937). Existe traducción al inglés: «A model of general economic equilibrium», Review of
Economic Studies, 13, 1-9 (1945).
167
Oskar Morgenstern, «Joseph Schumpeter, 1883-1950», Economic Journal 61, 197-202
(1950); citado en Allen, Joseph Schumpeter, op. cit., p. 156.
96
Fund_MAT_00c.indd 96 3/5/18 16:13

zas del comercio del libro. La obra fue leída ávidamente en Viena, incluso mucho des-
pués de la Primera Guerra Mundial, y su vigor juvenil atrajo a los jóvenes estudiantes.
Yo mismo recuerdo qué revelación significó para mí la primera vez que puse mis manos
en ella, igual que muchos de mi generación, y me decidí a leer todo lo que Schumpeter
había escrito o escribiera.
La Viena en la que creció y estudió Morgenstern vivió uno de sus periodos

culturales más creativos de toda su historia. Fue la Viena de Sigmund Freud, Lud-
wig Wittgenstein, Gustav Klimt, Egon Schiele, Oskar Kokoschka, Gustav Mahler
y Robert Musil, y en la que todavía se conservaba la memoria y tradición de pen-
samiento de Ernst Mach y Ludwig Boltzmann. Fue también la del Círculo de
Viena liderado por Moritz Schlick y en el que participaron, entre otros, Rudolf
Carnap, Otto Neurath, Philipp Frank, Herbert Feigl, Kurt Gödel, Hans Hahn y
Karl Menger (el matemático hijo de Carl), y con el que mantuvieron relaciones
otros como Karl Popper y Hans Reichenbach, e incluso el propio Morgenstern. En
un ensayo en el que explicó su colaboración con Von Neumann, y tras referirse a
un artículo que publicó en 1935 en Zeitschrift für Nationalökonomie («Vollkom-
mene Voraussicht und Wirtschaftliches Gleich gewicht»), Morgenstern mencionó
aquella relación:168
Después de que se publicase este artículo, el famoso filósofo y líder del denominado
«Círculo de Viena», profesor Moritz Schlick, me invitó a hablar de los problemas trata-
dos en él. Hice esto en una sesión bastante larga y el asunto fue discutido por los pre-
sentes con gran detalle. Al Círculo de Viena pertenecían, de una forma u otra, Carnap,
Feigl, Frank, Gödel, Hahn, Menger, Popper, Waismann, etc. No todos estuvieron pre-
sentes en esa ocasión. Yo asistí frecuentemente a estas reuniones al igual que al Coloquio
de Karl Menger, aunque no era un miembro formal de ninguno de los dos.
En el ensayo al que me estoy refiriendo, Morgenstern también señaló otros

intereses suyos en su época vienesa, entre los que figuraba la matemática, sin la cual
no le habría sido posible colaborar con Von Neumann:169 «Incluso en aquellos años
de la década de 1930 en Viena, me las arreglé para leer mucho de lógica y teoría de
conjuntos, p. ej., Hilbert-Ackermann, Fraenkel, Hilbert-Bernays, Hahn, Haus-
dorff, etc. También intenté acercarme al gran trabajo de Kurt Gödel sobre la inde-
cidibilidad, ayudado por mi amigo Karl Menger. Al mismo tiempo, Abraham
Wald, al que había podido ofrecerle un puesto de estadístico en mi Instituto, me
instruyó en varios campos de matemáticas».
168
Oskar Morgenstern, «The collaboration between Oskar Morgenstern and John von Neu-
mann on the theory of games», Journal of Economic Literature 14, 805-816 (1976); cita en p. 806.
Este artículo se reprodujo en uno de los apéndices de la ya citada edición de Theory of Games and
Economic Behavior publicada en 2004: Von Neumann y Morgenstern, Theory of Games and Economic
Behavior, op. cit., pp. 712-726.
169
Morgenstern, «The collaboration between Oskar Morgenstern and John von Neumann on
the theory of games», Journal of Economic Literature, op. cit., p. 807.
97
Fund_MAT_00c.indd 97 3/5/18 16:13

Oskar Morgenstern y Von Neumann.
98
Fund_MAT_00c.indd 98 3/5/18 16:13

Cuando Von Neumann pasó por Viena y habló en el Coloquio de Menger

sobre la expansión económica (prueba de que ya estaba interesado en esta disci-
plina), Morgenstern estaba en Ginebra asistiendo a una reunión de la Sociedad de
las Naciones. La oportunidad de que se conociesen llegó cuando Morgenstern tuvo
que abandonar Viena y Europa, después del Anschluss, la Anexión de Austria por
la Alemania de Hitler el 12 de marzo de 1938, y él se viese obligado a abandonar
su puesto universitario como «políticamente no fiable». Recibió entonces varias
invitaciones de universidades estadounidenses, optando por un contrato de tres
años en la Universidad de Princeton (la mitad de su salario lo pagaba la Fundación
Rockefeller). Allí, finalmente, se encontró con Von Neumann. Así describió cómo
se conocieron:170
El 1 de febrero de 1939 intervine después de un almuerzo en el Club Nassau ha-

blando de ciclos económicos, y allí estaba [Von Neumann] con Niels Bohr, Ostwald
Veblen y otros. Von Neumann y Bohr me invitaron a tomar el té esa tarde en Fine Hall
[perteneciente a la Universidad, donde se ubicaba, a la espera de un edificio propio, el
Institute for Advanced Study] y estuvimos varias horas hablando de juegos y experi-
mentos. Esta fue la primera vez que hablamos de juegos y la ocasión se vio realzada por
la presencia de Bohr. La perturbación de experimentos debida al observador era, por su-
puesto, uno de los famosos problemas de la mecánica cuántica suscitados por Niels
Bohr. Estas charlas se reanudaron con los dos en la casa de Weyl, que también había
entrado en mi vida. Este círculo se amplió aún más cuando conocí a Einstein en una
cena con Bohr en la casa de Von Neumann, y recuerdo vivamente lo que dijo Einstein
acerca de la prioridad de la teoría sobre el experimento, la preeminencia de la concep-
tualización y el profundo problema que es la intuición. En muchas reuniones posterio-
res, él volvía a menudo a estos y temas relacionados. Von Neumann y yo tuvimos
muchas otras discusiones muy animadas y de temas variados. Se produjo instantánea-
mente una asociación de mentes y una empatía espontánea entre nosotros. Le mencio-
né que estaba muy interesado en estudiar dos de sus trabajos, el que trataba de la teoría
de juegos y el que había presentado en Viena sobre la expansión económica. Intercam-
biamos enseguida preprints, dándole yo mi trabajo sobre previsión perfecta. Von Neu-
mann me dijo que no había trabajado en teoría de juegos o sobre el modelo de la ex-
pansión económica desde 1928. Pudo haber pensado de una forma u otra sobre esto,
pero nunca de forma sistemática, y tampoco había escrito nada. Yo comencé entonces
a estudiar seriamente su artículo sobre la teoría de juegos. Esto no era fácil debido a
partes de la matemática que eran nuevas para mí, en particular todo el tema del teore-
ma del punto fijo. El artículo sobre la expansión económica también me era difícil por
la misma razón. Esto condujo rápidamente a muchas conversaciones con Johnny, como
le llamaré a partir de ahora. Recuerdo vivamente la gran excitación intelectual que
sentí, de hecho también la implicación emocional con la teoría de juegos, que él había
desarrollado en 1928. Vi lo que significaba y las tremendas posibilidades que existían.
Morgenstern decidió entonces escribir un artículo en el que demostrase a los

economistas la esencia y significado de la teoría de juegos. Con tal fin sus contac-
170
Ibidem, pp. 807-808.
99
Fund_MAT_00c.indd 99 3/5/18 16:13

tos con Von Neumann se intensificaron hasta el punto de que, en el otoño de 1940,
después de que Morgenstern le enseñase un primer manuscrito, que Von Neumann
consideró demasiado breve y poco inteligible, este le propuso que escribiesen algo
conjuntamente. La idea inicial era preparar un artículo de en torno a un centenar
de páginas para publicarlo en los Annals of Mathematic Studies, editado por Mars-
ton Morse, pero en un momento Von Neumann sugirió que Princeton University
Press podría ser otra posibilidad más adecuada. La editorial aceptó la propuesta y
ambos continuaron trabajando, pero terminaron por olvidar que su propuesta era
de un manuscrito de unas cien páginas. Cuando Von Neumann se trasladó en 1942
a Washington D.C., por sus obligaciones relacionadas con la guerra, la colaboración
continuó. Morgenstern viajaba con frecuencia a la capital federal y en los fines de
semana trabajaban «con furia»; otras veces era Von Neumann el que iba a Prince-
ton. Finalmente, en la Navidad de 1942 terminaron el manuscrito (el «Prefacio»
lleva la fecha de enero de 1943). Pero las cien páginas previstas se habían transfor-
mado en 1.200 mecanografiadas, llenas de gráficos y expresiones matemáticas. No
obstante, la editorial lo aceptó, sin que pasase por ningún censor, pero exigió que
se consiguiera alguna ayuda económica, no solo por lo costoso de la edición sino
también porque consideraba que el riesgo económico era grande; es decir, porque
pensaba que se venderían pocos ejemplares. Obtenida la ayuda —4.000 dólares,
de una fuente anónima, pero que se supone fue o la Carnegie Foundation o el
Institute for Advanced Study— el libro apareció el 18 de septiembre de 1944;
tenía 616 páginas. Los temores de Princeton University Press resultaron infunda-
dos. Durante 1945 y 1946 se publicaron reseñas muy favorables y en marzo de
1946 apareció un artículo elogioso sobre él en la primera página de la edición
dominical de The New York Times.171 Una segunda edición, con un amplio apén-
dice, se publicó en 1947, y en 1953 una tercera con un nuevo prefacio.
Citaré algunos párrafos de reseñas que aparecieron:172
Herbert A. Simon (The American Journal of Sociology, mayo de 1945):
Theory of Games es un riguroso desarrollo matemático de una teoría de juegos de
estrategia y una aplicación de esa teoría a ciertos problemas sencillos de economía. Aun-
que no se hacen aplicaciones explícitas a la sociología o a la ciencia política, el esquema
es de tal generalidad y amplitud que sin duda puede realizar contribuciones a estos
campos de naturaleza más fundamental.
Arthur H. Copeland (Bulletin of the American Mathematical Society, julio de

1945):
La posteridad considerará este libro como uno de los mayores logros científicos de
la primera mitad del siglo xx. Este será sin duda el caso si los autores han conseguido
171
Las reseñas publicadas se detallan en Harold W. Kuhn, «Introduction» a la edición de 2004
de Theory of Games and Economic Behavior, op. cit., pp. vii-xiv.
172
Cito de las reproducidas en la edición de 2004 de Theory of Games and Economic Behavior,
op. cit.
100
Fund_MAT_00c.indd 100 3/5/18 16:13

establecer una nueva ciencia: la ciencia de la economía. El fundamento que han estable-
cido es extremadamente prometedor. Como se necesitarán tanto matemáticos como
economistas para desarrollar más la teoría, es conveniente comentar la base necesaria
para leer el libro. La matemática necesaria, más allá del álgebra y geometría analítica, se
desarrolla en el libro. Por otra parte, el lector no formado en matemáticas tendrá que
ejercitar un alto grado de paciencia si quiere comprender la teoría. El lector educado en
matemáticas encontrará el razonamiento estimulante y un reto. En lo que se refiere a la
economía, es suficiente con una base limitada.
Leonid Hurwicz (The American Economic Review, diciembre de 1945):
Cometeríamos una injusticia con los autores su dijéramos que su libro es únicamen-
te una aportación a la economía. El ámbito del libro es mucho más extenso. Las técni-
cas que aplican los autores al tratar problemas económicos son lo suficientemente gene-
rales como para ser válidas en ciencia política, sociología e incluso en estrategia militar.
La aplicabilidad a los propios juegos (ajedrez y póquer) es evidente de su título.
T. Barna (Economica, mayo de 1946):
Los profesores Neumann y Morgenstern han escrito un obra destinada a convertir-

se en un libro de texto fundamental de la teoría económica. Su esencia no es un refina-
miento o sumario de la economía matemática sino una condena directa de los métodos
particulares utilizados en economía y su sustitución por una aproximación matemática
a los problemas centrales de la teoría económica completamente diferente.
Según los autores, la no exitosa utilización de la matemática en economía (en
comparación con otras ciencias) se debía no a causas incorrectas sino al hecho de que
se había estado utilizando una técnica matemática incorrecta. Para la solución de los
problemas económicos es necesario eliminar dos obstáculos preliminares: la inadecuada
claridad en la formulación de los problemas económicos y la insuficiencia del substra-
to empírico. Mientras que la eliminación de estos obstáculos es necesaria, este libro se
sitúa en un nivel más abstracto, ocupándose del tratamiento matemático del compor-
tamiento humano habitual que es importante para la economía. Se considera que la
posibilidad principal de progreso se halla en el tratamiento cuantitativo de factores que
hasta ahora se han denominado «psicológicos» y considerado fuera del ámbito de la
economía. El tipo particular de técnica matemática (el del cálculo infinitesimal) que se
ha estado aplicando a la economía es adecuado para el tipo de problemas «Robinson
Crusoe»; aquí el problema es claramente uno de maximización. Pero cuando tratamos
con una economía de intercambio, con dos o más participantes, la naturaleza del pro-
blema cambia porque ahora cada individuo intenta maximizar algo que también de-
pende de la acción de otros.
Una economía de intercambio contiene varios intereses, a veces paralelos, a veces
conflictivos, y la economía del equilibrio es el resultado de la interacción entre esos in-
tereses. La descripción de semejante sistema exige la aplicación de una técnica matemá-
tica diferente de la que ha tenido éxito en la física y en otras ciencias naturales; en un
sentido abstracto, una economía de intercambio se parece a juegos de estrategia. En
consecuencia, el primer paso para desarrollar una teoría económica es la creación de una
teoría completa de juegos. Ésta requiere una nueva técnica matemática, apenas aplicada
todavía en otras ciencias, en la que el profesor Neumann ha estado trabajando durante
101
Fund_MAT_00c.indd 101 3/5/18 16:13

más de quince años. Ahora es la primera vez que se publica la teoría de juegos comple-
ta y esto forma la mayor parte del libro.
La técnica matemática es la de combinatoria y la teoría de conjuntos. Aparentemen-
te, esta técnica parece más difícil que el habitual método del cálculo infinitesimal, pero
probablemente esto se debe solamente a que es poco familiar, no sólo para los econo-
mistas sino también para muchos científicos. Por otra parte, dominar esta técnica no
exige un conocimiento previo de matemáticas superiores; de hecho, el libro explica todos
los conceptos matemáticos que se introducen desde el principio. Existen, por consiguien-
te, razones para desear que pueda ser adoptado por economistas; de otra forma, el pro-
greso mediante este método de análisis será improbable.
Otro de los apéndices es un ensayo del premio Nobel de Economía 1970,

miembro distinguido de la Escuela Neokeynesiana, Paul Samuelson, en el que es-
cribía:
Este clásico en la historia del pensamiento intelectual tiene ya 20 años y está dispo-
nible en edición en rústica. Representando la colaboración de un genio matemático y
de un dotado economista, el libro no sólo ha proporcionado placer estético a miles de
lectores y un fértil campo para subsiguientes investigaciones matemáticas sino que tam-
bién ha suministrado un estímulo directo para los campos relacionados de la probabili-
dad subjetiva [personal probability], toma de decisiones en estadística e investigación
operacional, programación lineal y optimización más general. De hecho, el libro ha
conseguido todo excepto lo que pretendía hacer de entrada; a saber, revolucionar la
teoría económica.
Sin embargo, Theory of Games es el trabajo de un genio que, debido a que arroja
alguna luz en un enigma de eras, será recordado dentro de mil años, cualquiera que sea
la vida económica en ese distante futuro. Sus más de 600 páginas están erizadas de sim-
bolismos matemáticos que parecerán lo mismo que griego a la vasta mayoría de personas
educadas hasta que lleguemos al feliz estado de C. P. Snow en el que las personas edu-
cadas conocen más de una cultura.
Aunque, efectivamente, como decía Samuelson Theory of Games and Economic

Behavior no revolucionó la economía, sí tuvo una importante repercusión en el
mundo académico de la teoría económica, especialmente a través de la obra desa-
rrollada por el estadounidense de origen ruso Leonid Hurwicz, premio Nobel de
Economía en 2007 por su modelización matemática de la decisión colectiva (fue
pionero en proponer que las instituciones deben de ser concebidas como sistemas
de información en las que los agentes envían mensajes que, reunidos, determinan
la asignación de los recursos disponibles, así como por la noción de «compatibilidad
de incentivos» en el «diseño de mecanismos»), por el también estadounidense,
pero de origen ucranio, Jacob Marschack, uno de los pioneros de la econometría
moderna, y por el economista estadístico y premio Nobel de 1984, el inglés Ri-
chard Stone, creador de la contabilidad nacional.173
173
La teoría de juegos (cooperativos o no cooperativos; de estos trataré enseguida) también ha
sido objeto de otros premios Nobel de Economía. Los dos premios Nobel de 2005, el alemán Robert
102
Fund_MAT_00c.indd 102 3/5/18 16:13

Como hemos visto en los comentarios anteriores, uno de los aspectos más des-
tacables del texto de Von Neumann y Morgenstern es que mostraba que la mate-
mática clásica no era adecuada para la economía. Los propios autores destacaron
este hecho. «No existe ninguna razón fundamental», escribían en el primer capítu-
lo de esta obra («Formulación del problema económico»), «por la que las matemá-
ticas no debieran ser utilizadas en la economía. Los argumentos que se oyen a
menudo de que las matemáticas no se podrán aplicar a la economía debido al ele-
mento humano, o a factores psicológicos, etc., o porque no existen —supuestamen-
te— medidas de factores importantes, se deben descartar como completamente
equivocados. Casi todas estas objeciones se han hecho, o podrían haber sido hechas,
hace muchos siglos en otros campos en los que las matemáticas son ahora el prin-
cipal instrumento de análisis. Con el «podrían haber sido hechas» empleado quere-
mos decir lo siguiente: intentemos imaginarnos a nosotros mismos en el período
que precedió a la fase matemática, o casi matemática, del desarrollo de la física, esto
es, el siglo xvi, o en los correspondientes casos de la química o la biología, esto es,
el siglo xviii. Dando por sentado la actitud escéptica de aquellos que objetan en
principio a la economía matemática, las perspectivas de las ciencias físicas y bioló-
gicas en aquellos períodos tempranos difícilmente podrían haber sido mejores que
aquella en que se encuentra la economía, mutatis mutandis, actualmente».174
Y sus argumentos no se detenían en este punto. También destacaban los efec-
tos positivos que podía producir, por un lado, la aplicación de la matemática a la
economía, así como el recíproco, la búsqueda de construcciones matemáticas que
describieran fenómenos económicos; esto es, era presumible que la matemática
también se beneficiaría de su relación con la economía (otra posibilidad mencio-
nada en las reseñas que recibió el libro). Refiriéndose al primer apartado, escribían:
«Con respecto a la falta de medidas de los factores más importantes, el ejemplo de
la teoría del calor es muy instructivo; antes del desarrollo de la teoría matemática
las posibilidades de mediciones cuantitativas eran menos favorables de lo que son
ahora en economía. Las medidas precisas de la cantidad y calidad de calor (energía
Aumann y el estadounidense Thomas Schelling, fueron premiados, el primero por su teoría sobre
cómo a través de «juegos repetidos» puede mejorarse la cooperación entre partes con intereses en
conflicto explicando desencuentros tales como las guerras de precios o de comercio internacional, y
el segundo por sus análisis sobre cómo la «coordinación estratégica» puede resolver conflictos y evi-
tar guerras entre países. También han sido premiados por sus aportaciones a la teoría de los juegos
los tres premios Nobel de 2007: el ya citado Leonid Hurwicz; Eric Maskin, que desarrolló la teoría
de la aplicación (implementation theory) dentro de la teoría del diseño de mecanismos que resuelve
los problemas potenciales de coexistencia de equilibrios inferiores respecto a los deseados; y Roger
Myerson, que estableció la idea del «principio de revelación» y aplicó la teoría del diseño de meca-
nismos a los juegos con información incompleta, en los que los jugadores no conocen sus objetivos,
acciones y costes con lo que se ha podido comprender mejor las subastas óptimas. Más información
en Leonard, Von Neumann, Morgenstern and the Creation of Game Theory, op. cit., y M. Dore, S.
Chakravarty y R. Goodvin, eds., John von Neumann and Modern Economics (Clarendon Press,
Oxford, 1989).
174
Cito de la tercera edición (1953), la reproducida en la edición conmemorativa de 2004, op.
cit., p. 3.
103
Fund_MAT_00c.indd 103 3/5/18 16:13

y temperatura) fueron el resultado y no el antecedente de la teoría matemática.

Esto se debe contrastar con el hecho de que las nociones cuantitativas y exactas de
precios, dinero y cambio de interés se habían desarrollado hacía ya muchos siglos».
Y con relación al segundo:175
La fase decisiva de la aplicación de las matemáticas a la física —la creación por

parte de Newton de una disciplina racional de la mecánica— dio origen al, y difícil-
mente puede ser separada del, descubrimiento del cálculo infinitesimal. (Existen otros
ejemplos, pero ninguno tan importante como este.)
La importancia de los fenómenos sociales, la riqueza y multiplicidad de sus mani-
festaciones, y la complejidad de sus estructuras, son como poco iguales a las de la física.
Se debe, por consiguiente, esperar —o temer— que se necesitarán descubrimientos
matemáticos de una altura comparable a la del cálculo para llegar a logros comparables
en este campo [...] A fortiori es poco probable que una mera repetición de los trucos que
nos sirvieron tan bien en la física valgan también para los fenómenos sociales. De hecho,
la probabilidad es muy pequeña ya que se demostrará que encontramos en nuestras
discusiones algunos problemas matemáticos que son muy diferentes de los que aparecen
en la ciencia física.
La teoría que Von Neumann y Morgenstern desarrollaron en Theory of Games

and Economic Behavior trataba únicamente de juegos cooperativos, pero en la
vida real los participantes en juegos normalmente intentar obtener posiciones
que les den ventajas, esto es, no cooperan con otros. La teoría de juegos fue exten-
dida a los no cooperativos por el matemático John Nash en su tesis doctoral de
1950.176 En 1994, Nash —famoso posteriormente por el libro y la película basados
en su dramática historia (padeció durante años una severa e incapacitante esquizo-
frenia), Una mente maravillosa— recibió el premio Nobel de Economía, compar-
tido con John Harsanyi y Reinhard Selten «por sus análisis pioneros del equilibrio
en la teoría de juegos no cooperativos». En la sucinta biografía que preparó con
ocasión de la concesión del premio Nobel, Nash mencionó que «mientras estaba
en Carnegie [donde estudió; ahora es la Carnegie Mellon University] seguí un
curso optativo de “Economía internacional” y como resultado de verme expuesto
a ideas y problemas económicos llegué a la idea que condujo a mi artículo “The
bargaining problema” [“El problema de la negociación”] que se publicó más tarde
en Econometría. Y fue esta idea, a su vez, la que, cuando era un estudiante gradua-
do en Princeton, me llevó a interesarme en la teoría de juegos que había sido esti-
mulada por el trabajo de Von Neumann y Morgenstern».177
175
Ibidem, pp. 5-7.
176
John Nash, Non-cooperative games, Ph.D. tesis, Princeton University (mayo de 1950). Re-
producida en edición facsímil en The Essential John Nash, Harold W. Kuhn y Sylvia Nasar, eds.
(Princeton University Press, Princeton, 2002), pp. 53-84. Esta tesis dio origen a dos artículos: «Equi-
librium points in n-person games», Proceedings of the National Academy of Sciences 36, 48-49 (1950),
y «Non-cooperative games», Annals of Mathematics 54, 286-295 (1951), que también se producen
en The Essential John Nash.
177
The Essential John Nash, op. cit., p. 8.
104
Fund_MAT_00c.indd 104 3/5/18 16:13

Hay que señalar, asimismo, que se introdujeron otras técnicas matemáticas en

el estudio de los fenómenos económicos. Un buen ejemplo en este sentido es el
denominado «enfoque diferenciable», al que Andreu Mas-Colell dedicó un libro
en el que, además de situar en un contexto más general la contribución de Von
Neumann y Morgenstern, señalaba lo siguiente:178
Hasta el final de la Segunda Guerra Mundial la economía matemática fue casi si-
nónimo de la aplicación del cálculo diferencial a la economía. Fue sobre la base de esta
técnica que Cournot (1838) inició el enfoque matemático en economía y Walras (1874)
y Pareto (1909) crearon la teoría del equilibrio económico general. El libro de Hicks,
Value and Capital (1939), y el de Samuelson, Foundations of Economic Analysis (1947),
representan la culminación de esta era clásica.
Después de la Segunda Guerra Mundial, la teoría del equilibrio general avanzó
gradualmente hacia el centro de la economía, pero un cambio dramático de técnicas
acompañó este proceso: la teoría de la convexidad y la topología reemplazaron casi por
completo al cálculo. En los libros fundamentales de la tradición moderna, como los de
Debreu, Theory of Value (1959), Arrow y Hahn, General Competitive Analysis (1971),
Scarf, Computation and Equilibrium Prices (1982), y Hildenbrand, Core and Equilibria
of a Large Economy (1974), las derivadas o bien están ausentes o como mucho juegan
un papel periférico.
¿Por qué ocurrió este cambio? Sería correcto apelar al impacto combinado del aná-
lisis Imput-Output de Leontief, la programación lineal de Dantzig y Koopman y la
teoría de juegos de Von Neumann y Morgenstern, pero esto da por sentado lo que
queda por probar. Esquematizado algo (o quizás bastante), se podrían mencionar dos
debilidades internas del enfoque tradicional del cálculo que desmerecía su rigor y, lo que
es más importante, impedía el progreso.
La primera debilidad consistía en la costumbre de solucionar el problema de la
existencia de un equilibrio contando el número de ecuaciones e incógnitas y verificando
que el número era el mismo. Con el tiempo resultó obvio, y nunca se les pasó por alto
a los autores más perceptivos, que esta forma de proceder no resolvía el problema. Even-
tualmente, la topología acudió al rescate y en forma de la teoría de punto fijo emergió,
en cuanto a técnica, como una de las piedras angulares del enfoque moderno.
La segunda debilidad consistió en la incapacidad del análisis tradicional para tratar
desigualdades de manera satisfactoria, o incluso de darse cuenta de que había un pro-
blema de esa naturaleza. Es aquí donde la teoría de la convexidad demostró ser una
herramienta decisiva.
En 1970 G. Debreu publicó un trabajo pionero sobre economías con un conjunto
de equilibrio finito. Esta contribución fue la que estuvo en el principio de un interés
renovado por las técnicas de diferenciabilidad. También marcó la introducción en eco-
nomía de los métodos de topología diferencial (en particular el punto de vista de la
genericidad y la teoría de transversalidad de funciones) que se habían desarrollado du-
rante los años cincuenta y principios de los sesenta por matemáticos como R. Thom.
También resulta difícil sobreenfatizar el impacto del pequeño y delicioso libro de Milnor,
178
Andreu Mas-Colell, La teoría del equilibrio económico general. Un enfoque diferenciable (Fun-
dación Argentaria, Madrid, 1992; edición original en inglés de 1985), pp. 21-22. Para un estudio
histórico de la teoría del equilibrio, véase Ingrao e Israel, The Invisible Hand, op. cit.
105
Fund_MAT_00c.indd 105 3/5/18 16:13

Topology from the Differentiable Viewpoint (1965), en la popularización de las nuevas

técnicas fuera de la matemática pura».
Von Neumann y la RAND

Era evidente que la teoría de juegos poseía un espectro muy amplio de aplica-
ciones; esto, junto a las múltiples habilidades de Von Neumann, hizo de él obje-
tivo de una organización que se había creado en 1946: la RAND (de Research
ANd Development). El origen de esta organización, que tanto daría de hablar en
el futuro, tuvo que ver con el temor que, inmediatamente después de finalizada la
Segunda Guerra Mundial, surgió en el Departamento de Guerra y en la Oficina
de Investigación y Desarrollo Científico estadounidenses de dejar de contar con
la colaboración de muchos científicos que habían trabajado en tareas militares,
pero que ahora volverían a sus universidades.179 Consecuentemente, en marzo de
1946 el general Henry Harley Arnold, comandante general de la Fuerza Aérea
estadounidense, destinó diez millones de dólares para el Proyecto RAND.180 Ini-
cialmente asociada a la Douglas Aircraft Company de Santa Mónica (California),
en febrero de 1948 la RAND se independizó, constituyéndose legalmente en mar-
zo. La idea era que se tratase de una organización sin afanes lucrativos, financiada
a través de contratos (fundamentalmente gubernamentales). En su acta de consti-
tución se especificaba que se creaba «para el progreso y la promoción de objetivos
científicos, educativos y benéficos, todos con vistas a lograr el bienestar público y
la seguridad de los Estados Unidos de América». Para ello, los asuntos centrales a
los que dedicó inicialmente sus esfuerzos tenían que ver con la vulnerabilidad e
integridad de estructuras físicas, lo que implicó considerar cuestiones del tipo de
la capacidad destructiva de las bombas atómicas y el desarrollo de sistemas de alar-
179
La historia de RAND y la participación de Von Neumann se tratan en Leonard, Von Neu-
mann, Morgenstern and the Creation of Game Theory, op. cit., cap. 13, y William Poundstone, El
dilema del prisionero, cap. 5 (Alianza Editorial, Madrid, 1995). Véase, asimismo, Martin J. Collins,
Cold War Laboratory: RAND, the Air Force, and the American State, 1945-1950 (Smithsonian Press,
Washington D.C., 2002).
180
Muestra del interés que Arnold tenía por contar con científicos es lo que escribió en su libro
Global Mission: «[Yo quería] obtener los mejores cerebros disponibles, y hacerles que considerasen
los últimos desarrollos en las Fuerzas Aéreas de los alemanes y los japoneses, así como de la RAF, y
que determinasen los pasos que debería dar Estados Unidos para tener la mejor Fuerza Aérea del
mundo dentro de veinte años […] Les dije a estos científicos que quería que pensasen a veinte años
vista. Tenían que olvidar el pasado; considerar los equipos disponibles en la actualidad solamente
como la base para las predicciones más atrevidas. Quería que pensasen sobre aviones con velocidad
supersónica, aeroplanos que se moviesen y operasen sin tripulaciones; mejora en bombas, de mane-
ra que pudiéramos utilizar bombas más pequeñas para obtener efectos más grandes; defensas contra
la aviación moderna y contra la que estaba por venir; sistemas de comunicación entre aeroplanos y
tierra, y entre los propios aeroplanos en el aire; televisión, tiempo meteorológico, investigación mé-
dica; energía atómica, y cualquier otro apartado de la aviación que pudiese afectar al desarrollo y
utilización del poder aéreo en el futuro»; H. H. Arnold, Global Mission (Harper, Nueva York, 1949),
p. 532. Especialmente importante fue la relación que Arnold mantuvo con Theodore von Kárman;
véase José Manuel Sánchez Ron, El poder de la ciencia (Crítica, Barcelona, 2007), pp. 769-777.
106
Fund_MAT_00c.indd 106 3/5/18 16:13

ma para proteger el territorio estadounidense ante posibles ataques de la Unión

Soviética. Básicamente, era lo que durante la guerra y aún después se había deno-
minado investigación de operaciones (u operacional ). Para semejante fin, la teoría de
juegos resultó ser un referente crucial. Y por ello, conseguir que John von Neu-
mann colaborase con RAND, muy conveniente. Así, el 16 de diciembre de 1948
John Williams, que dirigía la sección de Investigación Matemática, escribió a Von
Neumann ofreciéndole doscientos dólares mensuales por sus servicios como cola-
borador. «En la práctica», señalaba Williams en su carta, «espero que los miembros
del Proyecto cuya casuística pertenezca a su línea de pensamiento (es decir, referi-
das al mundo externo) puedan discutir sus opiniones con usted, bien por correo
o bien en persona. Le enviaríamos toda la documentación de trabajo y los informes
de RAND que pensamos que pudieran interesarle, y esperaríamos su reacción
(bien fuera fruncir el ceño, indicar algo o alguna sugerencia). En esta fase del tra-
bajo, sólo pediríamos que se empleara sistemáticamente en estas cuestiones duran-
te el tiempo que ocupa en afeitarse: nos gustaría que nos comunicara las ideas que
se le han ocurrido mientras empleaba el tiempo de esta manera».181
Von Neumann aceptó la oferta y parece que disfrutó mucho, especialmente
cuando asistía a reuniones en la sede de RAND en Santa Mónica. En la lista de
publicaciones de RAND, dos informes llevan su firma: «Solutions of games by
differential equations» (once páginas), con George W. Brown, distribuido por
RAND en 1950, y, con Morgenstern (que también colaboró con RAND), «Sym-
metric solutions of some general n-person games», un manuscrito de trece páginas
que prepararon en agosto de 1946, pero que RAND hizo público el 2 de marzo
de 1961.
Computadoras, autómatas y cerebro: Turing,

Wiener y Von Neumann
Al ocuparse de la organización lógica de las computadoras, Von Neumann se
vio conducido, de manera, podríamos decir, natural, a cuestiones relativas a las
analogías existentes entre computadoras, o autómatas (máquinas que funcionan
obedeciendo instrucciones lógicas codificadas en programas) y cerebro humano.
No fue el único de los pioneros en el campo de la computación y ámbitos relacio-
nados que vio semejante conexión, a la cabeza de ellos Alan Turing.
Relacionado con sus intereses en inteligencia artificial, Turing exploró las redes
de neuronas artificiales, campo denominado en ocasiones conexionismo (connectio-
nism) y, con más frecuencia, redes neuronales. Introdujo un tipo de red neuronal
que llamó «máquina no organizada de tipo B», que estaba formada por neuronas
artificiales. Probablemente, la mejor prueba de sus ideas fue un informe que pre-
paró en 1948, mientras trabajaba en el National Physical Laboratory británico. Se
titulaba Intelligent Machinery (Maquinaria inteligente) y su propósito era «investi-
gar la cuestión de si es posible que la maquinaria muestre un comportamiento
181
Citada en Poundstone, El dilema del prisionero, op. cit., pp. 146-147.
107
Fund_MAT_00c.indd 107 3/5/18 16:13

inteligente».182 En la sección 4 («Unorganised machines») es donde Turing intro-

ducía la idea de redes de neuronas artificiales:183
Hasta ahora hemos estado considerando máquinas diseñadas para un propósito

concreto (aunque las máquinas universales son, en cierto sentido, una excepción). En
su lugar, podemos considerar lo que sucede cuando construimos de una forma compa-
rativamente asistemática una máquina para algún tipo de componentes estándares. Po-
dríamos considerar algún tipo particular de máquina de esta naturaleza e investigar qué
tipos de cosas es probable que haga. Llamaremos «máquinas no organizadas» a las má-
quinas que han sido construidas, básicamente, de manera aleatoria. No pretendemos
que éste sea un término preciso. Es concebible que la misma máquina pueda ser consi-
derada por una persona como organizada y por otra como desorganizada.
Un ejemplo típico de máquina no organizada es el que sigue. La máquina está for-
mada por un número, N, bastante grande de unidades parecidas. Cada unidad tiene dos
terminales de entrada (input) y una terminal de salida (output) que se puede conectar a
las terminales de entrada de (0 o más) otras unidades.»
Es posible que, de hecho, Turing estuviese pensando en el cerebro humano,

que acaso esté más cerca de ser una máquina no organizada que organizada. Una
máquina no organizada que, no obstante, es capaz de producir pensamientos or-
ganizados.
Turing también trabajó en lo que se denomina morfogénesis, la ciencia que
estudia los procesos biológicos que hacen que un organismo desarrolle la forma
que finalmente tiene. Para ello diseñó simulaciones de computadoras que investi-
gaban la organización y forma de seres vivos. Poco después de que se instalase la
primera computadora digital electrónica en el Laboratorio de Máquinas Calcula-
doras (Computing Machine Laboratory) de la Universidad de Manchester, donde
Turing estaba trabajando, la utilizó para sus estudios morfogenéticos. En una
carta que escribió en febrero de 1951 informaba de esto a Michael Woodger, que
había trabajado con él, como su ayudante, en 1946 en el National Physical
Laboratory:184 «Nuestra nueva máquina comenzará a llegar el lunes. Estoy desean-
do que uno de sus primeros trabajos sea hacer algo sobre «embriología química».
En particular, pienso que se puede explicar la aparición de lo números de Fibo-
nacci en relación con los conos de abetos».
Producto de estos trabajos fue un artículo titulado «La base química de la
morfogénesis», que publicó en 1952, en el que presentaba un modelo matemático
de un embrión en crecimiento.185 Entre los resultados que obtuvo, uno era par
ticularmente importante: la demostración de que ciertos tipos de sistemas diná-
micos, que inicialmente son homogéneos, experimentan un cambio progresivo que
182
El manuscrito mecanografiado se reproduce en AlanTuring.net Archives («The Turing Ar-
chive for the History of Computing»), dirigido por Jack Copeland y Diane Proudfoot.
183
Ibidem.
184
Reproducida en AlanTuring.net («The Turing Archive for the History of Computing»).
185
Alan Turing, «The chemical basis of morphogenesis», Philosophical Transactions of the Royal
Society of London B 237, 37-72 (1952-1954).
108
Fund_MAT_00c.indd 108 3/5/18 16:13

conduce a la aparición de heterogeneidades espaciales. Y, ¿qué es la vida sino sis-

temas organizados que presentan heterogeneidades?
El segundo del gran trío de pioneros de la computación y de la aplicación de
sus posibilidades al estudio de facetas de los seres vivos fue el polifacético genio
estadounidense Norbert Wiener (1894-1964). Como señaló Rustom Masani en
su biografía de Wiener:186
Existen notables paralelismos entre la evolución intelectual de John von Neumann

y Norbert Wiener. Ambos comenzaron sus investigaciones en los fundamentos de la
matemática —Wiener a través de Principia Mathematica, Von Neumann de la teoría
formal de conjuntos de Hilbert—, y ambos efectuaron contribuciones fundamentales
significativas dentro de sus esquemas. Los dos sintieron una poderosa atracción por las
fronteras de la física, y crearon nuevas matemáticas para tratar con las realidades que se
estaban descubriendo: Wiener para la teoría del movimiento browniano de Einstein-
Smoluchowski, Von Neumann para la mecánica cuántica del átomo, entonces fresca de
la pluma de De Broglie, Heisenberg, Born y Schrödinger. La nueva matemática era
profunda: medidas sobre C[0, 1] e integración estocástica, y resolución espectral de
operadores en espacios de Hilbert. Ambos empujaron la nueva matemática hacia sus
profundidades: el trabajo de Wiener condujo al análisis armónico generalizado y teoría
tauberiana (apuntando a las álgebras de Banach), el trabajo de Von Neumann a anillos
de operadores, apropiadamente denominado hoy «álgebras de Von Neumann». Los dos
realizaron trabajos afines de gran altura: Wiener en la ecuación y causalidad de Hopf-
Wiener, Von Neumann en teoría ergódica. Durante la Segunda Guerra Mundial ambos
se involucraron en proyectos militares: Wiener en balística antiaérea, Von Neumann en
armamento atómico con el Proyecto Manhattan. Los dos estuvieron intensamente inte-
resados en las computadoras electrónicas; Wiener desde los días de su asociación con el
analizador diferencial de Vannevar Bush, Von Neumann desde el comienzo de la guerra.
Y ambos contribuyeron, en sus respectivas maneras, a ellas: Wiener, de forma poco sis-
temática, con ideas profundas, y Von Neumann, sistemáticamente, con el actual diseño
lógico. Los dos articularon en términos matemáticos las ideas filosóficas y metodológicas
nacidas en el fuego del conflicto y la guerra: Wiener con su teoría de predicción y fil-
trado que condujo a la cibernética, Von Neumann con su teoría de autómatas y su
teoría de estrategias («teoría de juegos»), y en esto ambos utilizaron de manera sustancial
sus tempranos trabajos de las décadas de 1920 y 1930. Y los dos realizaron penetrantes
ataques al territorio no lineal, Von Neumann de una forma más causal, Wiener más
aleatoriamente.
Sin entrar en demasiados detalles, diré que el interés de Wiener en las compu-
tadoras le condujo al estudio del cerebro, sistema nervioso y varios apartados de la
fisiología.187 Hablando en tercera persona, el propio Wiener mencionó algunas de
las raíces de estos intereses y, en particular, cómo se plasmaron en su conocido libro
186
Masani, Norbert Wiener, 1894-1964, op. cit., pp. 240-241.
187
Véanse, en este sentido, los trabajos incluidos en el volumen IV («Cibernetics, Science and
Society; Ethics, Aesthetics, and Literary Criticism; Books Reviews and Obituaries») de Norbert Wie-
ner: Collected Works, op. cit.
109
Fund_MAT_00c.indd 109 3/5/18 16:13

Cybernetics, or Control and Comunication in the Animal and the Machine (1948),
en una breve nota:188
Este conglomerado de ciencias se desarrolló durante la Segunda Guerra Mundial a
partir de la necesidad de poner a trabajar a talentos matemáticos y de otras ciencias en
problemas prácticos de diseños militares, que hasta entonces no habían sido considera-
dos de naturaleza puramente científica. Esta necesidad estaba estrechamente relacionada
con la de organizar procesos tales como el seguimiento de aeroplanos, que por su misma
rapidez y complejidad eludían los tipos existentes de intervención humana, mediante el
uso de dispositivos automáticos, mecánico o electrónicos auxiliares. De esta manera,
apareció, y fue tratado por Wiener en su libro Cybernetics, or Control and Comunication
in the Animal and the Machine (1948), un campo de investigación que cubría no solo
tales mecanismos, sino también su arquetipo, el cerebro y el sistema nervioso.
Norbert Wiener (1894-1964) (MIT Museum, AIP Emilio Segrè Visual Archives).
John von Neumann estaba al tanto de los trabajos de Wiener en estos campos;
de hecho, en 1949 publicó una reseña de Cybernetics, or Control and Comunication
in the Animal and the Machine en Physics Today, la revista de la American Physical
Society.189 Una muestra temprana de esto es una larga carta que envió a Wiener
188
Norbert Wiener, «Cybernetics», reproducido en Norbert Wiener: Collected Works, op. cit.,
p. 804.
189
John von Neumann, Physics Today 2, n.º 5, 33-34 (1949). «El libro», escribió allí Von Neu-
mann, «trata de las reacciones automáticas o casi automáticas de mecanismos intencionales —arti-
ficiales o vivos— a sus entornos, o más específicamente, trata de los mecanismos regulatorios, la
110
Fund_MAT_00c.indd 110 3/5/18 16:13

el 29 de noviembre de 1946, que anticipaba una reunión que debían tener los
dos el 4 de diciembre en Cambridge, pero de la que, si se celebró, no ha sobrevi-
vido nada.190 Demasiado extensa para citarla o comentarla en su totalidad, me
limitaré a recuperar algunos pasajes de ella. En uno de estos, casi al principio, Von
Neumann señalaba:
Nuestros pensamientos —quiero decir los suyos y de Pitts, y los míos— estaban
centrados principalmente en el campo de la neurología, y de manera más específica en
el sistema nervioso humano, y allí principalmente en el sistema nervioso central. Así, al
tratar de comprender la función de los autómatas y los principios generales que los go-
biernan, seleccionamos para una primera acción el objeto más complicado que existe
bajo el sol, literalmente. A pesar de su formidable complejidad, este asunto ha proporcio
nado información muy interesante bajo la presión de los esfuerzos de Pitts y McCulloch,
Pitts, Wiener y Rosenblueth. Lo que pensamos —o al menos, lo que pienso yo— acer-
ca de todo el tema de los autómatas sería mucho más confuso de lo que es si estos ex-
tremadamente atrevidos esfuerzos —con los que desearía poner a la par la muy a-neu-
rológica tesis de A. Turing— no se hubieran efectuado. Sin embargo, pienso que estos
éxitos no deberían cegarnos acerca de las dificultades del tema, dificultades que, creo, se
mantienen igual de prohibitivas, sino más, que siempre.
Vemos que Von Neumann se refería aquí a un grupo de investigadores que se

habían ocupado de estas cuestiones: Walter Pitts, discípulo en Chicago del filósofo
Rudold Carnap y del biofísico Nicolas Rashevsky; Warren McCulloch, profesor de
Psiquiaría en la Escuela de Medicina de Universidad de Illinois; y el fisiólogo mexi-
cano Arturo Rosenblueth, que colaboró estrechamente con Wiener.191 En 1943,
McCulloch y Pitts habían publicado un importante artículo, «Un cálculo lógico
de ideas inmanentes en la actividad cerebral», en el que formalizaban la estructura
intrínseca de los procesos neuronales, un trabajo que influyó mucho en Wiener y
que, como vimos, Von Neumann también tuvo en gran consideración.192
Una de las recomendaciones que hacía Von Neumann era centrarse en los
sistemas biológicos más simples:
Pienso que tenemos que dedicarnos a sistemas más simples. Es una falacia argumen-
tar que como la neurona es una célula (de hecho, parte de su empaquetado individual
síntesis de los cuales constituye estos autómatas. “Cibernética” es un neologismo, acuñado por el
autor para esa ocasión y —con la esperanza de que muchos lo comparta con él— para muchas oca-
siones futuras. El autor lo deriva de la palabra griega Κυβερνh′της (gobernador); esto es, el “gober-
nador” de la máquina de vapor, del que trató Clerk Maxwell en un artículo de 1868». En lugar de
«gobernador», sería mejor traducir ese término por «timonel».
190
Reproducida en Rédei, ed., John von Neumann: Selected Letters, op. cit., pp. 278-282, y en
Masani, Norbert Wiener, 1894-1964, op. cit., pp. 243-247.
191
Véase, por ejemplo, Norbert Wiener y Arturo Rosenblueth, «The mathematical formulation
of the problem of conduction of impulses in a network of connected excitable elements, specifically
in cardiac muscle», Archivos del Instituto de Cardiología de México 16, 205-265 (1946).
192
Warren McCulloch y Walter Pitts, «A logical calculus of the ideas immanent in nervous
activity», The Bulletin of Mathematical Biophysics 5, 115-133 (1943).
111
Fund_MAT_00c.indd 111 3/5/18 16:13

aislante es multicelular), solamente debemos considerar organismos multicelulares. La

célula es claramente un excelente «componente estándar», muy flexible y adecuado para
diferenciarse en forma y función, y los organismos superiores la utilizan libremente. Pero
su auto-reproductibilidad indica que posee en sí misma algunos de los atributos decisi-
vos de los organismos integrados y algunas células (por ejemplo, los leucocitos) son
autocontenidos, seres completos.
También llamaba la atención sobre unas «unidades» orgánicas que entonces

todavía no habían atraído demasiada atención de los investigadores, pero que pron-
to lo harían: los bacteriófagos (o fagos): «Los menos celulares organismos de los
virus o tipo bacteriófago poseen los rasgos decisivos de cualquier organismo vivo.
Se reproducen a sí mismos y son capaces de orientarse en un medio desorganizado,
para moverse hacia la comida, apropiarse de ella y utilizarla. En consecuencia, una
“verdadera” comprensión de estos organismos puede ser el primer paso adelante
relevante y posiblemente el mayor paso que puede necesitarse».193
En cuanto a sus propios trabajos, Von Neumann dedicó especial atención a
los autómatas, término en el que agrupaba a las computadoras y al sistema nervio-
so humano. Se trataba de un campo que representaba la culminación y reunión
de sus grandes intereses anteriores: lógica, axiomática y computadoras electrónicas.
Para apreciar algo de su enfoque, citaré unos pasajes del ensayo que preparó a
partir de su intervención en un simposio, el Hixon, el 20 de septiembre de 1948,
titulada «La teoría general y lógica de los autómatas», que ya nos apareció antes:194
Al comparar los organismos vivos y, en particular, el organismo más complicado, el

sistema nervioso central humano, con los autómatas artificiales, deberían tenerse en
mente las siguientes limitaciones. Los sistemas naturales son enormemente complejos,
y claramente es necesario subdividir el problema que representan en varias partes. Un
método de subdivisión, que es particularmente significativo en el contexto presente, es
este: los organismos se pueden considerar como constituidos de partes, unidades ele-
mentales, que son independientes en cierta medida. En este sentido, podemos, por
193
Los fagos fueron descubiertos en 1915-1917 por Frederick William Twort y Félix d’Hérelle.
Aunque son demasiado pequeños para observarlos con microscopios ordinarios, y estructural y quí-
micamente son muy sencillos (mitad proteínas, mitad ADN), están dotados de una gran capacidad
de autorreproducción. Uno de los primeros en darse cuenta del valor científico de los fagos —que
comenzó a estudiar en 1938— fue el físico Max Delbrück, que dejó la física para pasarse a la bio-
logía. Junto a Emory Ellis, Delbrück demostró que un fago que infecta a una célula puede dar lugar
a cientos de fagos idénticos en media hora, con lo que se convertían en extraordinarios instrumentos
para estudiar la replicación genética. Dos años después, se encontró con Salvador Luria y Alfred
Hershey, dando lugar al conocido como Grupo de los Fagos, cuyos miembros estaban unidos por
un deseo común: resolver el misterio del gen. Es interesante también mencionar que, en 1947, Lu-
ria, entonces profesor en Indiana, tomó como estudiante graduado a un joven biólogo de Chicago
de nombre James Watson, iniciándole como miembro del Grupo de los Fagos. Véanse los diferentes
artículos incluidos en John Cairns, Gunther S. Stent y James D. Watson, eds. (Cold Spring Har-
bor Laboratory Press, Cold Spring, 1992, «expanded edition»), Phage and the Origins of Molecular
Biology.
194
John von Neumann, «The general and logical theory of automata», op. cit., p. 527.
112
Fund_MAT_00c.indd 112 3/5/18 16:13

consiguiente, considerar que la primera parte del problema es la estructura y funciona-

miento individual de tales unidades elementales. La segunda parte del problema consis-
te en entender cómo están organizados estos elementos como un todo, y cómo el fun-
cionamiento del todo se expresa en términos de estos elementos.
La primera parte del problema está dominada actualmente por la fisiología. Está
estrechamente relacionada con los capítulos más difíciles de la química orgánica y de la
química-física, y en el futuro puede verse ayudada mucho por la mecánica cuántica.
Tengo pocas cualificaciones para hablar sobre ella, y no es en esta en la que me concen-
traré aquí.
Por el contrario, la segunda parte es la que probablemente atraiga a aquellos de
nosotros con la formación y gustos de un matemático o un lógico. Con esta actitud, nos
inclinaremos a prescindir de la primera parte del problema mediante el proceso de axio-
matización, y concentrarnos en la segunda parte.
Para desarrollar su programa, se concentraba en analizar cuestiones del tipo de

analogías entre organismos vivos y computadoras, en principio analógicas o digi-
tales, aunque daba preferencia a las segundas, en las que la utilización del sistema
binario (0 y 1) permitía establecer mejores similitudes con la relación sináptica
entre neuronas, para lo que se ayudaba por el modelo formal de redes neuronales
de McCulloch-Pitts.195
Dentro de su ambicioso programa, había dos cuestiones a las que dedicó par-
ticular atención: los sistemas autómatas autorreplicantes y los errores en la trans-
misión de información. Abordó el primero brevemente en el Simposio Hixon y
después preparó un manuscrito, que no llegó a completar y que se publicó póstu-
mamente como libro: Theory of Self-Reproducing Automata (1966), editado y com-
pletado por A. W. Burks. La idea —que trataba de imitar lo que sucede con siste-
mas naturales (por ejemplo, un virus)— era la de que sería posible diseñar
máquinas programables (esto es, que obedeciesen códigos de instrucciones inser-
tados en sus memorias) que fuesen capaces de componer, con materiales dispo
nibles en el medio en que se moviesen, otras como ellas, o, lo que es lo mismo,
que fuesen capaces de (auto)-reproducirse. Como decía en su ensayo Hixon:196 «Se
supone que el autómata constructor está situado en un reservoir en el que estas
flotando en gran número todos los componentes elementales y que realizará la
construcción en tal medio». Uno de los atractivos de esta idea es, como ha seña-
lado, entre otros, Freeman Dyson, que se podrían utilizar máquinas autorreplican-
tes para la exploración espacial (suponen, claro está, que encontrarían en el espacio
los materiales necesarios para reproducirse).
195
Aun así, se daba cuenta de que «los procesos que se desarrollan en el sistema nervioso pue-
den cambiar su carácter de digital a analógico, volviendo de nuevo al digital, etc., repetidamente»,
John von Neumann, El cerebro y el ordenador (Antoni Bosch, Barcelona, 1980), p. 78. Se encuentran
comentarios interesantes sobre esta cuestión en Freeman Dyson, «Are brains analog or digital?», en
Dyson, Birds and Frogs, op. cit., pp. 85-98.
196
John von Neumann, «The general and logical theory of automata», op. cit., p. 554.
113
Fund_MAT_00c.indd 113 3/5/18 16:13

Para entender de qué trataba la segunda cuestión a la que me refería, la de

errores en la transmisión de información, citaré unos párrafos del libro The Com-
puter and the Brain, que nos aparecerá enseguida:197
Desde luego, es claro que si en un sistema digital de notaciones falta un simple

impulso, puede resultar una deformación absoluta de su significado. Por otra parte, es
igualmente claro que si en un esquema del tipo descrito se pierde un simple impulso, o
incluso varios, o estos están incluidos de una forma innecesaria o equivocada, la frecuen-
cia relevante, es decir, el significado del mensaje, se distorsiona de forma esencial.
Aparece ahora una cuestión que es crucial contestar: ¿cuáles son las inferencias esen-
ciales, acerca de la estructura aritmética y lógica de la máquina de calcular representadas
por el sistema nervioso que pueden extraerse de estas observaciones en apariencia incon-
gruentes?
Para cualquiera que haya estudiado el deterioro de la precisión a lo largo de un
extenso proceso de cálculo, la respuesta es clara. El deterioro es debido a la acumulación
de errores por superposición, e incluso a la amplificación de los errores cometidos pre-
viamente en el cálculo, esto es, debido al considerable número de operaciones aritméti-
cas que tienen que ser realizadas en serie, o, en otras palabras, a la gran «profundidad
aritmética» el esquema.
Von Neumann desarrolló estas ideas en un artículo que se publicó en 1956,

poco antes, por tanto, de su muerte, como parte de un volumen editado por Clau-
de Shannon y John McCarthy.198 Que uno de los editores de este volumen fuese
Shannon es particularmente adecuado, dado que este fue uno de los principales
creadores de la teoría de la información, en la que, entre otras cuestiones, se ocupó
de la corrección de errores y supresión de ruidos.199
La dedicación de Von Neumann al tema de las computadoras y el cerebro
aparece también en un librito que recoge las conferencias Silliman que debería
haber pronunciado en la Universidad de Yale, pero que no pudo llegar a pronun-
ciar, aunque sí dejó preparado el manuscrito, publicado después de su fallecimien-
to con el título de The Computer and the Brain (Yale University Press, New Haven,
1958). En él intentaba utilizar el conocimiento del sistema nervioso humano para
elaborar una teoría cibernética general que produjese una tecnología de computa-
doras cada vez más potente. En los primeros párrafos explicaba lo que pretendía:200
Puesto que no soy ni neurólogo ni psiquiatra sino matemático, el siguiente trabajo

requiere ser explicado y justificado. Es una aproximación al entendimiento del sistema
197
Von Neumann, El cerebro y el ordenador, op. cit., pp. 84-85.
198
John von Neumann, «Probabilistic logics and the synthesis of reliable organisms from un-
reliable components», en Claude Shannon y John McCarthy, eds., Automata Studies (Princeton
University Press, Princeton, 1956), pp. 43-98.
199
Más información en Paul J. Nahin, The Logician and the Engineer. How George Boole and
Claude Shannon Created the Information Age (Princeton University Press, Princeton, 2013). Véanse,
en especial las pp. 106-110, donde se trata del artículo de Von Neumann.
200
Von Neumann, El ordenador y el cerebro, op. cit., p. 33.
114
Fund_MAT_00c.indd 114 3/5/18 16:13

nervioso desde el punto de vista del matemático. Sin embargo, esta frase, apenas enun-
ciada, debe ser matizada en dos puntos esenciales.
En primer lugar, describir lo que voy a intentar hacer aquí como una «aproximación
al entendimiento» es sobrevalorar mi trabajo; lo único que hago es recoger un conjunto
algo sistemático de especulaciones sobre cómo debería hacerse tal aproximación. Es
decir, mi idea es intuir, entre las líneas de acción a las que guía la matemática, cuáles
parecen a priori prometedoras, desde la distancia confusa en que las vemos casi todas, y
cuáles no. Ofreceré también justificaciones de estas hipótesis.
En segundo lugar, la expresión «el punto de vista del matemático», tal como quisie-
ra que se entendiese en este contexto, enfatiza aspectos poco habituales: en vez de insis-
tir sobre las técnicas matemáticas más generales, se quieren resaltar los aspectos lógicos
y estadísticos de la matemática. Además, la lógica y la estadística deben ser consideradas
principal, aunque no exclusivamente, como los instrumentos básicos de la «teoría de la
información». Asimismo, el cuerpo de conocimientos experimentales que se ha desarro-
llado alrededor de la planificación, evaluación y codificación de complicados autómatas
lógicos y matemáticos, será el foco de gran parte de esta teoría de la información. Los
más típicos de esos autómatas, pero no los únicos, siguen siendo sin duda los grandes
calculadores electrónicos.
De los muchos puntos interesantes de esta obra, me limitaré a señalar dos. El

primero trata de qué tipo de autómata es el sistema nervioso:201
Estas observaciones muestran que el sistema nervioso, cuando se le considera como

un autómata, debe tener tanto una parte aritmética como una parte lógica, y que las
necesidades de aritmética son tan importantes como las de lógica. Esto significa que es-
tamos de nuevo tratando con una máquina de calcular en el sentido estricto y que re-
sulta apropiado un análisis en términos de los conceptos familiares en la teoría de las
máquinas de calcular.
A la vista de esto, se plantea inmediatamente la siguiente cuestión: cuándo se con-
sidera el sistema nervioso como una máquina de calcular y con qué precisión debe es-
perarse que funcione la parte aritmética».
El segundo punto, con el que de hecho terminaba el libro, se dedicaba al

lenguaje:202
Avanzar más en este tema nos lleva necesariamente a cuestiones de lenguaje. Como
hemos indicado, el sistema nervioso se basa en dos tipos de comunicaciones: aquellas
que no implican formulaciones aritméticas, y aquellas que sí lo hacen, es decir, comu-
nicaciones de órdenes (de tipo lógico) y comunicaciones de números (de tipo aritméti-
co). El primero puede ser descrito propiamente como un lenguaje, el segundo entra
plenamente en el campo de las matemáticas.
Resulta obligado darse cuenta de que el lenguaje es, en gran medida, un accidente
histórico. Los lenguajes humanos básicos nos son transmitidos tradicionalmente de va-
201
Ibidem, pp. 82-83. Aunque no desarrollaré este punto, es obligado mencionar que el único
nombre propio que citaba Von Neumann en este libro era el de Alan Turing.
202
Ibidem, pp. 86-87.
115
Fund_MAT_00c.indd 115 3/5/18 16:13

rias maneras, pero su gran variedad prueba que no hay en ellos nada de absoluto y de
necesario. Idiomas como el griego y el sánscrito son realidades históricas y no necesida-
des lógicas. Por ello, es razonable suponer que la lógica y las matemáticas son, tanto una
como otra, formas históricas accidentales de expresión. Pueden tener variantes esenciales,
es decir, pueden existir en formas distintas de aquellas a las que estamos acostumbrados.
Desde luego, la naturaleza del sistema nervioso central y del sistema de mensajes que
éste transmite indica positivamente que así es. Hemos acumulado ya evidencia suficien-
te para darnos cuenta de que cualquiera que sea el lenguaje que el sistema nervioso
central utilice, éste se caracteriza por una profundidad lógica y aritmética menor que la
que nos es habitual […] Así, la lógica y las matemáticas en el sistema nervioso central,
cuando se las considera como lenguajes, deben ser estructuralmente distintas de aquellos
lenguajes a los que se refiere nuestra experiencia corriente.
Final
Aunque su obra fue monumental, tanto en tamaño como en variedad, John
von Neumann no vivió demasiado: poco más de cincuenta y tres años (casi lo
mismo que otro gigante de la ciencia, Enrico Fermi). Su esposa, Klara, dejó testi-
monio de sus últimos meses; es mejor utilizar sus palabras:203
El 15 de marzo de 1955, Johnny prestó juramento como miembro de la Comisión

de Energía Atómica, y en los primeros días de mayo nos instalamos en Washington. Tres
meses más tarde, en agosto, nuestra activa e interesante vida, centrada alrededor de la
extraordinaria e infatigable mente de mi marido, experimentó una brusca interrupción;
Johnny se quejaba de grandes dolores en su hombro izquierdo y, después de una inter-
vención quirúrgica, le fue diagnosticado un cáncer.204
Aun así, continuó trabajando —terminó asistiendo a reuniones en una silla de

ruedas—, pero, continuaba Klara, «a primeros de abril [1956] Johnny ingresó en
el Hospital Walter Reed; nunca salió de él hasta su muerte el 8 de febrero de
1957».205
203
Klara von Neumann, «Prefacio», en J. von Neumann, El ordenador y el cerebro, op. cit.,
pp. 27-31.
204
Parece ser, aunque ignoro si se ha confirmado, que el cáncer fue consecuencia de la irradia-
ción que sufrió durante pruebas de bombas atómicas.
205
Poco antes de verse obligado a ingresar en el hospital, Von Neumann pensó en abandonar
el Instituto de Princeton, debido a que las facilidades materiales que encontraba allí para avanzar en
la construcción de computadoras más potentes no eran de su agrado. Evidencia en este sentido es
una carta que envió el 24 de febrero de 1956 a James R. Killian, Jr., presidente del MIT: «La última
vez que tuve el placer de reunirme con usted y el Dr. Stratton en el Cosmos Club y subsiguiente-
mente, con relación al mismo asunto, con Mr. Melvin Kelly en mi despacho, usted me ofreció una
“Institute Professorship” en el Massachusetts Institute of Technology, con un salario anual de 20.000 $
y con lo que entendí que eran privilegios de tal puesto, esto es, obligaciones docentes no fijadas, no
afiliación departamental fija, sino responsabilidad general para el tema que representan mis intereses.
Dejamos nuestras negociaciones completamente abiertas entonces. Ahora querría decirle que estoy
considerando esta oferta muy seriamente. Deseo tomar una decisión sobre mi situación futura y su
oferta figura, por supuesto, de manera muy importante en mis decisiones. Por supuesto, actualmen-
116
Fund_MAT_00c.indd 116 3/5/18 16:13

Su última aparición pública fue a comienzos de 1956, cuando el presidente

Eisenhower le entregó el premio Enrico Fermi. Fue el primero en recibirlo. Y las
fotografías que nos han llegado del acto le muestran sentado en una silla de ruedas.
En la notificación se señalaba que se le concedía, «por su contribución científica a
la teoría de máquinas computadoras rápidas y por sus originales contribuciones a su
diseño y construcción. Más que ninguna otra persona, él previó el importante y
necesario papel que desempeñarían en el control y utilización de la energía atómi-
ca y en el avance general de las artes y las ciencias en beneficio de la humanidad».
Eisenhower entrega el Premio Fermi a Von Neumann (febrero de 1956).
te soy un miembro de la U.S. Atomic Energy Commission y cualquier plan que pueda tener de
abandonar el servicio gubernamental debe ser estrictamente confidencial. No obstante, en orden a
clarificar completamente nuestras ideas, quiero decirle —solamente para propósitos de planifica-
ción— que si fuese al Instituto estaría pensando en la fecha del 1 de enero de 1957 para el cambio
de mi estatus». A continuación, establecía una serie de condiciones, relativas a pensión, seguros
médicos, disponibilidades para disponer de lo necesario en el desarrollo de computadoras, así como
si dispondría de permiso para continuar con sus labores de asesoramiento tanto para el Gobierno
como para industrias. Tales planes, que le habrían llevado de Princeton al Cambridge de Massachu-
setts, no se pudieron llevar a cabo debido a su fallecimiento. M. Rédei, ed., John von Neumann:
Selected Letters, op. cit., pp. 165-166.
117
Fund_MAT_00c.indd 117 3/5/18 16:13

Su viejo amigo y compatriota Eugene Wigner escribió que «cuando Von Neu-
mann se dio cuenta de que estaba incurablemente enfermo, su lógica le forzó a
concluir que él dejaría de existir y por consiguiente de tener pensamientos. Sin
embargo, esta es una conclusión cuyo contenido completo es incomprensible para
el intelecto humano y que, por consiguiente, le horrorizó. Rompía el corazón ver
la frustración de su mente, cuando desapareció toda esperanza, en su lucha con el
destino que se le aparecía como inevitable e inaceptable».206
Falleció el 8 de febrero de 1957. Con él desapareció una de las mentes más
poderosas, originales e interdisciplinares de que tiene constancia la ciencia.
206
Wigner, «John von Neumann (1903-1957)», op. cit., p. 130.
118
Fund_MAT_00c.indd 118 3/5/18 16:13

FUNDAMENTOS MATEMÁTICOS
DE LA MECÁNICA CUÁNTICA
Fund_MAT_01.indd 119 3/5/18 16:26

Fund_MAT_01.indd 120 3/5/18 16:26
Introducción
El objeto de este libro es la exposición unificada y matemáticamente correcta,

hasta donde ello sea posible y oportuno, de la nueva Mecánica cuántica, la cual,
en el curso de los últimos años, ha logrado una forma probablemente definitiva
en sus partes esenciales: la llamada teoría de las transformaciones. El peso capital
gravita en él sobre los problemas generales y de principio que han surgido a pro-
pósito de esta teoría y así se investigan en detalle especialmente las difíciles cues-
tiones de interpretación, aun a menudo no del todo dilucidadas. En particular, es
considerable en este aspecto la transcendencia de la relación de la Mecánica cuán-
tica con la Estadística y la Mecánica estadística clásica. Por el contrario, nos abs-
tendremos casi constantemente de examinar las aplicaciones de los métodos cuán-
ticos a los problemas particulares, como también de exponer las teorías más
especiales que derivan de la general —por lo menos hasta donde quepa sin que
peligre la comprensión de las relaciones generales. Esto parece tanto más indicado
cuanto que, tocante a esos puntos, existen ya o se encuentran en curso de publi-
cación varios y excelentes trabajos.1
Se exponen, por otro lado, los recursos matemáticos necesarios para los fines
teoréticos de la nueva Mecánica, a saber: la teoría del espacio de Hilbert y de sus
operadores hermíticos. Para ello es indispensable abordar asimismo el estudio de
los operadores no acotados, o sea, ampliar la teoría más allá de los límites clásicos
establecidos por Hilbert y E. Hellinger, F. Riesz, E. Schmidt y O. Toeplitz.
En orden al método seguido en este punto hay que advertir que, por regla general,
los cálculos se efectúan con los propios operadores (que representan las magnitudes
físicas) y no con las matrices, las cuales resultan de estos justamente tras la intro-
ducción de un sistema de coordenadas (particular y arbitrario) en el espacio de
Hilbert. Esta manera de proceder con independencia de las coordenadas, es decir,
con carácter invariante, fuertemente orientada hacia lo geométrico, trae consigo
importantes ventajas formales.
Dirac, en diferentes memorias y en su libro aparecido recientemente,2 ha ex-
puesto la Mecánica cuántica siguiendo un método apenas superable en brevedad
y elegancia, que presenta también el carácter invariante. De ahí que quizá sea
oportuno aducir aquí algunos argumentos en favor del nuestro, el cual difiere
esencialmente del que acabamos de mencionar.
El método de Dirac, seguido hoy por su claridad y elegancia en gran parte de
la literatura relativa a la Mecánica cuántica, no cumple en modo alguno con las
exigencias del rigor matemático, ni aun cuando, por ser justos, se reducen estas a
la medida por lo demás habitual en la Física teórica. Así, por ejemplo, mantiene
constantemente la ficción de que todo operador autoadjunto puede reducirse a la
forma diagonal, por donde aquellos operadores en los que de hecho ello no es
posible hacen indispensable la introducción de funciones ((impropias» que mues-
tran propiedades intrínsecamente contradictorias. Ese introducir entes matemáti-
cos ((ficticios» es eventualmente inevitable incluso cuando solo se trata de calcular
121
Fund_MAT_01.indd 121 3/5/18 16:26

numéricamente el resultado de un experimento concretamente definido. No cabría

esgrimir esto como objeción si estas estructuras conceptuales, que no se ajustan al
marco actual del Análisis, fuesen realmente esenciales para la nueva teoría física.
De la misma manera que la Mecánica newtoniana en parte motivó la aparición
del cálculo infinitesimal, intrínsecamente contradictorio, sin duda alguna, en su
forma primitiva, la Mecánica cuántica sugeriría, quizá, una nueva estructuración
de nuestro «Análisis de infinitas variables»; es decir, debiera modificarse el aparato
matemático, no la teoría física. Pero, de hecho, no es este el caso, antes bien de-
mostraremos que es posible fundamentar la teoría de las transformaciones de ma-
nera tan clara y armónica como en el método de Dirac y, además, por modo
matemáticamente irreprochable. Tocante a este punto hay que subrayar que la
estructuración correcta no consiste, por ejemplo, en una mera puntualización y
explicación matemáticas del método de Dirac, sino que requiere desde un princi-
pio una manera de proceder diferente, a saber, el enlace con la teoría espectral de
los operadores debida a Hilbert.
En el análisis de los principios fundamentales se demuestra, en particular,
cómo las fórmulas estadísticas de la Mecánica cuántica pueden deducirse de algu-
nas hipótesis cualitativas fundamentales. Se discute, además, con todo detalle la
cuestión de si es posible reducir el carácter estadístico de la Mecánica cuántica a
un aspecto equívoco, esto es, incompleto, de nuestra descripción de la Naturaleza:
esta explicación estaría exactamente de acuerdo con el principio general según el
cual todo enunciado probabilístico nace de la no integridad de nuestros conoci-
mientos. Repetidas veces ha sido propuesta esta explicación que recurre a «pará-
metros ocultos», al igual que otra, afín con ella, que atribuye los «parámetros
ocultos» al observador y no al sistema observado. Con todo, demuéstrase que di-
fícilmente se puede esto conseguir de modo satisfactorio; más exactamente: una
tal explicación es incompatible con ciertos postulados fundamentales de la Mecá-
nica cuántica.3
Consideraremos también la relación de esta estadística con la Termodinámica.
Una investigación a fondo prueba que aquí pueden zanjarse las dificultades, de
todos conocidas por la Mecánica clásica, ligadas a las «hipótesis de desorden» que
son necesarias para el establecimiento de la Termodinámica.
122
Fund_MAT_01.indd 122 3/5/18 16:26

I
Consideraciones preliminares
1. La génesis de la teoría de las transformaciones

No cabe aquí señalar los grandes éxitos que en el curso de los años desde 1900
hasta 1925 ha alcanzado la teoría de los quanta, cuya evolución se ha visto presi-
dida por los nombres de Planck, Einstein y Bohr.5 Al acabar este desarrollo
quedó fijado, poco menos que incontestablemente, que todos los procesos elemen-
tales, es decir, todo lo que ocurre en la escala atómico-molecular, están regidos por
las leyes «discontinuas» de los quanta. En casi todos los campos aparecieron mé-
todos cuantitativos basados en la teoría cuántica que las más de las veces propor-
cionaban resultados coincidentes con la experiencia o bien o de modo aceptable.
Y lo que era fundamentalmente de gran significación: en el mundo conceptual de
la investigación físico-teorética había ingresado la idea de que el principio de con-
tinuidad (el natura non facit saltus) que rige el mundo macroscópico percibido, es
una apariencia resultante de promediar en un mundo que, en su esencia, es dis-
continuo; de que es algo debido a que el percibir el hombre en la mayoría de los
casos solo la suma de muchos cuatrillones de procesos elementales y esto de una
vez provoca la intervención de la ley niveladora de los grandes números, la cual
encubre por completo la verdadera naturaleza de los procesos individuales.
Sin embargo, en dicho tiempo, no existía ninguna construcción físico-mate-
mática de la teoría cuántica que hubiese englobado en un todo único lo hasta
entonces conocido, ni mucho menos una que hubiera podido ofrecer el carácter
de unidad monumental (roto por los fenómenos cuánticos) del sistema Mecánica-
Electrodinámica-teoría de la Relatividad. A pesar del derecho evidentemente jus-
tificado de la teoría de los quanta a la universalidad, faltaba el aparato formal y
conceptual para ello necesario, pues era por aquel entonces una maraña de difícil
deshacer de principios esencialmente distintos, independientes, heterogéneos y, en
parte, contradictorios entre sí. Los puntos más chocantes eran los siguientes: el
principio de correspondencia, que en parte se ajustaba a la Mecánica clásica y a la
Electrodinámica (si bien desempeñó un papel decisivo en la explicación última de
los hechos), la en sí contradictoria duplicidad de la naturaleza de la luz (ondas y
corpúsculos, cf. Nota 5 y Nota 148) y, finalmente, la existencia de movimientos
no cuantificados (aperiódicos) y cuantificados (periódicos o bien multiperiódicos).6
El año 1925 trajo la solución. Un principio sentado por Heisenberg pudo ser
desarrollado por Born, Heisenberg, Jordán y poco después por Dirac hasta
constituir un nuevo sistema de la teoría cuántica, hasta la primera construcción
sistemática acabada que ha poseído la Física en este orden de ideas. Algo más tar-
de descubrió Schrödinger, partiendo de un punto completamente distinto, la
«Mecánica ondulatoria» que logró el mismo resultado y pronto se mostró equiva-
lente al sistema de Heisenberg-Born-Jordan y Dirac,7 por lo menos en sentido
matemático (cf. I.3,4). Ambas teorías pudieron ser sintetizadas en una sola, la
123
Fund_MAT_01.indd 123 3/5/18 16:26

«teoría de las transformaciones», por Dirac y Jordán, tomando como base la in-
terpretación estadística que dio Born de la descripción de la Naturaleza desde el
punto de vista de la teoría de los quanta. En dicha teoría se unen aquellas dos,
completándose y haciendo posible un dominio de las cuestiones físicas particular-
mente simple desde el punto de vista matemático.
Debemos decir todavía, aunque ello no pertenece ya a nuestro tema, que aho-
ra, después que Goudsmit y Uhlenbeck hubieron descubierto el momento mag-
nético y de rotación del electrón, desaparecieron casi todas las dificultades de la
primitiva teoría cuántica, de modo que hoy nos encontramos en posesión de una
teoría mecánica punto menos que totalmente satisfactoria. Verdad es que la unidad
a que aludíamos con la Electrodinámica y la teoría de la Relatividad no se ha vuel-
to a conseguir; pero por lo menos existe una Mecánica de validez general en la que
se encuadran, con evidente necesidad, las regularidades que se dan en lo cuántico
y encuentran explicación satisfactoria la mayor parte de nuestras experiencias.10
2. Métodos y fórmulas primeros

de la Mecánica cuántica
Para conseguir una orientación provisional, expondremos sucintamente cómo
se plantean los problemas en la «Mecánica de las matrices» de Heisenberg-Born-
Jordan y cómo en la «Mecánica ondulatoria» de Schrödinger.
En ambas teorías se plantea, en primer lugar, un problema de Mecánica clási-
ca caracterizado por una función de Hamilton
H (q1, …, qk; p1 …, pk).
(Como es sabido y se encuentra puntualizado en los tratados de Mecánica, esto

último significa lo siguiente: Sea k el número de grados de libertad del sistema que
se considera, es decir, su estado queda fijado cuando se dan los valores numéricos
de las k coordenadas q1, …, qk. La energía del mismo es una función conocida de
las coordenadas y de sus derivadas respecto del tiempo:
E = L (q1, …, qk; q·1 …, q·k)
función en general cuadrática respecto de las derivadas q·1, …, q·k. Mediante las
fórmulas
∂L ∂L
p1 = · , …, pk = ·
∂q1 ∂qk
se introducen los «impulsos conjugados», p1, …, pk, de las coordenadas q1, …, qk,
los cuales, en la hipótesis que hemos hecho acerca de L, dependen linealmente de
las q·1, …, q·k. En todo caso podemos eliminar de L las q·1, …, q·k al expresar estas
en función de las p1, …, pk, con lo que queda
124
Fund_MAT_01.indd 124 3/5/18 16:26

E = L (q1, …, qk; q·1, …, q·k) = H (q1, …, qk, p1, …, pk).
Esta H es la función de Hamilton.) Tanto en una como en otra teoría se persigue

llegar a saber lo más posible acerca del comportamiento efectivo de dicho sistema,
esto es, el comportamiento desde el punto de vista cuántico,11 y ello a partir de la
función de Hamilton. En primer lugar, por consiguiente, se proponen determinar
los niveles de energía posibles, luego llegar a conocer los correspondientes «estados
estacionarios», calcular sus «probabilidades de transición», etcétera.12
El método que da la teoría de las matrices para la resolución de este problema
es el siguiente: se determina un sistema de 2k matrices Q1, …, Qk, P1, …, Pk 13
que, primero, satisfagan las relaciones
QmQn QnQm = 0 Pm Pn Pn Pm = 0
0 para m n,
(m, n = 1, …, k)
PmQn Qn Pm = h
1 para m = n,
2 i
y, segundo, tales que la matriz W = H (Q1, …, Qk; P1, …, Pk) sea una matriz dia-
gonal. (No entraremos en pormenores acerca del origen de estas ecuaciones, en
particular del primer grupo, las llamadas «relaciones de permutación», que rigen
todo el cálculo de matrices no-conmutativo de esta teoría. La constante h que
aparece en ellas, es el quantum de acción de Planck. Sobre el particular encontra-
rá el lector una información completa en las obras citadas en la Nota 1.) Los ele-
mentos diagonales de W, w1, w2, …, son entonces los diferentes niveles de energía
del sistema posibles. Los elementos de las matrices Q1, …, Qk —q(1) (k)
mn, …, q mn—
determinan en cierto modo las probabilidades de transición del mismo, desde el
estado m-simo de energía wm, p. e., al n-simo estado de energía wn, (wm > wn) y la
correspondiente radiación emitida.
Hay que hacer notar que la matriz
W = H (Q1, …, Qk, P1, …, Pk)
no queda determinada sin más por Q1, …, Qk, P1, …, Pk y la función de Hamil-
ton de la mecánica clásica H (q l, …, qk, p1, …, pk), pues las Q1 y Pl no son todas
permutables entre sí en la multiplicación, mientras que, desde el punto de vista
de la Mecánica clásica, carecería en absoluto de sentido el distinguir, por ejemplo,
entre un término pl ql y un término ql pl . Por consiguiente, por cima del sentido
clásico de la expresión H, debemos fijar en ella el orden de los factores ql y pl en
cada uno de sus términos. No se ha establecido en toda su generalidad el criterio
a seguir en un caso cualquiera, pero sí se conoce la disposición adecuada en los
más importantes casos particulares. (En el supuesto de que el sistema que se estu-
dia conste de ν partículas y, por lo tanto, para k = 3ν coordenadas q1 …, q3ν —de
modo que q3μ – 2, q3μ – 1, q3μ son las coordenadas cartesianas de la μ-ésima partícu-
125
Fund_MAT_01.indd 125 3/5/18 16:26

la y μ = 1, 2, …, ν—, si, además, la interacción de estas partículas está represen-

tada por una energía potencial V (q1, …, q3ν), no cabe, en efecto, duda ninguna
de aquella clase. La función de Hamilton clásica es entonces:
ν
1
H (q1, …, q3ν , p1, …, p3ν ) = ∑ (p32µ −2 + p32µ −1 + p32µ ) + V (q1, …, q3ν ),
µ =1 2mµ
donde mμ es la masa de la μ-ésima partícula y p3μ – 2, p3μ – 1, p3μ sus impulsos. Está
perfectamente claro lo que significa esta expresión tras haber sustituido las p y las q
por las matrices Q1, …, Q3ν, P1, …, P3ν. En particular, el término V no puede dar
lugar a ninguna dificultad, pues todas las Q1, …, Q3ν son permutables entre sí.) Es
esencial que se introduzcan exclusivamente matrices hermíticas, esto es, matrices
A = {am n} tales que para sus elementos valgan las igualdades am n = a–n m (¡los elemen-
tos am n pueden ser números complejos !). Luego H (Q1, …, Qk, P1, …, Pk) debe
ser hermítica, si todas las matrices Q1, …, Qk, P1, …, Pk lo son. Esto involucra una
cierta limitación en la cuestión a que aludíamos acerca del orden de sucesión de
los factores, aunque no suficientemente restrictiva como para determinar unívoca-
mente H (Q1, …, Qk; P1, …, Pk) a partir de la H (q1, …, qk; p1, …, pk) clásica.14
Frente a lo que precede, la norma que ofrece la Mecánica ondulatoria se expre-
sa como sigue: Se forma primero la función de Hamilton, H (q1, …, qk; p1, …, pk)
y luego se establece la ecuación diferencial
⎛ h ∂ h ∂ ⎞
H ⎜ q1, …, qk , , …, ψ (q1, …, qk ) = λψ (q1, …, qk ),
⎝ 2π i ∂q1 2π i ∂qk ⎟⎠
en la que ψ (q1, …, qk) es una función definida en el espacio de los los estados del
sistema (¡y no en el espacio de las fases!, es decir, entre los argumentos de ψ no
⎛ h ∂ h ∂ ⎞
deben figurar las pi, …, pk). En esta ecuación, H ⎜ q1, …, qk , , …,
⎝ 2π i ∂q1 2π i ∂qk ⎟⎠
se concibe como operación funcional de significado fácilmente comprensible. Por
ejemplo, en el caso antes citado
ν
1
H (q1, …, q3ν , p1 …, p3ν ) = ∑ (p32µ −2 + p32µ −1 + p32µ ) + V (q1, …, q3ν ),
µ =1 2mµ
⎛ h ∂ h ∂ ⎞
la expresión H ⎜ q1, …, q3ν , , …, transforma ψ (q1, …, q3ν) en
⎝ 2π i ∂q1 2π i ∂q3ν ⎟⎠
2
ν
1 h ⎛ ∂2ψ ∂2ψ ∂2ψ ⎞
∑ 2m ⎛⎝ 2π i ⎞⎠ ⎜ ∂q 2 + ∂q 2 + ∂q 2 ⎟ + V ψ .
µ =1 µ ⎝ 3 µ −2 3 µ −1 3µ ⎠
126
Fund_MAT_01.indd 126 3/5/18 16:26

(En V y en ψ no hemos puesto de manifiesto las variables (q1, …, q3ν). Ya que

h ∂ h ∂
la operación q1 es diferente de la operación q ,15 subsiste aquí
2 π i ∂q1 2 π i ∂q1 1
aquella incertidumbre acerca de cómo deben sucederse los factores qm y pn en
H (q1, …, qk; p1, …, pk) —pero Schrödinger demostró que puede zanjarse esta
indeterminación acudiendo a un cierto principio de variación del que se origina
una ecuación diferencial autoadjunta.16
Esta ecuación diferencial (la «ecuación de las ondas») posee todo el carácter de
un problema de valores propios al concebir el parámetro λ como parámetro de va-
lores propios y al imponer a la función ψ (q1, …, qk) la anulación en el contorno
del espacio de los estados (el espacio de las q1, …, qk), por ejemplo, aparte de la
regularidad y la univocidad en él (función propia). Para la teoría ondulatoria, los
valores propios de λ (tanto en el caso de un espectro discreto, como en el de es-
pectro continuo17) son los niveles de energía posibles y las correspondientes fun-
ciones propias ψ (¡complejas!) se hallan en conexión con los estados estacionarios
del sistema (en el sentido de Bohr). Así, en un sistema de electrones (k = 3ν,
cf. más arriba; e es la carga del electrón), la densidad de carga del μ-ésimo electrón
medida en el punto x, y, z, electrón que, según Schrödinger, debe concebirse
como «untado» por todo el espacio x, y, z (= q3μ – 2, q3μ – 1, q3μ), está dada por la
siguiente expresión:
3 3
2
e … (q1, …, q3 µ 3, x, y, z, q3 µ +1, …, q3 dq1… dq3 µ 3 dq3 µ +1 … dq3
(Para que resulte la carga total e, ψ debe normalizarse de modo que quede satis-
fecha la condición
3
2
… (q1, …, q3 ) dq1… dq3 = 1
[¡La integración se efectúa sobre todas las 3ν variables!] Para cada μ = 1, …, ν se

obtiene la misma ecuación.)
Además, la mecánica ondulatoria está en condiciones de decirnos algo acerca
de los sistemas que no se hallan en uno de los estados estacionarios de Bohr18.
Cuando el estado no es estacionario, es decir, cambia con el tiempo, la función de
onda ψ contiene el tiempo t, ψ = ψ (q1, …, qk; t), y evoluciona de acuerdo con la
ecuación
⎛ h ∂ h ∂ ⎞ h ∂ 19
−H ⎜ q1, …, qk , , …, ⎟ ψ (q1, …, qk ; t) = ψ (q1, …, qk ; t)
⎝ 2π i ∂q 1 2π i ∂qk⎠ 2π i ∂t
127
Fund_MAT_01.indd 127 3/5/18 16:26

de modo que puede prefijarse arbitrariamente su valor en todo el espacio (q) para
t = t0 y con ello está unívocamente determinada para todo t. En rigor, conforme
muestra la comparación de las dos ecuaciones de Schrödinger, también las ψ
estacionarias son funciones de t, solo que en ellas la dependencia de t toma la
forma
2π i
− λt
ψ (q1, …, qk ; t) = e h ψ (q1, …, qk ; 0).
El tiempo aparece, pues, solo en un factor que es independiente de q1, …, qk (el

mismo, en un instante dado, en todo el espacio de los estados) y de valor absolu-
to igual a la unidad, con lo que su presencia no altera, por ejemplo, la distribución
de la densidad de carga que hemos definido más arriba. (Supondremos ya en ge-
neral que un factor independiente de las variables espaciales y de valor absoluto
igual a la unidad contenido en ψ, es fundamentalmente inobservable, conjetura
que se verá confirmada por detenidas consideraciones ulteriores.)
Dado que las funciones propias de la primera ecuación diferencial constituyen
un sistema ortogonal completo20, podemos desarrollar cada ψ = ψ (q1, …, qk) en
serie de tales funciones. Sean ψ1, ψ2, … las funciones propias (¡todas ellas inde-
pendientes del tiempo!), λ1, λ2, …, respectivamente, sus valores propios; el desa-
rrollo de ψ es
∞
ψ (q1, …, qk ) = ∑ anψ n (q1, …, qk ).21
n =1
Los coeficientes an son constantes numéricas, si ψ es independiente de t; pero si

entre las variables de que depende ψ figura el tiempo, este aparece en los coeficien-
tes an. (Por el contrario, las funciones propias ψ1, ψ2, … deben ser independientes
de él, tanto aquí como siempre en lo que sigue.) Si, pues, ψ = ψ (q1, …, qk) es, en
realidad, ψ (q1, …, qk; t0) de la segunda ecuación diferencial se sigue, atendiendo
∞
a que ψ = ψ (q1, …, qk ; t) = ∑ an (t)ψ n ,
n =1
∞ ∞
Hψ = ∑ an (t)H ψ n = ∑ λn an (t)ψ n,
n =1 n =1
h ∂ψ ∞
h
=∑ a!n (t)ψ n,
2π i ∂t n =1 π i
2
y comparando coeficientes, que

2π i
h − λn t
a!n (t) = − λn an (t), an (t) = cne h
2π i
128
Fund_MAT_01.indd 128 3/5/18 16:26

es decir,
2π i 2π i
− λn (t −t0) − λn (t −t0)
an (t) = e h an (t0 ) = e h an,
∞ 2π i
− λn (t −t0)
ψ = ψ (q1, …, qk ; t) = ∑ e h anψ n (q1, …, qk ).
n =1
Por consiguiente, cuando ψ; no es estacionaria, esto es, cuando no son nulos todos
los coeficientes an salvo uno, ya no varía ψ con el tiempo simplemente a través de
un factor espacialmente constante (espacio de los estados) de valor absoluto uni-
dad, de donde se sigue que cambiarán con el tiempo, en general, las densidades
de carga antes definidas, o sea, en el espacio x, y, z tendrán lugar verdaderas osci-
laciones eléctricas.22
Como se ve, la estructura conceptual adoptada y las normas prácticas se ex-
presan de modo bastante diferente en la teoría de las matrices y en la ondulatoria-
Sin embargo, ya desde un principio proporcionaron siempre los mismos resulta-
dos, incluso en aquellos puntos donde una y otro hacían patentes detalles que
discrepaban de las primitivas concepciones de la teoría cuántica.23 Este notable
hecho quedó explicado desde luego por la demostración que de su equivalencia
matemática dio Schrödinger, demostración a que se aludió en I, 1.24 Nuestro
objeto va a ser ahora precisamente la demostración de esta equivalencia, a la vez
que expondremos la teoría de las transformaciones general de Dirac-Jordan que
comprende a ambas teorías.
3. Equivalencia de las dos teorías: la teoría

de las transformaciones
El problema fundamental de la teoría de las matrices era determinar las ma-
trices Q1, …, Qk, P1, …, Pk de forma que, primero, quedaran satisfechas las rela-
ciones de permutación (I, 2, pág. 7) y, segundo, una cierta función de las mismas,
H(Q1, …, Qk; P1, …, Pk), resultase ser una matriz diagonal. Born y Jordán, ya
en su primera publicación, dividieron el problema en dos partes del siguiente
modo: – – –
– En primer lugar se procuraba hallar matrices cualesquiera Q1, …, Qk; P 1, …,
P k que solo debían satisfacer las relaciones de permutación, lo que se conseguía
fácilmente.25 La matriz
– – – – –
H = H (Q1, …, Qk, P 1, …, P k)
no resultaba ser, por regla general, una matriz diagonal. Acto seguido se disponían
las soluciones correctas en la forma
– – – –
Q1 = S –1Q1 S, …, Qk = S –1Qk S, P1 = S –1P 1 S, …, Pk = S –1P k S,
129
Fund_MAT_01.indd 129 3/5/18 16:26

donde S podía ser una matriz cualquiera, sujeta, de todos modos, a poseer una
inversa S –1, tal que– S –1 S =–S S ––1 = 1.–Puesto que de la validez de las relaciones de
permutación para Q1, …, Qk, P1, …, Pk –se sigue –la validez– para – Q1 …,– Qk, P1, …, Pk
(¡cualquiera que sea S !), y puesto que H = H (Q1, …, Qk; P 1, …, P k) se transfor-
ma en
H = H (Q1 …, Qk, P1, …, Pk),

– –
siendo H = S –1– H S,26 hay que exigir de S tan solo que S –1 H S sea una matriz dia-
gonal, donde H es una matriz dada. (Realmente– debería cuidarse de que S –1 Q1 S,
etc., resultasen hermíticas, como lo eran Q1, etc. De todos modos, al examinar la
cosa más de cerca se echa de ver que siempre podemos satisfacer luego a esta ul-
terior condición impuesta a S, y es este el motivo de que no la tomemos en cuen-
ta en esta consideración preliminar.) –
Basta así transformar
– una matriz H dada en una matriz diagonal de acuerdo
con el esquema S –1 H S. Veamos exactamente– qué significa esto.
Sean hμν los elementos de la matriz H, sμν los de la matriz incógnita S, wμ los
elementos diagonales de la matriz diagonal H –igualmente desconocida, esto–es,
wμ δμν los elementos de esta.27 Decir que H = S –1 H S, equivale a decir que S H = H S,
y si igualamos entre sí los correspondientes elementos de ambos miembros, elemen-
tos determinados según las conocidas reglas de la multiplicación de matrices, esto
a su vez significa que
∑ sμν · wν δνρ = ∑ hμν sμρ,

ν ν
o sea
∑ hμν snρ = wρ · sμρ.
ν
Cada una de las columnas s1ρ, s2ρ, … de la matriz S (ρ = l, 2, …) y los correspon-
dientes elementos diagonales wρ de la matriz H son soluciones, por consiguiente,
del llamado problema de valores propios, que reza así: determinar xμ (μ = 1, 2, …)
y λ, tales que
∑ hμν xν = λ xμ, (μ = 1, 2. …)
ν
(Hay que excluir, naturalmente, la solución trivial x1 = x2 = … = 0.) En efecto,

xν − sνρ, λ = wρ es una solución. (No cabe que sea en este caso, xν ≡ 0, es decir,
sνρ ≡ 0 [para todo ν], pues entonces se anularía idénticamente la ρ-ésima columna
de S, ¡a pesar de poseer S una inversa S –1!) Y es lo notable que estas son, en esen-
cia, las únicas soluciones.
En efecto: la ecuación
– anterior nos dice que transformar el vector x = {x1, x2, …}
mediante la matriz H equivale a multiplicarlo por el número λ. Sea y = y1, y2, …}
130
Fund_MAT_01.indd 130 3/5/18 16:26

el vector
– que origina la aplicación de S –1 a x–= {x1, x2, …}, – Transformar y median-
te H es transformar x mediante H S –1 = S –1
H S S –1 = S –1 H, esto es, λx con S –1. El
–
resultado es, pues, λy. Ahora bien, Hy posee las componentes ∑ wμ δμν · yν = wμ yμ
ν
y λy las componentes λyμ. Luego debe ser wμ yμ = λyμ para μ, = 1, 2, …, o sea,
yμ = 0 siempre que wμ ≠ λ. Representemos con η un vector cuya ρ-ésima com-
ρ
ponente sea igual a 1 y todas las demás cero. El resultado anterior puede formu-
larse diciendo que el vector y es una combinación lineal de aquellos η ρ cuyos
superíndices coinciden con los subíndices de las wρ tales que wρ = λ, en particular
nulo cuando esto no ocurre para ningún valor de ρ. Y como x resulta de aplicar
S a y, x es una combinación lineal de los transformados de dichos η ρ mediante S.
La ρ-ésima componente de Sη ρ es ∑ sμν δμρ = sμρ, pues las η ρ son δνρ (ν = 1, 2, …).
ν
Por lo tanto, al concebir la ρ-ésima columna de s1ρ, s2ρ, … de S como vector,
x aparece como combinación lineal de todas las columnas para las que w = λ —en
particular nulo si esto nunca ocurre. Queda así demostrada nuestra afirmación: las
w1, w2, … son los únicos valores propios y xν = sνρ, λ = wρ son las, en esencia,
únicas soluciones— cualquiera otra es combinación lineal de ellas.
Esto es sumamente importante, pues de ello cabe seguir, no solo que el cono-
cimiento de S, H permite determinar todas las soluciones del problema de valores
propios, sino que, recíprocamente, podremos determinar S, H tan pronto hayamos
resuelto dicho problema. Los elementos diagonales de H, por ejemplo (los únicos
no nulos), son simplemente todas las soluciones λ, y cada una de estas λ aparece
en la sucesión w1, w2, … tantas veces cuantas soluciones: x1, x2, … linealmente
independientes le correspondan,28 con lo que quedan fijados los w1, w2, … salvo
el orden de sucesión.29
El problema central de la teoría de las matrices es, pues, la resolución de la
ecuación de valores propios
E1 ∑ hμν xν = λ · xμ (μ = 1, 2, …)
ν
Pasemos ahora a la teoría ondulatoria. La ecuación fundamental de esta es la

«ecuación de las ondas»
E2 H ϕ (q1, …, qk) = λ ϕ (q1, …, qk)
donde H es el operador diferencial que hemos ya examinado. Se trata de ha

llar todas las soluciones ϕ (q1, …, qk) y λ con exclusión de la solución trivial
ϕ (q1, …, qk) = 0, λ arbitrario. Esto es análogo a lo que se pedía en E1: la sucesión
x1, x2, …, que podemos considerar como función xν de la variable «discontinua»
ν (con el campo de variabilidad 1, 2, …), corresponde a la función ϕ (q1, …, qk)
con las variables «continuas» q1, …, qk; λ representa en ambos casos el mismo
papel. Solo la transformación lineal
xμ → ∑ hμν xν
ν
131
Fund_MAT_01.indd 131 3/5/18 16:26

muestra muy poco parecido con la
ϕ (q1, …, qk) → H ϕ (q1, …, qk) .
¿Cómo conseguir en este caso una analogía?

Hemos considerado el índice v como variable y establecido su paralelo con
las k variables q1, …, qk, es decir, el de un número entero positivo con un punto
genérico del espacio de los estados k-dimensional, espacio al que, en adelante,
llamaremos Ω. Por consiguiente, no cabe esperar que se pueda transferir ∑ como
ν
suma a Ω, más bien es la integral ∫ … ∫ …, dq1, …, dq1 (o abreviadamente
!
Ω
∫Ω … dv, donde dv es el elemento de volumen dq1 … dqk en Ω) el ente análogo.

Al elemento de matriz hμν, que depende de dos variables del tipo del índice ν,
corresponde en este orden de ideas una función
h (q1, …, qk; q'1, …, q'k),
en la que q1, …, qk y q'1, …, q'k recorren Ω independientemente. Así la transfor-

mación
xμ → ∑ hμν xν o xν → ∑ hνν' xν'
ν ν'
se trueca en
ϕ (q1, …, qk) → ∫ … ∫ h (q1, …, qk; q'1, …, q'k) ϕ (q'1, …, q'k) dq'1, …, dq'k,

!
Ω
y la ecuación de valores propios E1., que también podemos escribir en la forma
E1. ∑ hνν' xν' = λ · xν,

ν'
a su vez en
E3. ∫ … ∫ h (q1, …, qk; q'1, …, q'k) ϕ (q'1, …, q'k) dq'1, …, dq'k =

!
Ω
= λ · ϕ (q1, …, qk).
En la Matemática se han estudiado repetidas veces problemas de valores propios

de la clase del E3. y, en efecto, pueden tratarse en amplia analogía con los problemas
E1.. Han recibido el nombre de «ecuaciones integrales».30 Desgraciadamente, pero,
E2. no tiene la forma E3. aunque podría conducirse a ella si lográramos hallar, en
correspondencia con el operador diferencial
132
Fund_MAT_01.indd 132 3/5/18 16:26

⎛ h ∂ h ∂ ⎞
H = H ⎜ q1, …, qk , , …, ,
⎝ 2π i ∂q1 2π i ∂qk ⎟⎠
una función h (q1, …, qk; q'1, …, q'k) tal que para todas las funciones ϕ (q1, …, qk)
fuese
I. Hϕ (q1, …, qk) = ∫ … ∫ h (q1, …, qk; q'1, …, q'k) ϕ (q'1, …, q'k) dq'1, …, dq'k

!
Ω
Esta función h (q1, …, qk; q'1, …, q'k), caso de que exista, es el llamado «núcleo
integral» de la operación funcional H que, a su vez, se llama entonces un «opera-
dor integral».
Ahora bien, es el caso que semejante transformación resulta ser imposible: los
operadores diferenciales H no son nunca operadores integrales. Ni tan solo lo es
el más simple de los operadores funcionales, el que transforma cada función ϕ en
sí misma, el operador 1. Cerciorémonos de ello y, para simplificar, supongamos
k = l. Se trata, pues, de determinar h (q; q' ) de modo que
∞
Δ1. ϕ (q) ≡ ∫ −∞
h q, q' )ϕ (q' )dq' ,
cualquiera que sea la función ϕ (q). Sustituyamos la función ϕ (q) por la nueva
función de q ϕ (q0 + q), hagamos luego q = 0 y elijamos como variable de integra-
ción q'' = q' + q0. Se tiene entonces
∞
ϕ (q 0) ≡ ∫
−∞
h(0 q'' − q0 )ϕ (q'' )dq''
y al sustituir q0, q'' por q, q' se ve que h (0, q' - q) es solución de nuestro problema,
si lo es h (q, q' ). Esto nos permite suponer, sin más, que h (q, q' ) depende solo de
q' - q (h (q, q' ) = h (q' - q)), y escribir
∞
Δ2. ϕ (q) ≡ ∫
−∞
h(q' − q)ϕ (q' )dq' .
La sustitución una vez más de j (q) por j (q0 + q) demuestra que basta considerar
el valor q = 0, es decir, que
∞
Δ3. ϕ (0) ≡ ∫−∞
h(q)ϕ (q)dq.
133
Fund_MAT_01.indd 133 3/5/18 16:26

Puede admitirse que la función h (q) es función par, ya que, al sustituir en Δ3 j (q)
por j (-q), resulta que h (q) y h (-q) son a la vez solución y, de serlo, con ellos lo
h (q) + h (-q)
es h1(q) = .
2
Que estas condiciones son irrealizables es claro: elijamos j (q) de modo que
j (q) > 0 para q ≠ 0 y j (0) = 0; de D3. se sigue entonces h (q) = 0 para q ≠ 0.31 Si
+∞
elegimos, en cambio, j (q) ≡ l, de D3. resulta ∫− ∞ h(q)dq = 1, mientras que de lo
+∞
que precede se sigue ∫− ∞ h(q)dq = 0.
Sin embargo Dirac finge una función tal que
+∞
Δ4. d (q) = 0 para q ≠ 0, d (q) = d (-q), ∫−∞
δ (q)dq = 1.
Esta función, de existir realmente, satisfaría la igualdad
+∞ +∞ +∞
∫
−∞
δ (q)ϕ (q)dq = ϕ (0) ∫−∞
δ (q) dq + ∫ −∞
δ (q)[ϕ (q) − ϕ (0)]dq =
+∞
= ϕ (0) ⋅1 + ∫ −∞
0 ⋅ dq = ϕ (0),
y, por lo tanto, también Δ2., Δ1.. Debemos imaginárnosla, por ende, nula en toda
la recta salvo en el origen, pero hasta tal punto infinita en este que en definitiva
la integral de d (q) valga 1.32
Una vez se ha aceptado esta ficción, es ya posible representar los más diversos
operadores diferenciales como operadores integrales —supuesto que junto con
d (q) se introduzcan sus derivadas. Se encuentra así:
dn dn +∞ +∞ ∂n
dq n
ϕ (q) =
dq n ∫ −∞
δ (q − q' )ϕ (q' )dq' = ∫ −∞ ∂q n
δ (q − q' ) ⋅ ϕ (q' )dq' =
+∞
= ∫ −∞
δ (n) (q − q' )ϕ (q) − ϕ (q' )dq' ,
+∞
q n ⋅ ϕ (q) = ∫ −∞
δ (q − q' )q n ⋅ ϕ (q' )dq' ,
d n
es decir, y qn… poseen los núcleos integrales d (n)(q - q' ) y d (q - q' ) qn, res-
dqn
pectivamente. Según el mismo esquema, se pueden buscar los núcleos integrales
de operadores diferenciales tan complicados como se quiera. En el caso de varias
134
Fund_MAT_01.indd 134 3/5/18 16:26

variables q1, …, qk, es el producto de funciones d lo que conduce a la meta; así,

por ejemplo:
∫!
… ∫ d (q1 − q'1)d (q2 − q'2) … d (qk − q'k) ϕ (q'1, …, q'k) dq'1, … dq'k =
Ω
+∞ ⎡ ⎡ +∞
⎡ +∞
⎤ ⎤
= ∫ ∫ ∫
⎢… ⎢ ⎢⎣ ϕ (q'1 , …, q'k )δ (q1 − q'1)dq'1 ⎤⎥ δ (q2 − q' 2 )dq' 2 ⎥…⎥ ⋅
−∞
⎣ ⎣ −∞ −∞ ⎦ ⎦ ⎦
⎡ ⎡ +∞
+∞
⎤ ⎤
⋅ δ (qk − q'k )dq'k = ∫ ∫
⎢… ⎢ − ∞ ϕ (q1, q' 2, …, q'k )δ (q 2 − q' 2 )dq' 2 ⎥…⎥ ⋅
−∞ ⎣ ⎣ ⎦ ⎦
⋅ δ (qk − q'k )dq'k = ϕ (q1, …, qk ).
∫!
… ∫ d' (q1 − q'1)d (q2 − q'2) … d (qk − q'k) ϕ (q'1, …, q'k) dq'1 … dq'k =
Ω
=
∂ …
∂q1 
∫ ∫
δ (q1 − q'1)δ (q2 − q' 2 )… δ (qk − q'k )ϕ (q'1,…, q'k )dq' … dq'k =
Ω
∂
= ϕ (q1,…, qk ), etc.
∂q1
De esta manera se obtiene, aunque de modo algo forzado, la representación

integral I para prácticamente todos los operadores.
Una vez conseguida esta representación, la analogía de los problemas E1. y E3.
es completa: basta sustituir n, n', ∑ y x por q1 … qk, q'1 … q'k, ∫ … ∫ … dq'k …dq'k
ν' !
Ω
y j. Al igual que los vectores xν corresponden a las funciones j (q1, …, qk), así
debemos colocar las matrices al lado de los núcleos integrales. Pero es aún más
conveniente considerar estos directamente como matrices y designar las q1, …, qk
como filas y las q'1, …, q'k como columnas (¡correspondiendo a n y n', respectiva-
mente!). Junto a las matrices ordinarias {hnn' } con un conjunto discreto de filas y
de columnas, caracterizadas, unas y otras, por los números 1, 2, …, tenemos en-
tonces también otras, {h(q1, …, qk; q'1, …, q'k} (los núcleos integrales), para las
cuales los elementos de ambos conjuntos lo están por dos juegos de k variables
que describen todo W de modo continuo.
Esta analogía puede parecer meramente formal, pero en realidad no lo es, pues
también los índices n y n' cabe considerarlos como coordenadas en un espacio de
estados, a saber, cuando se interpretan como números cuánticos en el sentido de la
teoría de Bohr: como números característicos de las posibles trayectorias en el
135
Fund_MAT_01.indd 135 3/5/18 16:26

espacio de las fases, los cuales han pasado a ser números enteros en virtud de las
prohibiciones que entrañan las condiciones de cuantificación.
No queremos aquí seguir adelante en este orden de ideas, moviéndose en el
cual Dirac y Jordán llegaron a constituir una teoría unitaria de los procesos
cuánticos. En esta las formas «impropias» (como d (x), d' (x), …) representan un
papel decisivo —pero tales formas caen fuera del marco de los métodos matemá-
ticos generalmente en uso, v nosotros pretendemos describir la Mecánica cuántica
con ayuda de estos últimos. Pasamos por ellos al otro método para la unificación
de ambas teorías, al método de Schrödinger.
4. Equivalencia de las dos teorías:

el espacio de Hilbert
El método esbozado en 1.3, se reducía, en el fondo, al establecimiento de una
analogía entre el espacio «discreto» de los valores de los índices, Z = (1, 2, …), y
el espacio continuo, W, de los estados del sistema (W es k-dimensional, si k es el
número de los grados de libertad mecánico-clásicos). No es maravilla que esto no
se pueda lograr sin cierta violencia sobre el formulismo y la matemática: los espa-
cios Z y W son verdaderamente muy distintos, v toda tentativa de ponerlos en
relación debe chocar con grandes dificultades.33
En verdad, lo que nos importa no es una relación entre Z y W, sino entre las
funciones en ellos definidas, es decir, entre las sucesiones x1, x2, …, que son las
funciones en Z, y las funciones de onda j (q1, …, qk), que lo son en W, pues tan
solo esas funciones intervienen en las cuestiones de Mecánica cuántica.*(1)
En la teoría de Schrödinger cumple una importante función la integral
∫!
… ∫ ∙j (q1, …, qk)∙ 2 dq1 … dqk,
Ω
que debe ser = 1 para que j sea aplicable a las relaciones físicas. Frente a ella, en
la teoría de las matrices (cf. el problema E1. en I, 3), el papel principal lo desem-
peña el vector x1, x2, …, y a él se impone siempre la condición de ser finita la
serie ∑ ∙xν∙2 de acuerdo con la teoría de Hilbert de esos problemas de valores pro-
ν
pios (cf. Nota30). Incluso es frecuente introducir la condición de normalización
* Del mismo modo que x1, x2, … se concibe como un todo único (campo de variabilidad de la
variable xν, dependiente del índice n, que para el valor n = n' toma el valor xν' , para n = n'' el valor
xn'' , etc.), así también el conjunto de todos los valores de j (q1, …, qk) (campo de variabilidad de la
variable j, dependiente del sistema de variables (q1, …, qk), que para (q1, …, qk) = (q'1, …, q'k) toma
el valor j (q'1, …, q'k), para (q1, …, qk) = (q''1, …, q''k) el valor j (q''1, …, q''k), etcétera). No se pre-
cisa, pues, en j el proceso funcional, sino el conjunto de sus valores numéricos vinculados a los que
tome (q1, …, qk). La sucesión está definida cuando se da para cada n el valor de xn; la función está
definida cuando se da para cada (q1, …, qk) el valor de j. Y al concepto de una variable numérica
dependiente del conjunto de los valores que integran una sucesión, corresponde el de una variable
numérica dependiente del conjunto de los valores de la función, es decir, el de funcional. (N. del T.)
136
Fund_MAT_01.indd 136 3/5/18 16:26

∑ ∙xν∙2 = 1 para excluir la solución trivial xν ≡ 0. Esto sugiere limitar el círculo de

ν
las funciones aceptables en Z y en W a aquellas para las cuales sean finitas
∑ ∙xν∙2 e ∫ … ∫ ∙j (q1, …, qk)∙ 2 dq1 … dqk,

ν !
Ω
respectivamente, ya que solo en tales funciones se puede hacer igual a la unidad,

multiplicando por un factor constante, dicha suma y dicha integral, esto es, Se
puede normalizar una solución en el sentido ordinario.34 Llamaremos Fz y FW,
respectivamente, a los conjuntos de estas funciones.
Para Fz y FW vale el siguiente teorema: Fz y FW son isomorfos (Fischer y F.
Riesz35). Que sean isomorfos significa que es posible establecer entre Fz y FW una
correspondencia biunívoca (esto es, hacer corresponder a cada sucesión x1, x2, …,
con ∑ ∙xν∙2 finita, una función j (q1, …, qk), con ∫ … ∫ ∙j (q1, …, qk)∙ 2 dq1 … dqk
ν !
Ω
finita, y recíprocamente), de modo que la correspondencia así establecida sea lineal
y conserve las longitudes. El carácter lineal implica que si a x1, x2, … corresponde
j (q1, …, qk) y a y1, y2, …, ψ (q1, …, qk), a ax1, ax2, … corresponda aj (q1, …, qk)
y a x1 + y1, x2 + y2, …,
j (q1, …, qk) + ψ (q1, …, qk);
y la conservación de la longitud trae consigo que el ser correspondientes x1, x2, …

y j (q1, …, qk) justifique la igualdad
∑ ∙xν∙2 = ∫ … ∫ ∙j (q1, …, qk)∙ 2 dq1 … dqk.

ν !
Ω
(Hablamos aquí de «conservación de la longitud)) porque se acostumbra a interpre
Σν xν y ∫!
… ∫ ϕ (q1, …, qk 2 dq1 … dqk
2
tar x1, x2, … y j (q1, …, qk) como vectores y
Ω
como a sus respectivas longitudes.)
Pero hay más: supongamos que … correspondan x1, x2, … y j (q1, …, qk) de
una parte, y1, y2, … y ψ (q1, …, qk) de otra; en estas condiciones se tiene:
∑ xν y−n = ∫ … ∫ j (q1, …, qk) ψ (q1, …, qk) dq1 … dqk

ν !
Ω
y ambos miembros convergen en valor absoluto. Acerca de este último punto hay
que hacer notar que, bien mirado, fuera quizá de desear que
137
Fund_MAT_01.indd 137 3/5/18 16:26

∑ xν = ∫ … ∫ j (q1, …, qk) dq1 … dqk

ν !
Ω
o algo por este estilo, es decir, una completa analogía entre adición de una parte
e integración de otro, pero un examen detenido muestra que la adición ∑ y la
ν
integración ∫ … ∫ … dq1 … dqk se aplican en Mecánica cuántica siempre y tan
!
Ω
solo a expresiones de la forma xν y−n y j (q1, …, qk) ψ (q1, …, qk) respectivamente.
No vamos a estudiar ahora cómo ha de resultar esa correspondencia, ya que
de todos modos tendremos que ocuparnos de ella con todo detalle en el próximo
capítulo. Pero hay que poner de relieve lo que significa el mero existir esta corres-
pondencia: Z y W son muy diferentes; establecer entre ellos una relación debe
conducir a dificultades matemáticas insolubles. En cambio, FZ y FW son isomorfos,
o sea, idénticos en su estructura íntima (realizan en dominios matemáticos distin-
tos las mismas propiedades abstractas), y pues ellos (¡y no Z y W!) son el auténti-
co substrato analítico de la teoría de las matrices y de la ondulatoria, respectiva-
mente, esta isomorfía significa que ambas teorías deben dar los mismos resultados;
es decir, este es el caso si dicho isomorfismo coordina entre sí la matriz
– – – – –
H = H (Q l, …, Q k, P 1, …, P k)
⎛ h ∂ h ∂ ⎞
y el operador H = H ⎜ q1,…, qk ; ,…, . Dado que una y otro
⎝ 2π i ∂q1 2π i ∂qk ⎟⎠
– , P– (l = 1, 2, …, k) y de los operadores funcionales
resultan de las matrices Q i l
h ∂
qi …, … (l = 1, …, k), respectivamente, mediante las mismas operaciones
2pi ∂ql
algébricas, basta demostrar que ql … corresponde a la matriz Q – y h ∂ …a
i
2pi ∂ql
la matriz P . Ahora bien, de Q– , P– (l = 1, …, k) no se exigía sino que satisficieran
l l l
las «relaciones de permutación» (I, 2):
QmQn − QnQm = 0, Pm Pn − Pn Pm = 0⎫
⎪⎪
⎧= 0 para m ≠ n⎬ (m, n = 1, 2,…).
⎪
Qm Pn − PnQm ⎨ h ⎪
⎪⎩= 2π i 1 para m = n⎪⎭
h ∂
Y es claro que las matrices correspondientes a ql …, … lo harán cierta-
2pi ∂ql
h ∂
mente, pues los operadores funcionales ql …, … poseen ya de suyo estas
2pi ∂ql
138
Fund_MAT_01.indd 138 3/5/18 16:26

propiedades,36 las cuales no se perderán al efectuar la transformación isomorfa

en FZ .
Porque los sistemas FZ y FW son isomorfos, y matemáticamente equivalentes
las teorías de la Mecánica cuántica edificadas sobre ellos, es de esperar que se lo-
grará una estructura unitaria, independiente de lo accidental que resulta del mar-
co formal en cada caso elegido, y que presente los rasgos positivamente esenciales
de la Mecánica cuántica, cuando se busquen las propiedades intrínsecas, comunes
a FZ y FW, de los conjuntos de funciones y se las elija, una vez halladas, como
punto de partida.
FZ es el llamado en general «espacio de Hilbert». Nos importa, pues, fijar en
primer lugar las propiedades del espacio de Hilbert intrínsecas, las que no depen-
den de la especial vestidura FZ o FW. El dominio matemático definido por estas
propiedades es el «espacio de Hilbert abstracto». Este espacio hay que equipararlo
al FZ o al FW en los casos particulares concretos del cálculo, pero es de más cómo-
do manejo que ellos cuando se persiguen fines generales.
Queda así justificado nuestro propósito de definir el espacio abstracto de Hil-
bert y demostrar luego con todo rigor los siguientes puntos:
1. Que el espacio abstracto de Hilbert (abreviadamente, E. H.) está unívo-

camente caracterizado por las propiedades que se indicarán, es decir, que
no admite interpretación ninguna esencialmente distinta.
2. Que sus propiedades corresponden lo mismo a FZ que a FW. (Con esto
quedarán rigurosamente demostrados los extremos que se han expuesto
solo cualitativamente en I, 4.) Cuando esto se haya logrado, aplicaremos
el instrumento matemático así obtenido a la construcción de la Mecánica
cuántica.
139
Fund_MAT_01.indd 139 3/5/18 16:26

Fund_MAT_01.indd 140 3/5/18 16:26
II
Generalidades acerca del espacio

de Hilbert abstracto
1. Caracterización del E. H.
Hemos de llevar a la práctica el programa presentado al final de I, 4: Caracte
rizar el E. H., que proporciona la base matemática para el estudio de la Mecánica
cuántica, de modo tal que no se apliquen otros conceptos que los que luego serán
utilizados en dicha teoría, y en virtud de lo cual poseen exactamente tanto sentido
en el espacio funcional discreto FZ de las sucesiones xv (ν = 1, 2, …) cuanto en el
espacio continuo FΩ de las funciones de onda ϕ (q1, …, qk), (q1, …, qk recorren
el espacio de los estados Ω). Estos conceptos, conforme ya indicamos, son los si
guientes:
α ) La «multiplicación escalar», es decir, la multiplicación de un número a
(complejo) por un elemento f del E. H.: af. En FZ resulta así de xν axν; en FΩ, de
ϕ (q1, …, qk) a ϕ (q1, …, qk).
β ) La adición y substracción de dos elementos f, g del E. H.: f ± g. En FZ
resulta así de xν e yν xν ± yν, respectivamente; en FΩ, de ϕ (q1, …, qk) y ψ (q1, …,
qk), ϕ(q1, …, qk) ± ψ (q1, …, qk).
γ ) La «multiplicación interior» de dos elementos f, g del E. H., que da lugar,
no como α ) y β ) a un elemento del E. H., sino a un número complejo: ( f, g).
En FZ resulta así de xv e yv ∑ x
ν ν ν
y− ; en FΩ, de ϕ (q1, …, qk) y ψ (q1, …, qk), ∫ … ∫

Ω
ϕ (q1, …, qk) ψ (q1, …, qk)· dq1 … dqk. (Hay que completar las definiciones en FZ
y FΩ con las correspondientes demostraciones de la convergencia. Estas se darán
en II.3).
En lo que sigue, los puntos del E. H. se representarán sistemáticamente por
f, g, …, ϕ, ψ, …, los números complejos por a, b, …, x, y, …, y los números
enteros positivos por k, l, m, …, μ, ν, … Donde sea necesario, llamaremos E∞
al E. H., como abreviatura de «espacio euclídeo de infinitas dimensiones», aná
logamente a la expresión habitual ℰn para el «espacio euclídeo de n dimensiones»
(n = 1, 2, …).
Lo notable en las operaciones af, f ± g, ( f, g) reside en que son precisamente
las operaciones fundamentales del cálculo vectorial, aquellas que hacen posible,
por ejemplo, el establecimiento del cálculo de segmentos y de ángulos en la Geo
metría euclídea o del de fuerza y trabajo en la Mecánica del punto. Donde más
clara aparece la semejanza es en FZ cuando en vez de las x1, x2, … del E∞ se con
sideran los puntos en el sentido ordinario (x1, x2, …, xn) de un En, para el cual
justamente son viables las operaciones α), β ), γ ). En particular, el estado de cosas
que resulta para n = 3, es el que se da en el espacio ordinario. A veces es más
141
Fund_MAT_02.indd 141 9/5/18 10:10

oportuno interpretar x1, x2, …, xn no como punto, sino como vector (p. e., el de
origen en 0, 0, …, 0 y extremo en x1, x2, …, xn ).
Para caracterizar el E. H. tomaremos como base las relaciones vectoriales fun
damentales af, f ± g, ( f, g) y consideraremos a la vez el E∞ y todos los En, conforme
hará ver la discusión que sigue. De este modo, allí donde no queramos decidir
entre E∞ y los En utilizaremos como término neutral el E para indicar el espacio.
Postulamos primero la validez en E de las propiedades vectoriales típicas:37
A. E es un espacio lineal.

Es decir: en E se ha definido una adición, f + g, y una multiplicación «escalar»,
af ( f, g son elementos de E, a un número complejo; f + g y af pertenecen a E) y
existe, además, un elemento 0.38 Para ellas y para éste valen las conocidas normas
propias del cálculo del álgebra vectorial:
f + g = g + f (propiedad conmutativa de la adición),

( f + g) + h = f + ( g + h) (propiedad asociativa de la adición),
a ( f + g) = af + ag, (a + b)f = af + bf (propiedades distributivas de la multi
plicación),
(ab)f = a(bf ) (propiedad asociativa de la multiplicación),
0f = 0 (*), 1 f = f (propiedades del cero y del uno).
Las leyes algorítmicas no mencionadas aquí se siguen de estos postulados sin

dificultad. Así, por ejemplo, el papel del cero en la adición:
f + 0 = 1 · f + 0 · f = (1 + 0) · f = 1 · f = f,
o la posibilidad unívoca de sustracción, una vez sentado que, por definición,
−f = (−1) · f , f − g = f + (−g),
ya que resulta
( f − g ) + g = ( f + (− g )) + g ⎫
= f + ((−1) ⋅ g + 1⋅ g )
= f + ((− g ) + g ),⎪⎪
⎬ = f + ((−1) + 1) ⋅ g )
( f + g ) − g = ( f + g ) + (− g )⎪
= f + 0⋅ g = f + 0 = f ,
= f + ( g + (− g )),⎪⎭
o, finalmente, las leyes distributivas de la multiplicación respecto de la substrac

ción:
* El símbolo 0 del primer miembro es el número cero, el del segundo el elemento cero del espa
cio. Si se utilizaran símbolos distintos (p. ej., 0 para el número y o para el elemento), la demostración
que sigue en el texto rezaría así: f + o = 1 · f + 0 · f = (1 + 0) f = 1 · f = f (Cf. Nota 38). (N. del T.)
142
Fund_MAT_02.indd 142 9/5/18 10:10

Generalidades acerca del espacio de Hilbert abstracto
a · ( f − g) = a · f + a · (−g) = af + a · ((−1) · g) = af + (a · (−1)) g =

= af + ((−1) · a) · g = af + (−ag) = af—ag,
(a − b) · f = a · f + (−b) · f = af + ((−1) b) · f = af + (−bf ) = af − bf.
No merece la pena seguir adelante con estas cosas, pues es obvio, sin más, que
todas las reglas del cálculo vectorial lineal conservan aquí su validez.
De lo que precede se deduce la posibilidad de definir, como en el caso de los
vectores ordinarios, la independencia lineal de k elementos f1, …, fk de E.
Definición 1. f1, …, fk son linealmente independientes cuando de a1 f1 + … +

+ ak fk = 0 (a1, …, ak son números complejos) se sigue a1 = … = ak = 0.
Definamos, además, el ente análogo en E a las figuras lineales del espacio vec
torial ordinario (rectas, planos, etc., que pasan por el origen), esto es, las varieda
des lineales:
Definición 2. De un conjunto B parte de E diremos que es una variedad lineal,

si contiene toda combinación lineal, a1 f1 +… + ak fk, de k elementos (k = 1, 2, …)
cualesquiera f1, …, fk pertenecientes a B.
Sea C un conjunto parcial cualquiera de E f1, …, fk k elementos arbitrarios de
C (k = l, 2, …), a1, …, ak números complejos cualesquiera. El conjunto de todos
los elementos a1 f1 + … + ak fk es una variedad lineal que evidentemente contiene
a C y está a su vez contenida en cualquier otra variedad lineal que contenga asi
mismo a C. (En otros términos, esta variedad lineal está constituida por todos los
elementos de C y todas aquellas combinaciones lineales de estos elementos que no
están contenidas en C.) A ella se refiere la siguiente
Definición 2'. La extensión lineal de un conjunto cualquiera C contenido

en E, o variedad lineal definida por C, es el conjunto de todos los elementos a1 f1 +
… + ak fk (k = 1, 2, …) que son combinaciones lineales, con coeficientes comple
jos cualesquiera, de elementos f1, …, fk de C elegidos arbitrariamente y en núme
ro cualquiera. El símbolo que hacemos corresponder a la extensión lineal de C es
{C}.
Antes de ampliar estas nociones formularemos el principio fundamental si
guiente del cálculo vectorial, la existencia del producto interior:
B. En E está definido un producto interior, es decir, a cada par de elementos

f, g de E se ha hecho corresponder un número complejo, ( f , g ), llamado produc
to interior de f por g, y esta correspondencia posee las siguientes propiedades:
( f' + f", g) = ( f', g) + ( f", g) (propiedad distributiva del primer factor),

(a · f, g) = a · ( f , g) (propiedad asociativa del primer factor),
( f , g) = ( g, f ) (simetría hermítica),
( f , f ) ≥ 0, y solamente = 0 para f = 040 (definido).
143
Fund_MAT_02.indd 143 9/5/18 10:10

La simetría hermítica del producto interior permite deducir la validez de las

dos primeras propiedades para el segundo factor de su validez para el primero
(basta permutar f y g entre sí y formar los complejos conjugados de ambos miem
bros):
( f, g' + g" ) = ( f, g' ) + ( f, g" ),

( f, a · g) = a− ( f, g).
La importancia de la noción de producto interior es muy grande porque hace

posible la definición de distancia. En el espacio euclídeo, el módulo de un vector
f es, por definición, f = ( f , f ) 41 y la distancia entre dos puntos f, g es igual a
∙ f − g ∙. De esto partimos para sentar la
Definición 3. El valor absoluto de un elemento f de E es f = ( f , f ) , la

distancia de dos elementos j y g de E, ∙ f − g ∙.42
Veremos acto seguido que esta noción presenta todas las propiedades de la
distancia. Con tal fin demostramos el
Teorema 1. Siempre es ∙( f, g)∙ ≤ ∙ f ∙ · ∙ g ∙ *.
Demostración: Convengamos en representar la parte real y la parte imaginaria

de un número complejo z = u + iv por Re z e Im z, respectivamente (Re z = u,
Im z = v). Sentado esto, podemos escribir, en primer lugar,
∙ f ∙2 + ∙ g ∙2 − 2 Re( f , g) = ( f , f ) + ( g, g) − ( f , g) − ( g, f ) = (f − g, f − g) ≥ 0,

1
Re ( f , g) ≤ (∙ f ∙2 + ∙ g ∙2).
2
1
g (a real y > 0) no altera en nada el primer
La sustitución de f , g por af ,
a
miembro, mientras que el segundo se convierte en
1 2 2 1
(a ∙ f ∙ + 2 ∙ g ∙2).
2 a
Cualquiera que sea a es, pues,
1 2 2 1
(a ∙ f ∙ + 2 ∙ g ∙2) ≥ Re ( f, g).
2 a
* Desigualdad de Cauchy-Schwarz. (N. del T.)
144
Fund_MAT_02.indd 144 9/5/18 10:10

En particular, esta relación subsiste cuando su primer miembro se sustituye

g
por su valor mínimo ∙ f ∙ · ∙ g ∙, mínimo que es accesible para a = si f y g
f
son ≠ 0, y al que tiende dicho primer miembro cuando a → +∞, si f = 0, o cuan
do a → +0, si es g = 0. En todo caso es, pues,
Re ( f, g) ≤ ∙ f ∙ · ∙ g ∙
Si en esta desigualdad de sustituye f, g por eiα f, g (α real), es ahora el segundo

miembro el que no cambia, porque
(af, af ) = aa–( f, f ) = ∙a∙2( f, f ), ∙af ∙ = ∙a∙ · ∙ f ∙,
y al ser ∙a∙ = 1 resulta ∙af ∙ = ∙ f ∙. El primer miembro, en cambio, se transforma

en
Re [eiα ( f , g)] = cos α · Re ( f, g) − sen α · Im ( f, g).
El valor máximo de esta expresión es, patentemente,
[Re( f , g)]2 + [Im( f , g)]2 = ( f , g )
y, por lo tanto,
∙( f, g)∙ ≤ ∙ f ∙ · ∙ g ∙
Teorema adicional. Para que en la relación precedente valga el signo de igual

dad, f y g, deben coincidir salvo un factor complejo constante.
Demostración: La relación Re( f, g) ≤

1
2
( )
∙ f ∙2 + ∙ g ∙2 es una igualdad siempre y
sólo cuando ( f − g, f − g) = 0, es decir, f = g. Para pasar de ella a ∙( f, g)∙ ≤ ∙ f ∙ · ∙ g ∙
1
se sustituyen f, g por eiα af, g (a y α son ciertos números reales y a > 0), cuando
a
no son cero f o g. Luego, para que en esta última relación valga el signo =, debe
1
ser e iα af = g, de donde g = a2 eiα f = cf, (c ≠ 0). Recíprocamente, para f o g igua
a
les a cero o para g = cf , (c ≠ 0), vale evidentemente el signo de igualdad.
Teorema 2. Siempre es ∙ f ∙ ≥ 0 y sólo = 0 para f = 0. Siempre es ∙af ∙ = ∙a∙ · ∙ f ∙.

Siempre es ∙ f + g ∙ ≤ ∙ f ∙ + ∙ g ∙, y en esta relación vale el signo = sólo si f y g coin
ciden salvo un factor constante real y ≥ 0.
145
Fund_MAT_02.indd 145 9/5/18 10:10

Demostración: Ya antes hemos reconocido ciertas las dos primeras proposicio

nes, por lo que sólo es menester demostrar la tercera. Se tiene:
( f + g, f + g) = ( f, f ) + (g, g) + ( f, g) + ( g, f ) =

= ∙ f ∙2 + ∙ g ∙2 + 2 Re (f, g) ≤ ∙ f ∙2 + ∙ g2∙ + 2 ∙ f ∙ · ∙ g ∙ = (∙ f ∙ + ∙ g ∙)2;
luego
∙ f + g ∙ ≤ ∙ f ∙ + ∙ g ∙
Para que sea ∙ f + g ∙ = ∙ f ∙ + ∙ g ∙ debe ser, pues, Re ( f, g) = ∙ f ∙ · ∙ g ∙, lo que
obliga a que o f o g sean nulos o a que g = a2f = cf (c real y > 0), en virtud de las
consideraciones hechas en el teorema adicional. Que si se dan estas últimas cir
cunstancias vale realmente el signo =, es claro.
Del teor. 2 se sigue desde luego que la distancia ∙ f − g ∙ tiene las propiedades
siguientes: Sólo si f = g, es cero la distancia entre f y g. La distancia entre f y g es
la misma que entre g y f . La distancia entre f y h es siempre ≤ que la suma de
las distancias entre f , g y g, h, y sólo es igual cuando g = af + (1 − a)h (a real,
0 ≤ a ≤ 1).43 La distancia entre af, ag es el producto por ∙a∙ de la distancia entre
f , g.
Son éstas precisamente las propiedades que se precisan en el concepto de dis
tancia y que permiten reducir a esta noción, en Geometría y Topología, los con
ceptos de continuidad, acotación, punto de acumulación, etc.* Tomándolas como
base daremos las definiciones que siguen:
Una función F( f ) definida en E (esto es, definida para los elementos f de E y
cuyos valores o son siempre elementos de E o son siempre números complejos) es
continua en un punto f0 de E, cuando para cada ε > 0 existe un δ > 0 tal qué
∙ f − f 0∙ < δ implica la desigualdad ∙F( f ) − F( f 0)∙ < ε o la ∙F( f ) − F( f 0)∙ < ε, según
que el conjunto de los valores de F( f ) pertenezca a E o al campo de los números
complejos, respectivamente**. Una función F( f ) definida en E es acotada en E o
en una parte de E cuando es posible elegir una constante C tal que en E o en di
cha parte de E sea, sin excepción, ∙F( f )∙ ≤ C o ∙F( f )∙ ≤ C. Definiciones análogas
se dan en el caso de más de una variable.
Una sucesión f1, f2, … de elementos de E converge hacia f o tiene un límite f,
cuando la sucesión numérica ∙ f1 − f ∙, ∙ f2 − f ∙, … tiende a cero. Un punto es
punto de acumulación de un conjunto C (¡parte de E!) cuando es límite de una
* Véase, p. ej., M. Fréchet, «Les espaces abstraits» (París, Gauthier Villars, 1928), especial
mente la Sección II, pp. 61 y ss. (N. del T.)
** Casi huelga, pero de todas forma haremos notar que el concepto de función es aquí el ya
clásico de correspondencia establecida entre dos conjuntos. En nuestro caso, uno está formado por
elementos f de E y constituye el campo de existencia de F( f ) (conjunto que puede no coincidir con
todo E) y el otro, el dominio de los valores de F( f ), está formado o exclusivamente por elementos
de E o exclusivamente por números complejos. (N. del T.)
146
Fund_MAT_02.indd 146 9/5/18 10:10

sucesión de elementos de C.44 En particular, un conjunto C se dice que es cerrado

cuando a él pertenecen todos sus puntos de acumulación; un conjunto C es denso
doquiera cuando todo punto de E es un punto de acumulación de C.
Es fácil demostrar que af, f + g y ( f, g) son funciones continuas respecto de
todas sus variables. En efecto, a causa de ser
∙af − af' ∙ = ∙a∙ · ∙ f − f' ∙,

∙( f + g) − ( f' + g' )∙ = ∙( f − f' ) + (g − g' )∙ ≤ ∙ f − f' ∙ + ∙ g − g' ∙
resulta patente la continuidad en los dos primeros casos. Por otra parte, de
∙f − f' ∙ < ε, ∙ g − g' ∙ < ε
se sigue, haciendo f' − f = ϕ, g' − g = ψ,
∙( f, g) − ( f', g' )∙ = ∙( f, g) − ( f + ϕ, g + ψ)∙ = ∙(ϕ, g) + ( f, ψ) + (ϕ, ψ)∙
≤ ∙(ϕ, g)∙ + ∙( f, ψ)∙ + ∙(ϕ, ψ)∙
≤ ∙ϕ ∙ · ∙ g ∙ + ∙ f ∙ · ∙ψ)∙ + ∙ϕ ∙ · ∙ψ ∙
≤ ε (∙ f ∙ + ∙ g ∙ + ε),
y como para ε → 0 tiende a cero este último producto, podrá éste hacerse menor
que cualquier δ > 0 sin más que tomar ε suficientemente pequeño.
Mucho nos permiten decir acerca de E, como se ve, los axiomas A y B, pero
no lo bastante como para poder diferenciar entre sí los En y todos ellos de E∞. Ni
una palabra se ha dicho aún acerca del número de dimensiones. Es sabido que éste
depende, del número máximo de vectores linealmente independientes. Cuando
existe un tal número máximo n (n = 0, 1, 2, …) vale para él la proposición
C(n). Existen exactamente n vectores linealmente independientes.

Es decir, es posible hallar n vectores linealmente independientes, pero no n + 1.
Pero cuando no existe un número máximo de vectores en esas condiciones,
C(∞). Existe una infinidad de vectores linealmente independientes.
C. No es propiamente un nuevo postulado: si A y B valen, o vale C(n) o vale
(∞)
C . Según sea aquel por el que nos decidamos, obtendremos un tipo u otro de
espacio E. Veremos que C(n) comunica a E todas las características del espacio eu
clídeo (complejo) de n-dimensiones. Por el contrario, no basta C(∞) para asegurar
la igualdad esencial del E así determinado y el E. H. E∞, antes bien, son necesarios
para ello dos nuevos postulados, D y E. De modo más preciso: Demostraremos
que el E fijado por A, B, C(n) posee todas las propiedades del En, en particular las
que indicaremos en D y E, o sea que estas dos proposiciones están justificadas por
A, B y C(n). Demostraremos que el E fijado por A, B, C(∞), D y E posee todas las
147
Fund_MAT_02.indd 147 9/5/18 10:10

propiedades del E∞, pero que para ello son esenciales D y E, o sea que D y E no
se siguen de A, B y C(∞). Enunciemos, pues, estas dos proposiciones, aunque de
jemos para más tarde la demostración de que son ciertas en todos los En y en E∞.
D. E es completo,45
es decir, si una sucesión f1, f2, … de elementos de E cumple la condición de con
vergencia de Cauchy (dado ε > 0 existe un N = N(ε) tal que de m, n ≥ N se sigue
∙ fm − fn ∙ < ε), esta sucesión es convergente, esto es, posee un límite f. (Cf. la de
finición de este concepto dada más arriba.)
E. E es separable45,
es decir, existe en E una sucesión f1, f2, … que en E es densa doquiera.
En II.2 desarrollaremos, apoyándonos en estos fundamentos, la «Geometría»
de E y se establecerá su coincidencia con las geometrías de los En o la del E∞.
2. Geometría del E. H.
Comencemos por sentar dos definiciones. La primera encierra de la evaluación
geométrica de los ángulos justamente lo que es necesario para nuestro objeto: el
concepto de ángulo recto, de ortogonalidad.
Definición 4. Dos f, g de E son ortogonales cuando ( f, g) = 0. Dos variedades

lineales M, N son ortogonales cuando lo es cada elemento de M con cada uno de
los de N. Se dice de un conjunto O que es un sistema ortonormal (ortogonal y
normal), cuando para todos los f, g de 0 es
⎧1, para f = g,
( f , g) = ⎨
⎩0, para f ≠ g;
o sea, cada dos elementos distintos son ortogonales entre sí y el módulo de cada
elemento vale la unidad.46 En particular, un sistema ortonormal, O, es completo,
por definición, cuando no está contenido en ningún otro sistema ortonormal que
contenga algún otro elemento además de los de O.47
Obsérvese que decir de un sistema O que es un sistema ortonormal comple
to, es decir que no existe ningún f que sea de módulo 1 (∙ f ∙ = 1) y a la vez orto
gonal a O (cf. Nota 46). Pero hay más: si existiese un f ≠ 0 ortogonal a O, existiría
1 1
f' = f (∙ f ∙ es > 0) ortogonal asimismo a O y de módulo ∙ f' ∙ = · ∙ f ∙ = 1,
∙ f ∙ ∙ f ∙
lo que no puede ser. Luego, si 0 es un sistema ortonormal completo, cada f orto
gonal a él debe coincidir con el elemento 0.
Sentado esto, pasemos a la segunda definición. Sólo en E∞ desempeña ésta un
papel esencial, pues en los En toda variedad lineal es de la clase de la que en dicha
148
Fund_MAT_02.indd 148 9/5/18 10:10

definición se trata (cf. el final de II.3). Por esto no cabe dar de ella una imagen
geométrica intuitiva.
Definición 5. Llamaremos variedad lineal cerrada a una variedad lineal que a
la vez es cerrada. Si C es un conjunto cualquiera de E y añadimos a {C} extensión
lineal de C, todos sus puntos de acumulación, resulta una variedad lineal cerrada
que contiene a C48 y la llamaremos extensión lineal cerrada de C (o variedad lineal
cerrada definida por C y, simbólicamente, [C].
Con todos esos elementos es ya posible abordar el análisis minucioso de E, en
particular de los sistemas ortonormales. Aquellos teoremas que además de la vali
dez de A, B presuponen la de C(n) o la de C(∞), D, E los distinguiremos añadiendo
los índices (n) o (∞), respectivamente, mientras que los que valen en uno y otro caso
no irán afectados de ningún índice.
Teorema 3(n). Todo sistema ortonormal posee un número de elementos no
mayor que n (≤ n) y es completo siempre y sólo cuando tiene precisamente n ele
mentos.
Observación: De la primera parte se sigue que existe un número máximo de
elementos para un sistema ortonormal; aquellos sistemas que lo alcanzan son com
pletos, por definición. Por consiguiente, en el caso C(n) existen sistemas ortonor
males completos y poseen, según lo que precede, n elementos: ϕ1, ϕ2, …, ϕn.
Demostración: Los elementos ϕ1, ϕ2, …, ϕm de un sistema ortonormal finito
son linealmente independientes, pues de
a1ϕ1 + … + amϕm = 0
se deduce, multiplicando interiormente por ϕμ (μ = 1, 2, …, m), que (aμ = 0).

Luego, en virtud de C(n), un tal sistema no puede contener n + 1 elementos, ni
tampoco puede haber en un sistema ortonormal arbitrario un conjunto parcial
que conste de n + 1 elementos. Por consiguiente, todo conjunto ortonormal cons
ta de un número ≤ n de elementos. Si consta precisamente de n elementos, no
cabe ampliarlo v es, por lo tanto, completo. Un sistema ortonormal con m < n
elementos, ϕ1, ϕ2, …, ϕm, no es completo; pues, ya que entre las combinaciones
lineales a1ϕ1 + … + amϕm no hay n > m linealmente independientes, existe, de
acuerdo con C(n) por lo menos un / que es distinto de todos los a1ϕ1 + … + amϕm,
es decir,
ψ = f − a1ϕ1 – … – amϕm
es ≠ 0 cualquiera que sean las aμ. Basta determinar las aμ de modo que aμ = ( f, ϕμ)
(μ = 1, 2, …, m), lo que es siempre posible, para que la ψ que así resulta sea or
togonal a todas las ϕμ: (ψ, ϕμ ) = 0 para μ = 1, 2, …, m. Por consiguiente, nuestro
sistema no es completo.
149
Fund_MAT_02.indd 149 9/5/18 10:10

Teorema 3(∞). Un sistema ortonormal contiene un número finito o una infi

nidad numerable de elementos; si es completo, sus elementos forman siempre una
infinidad numerable.
Observación: Resulta así que todo sistema ortonormal puede escribirse en for
ma de Sucesión, ϕ1, ϕ2, …, acaso no indefinida, es decir, finita. Además, el que
un sistema ortonormal conste de infinitos elementos es sólo condición necesaria
para que sea completo, pero no suficiente,49 bien al contrario de lo que ocurría en
C(n) respecto del número n.
Demostración: Sea O un sistema ortonormal, f y g dos de sus elementos, dife
rentes. Se tiene
( f − g, f − g) = ( f , f ) + (g, g ) − ( f , g) − (g, f ) = 2, f −g = 2
Sea f1, f2, … la sucesión doquier densa en E, sucesión que existe en virtud de E. Para
1
cada f de O existe un fm de esta sucesión tal que f − f m < 2 y a dos f, g de O
2
distintos, corresponden dos fm, fn asimismo distintos, pues si fuese fm = fn, sería
1 1
f − g = ( f − f m ) − (g − f m ) ≤ f − f m + g − f m < 2+ 2 = 2.
2 2
Luego a cada f de O corresponde un fm de f1, f2, …, y a diferentes f diferentes fm.

Por lo tanto, O o es finito o infinito numerable.
Como en el teorema 3(n), se demuestra que si existen en E más de m elementos
linealmente independientes, un sistema ortonormal ϕ1, ϕ2, …, ϕm no puede ser
completo. Y como aquí, según C(∞), tales elementos existen siempre, por grande
que sea m, un sistema oftonormal completo debe ser infinito.
Los dos teoremas que siguen se refieren, en la parte en que se habla de con
vergencia, sólo a C(∞), pero es mejor formularlos en general, considerado lo que
además se dice en ellos.
Teorema 4. Sea ϕ1, ϕ2, … un sistema ortonormal. Todas las series ∑ (f, ν
ϕν)
(g, ϕν) son en tal caso absolutamente convergentes. En particular, para f = g es siem
pre ∑ ∙ f,
ν
ϕν ∙2 ≤ ∙ f ∙2.
N
Demostración: Sea aν = ( f , ϕν), ν = 1, 2, …; ψ = f − ∑ aνϕν es entonces or
ν =1
togonal a todos los ϕν, ν = 1, 2, …, N (cf. la demostración del teorema 3(n)) y, por
lo tanto,
N
f = ∑ aνϕν +ψ
ν =1
N N N N N
( f , f ) = ∑ aµ aν (ϕ µ ,ϕν ) + ∑ aν (ϕν ,ψ ) + ∑ aν (ψ ,ϕν ) + (ψ ,ψ ) = ∑ aν + (ψ ,ψ ) ≥ ∑ aν
2 2
µ, ν =1 ν =1 ν =1 ν =1 ν =1
150
Fund_MAT_02.indd 150 9/5/18 10:10

N
es decir, ∑ aν ≤ f . Si el sistema ϕ1, ϕ2, … es finito, de ahí se sigue desde lue
2 2
ν =1
go que ∑ ∙ a
ν ν ∙ ≤ ∙ f ∙ ; si es infinito, basta hacer que N → ∞ para que de la relación
2 2
anterior resulte la convergencia de ∑ ∙ aν ν ∙ como asimismo el que su suma es ≤ ∙ f ∙ .
2 2
Con esto queda demostrada la segunda parte. Pero la primera se deduce de la se
gunda atendiendo a que
( f , ϕν )(g, ϕν ) ≤
1
2
{ 2 2
( f , ϕν ) + (g, ϕν ) . }
El teorema queda, pues, completamente demostrado.
∞
Teorema 5. Sea ϕ1, ϕ2, … un sistema ortonormal infinito. La serie
∞
∑ xνϕν
ν =1
∑ xν
2
es convergente siempre y sólo cuando lo es la serie . (Esta última serie tiene
ν =1
todos sus términos ≥ 0 y es, por lo tanto, convergente o diverge propiamente ha
cia (+ ∞)*.
Demostración: Dado que el caso a que se refiere el enunciado se presenta sólo
en C(∞), podemos aplicar el criterio de convergencia de Cauchy, es decir, echar
∞ N
mano de D. Según éste, ∑ xνϕν converge, esto es, la sucesión de las ∑ xνϕν con
ν =1 ν =1
verge para N → ∞ cuando para cada e > 0 existe N = N(e) tal que cualesquiera
sean L, M > N es
L M
∑ xν ϕν − ∑ xν ϕν < ε.
ν =1 ν =1
Tomemos L > M > N; entonces es
L M L
∑ xν ϕν − ∑ xν ϕν = ∑ xνϕν < ε ,
ν =1 ν =1 ν = M +1
2
L
⎛ L L
⎞ L
∑ xν ϕν = ⎜ ∑ xν ϕν , ∑ xν ϕν ⎟ = ∑ xµ xν (ϕ µ , ϕν ) =
M +1 de vista ⎝
* No seν =pierda ν = MNeumann
que +1 = M +1 aquí ⎠el término
ν utiliza µ,ν = M +1convergencia en dos sentidos
∞
esencialmente distintos. ∑ xνϕν =converge,
L L
cuando lo hace,
M
en el 2sentido que se ha dado en II.1. al
∑ ∑ ∑
2 2
ν =1 x = x − x , ν ν ν
término convergencia: sus términos
ν =no son números
M +1 ν =1 ni funciones,
ν =1 son elementos abstractos del E. H.
En el modelo funcional del E. H. (véase más adelante), las ϕν son funciones de cuadrado sumable
en el sentido de Lebesgue y la convergencia, la convergencia en media. En cambio, la convergencia
∞
∑ xν
2
a que se refiere en , es la convergencia ordinaria del Análisis elemental. La misma observación
ν =1
debe hacerse a la demostración que da y al empleo del criterio de convergencia de Cauchy: utiliza en
ella un criterio de Cauchy postulado (postulado D) y otro criterio de Cauchy que es el que se de
muestra en los elementos de Análisis. (N. del T.)
151
Fund_MAT_02.indd 151 9/5/18 10:10

Fundamentos matemáticos Lde la mecánica
M
cuántica L
∑ xν ϕν − ∑ xν ϕν = ∑ xνϕν < ε ,
ν =1 ν =1 ν = M +1
2
L
⎛ L L
⎞ L
∑ xν ϕν = ⎜ ∑ xν ϕν , ∑ xν ϕν ⎟ = ∑ xµ xν (ϕ µ , ϕν ) =
ν = M +1 ⎝ ν = M +1 ν = M +1 ⎠ µ,ν = M +1
L L M
∑ xν = ∑ xν − ∑ xν ,
2 2 2
=
ν = M +1 ν =1 ν =1
y, por consiguiente,
L M
0 ≤ ∑ xν − ∑ xν < ε 2.
2 2
ν =1 ν =1
Pero ésta es precisamente la condición de convergencia de Cauchy para la sucesión

N ∞
∑ xν ∑ xν
2 2
, N → ∞ es decir, para la serie .
ν =1 ν =1
Teorema adicional. Si f = ∑ x ϕ , se tiene (f, ϕn) = xn, tanto si el sistema or
ν n n
tonormal ϕn es finito como si es infinito —en este último caso, supuesto, claro
está, que la serie sea convergente.
⎛N ⎞
Demostración: Para N ≥ n el producto interior ⎜ ∑ xµϕ µ , ϕν ⎟ es igual a
⎝ µ =1 ⎠
N
∑ xµ (ϕµ , ϕν ) = xν .
µ =1
Si el sistema ϕ1, ϕ2, … es finito, podemos tomar N igual al mayor de los índices
n; si ϕ1, ϕ2, … es un sistema infinito, podemos hacer tender N a ∞ apoyándonos
en la continuidad del producto interior*. En ambos casos resulta ( f, ϕm) = xm
Teorema 6. Sea ϕ1, ϕ2, … un sistema ortonormal y f cualquiera en el E. H.

La serie f' = ∑ x ϕ , en la que xn = ( f, ϕn)(n = 1, 2, …) es siempre convergente y
ν n n
la diferencia f − f' es ortogonal a ϕ1, ϕ2, …
Demostración: La convergencia se deduce de los teoremas 4 y 5, y según el
teorema adicional al teorema 5 es ( f', ϕn) = xn = ( f, ϕn), de donde ( f − f', ϕn) = 0.
Tras estos preparativos podemos ya indicar criterios generales, esto es, válidos
también en C(∞), que permitan reconocer si un sistema ortogonal dado es o no
completo.
* ⎛∞ ⎞ ⎛ N
⎞ ⎛∞ ⎞
⎜⎝ ∑
µ =1
α µϕ µ , ϕν ⎟ = ⎜ lim ∑ α µϕ µ ⋅ ϕν ⎟ = lim ⎜ ∑ α µϕ µ , ϕν ⎟ = xν .
⎠ ⎝ N →∞ µ =1 ⎠ N →∞ ⎝ µ =1 ⎠

La continuidad implica la validez de la inversión
(lim f n, g) = lim ( f n, g)
n→∞ n→∞
cuando existe lim fn, como puede verse fácilmente. (N. del T.)
152
Fund_MAT_02.indd 152 9/5/18 10:10

Teorema 7. Sea ϕ1, ϕ2, … un sistema ortonormal. Para que sea un sistema
ortonormal completo es necesaria y suficiente cada una de las siguientes condi
ciones:
a) La variedad lineal cerrada [ϕ1, ϕ2, …] definida por ϕ1, ϕ2, … coincide
con E.
b ) Cualquiera que sea f es f = ∑ x ϕ , donde xn = ( f, ϕn) (n = 1, 2, …; la
ν n n
convergencia resulta del teorema 6).
γ ) Cualesquiera que sean f y g es
( f , g) = ∑ ( f , ϕν )(g, ϕν )
(La convergencia absoluta del segundo miembro resulta del teorema 4.)
Demostración: Si ϕ1, ϕ2, … es completo, f − ∑ x ϕ (x = ( f , ϕn) · n = l, 2, …)
ν n n n
es igual al elemento 0, pues, según el teorema 6, es ortogonal a ϕ1, ϕ2, … Por ende
queda satisfecha la condición b). Si se cumple la condición b), cada elemento f es
N
el límite de la sucesión asociada ∑ xνϕν para N → ∞ (cuando ϕ1, ϕ2, … es infi
ν =1
nito) y pertenece, por lo tanto, a [ϕ1, ϕ2, …]. Luego, E ≡ [ϕ1, ϕ2, …], es decir, se
verifica a). Finalmente si vale a) y f es ortogonal a todos los ϕ1, ϕ2, …, lo es
también a todas sus combinaciones lineales y, por tazón de continuidad, a todos
los puntos de acumulación de éstas, es decir, f es ortogonal a [ϕ1, ϕ2, …], es decir,
a E y, por consiguiente, f es ortogonal a sí mismo: ( f , f ) = 0 ∴ f = 0. Luego ϕ1,
ϕ2, … es completo.
Tenemos, pues, el siguiente esquema lógico
carácter de completo → b) → a) → carácter de completo,
que permite reconocer a a) y b) la calidad de necesarias y suficientes.

Supongamos que γ ) se cumple. En este supuesto, si f es ortogonal a ϕ1, ϕ2,
…, basta hacer en γ ) f = g para reconocer que es entonces ( f , f ) = ∑0 · 0 = 0, de
donde f = 0, es decir, ϕ1, ϕ2, … es completo. Por otra parte, se sigue de b ) (que
equivale a decir de ϕ1, ϕ2, … que es completo) que
⎛N N
⎞
( f , g) = lim ⎜ ∑ ( f , ϕν )ϕν , ∑ (g, ϕν )ϕν ⎟
N →∞ ⎝ ⎠
ν =1 ν =1
N
= lim
N →∞
∑ ( f , ϕµ )(g, ϕν )(ϕµ , ϕν )
µ,ν =1
N ∞
= lim ∑ ( f , ϕν )(g, ϕν ) = ∑ ( f , ϕν )(g, ϕν ),
N →∞
ν =1 ν =1
153
Fund_MAT_02.indd 153 9/5/18 10:10

(si el sistema ϕ1, ϕ2, … es finito, huelgan los pasos al límite), esto es, de b ) se
sigue g ). Luego, también g ) es necesaria y suficiente.
Teorema 8. Para cada Sucesión f1, f2, … existe un sistema ortonormal g1, g2,
… que define la misma variedad lineal cerrada que ella (ambas sucesiones pueden
ser finitas).
Demostración: En primer lugar, sustituyamos f1, f2, … por una sucesión parcial
g1, g2, … que defina la misma variedad lineal cerrada, pero además tal que sus
elementos sean todos linealmente independientes. La determinación de g1, g2, …
puede efectuarse del siguiente modo: sea g1 el primer fn diferente de 0; g2 el pri
mero fn que es distinto de todos los a1 g1; g3 el primer fn que es distinto de todos
los a1 g1 + a2 g2; etc. (Si para un cierto p no existe ningún fn que sea distinto de
todos los a1 g1 + … + ap gp, interrumpiremos la su cesión de los gn en él término
gp). Los elementos g1, g2, … cumplen nuestro propósito.
Formemos ahora, siguiendo el «método de ortogonalización», de E. Schmidt,
1
γ 1 = g1, ϕ1 = γ 1,
γ1
1
γ 2 = g 2 − (g 2, ϕ1)ϕ1, ϕ2 = γ2
γ2
1
γ 3 = g 3 − (g 3, ϕ1)ϕ1 − (g 3, ϕ2 )ϕ2, ϕ3 = γ 3, *
γ3
.......................................................................... *
La construcción de cada ϕp es efectivamente posible, es decir, todos los deno

minadores ∙gp ∙ son ≠ 0, pues si, p. e., fuese gp = 0, gp sería combinación lineal de
ϕ1, ϕ2, …, ϕp – 1, o sea, en último término, de g1, g2, …, gp − 1, contra la hipótesis.
Además, es claro que gp es combinación lineal de ϕ1, …, ϕp (y esto, cualquiera que
sea p) y que ϕp es combinación lineal de g1, …, gp. Luego g1, g2, … y ϕ1, ϕ2, …
definen la misma variedad lineal cerrada:
[ϕ1, ϕ2, …] ≡ [g1, g2, …] ≡ [f1, f2, …]
Finalmente, por construcción es ∙ϕp ∙ = 1 y, para q < p, (gp, ϕq) = 0, es decir,

(ϕp, ϕq) = 0 (q < p). Pero como en esta última igualdad podemos permutar entre
* El método consiste, conforme se ve, en restar de cada elemento gp su proyección sobre la va
riedad lineal {ϕ1, …, ϕp − 1}. Además, merece ser puesto de relieve que en la demostración de este
teorema no se utilizan los anteriores (del 3 en adelante), lo que permite apoyar en él parte de la de
mostración de la existencia en el E. H. de un sistema ortonormal completo, existencia que hasta aquí
está en el aire. (N. del T.)
154
Fund_MAT_02.indd 154 9/5/18 10:10

sí p y q, resulta que (ϕp, ϕq) = 0 cualesquiera sean p ≠ q. ϕ1, ϕ2, … es, por lo
tanto, un sistema ortonormal.
Teorema 9. Para cada variedad lineal cerrada C existe un sistema ortonormal
cuya extensión lineal cerrada coincide con C.
Demostración: En el caso C(n) el teorema es evidente, porque si en E se cumplen
A, B, C(n), en cada variedad lineal B contenida en E se cumplen A, B, C(m) con
un m ≤ n de modo que la observación relativa al teorema 3(n) es aplicable a B: exis
te un sistema ortonormal ϕ1, …, ϕm que es completo en B, y este solo hecho, en
virtud del teorema 7, a), justifica ya el teorema. (Vemos que en este caso es inclu
so innecesaria la hipótesis de que B sea cerrada, más bien resulta este carácter de
la misma demostración. Cf. lo dicho antes de la definición 5.)
En el caso C(∞) recordemos primero que E es separable (axioma E) y vamos a
demostrar que también C lo es —en general, todo conjunto parcial de E es sepa
rable. Formemos para ello la sucesión f1, f2, … densa dondequiera en E (cf. E en
II.1) y para cada fn y cada m = 1, 2, … la esfera En, m constituida por todos los f
1
tales que ∙ f − fn ∙ < . Para cada En, m que contiene puntos de C, elijamos uno de
m
estos puntos al que llamaremos gn, m. Para ciertos n, m puede, por consiguiente, no
estar definido gn, m, pero los sí definidos forman una sucesión de elementos de C.50
1 e
Sea f un punto cualquiera de C y e > 0. Existe un m tal que < y un fn, tal
1 m 2
que ∙ fn − f ∙ < . Luego, ya que En, m contiene un punto de C (a saber, el f ), gn, m
m
1 2
está definido y ∙ fn − gn, m∙ < es decir, ∙ f − gn, m∙ < < e. El elemento f, que era
m m
cualquiera en C, es, pues, punto de acumulación de los gn, m definidos y, por lo
tanto, la sucesión gn, m es doquier densa en C, es decir, C es separable.
Sentado esto, sea f1, f2, … la sucesión de elementos de C que es densa doquier
en C. Su extensión lineal cerrada [ f1, f2, …] contiene todos los puntos de acumu
lación de f1, f2, … y, por lo tanto, todo C. Pero como C es una variedad li
neal cerrada y f1, f2, … pertenecen a ella, también es [ f1, f2, …] parte de C; luego
C ≡ [f1, f2, …]. Si ahora construimos el sistema ortonormal ϕ1, < ϕ2, … de acuer
do con el teorema 8, de modo que {ϕ1, ϕ2, …} ≡ { f1, f2, …}, basta añadir a los
dos miembros de esta identidad sus puntos de acumulación para que resulte
{ϕ1, ϕ2, …} ≡ { f1, f2, …} ≡ C. Queda así demostrado el teorema.
Si aplicamos el teorema 9 al caso de ser C = E, resulta, en virtud del teorema 7,
a), que el sistema ortonormal ϕ1, ϕ2, … es completo; luego existen sistemas or
tonormales completos.
Con esto estamos ya en condiciones de demostrar que E es un En o E∞, según
que valga en él C(n) o C(∞); es decir, E está determinado en todas sus propiedades.
Para conseguirlo, basta hacer ver que es posible representar E biunívocamente
sobre el conjunto de todos los {x1, …, xn} o de todos los {x1, x2, …} tales que la
∞
∑ xν
2
sea finita de modo que
ν =1
155
Fund_MAT_02.indd 155 9/5/18 10:10

1. de f ↔ {x1, x2,…} se siga af ↔ {ax1, ax2,…};
⎪⎧ f ↔ {x1, x2,…}⎪⎫
2. de ⎨ ⎬ se siga f + g ↔ {x1 + y1, x2 + y2,…};
⎪⎩ g ↔ { y1, y2,…} ⎪⎭
⎧⎪ f ↔ {x1, x2,…}⎫⎪ n o∞
3. de ⎨ ⎬ se siga ( f ⋅ g) = ∑ xν yν
⎪⎩ g ↔ { y1, y2,…} ⎪⎭ ν =1
(En el caso ∞ hay que demostrar en 3 la convergencia absoluta.)

He aquí la correspondencia f ↔ {x1, x2, …}: Sea ϕ1, ϕ2, … un sistema orto
normal completo, el cual consta de n elementos en el caso C(n), de infinitos en el
C(∞) (teoremas 3(n) y 3(∞)). Sea {x1, x2, …} un elemento cualquiera de En o E∞ y
hagamos
n o∞
f= ∑ xν ϕν .
ν =1
∞
Según el teorema 5 esta serie converge incluso en el caso ∞ (pues en E∞ la ∑ xν
2
ν =1
es finita ), es decir, E, con la condición C(n) o la C(∞) agota todos los elementos de
En o E∞, respectivamente. Recíprocamente, sea f elemento cualquiera de E y
n o∞ n o∞
∑ ( f , ϕν )ϕν ∑
2
la serie asociada (teorema 7, b ); la serie f , ϕν es convergente
ν =1 ν =1
(teorema 4) y, por lo tanto, {( f , ϕ1), ( f , ϕ2), …} es elemento de En o E∞. Que a
cada {x1, x2, …} sólo un f le corresponde, es claro ; el recíproco se deduce del
teorema adicional al teorema 5.
1, 2 evidentemente se cumplen y 3 se sigue del teorema 7, g ).
3. Digresión acerca de las condiciones A-E 51

Hemos de verificar todavía la afirmación 2 hecha al final de I.4: que FZ, FΩ
satisfacen las condiciones A – E. En rigor, basta considerar FΩ, pues demostrare
mos en II.2 que un E definido por A – E debe coincidir en todas sus propiedades
con E∞, es decir, con FZ de forma que A – E también deben valer para éste. De
mostraremos, además, la independencia de las condiciones D, E respecto de
A − C(∞), independencia a la que aludimos en II.2, como también el que se dedu
cen de A − C(n), esto es, que valen en En. Estas tres cuestiones puramente mate
máticas constituyen el objeto de este capítulo.
Para comprobar la validez de A − E en FΩ, cuestión con la que comenzamos,
nos será menester apoyarnos en el concepto de integral de Lebesgue, acerca de
cuyo establecimiento debemos remitir al lector a los tratados especiales.52 (La in
tegral de Lebesgue, sin embargo, sólo interviene en esta ocasión y su conocimien
to no es indispensable para los restantes capítulos.)
156
Fund_MAT_02.indd 156 9/5/18 10:11

En I.4 habíamos introducido Ω como espacio de k dimensiones de las q1, …, qk

y FΩ como conjunto de todas las funciones ϕ(q1, …, qk) cuya ∫ … ∫ ∙ϕ(q1, …, qk)∙2

Ω
dq1 … dqk es finita. Las q1, …, qk varían entre − ∞ y + ∞. Sin embargo, todas
nuestras deducciones conservarían su valor, e incluso la demostración podría re
producirse literalmente en la mayor parte de los casos, si limitásemos el dominio
de variabilidad de las q1, …, qk (si, por ejemplo, Ω pasase a ser un semi-espacio,
o el interior de un cubo, o el interior de una esfera, o el exterior de estas figuras,
etc.), e incluso si eligiésemos como Ω una superficie curva (p. e., la superficie de
una esfera, etc.). Pero, con el fin de no extraviarnos en complicaciones accesorias
(cuya discusión puede el propio lector llevar a cabo sin esfuerzo, tomando como
pauta nuestra demostración tipo), nos limitaremos a aquel caso, el más sencillo.
Pasemos ya a examinar sucesivamente A – E.
Ad A. Hay que demostrar que si f, g pertenecen a FΩ, af y f ± g pertenecen
asimismo a FΩ, es decir, que si
∫ ∫ g *
2 2
f e
Ω Ω
∫Ω af ∫Ω f
∫Ω f ± g . (Pues no cabe
2 2 2 2
son finitas, también lo son =a e
2
equívoco ninguno, con esta notación representamos ∫ … ∫ f (q1, … qk) dq1 … dqk ,
!
∫!
… ∫ g(q1, … qk ) dq1 … dqk , etc.).
2
Ω
Ω
Que la primera es finita, es trivial. En cuanto a las segundas, obsérvese que a
causa de ser ∙ f ± g ∙2 = ∙ f ∙2 + ∙g ∙2 ± 2 Re ( f, –g ),53 su finitud quedará demostrada
tan pronto se demuestre la de ∫Ω f , g = ∫Ω f
g . Pero esto último se deduce de la
1
hipótesis sin más que considerar la relación ∙ f ∙∙g ∙ ≤ (∙ f ∙2 + ∙g ∙2).
2
Ad B. El producto interior de dos funciones f, g de FΩ lo definimos mediante
la relación ( f , g) = ∫Ω f g, cuyo segundo miembro es absolutamente convergente
según acabamos de ver. Todas las propiedades postuladas en B. son aquí evidentes,
salvo la última: que ( f, f ) = 0 implique f ≡ 0. En el presente caso, decir que
( f, f ) = 0 es decir ∫Ω f = 0, o sea, que la medida en el sentido de Lebesgue del
2
conjunto de los puntos en que es ∙ f ∙2 > 0, o sea, f (q1, …, qk) ≠ 0 es nula. Pero si
convenimos en considerar como no esencialmente diferentes dos funciones f y g
cuando es nula la medida-L (medida en el sentido de Lebesgue) del conjunto de
los puntos (q1, …, qk) en los que es f (q1, …, qk) ≠ g(q1, …, qk)54 podemos decir
que es f ≡ 0 al ser nula la ∫Ω f **.
2
* Estas integrales reponden al concepto de integral de Lebesgue. (N. del T.)

** En otros términos, dos funciones f y g de cuadrado sumable-£ que, en tanto que funciones,
pueden no ser iguales, las concebimos como el mismo punto de FΩ si son en general iguales, es decir,
157
Fund_MAT_02.indd 157 9/5/18 10:11

Ad C. Sean O1, …, On, n conjuntos contenidos en Ω, sin punto común dos

a dos, cuyas medidas-L sean positivas y finitas. A cada conjunto Oι hagamos co
rresponder una función fι (q1, …, qk) definida del siguiente modo: fι (q1, …, qk) = 1
si (q1, …, qk) pertenece a Oι, fι (q1, …, qk) = 0 si (q1, …, qk) no pertenece a Ol .*
Las n funciones fl (q1, …, qk) así definidas pertenecen a FΩ, ya que ∫Ω f l (q1,…, qk ) =
2
= medida de Ol , que es finita, y son, además, linealmente independientes, pues de

a1 f1 + … + an fn ≡ 0 se sigue que el primer miembro es cero, salvo acaso en un
conjunto de puntos de medida-L nula, y como en Oι (que tiene medida > 0) se
reduce a la constante aι, debe ser aι = 0 (l = 1, …, n). Esta construcción puede
llevarse a cabo cualquiera que sea n. Luego, en FΩ vale C(∞).
Ad D. Sea f1, f2, …, una sucesión en la que se cumple la condición de con

vergencia de Cauchy (la generalizada, cf. pág. 32), es decir, en la que, para cada
e > 0, existe un N = N(e) tal que ∫Ω f m − f n < ε cualquiera m, n ≥ N. Tomemos
2
()
1 1
( ) 1
( )
n1 = N ; n2 ≥ n1, N 2 ; n3 ≥ n1, n2, N 3 ; … Las nν crecen con ν (h1 ≤ h2 ≤ …)
( )
8 8 1 8 1
y, además, es nn, nn + 1 ≥ N ν , de modo que ∫Ω fnν +1 − f nν < ν . Sentado esto,
2
8 8 1
consideremos el conjunto P (ν) de todos los puntos en los que ∙ fn − fn ∙ > ν . Si m(ν)
2 ν + 1 ν
es la medida-L de P (ν), se tiene

2
⎛ 1⎞ µ (ν )
∫
2
f nν +1 − f nν ≥ ⎜ ν ⎟ µ(ν ) = ν ,
Ω ⎝2 ⎠ 4
de donde, recordando la desigualdad anterior,
m(ν) 1 1
< ν , m(ν) < ν ,
4ν 8 2
1 1
o sea, que ∙ fn − fn ∙ ≤ , salvo en un conjunto, el P (n), de medida-L m(n) < ν .
ν+1
2ν
ν
2
Sea ahora Q(n) el conjunto suma de P (n), P (n + 1), P (n + 2), …; su medida-L es
iguales salvo en los puntos de un conjunto de medida-£ nula y escribimos, pensando en ellas el pun
to de FΩ, f ≡ g. Dentro de este mismo orden de ideas, decimos que entre n funciones existe una re
lación lineal si se pueden determinar n constantes numéricas a1, ..., an tales que a1 f1 + … + an fn sea
en general nula, y escribimos a1 f1 + … + an fn ≡ 0. No es, pues, que el primer miembro sea idéntica
mente nulo, sino que es cero en general y, por lo tanto, define el mismo punto del FΩ que las fun
ciones idénticamente nulas. (N. del T.)
* fl es, pues, la llamada, en Teoría de conjuntos, función característica del conjunto Ol :
fl (P) = 1, si P ∈ Ol,
fl (P) = 0, si P ∈ FΩ − Ol ,
(N. del T.)
158
Fund_MAT_02.indd 158 9/5/18 10:11

1 1 1 1
med. Q(n) ≤ m(n) + m(n + 1) + m(n + 2) + … < ν + ν + 1 + ν + 2 + … = ν − 1
2 2 2 2
y fuera de Q(n) se cumple que
1 1 1
∙ fn − fn ∙ ≤ , ∙ fn − fn ∙ ≤ , ∙ fn − fn ∙ ≤ , …,
ν+1 ν
2ν ν+2 ν+1
2ν + 1 ν+3 ν+2
2ν + 2
y, por consiguiente, para n' y n" cualesquiera (n ≤ n' ≤ n" ),
∙ fn − fn ∙ ≤ ∙ fn
ν" ν' ν' + 1
− fn ∙ + ∙ fn
ν' ν' + 2
− fn ∙ + … + ∙ fn − fn ∙
ν' + 1 ν" ν' − 1
1 1 1 1
≤ + + … + ν" − 1 < ν' − 1 .
2ν' 2ν' + 1 2 2
Resulta así que, para n' → ∞, ∙ fn − fn ∙ tiende a cero cualquiera que sea n" > n'
ν" ν'
cuando (q1, …, qk) no pertenece, a Q(n); en otros términos, la sucesión fn1, fn2, …
(que es una sucesión parcial de la primitiva f1, f2, …) satisface la condición de
convergencia de Cauchy (en el sentido del Análisis elemental) salvo en Q(n) y, por
lo tanto, converge uniformemente en FΩ − Q(n).* Sea Q el conjunto de los puntos
(q1, …, qk) en los que fn1, fn2, … no converge. El conjunto Q es parte de cada uno
de los Q(n) (Q(n) ⊃ Q(n + 1) ⊃ Q(n + 2) ⊃ …) y, por consiguiente, med. Q ≤ med. Q(n) <
1
< ν − 1 (n = l, 2, …), es decir, med. Q = 0. Luego la sucesión fn1, fn2, … converge
2
en FΩ, salvo en los puntos del conjunto Q de medida-L nula, y converge unifor
memente en cada F − Q(n), por grande que sea n. Basta modificar la definición de
las fn atribuyéndoles el valor cero en Q para que fn1, fn2, … converja en todo FΩ.
(Cf. Nota5 4.)
Hemos entresacado así de la sucesión funcional f1, f2, … una sucesión parcial
fn1, fn2, … que converge en todo punto (q1, …, qk) y mientras que no hay motivo
alguno para que ello ocurriera con la f1, f2, … Sea f = f (q1, …, qk) el límite de fn1,
fn2, …; nos queda por demostrar: 1. que f pertenece a FΩ, es decir, que la ∫Ω f
2
es finita; 2. que f no solamente es límite de la sucesión fn1, fn2, … en el sentido

ordinario del límite funcional, sino que dicha sucesión converge hacia f en el
sentido de la «convergencia total»** del espacio de Hilbert; es decir, no solo
∙ f − fn ∙ → 0 para cada (q1, …, qk), sino que, además, f − f nν = ∫ f − f nν 2 → 0;
ν
Ω
3. que en este último sentido, f es límite incluso de la sucesión completa f1, f2, …,
esto es, que f − f n = ∫Ω f − f n 2 → 0.
∞
* De otro modo, en FΩ − Q(n) la serie funcional ∑ f µ +1 − f µ ( f n 0 = 0) f admite como serie
µ =ν ∞
1
mayorante a partir de m = n la serie numérica convergente ∑ 2µ y de ello se deduce desde luego la
µ =ν
convergencia uniforme de fnm (m = 1, 2, …) en FΩ − Q(n). (N. del T.)
** Llamado por otros autores «convergencia fuerte». (N. del T.)
159
Fund_MAT_02.indd 159 9/5/18 10:11

1
Sea e > 0, n0 tal. que nn ≥ N(e) (p. e., ≤ e), y n ≥ n0, n ≥ N(e).
0
8ν 0
Se tiene entonces que ∫Ω f nν − f n 2 < ε haciendo que n → ∞ resulta
∫ ∫ ∫
2 2
f − fn 2 = lim f nν − f n = lim f nν − f n ≤ ε
Ω Ω ν →∞ ν →∞ Ω
en virtud de un teorema relativo a la convergencia de las integrales de Lebesgue

(cf. Nota 52). Por consiguiente: a) la integral ∫Ω f − f n 2 es finita, o sea, f − fn per
tenece a FΩ, y, pues fn es también elemento de FΩ, f = ( f − fn) + fn pertenece a FΩ,
con lo que queda demostrado 1; b) de la desigualdad anterior se deduce, sin más
que hacer n → ∞, que ∫ f − f n 2 → 0, es decir, también los puntos 2. y 3. son
verdaderos.
Ad E. Es posible determinar una sucesión de puntos de FΩ, f1, f2, …, que es

dondequiera densa en FΩ.
En efecto: Sea Ω1, Ω2, … una sucesión de dominios parciales de Ω que, en
conjunto, cubran todo Ω y cada uno de los cuales tenga medida-L finita —por
ejemplo, esferas ΩN de centro en el origen y radio N. Sea f = f (q1, …, qk) un ele
mento cualquiera de FΩ y, en correspondencia con cada N = 1, 2, …, definamos
una función fN = fN (q1, …, qk) del modo siguiente:
⎧ ⎧⎪si q1, …, qk pertenece a ΩN

⎪ f (q1, …, qk ) ⎨
f N (q1, …, qk ) = ⎨
⎪⎩y f (q1, …, qk ) ≤ N,
⎪0 en los demás casos
⎩
Cualquiera que sea el punto q1, …, qk, fN (q1, …, qk) → f (q1, …, qk) (e incluso
este límite es accesible, en cada punto, para un cierto valor de N, pues el conjun
to de puntos en que es f (q1, …, qk) = ∞ tiene medida-L nula) y, por lo tanto, en
todo punto de W ∙ f − fN ∙2 → 0. Por otra parte, la diferencia f − fN o es 0 o coinci
de con f, de modo que ∙ f − fN ∙2 ≤ ∙ f ∙2. Las integrales ∫Ω f − f N 2 admiten, pues,
la mayorante fija ∫Ω f 2 (¡ finita !), .o sea ∙ f − fN ∙ existe. Este resultado junto con
el anterior y con la consideración del teorema de convergencia a que antes hemos
aludido, nos permite escribir:
∫ ∫
2 2
lim f − f N = lim f − fN = lim f − f N = 0.
N →∞ N →∞ Ω Ω N →∞
Llamemos G la clase de todas las funciones g = g(q1, …, qk) que en todo el

espacio W satisfacen una desigualdad de la forma ∙g ∙ ≤ C (C fija) y además tales
que el conjunto de puntos en que es g ≠ 0 tiene medida-L finita. Las funciones fN
que antes hemos construido pertenecen todas a G, y, por lo tanto, G es doquier
denso en FW.
160
Fund_MAT_02.indd 160 9/5/18 10:11

Sea e > 0, g elemento de G, C una cota superior de ∙g ∙, M la medida del con
junto de los puntos en que es g ≠ 0. Construyamos una cadena de números racio
nales −C < r1 < r2 < … < rt < C tal que r1 < −C + e, r2 < r1 + e, …, rt < rt − 1 +
+ e, C < rt + e, lo que se consigue fácilmente. Reemplacemos cada uno de los
valores no nulos de Re g(q1, …, qk) por el más próximo de los valores rs(s = 1, 2,
…, t), dejando invariables los valores 0. La función h1(q1, …, qk) así definida di
fiere en todo W de Re g(q1, …, qk) en menos de e. Del mismo modo construyamos
la función h2(q1, …, qk) a partir de Im g (q1, …, qk). En estas condiciones, la fun
ción h = h1 + ih2 es tal que
∫ ∫ ∫
2 2 2
g−h = Re g − h1 + Im g − h2 ≤ M ε 2 + M ε 2 =
Ω Ω Ω
= 2M ε 2, g − h ≤ 2M ε
δ
Dado d > 0, basta hacer ε < para que ∙ g - h ∙ < d.
2M
Llamemos H la clase de todas las funciones h = h(q1, …, qk) que toman sólo
un número finito de valores diferentes y precisamente de la forma r + is (r y s
racionales) y cada uno, salvo el 0, sólo sobre conjuntos de medida-L finita. Las
funciones · h que hemos construido pertenecen a la clase H, de modo que H es
denso doquiera en G, y, por consiguiente, también en FW.
Sea II un conjunto de medida-L finita y fII = fII(q1, …, qk) la función así defi
nida:
⎧1 en II,
f II(q1, …, qk ) = ⎨
⎩0 fuera de II.
(fII es, pues, la función característica del conjunto II).

La clase H está constituida evidentemente por todas las funciones de la forma
t
∑ (ρs + iσ s )f II s
(t = 1, 2, …; ρs y σ s racionales).
s =1
Admitamos que hemos conseguido formar una sucesión de conjuntos de me

dida-L finita, II(1), II(2), … que goza de la siguiente propiedad: para cada conjunto
II y cada e > 0 existe un II(n) tal que la medida-L del conjunto de todos los puntos
que pertenecen a II, pero no a II(n), o a II(n) pero no a II (conjunto que es el lla
mado conjunto diferencia de II, II(n)), es < e. Las funciones
t
∑ (ρs + iσ s )f II (ns )
s =1
161
Fund_MAT_02.indd 161 9/5/18 10:11

(t = 1, 2, …; rs y ss, racionales; n = 1, 2, …) constituyen un conjunto doquiera

t
denso en H. En efecto: Sea ∑ (ρs + iσ s )f IIs una función cualquiera de H, y consi
t s =1
deremos la función ∑ (ρs + iσ s )f IIs(ns ) donde II(n ) es el conjunto de la sucesión II(n) s
s =1
correspondiente al conjunto IIs. Se tendrá:
t t 2
∫Ω ∑ (ρs + iσ s )fII − ∑ (ρs + iσ s )fII

s =1
s
s =1
(ns ) =
t 2 t 2
= ∫ ∑ (ρs + iσ s )( f IIs − f II(ns) ) =

Ω s =1
∑ (ρs + iσ s )( f IIs − f II(ns) ) ;
s =1
pero (teorema 2. de II.1, deducido de A. y B.)
t t
∑ (ρs + iσ s )( f II − f II s
(ns ) ) ≤ ∑ ρs2 + σ s2 f IIs − f II(ns ) ,
s =1 s =1
y, por lo tanto,
{∫ }
t t t
∑ (ρs + iσ s ) f IIs − ∑ (ρs + iσ s ) f II(ns) ≤ ∑ ρs2 + σ s2
2 2
Ω
f IIs − f II(ns ) =
s =1 s =1 s =1
t 1
= ∑ ρs2 + σ s2 {medida del conjunto diferencia (IIs , II(ns ))}2
s =1
t
< ∑ ε ρs2 + σ s2 .
s =1
Dado d > 0, basta determinar s con la condición
δ2
ε= 2
⎧t 2 ⎫
1
⎨∑ ( ρs + σ s )2 ⎬
2
⎩ s=1 ⎭
para que sea
t t
∑ (ρs + iσ s ) f II − ∑ (ρs + iσ s ) f II
s
(ns ) < δ,
s =1 s =1
162
Fund_MAT_02.indd 162 9/5/18 10:11

es decir, aquel conjunto de funciones es efectivamente denso doquier en H.*

t
Ahora bien, las funciones ∑ (ρs + iσ s )f II (ns ) pueden ordenarse de modo que
s =1
constituyan una sucesión que, por ser dondequiera densa en H, lo será en G, es
decir, lo será en FW y quedará demostrado Ad E. Sea t, en efecto, el común de
nominador de r1, s1, …, rt, st y r'1, s'1, …, r't , s't los correspondientes nuevos
numeradores; la función genérica del conjunto que consideramos podrá escribirse
en la forma
1 t
∑ (ρs + iσ s )f II(ns),
τ s =1
donde t, t = l, 2, …; r's, s's = 0, ±1, ±2, …; ns = 1, 2, … para s = 1, 2, …, t.

Disponer en sucesión estas funciones es lo mismo que hacerlo con los sistemas de
números (t, t, r'1, s'1, …, r't, s't, n1, …, nt ) y esto último es fácil, sin más que
atenerse a los valores crecientes de
t + t + ∙r'1∙ + ∙s'1∙ + … + ∙r't∙ + ∙s't∙ + n1 + … + nt,
pues a cada valor atribuido a esta suma de números naturales corresponde un nú
mero finito de dichos sistemas. Ordenando éstos de modo cualquiera dentro de
la clase a que pertenecen, obtenemos una sucesión simple conforme pretendíamos.
Hay que construir ahora la sucesión de conjuntos II(1), II(2), … Para lograrlo
nos apoyaremos en el hecho de que, dado un conjunto cualquiera II de medida-L
finita, M, y un número d > 0, existe un conjunto de puntos abierto, II', que con
tiene a II y cuya medida excede a la de éste en menos de d (cf. loc. cit. en la Nota 52
y en la Nota 45, donde se define también el concepto de «conjunto abierto»). Pero
* Nos hemos permitido modificar ligeramente la demostración que da Neumann y que reza así:
t t 2
∫Ω ∑ (ρs + iσ s )fII − ∑ (ρs + iσ s )fII

s =1
s
s =1
(ns ) ≤
t t
≤∑ ∫ (ρs + iσ s )f IIs − (ρs + iσ s ) f II(ns ) = ∑ (ρs2 + σ s2 ) ∫
2 2
f IIs − f II(ns ) =
s =1 Ω s =1 Ω
t t
= ∑ (ρs2 + σ s2 ) ⋅ Med (IIs , II(ns ) ) < ∑ (ρs2 + σ s2 )ε ,
s =1 s =1
δ2
de donde, si ε = t ,
∑ ( ρs2 + σ s2 )
s=1
t t
∑ (ρs + iσ s )f II − ∑ (ρs + iσ s )f II
s
(ns ) < δ . (N. del T.).
s =1 s =1
163
Fund_MAT_02.indd 163 9/5/18 10:11

a cada conjunto abierto II' y cada d > 0 es posible evidentemente vincular un

conjunto II" formado por un número finito de cubos, contenido en II', cuya
medida-L sea mayor que (med. II' ) - d, Las longitudes de las aristas y las coorde
nadas de los centros de tales cubos cabe elegirlas todas ellas entre los números
racionales. Es fácil ver que el conjunto diferencia de II, II" antes definido tiene
una medida - L < d + d = 2d, menor que e, por consiguiente, si se ha elegido
e
d = . Todo quedará, pues, resuelto, si conseguimos ordenar en sucesión esos
2
conjuntos de cubos.
Lo que caracteriza a cada uno de tales conjuntos es el número n = 1, 2, … de
cubos que contiene y las longitudes χ(n) de las aristas y las coordenadas , x1(n), …, x(kn)
de los centros de dichos cubos, (n = 1, 2, …, n). Los números χ(n), x1(n), …, x(kn) son
racionales; sea η = 1, 2, … su común denominador, y
χ' (n) = 1, 2, …; x'1 (n), …, x'k (n) = 0, ±1, ±2, …,
los nuevos numeradores. Nuestros conjuntos de cubos se caracterizan, pues, por

los sistemas de números
n, h, χ' (1), x'1 (1), …, x'k (1) …, χ' (n), x'1 (n), …, x'k (n).
Ordenemos estos sistemas atendiendo a los valores crecientes de las sumas
n + h + χ' (1) + ∙x'1 (1)∙ + … + ∙x'k (1)∙ + … + χ' (n) + ∙x'1 (n)∙ + … + ∙x'k (n)∙.
Como en el caso de combinaciones lineales de funciones, obtenemos así una su

cesión simple.
Antes de proseguir, respondamos a la siguiente cuestión: Se da un E que satis
face A-E (entre ellas, C(∞)). ¿En qué conjuntos parciales C de E se cumplen asimis
mo A-E, supuesto que se conserven las definiciones de af, f ± g, ( f, g)?
Para que en C quede satisfecho A. C debe ser una variedad lineal. B vale en C
de suyo. Aplacemos por un instante la consideración de C: sea como fuere, se
cumple C(n) o C(∞). Por su parte, D exige que si una sucesión de elementos de C
satisface en C la condición de convergencia de Cauchy, posea un elemento límite
en C. Pero como en cualquier caso una tal sucesión posee un límite en E, se trata
simplemente de que este límite pertenezca también a C, es decir, C debe ser cerra
do. Conforme vimos en la demostración del teorema 9, E vale siempre. Resumien
do: C debe ser una variedad lineal cerrada. Sea ϕ1, ϕ2, … el sistema ortonormal
cuya extensión lineal cerrada coincide con C (teorema 9). Si es infinito vale eviden
temente C(∞) y C es isomorfo con E∞ y, por consiguiente, con el propio E; si ter
mina en el elemento ϕn, vale C(n), en virtud, por ejemplo, del teorema 3(n), es decir,
C es isomorfo con En. Mas como D, E se cumplen en todo caso en C, valen en
cada En y, por consiguiente, se siguen de A-C(n).
164
Fund_MAT_02.indd 164 9/5/18 10:11

Conforme se ve, hemos evitado mediante artificios lógicos la verificación di

recta de A-E (bien comprendan C(n) o C(∞)) en En, E∞ (respectivamente). De todos
modos, una tal verificación no da lugar a dificultades esenciales y la dejamos a
cargo del lector.
Queda aún por demostrar la independencia de D y E respecto de A-C(∞). He
mos visto ahora mismo que cada variedad lineal del E∞ satisface A, B, E como
también C(n) o C(∞), pero que, si no es cerrada, no cumple D. Mas en este último
supuesto debe valer en ella C(∞) ya que de C(n) se sigue D. Es fácil indicar una va
riedad lineal con estas características: Sea ϕ1, ϕ2, … un sistema ortonormal. El
N
conjunto de todos los elementos de la forma ∑ xνϕν (N = 1, 2, …; x1, x2, …, xN arbitrarios)
1 ⎛ ∞ ⎛ 1⎞
ν =1
⎞
∞ 2
arbitrarios) es una variedad lineal no cerrada, pues ∑ ϕν ⎜ ¡∑ es finito!⎟ es
ν ⎝ ⎝
ν =1ν ⎠ ν =1 ⎠
ciertamente punto de acumulación de la misma, pero no elemento de ella
∞
⎛N 1 1 ⎞
∑
⎜⎝ ν =1 ν ϕν → ∑ ϕν para N → ∞⎟ . Luego, D es independiente de A-C(∞), E.
ν =1 ν ⎠
Consideremos además todas las funciones x(a ), cuyo parámetro a varía de
modo continuo entre -∞ y +∞, tales que los valores de a para los que es x(a ) ≠ 0
pueden escribirse en forma de sucesión y que la suma relativa a éstos, ∙x(a )∙2, S
sea finita.55 Todas estas funciones forman un espacio, Econt.. Si x(a ), y (a ) son dos
puntos cualesquiera de éste, sólo para dos sucesiones de valores de a es x(a ),
y (a ) ≠ 0, y dado que estas dos sucesiones pueden disponerse en forma de una
sucesión única, podemos afirmar que, excepto para los valores de a de una cierta
sucesión a1, a2, …, es siempre x(a ) = y (a ) = 0. Basta así considerar únicamente
los valores xn = x(an), yn = y (an) para n = 1, 2, …, con lo que todo ocurrirá como
en E∞, mientras se trate sólo de dos puntos del Econt.. Por lo tanto, A y B valen en
Econt. exactamente como en E∞.56 Lo mismo sucede en el caso de k puntos del Econt.
(k = 1, 2, …); luego, en él vale también C(∞). Incluso en el caso de una sucesión
de puntos del Econt. podemos establecer la correspondencia con el E∞, pues si esa
es la x1(a ), x2(a ), …, los valores a para los cuales es xn(a ) ≠ 0 constituyen, para
cada n = 1, 2, …, una sucesión a1(n), a2(n), … y todas éstas, a su vez, una sucesión
doble am(n)(n, m = 1, 2, …), que también puede escribirse en forma de sucesión
simple: a1(1), a2(1), a1(2), a3(1), a2(2), a1(3), … Luego, al igual que en E∞, vale D en Econt..
Muy de otro modo suceden las cosas con E: ante él todos los puntos del E des
empeñan un mismo oficio (todos deben ser puntos de acumulación de una cierta
sucesión) y no podemos juzgar de Econt. por lo que pasa en E∞. Y en verdad que E
no se cumple en Econt., pues cabe señalar una consecuencia de E que no vale en
éste: existe en Econt. un sistema ortonormal que no puede disponerse en forma de
sucesión, contra lo que se afirma en el teorema 3(∞).
{ }
En efecto, sea xb(a ) = 1 para a = b . Para cada b, xb(a ) es un elemento de
= 0 para a ≠ b
Econt. y los xb(a ) en conjunto constituyen un sistema ortonormal. Este únicamen
te podría escribirse en sucesión si ello fuese posible con los valores b del interva
165
Fund_MAT_02.indd 165 9/5/18 10:11

lo (-∞, +∞), y ya se sabe que no es este el caso.57 Luego E es independiente de

A-C(∞), D.
(Repárese en la diferencia esencial entre el espacio de las funciones f (x) cuya
+∞
∫−∞ ∑ x(α )
2 2
f (x) dx es finita y el de las x(a ) cuya es finita. ¡A decir verdad, po
α +∞
∫−∞ x(α ) dα
2
dríamos definir el primero como espacio de todas las x(a ) cuya es
+∞
finita! Toda la diferencia estriba en la sustitución de la ∫−∞ … dα por la ∑ …, y,
α
sin embargo, mientras el primer espacio es un FW, en él se cumplen, por consi
guiente, A-E y es isomorfo con E∞, el último, el Econt., infringe E y es esencialmen
te distinto de E∞).
4. Variedades lineales cerradas

La importancia que presenta para nosotros el § II.2 reside, no sólo en la de
mostración del isomorfismo, sino también en los varios teoremas relativos a los
sistemas ortonormales que en él se demostraron. Nos proponemos ahora proseguir
el análisis geométrico del espacio de Hilbert y estudiar detenidamente las varieda
des lineales cerradas que desempeñan en E∞ un papel análogo al que en el En
desempeñan las rectas, planos, etc. (es decir, los Em, m ≤ n).
Recordemos antes el simbolismo que se introdujo en las definiciones 2, 5: Si C
es un conjunto cualquiera contenido en E, {C} y [C] son, respectivamente, la ex
tensión lineal de C y la extensión lineal cerrada de C, esto es, los menores conjun
tos de una y de otra clase que contienen a C. Haremos extensiva aquí esta notación
a los conjuntos que resultan de reunir A, B, conjuntos cualesquiera contenidos
en E, y elementos f, g, … de E. Así {A, B, …, f, g, …} y [A, B, …, f, g, …] re
presentan, respectivamente, la variedad lineal y la variedad lineal cerrada definidas
por uno de aquellos conjuntos reunión. Si en particular M, N, … (en número
finito o infinito) son variedades lineales cerradas, indicaremos con M + N, … la
variedad lineal cerrada [M, N, …].* La variedad lineal {M, N, …} consta, evi
dentemente, de todas las sumas f + g + … ( f describe M, g describe N, …) y
[M, N, …] = M + N + … resulta de éstas mediante la adición de los puntos de
acumulación. Cuando se trata de sólo un número finito de conjuntos M, N, … y
cada elemento de uno cualquiera es ortogonal a cada uno de los elementos de los
conjuntos restantes, dichas dos formas son iguales entre sí, conforme veremos, a
pesar de que no hay motivo alguno para que así ocurra en general.
* M + N + … no es, por consiguiente, una suma en el sentido de la Teoría de conjuntos. Des

de el punto de vista de ésta, forman parte de M + N + … sólo aquellos elementos, que pertenecen
a uno por lo menos de los conjuntos M, N, …, mientras que en el conjunto M + N + …, tal como
lo define Neumann, al lado de todos los elementos de M, N, … figuran elementos no contenidos en
ninguno de estos conjuntos. Así se comprende que el conjunto M + N + … pueda ser definido como
conjunto cerrado, mientras que, como es sabido, la suma de una infinidad numerable de conjuntos
cerrados no es en general un conjunto cerrado. (N. del T.)
166
Fund_MAT_02.indd 166 9/5/18 10:11

Sea M una variedad contenida en la variedad lineal cerrada N y consideremos

el conjunto de los elementos de N que son ortogonales a todos los de M. También
este conjunto es, evidentemente, una variedad lineal cerrada,* y la llamaremos
diferencia de M y N : N - M. El teorema 14 pondrá en claro los motivos que ha
blan en favor de haber llamado diferencia al conjunto que acabamos de definir. Es
sobre todo importante el conjunto E - M, conjunto de todos los f ortogonales a
todo M: lo llamaremos la variedad lineal cerrada complementaria de M.
Mencionemos finalmente tres variedades lineales cerradas particularmente sim
ples: primero, el propio E; segundo, el conjunto cuyo único elemento es el 0, {0} =
= [0]; y tercero, el conjunto de todos los af ( f = un elemento dado de E, a variable
numérica) que evidentemente es una variedad lineal cerrada, y por eso = { f } = [ f ].
A continuación introducimos el concepto de «proyectar», concepto en todo
análogo al de la geometría euclídea.
Teorema 10. Sea M una variedad lineal cerrada. Cada elemento f de E pue
de descomponerse de modo único en dos sumandos, f = g + h, uno de los cuales,
el g, pertenece a M y el otro, el h, a E - M.
Observación: Llamaremos a g la proyección de f en M y a h la perpendicular
de f a M. Para indicar a g introduciremos el signo PM f.
Demostración: Sea ϕ1, ϕ2, … el sistema ortonormal cuya extensión lineal ce
rrada es precisamente M, sistema que existe según el teorema 9. La serie ∑ ( f , ϕn )ϕn,
n
que converge según el teorema 6, define un elemento g = ∑ ( f , ϕn )ϕn que perte
n
nece evidentemente a M. Además, h = f - g es ortogonal a todos los elementos
j1, j2, … (teorema 6) y como los vectores ortogonales a h constituyen una varie
dad lineal cerrada, al ser ortogonales a h los vectores j1, j2, … también lo serán
los de [j1, j2, …] = M, es decir, h pertenece a E - M. Sea f = g' ± h' una segun
da descomposición de f en dos sumandos, el g' elemento de M y el h' elemento
de E - M. De la comparación de ambas descomposiciones resulta g + h = g' + h',
de donde g - g' = h' - h = j. El elemento j debe pertenecer, pues, a M y a E - M
y, por lo tanto, ha de ser ortogonal a sí mismo: (j, j) = 0, es decir, j = 0. Luego,
g' = g y h' = h.
PM f es, por consiguiente, una operación que vincula a cada f de E su proyec
ción en M, PM f. En el párrafo próximo definiremos como operador, R, a una
* En efecto: f ∈ N - M y g ∈ N - M implica ( f, x) = 0, ( g, x) = 0, cualquiera que sea x ∈ M.
Luego (af + bg, x) = a( f, x) + b( g, x) = 0, cualesquiera sean a y b y x ∈ M, es decir, af + bg ∈ N - M,
esto es N - M es una variedad lineal. Que es cerrada se sigue de que, si f1, f2, … es una sucesión
convergente de elementos de N - M y, por lo tanto, de N, y es f su límite, éste pertenece a N(N es
cerrado) y en virtud de II.1,
( f , x) = (lim f n, x) = lim ( f n, x) = 0
n→∞ n→∞
cualquiera que sea x ∈ M. Luego, también f ∈ N - M. (N. del T.)
167
Fund_MAT_02.indd 167 9/5/18 10:11

función definida en un conjunto parte de E cuyos valores son elementos de E, es

decir, una correspondencia que a ciertos f de E liga ciertos elementos Rf , asimismo
de E (¡no a todos los elementos necesariamente; para otros f de E acaso R no esté
definido, carezca de sentido!). PM es, por consiguiente, un operador definido en
todo E, al que llamaremos el operador de proyección de M.
Teorema 11. El operador PM posee las siguientes propiedades:
PM(a1 f1 + … + an fn) = a1PM f1 + … + anPM fn,

(PM f, g) = (f, PMg),
PM(PM f ) = PM f.
M es el conjunto de todos los valores de PM, es decir, el conjunto de todos los

PM f ; pero también se puede caracterizarlo como conjunto de todas las soluciones
de la ecuación PM f = f , mientras que E - M es el conjunto de todas las soluciones
de PM f = 0.
Observación: También en el próximo párrafo hemos de ver que la primera pro
piedad es característica de los llamados operadores lineales, y que la segunda lo es
de los hermíticos. La tercera propiedad expresa que aplicar dos veces consecutivas
el operador PM equivale a aplicarlo una sola vez —a este hecho se refiere la expre
sión simbólica generalmente en uso PM PM = PM o P 2M = PM.
Demostración: Efectuemos la descomposición de los elementos f1, …, fn en
g1, …, gn, elementos de M, y h1, …, hn, elementos de E - M. De las igualdades
f1 = g1 + h1, …, fn = gn + hn
se sigue
a1 f1 + … + an fn = (a1g1 + … + an gn) + (a1h1 + … + anhn),
donde a1g1+ … + an gn es un elemento de M y a1h1 + … + anhn pertenece a E - M.

Luego
PM (a1 f1 + … + an fn) = a1g1 + … + angn = a1 PM f1 + … + an PM fn.
Esta es la primera fórmula.

Sea, en segundo lugar,
f = g' + h', g = g" + h" (g', g" elementos de M h', h" de E - M).
Los elementos g', g" son ortogonales a h', h" y, por consiguiente,
( g', g) = (g', g" + h" ) = ( g', g" ) = ( g' + h', g" ) = ( f , g" ),
es decir, (PM, g) = ( f , PM g), que es la segunda fórmula.
168
Fund_MAT_02.indd 168 9/5/18 10:11

Finalmente, PM f pertenece a M y, por lo tanto, PM f = PM f + 0 es la descom

posición, garantizada por el teorema 10, de PM f, es decir, PM (PM f ) = PM f. Esta es
la tercera fórmula.
PM f = f nos dice que en la descomposición de f , f = g + h, donde g es elemen
to de M y h de E - M (teorema 10), es f = g y h = 0, o sea, que f pertenece a M.
Análogamente, si PM f = 0, es, en f = g + h, g = 0 y f = h, es decir, f pertenece a
E - M. Esto es precisamente lo que hemos afirmado en quinto y sexto lugar. Por
último, todos los PM f son, por definición, elementos de M, y cada f' de M es igual
a un PM f —por ejemplo, según lo que acabamos de decir, igual a PM f'. Y ésta es
nuestra cuarta afirmación.
Observemos aún que de la segunda y tercera fórmulas de este teorema se de
duce que
(PM f , PM g) = ( f , PM PM g) = ( f , PM g) = (PM f, g).
Esto sentado, veamos de definir los operadores de proyección PM independien

temente de las variedades M.
Teorema 12. Un operador E que tiene sentido en todo el espacio (cf. lo dicho
antes del teorema 11) es un operador de proyección, esto es, existe una variedad
lineal cerrada M tal que E = PM, siempre y solamente cuando E posee las siguien
tes propiedades:
(Ef , g) = ( f , Eg), E 2 = E
(cf. la observación al teorema 11). En estas condiciones, M está unívocamente de

terminada por E (según el teorema 11).
Demostración: En virtud del teorema 11, es claro tanto la necesidad de estas
condiciones cuanto el estar determinado M por E. Por este motivo basta demostrar
que si E posee aquellas propiedades, existe una variedad lineal cerrada M tal que
E = PM.
Sea M la variedad lineal cerrada definida por el conjunto de todos los Ef (de-
finición 5). El vector g - Eg es ortogonal a todos los Ef :
(Ef , g - Eg) = (Ef , g) - (Ef , Eg) = (Ef , g) - (E 2f , g) = 0.
Los elementos de E que son ortogonales a g - Eg forman una variedad lineal

cerrada que contiene los Ef y con ellos a M; luego g - Eg pertenece a E - M. La
descomposición de g relativa a M es, por lo tanto, g = Eg + (g - Eg), de donde
PM g = Eg, siendo g arbitrario. Con esto queda todo demostrado.
Cuando es M = E o = [0], es E - M = [0] o E, respectivamente, y por eso la
descomposición de un f hecha de acuerdo con el teorema 11 es, en el primer caso,
f = f + 0, y en el segundo f = 0 + f , o sea PM f = f y PM f = 0, respectivamente.
169
Fund_MAT_02.indd 169 9/5/18 10:11

El operador (¡con sentido en todo el espacio!) definido por Rf = f lo llamaremos

operador unidad, 1, y el que lo está por Rf = 0, operador 0. Se tiene, pues: PE = 1,
P o = 0. Es claro, además, que la descomposición f = g + h relativa a M (g ele
mento de M, h de E - M) es también aplicable en la forma f = h + g a E - M
(h elemento de E - M, g elemento de M), pues, por pertenecer g a M, g es orto
gonal a cada elemento de E - M y así forma parte de E - (E - M). Por esto po
demos escribir PM f = g, PE - M f = h = f - g, o sea, PE - M f = f - PM f , hecho este
último (PE - M f = 1 · f - PM f ) que expresaremos simbólicamente mediante
PE - M = 1 - PM. (Respecto de la adición, substracción y multiplicación de opera
dores, cf. las consideraciones preliminares al teorema 14). En lo que precede reco
nocimos con facilidad que M es parte de E - (E - M), pero sólo de modo más
prolijo se podría demostrar directamente que es M = E - (E - M). Con todo, esta
coincidencia se sigue desde luego de
PE - (E - M) = 1 - PE - M = 1 - (1 - PM) = PM
Obsérvese de paso que, junto con E, es también 1 - E un operador de pro

yección y que, a causa de ser 1 - (1 - E) = E, vale asimismo el recíproco.
Teorema 13. Siempre es
∙Ef ∙2 = (Ef, f ), ∙Ef ∙ ≤ ∙f ∙,
y ∙Ef ∙ = 0, ∙Ef ∙ = ∙f ∙ es característico de los elementos f de E - M y de M, res

pectivamente.
Observación: Por consiguiente, en particular
∙Ef - Eg ∙ = ∙E( f - g)∙ ≤ ∙ f - g ∙,
es decir, el operador E es continuo (cf. lo dicho después del teorema 2. en II.1).

Demostración: Se tiene en primer lugar (cf. lo que sigue al teorema 11):
∙Ef ∙2 = (Ef, Ef ) = (Ef, f ),
y como también 1 - E es un operador de proyección,
∙Ef ∙2 + ∙ f - Ef ∙2 = ∙Ef ∙2 + ∙(1 - E) f ∙2 =

= (Ef, f ) + ((1 - E)f , f ) = ( f, f ) = ∙ f ∙2.
Pero los dos sumandos del primer miembro son ≥ 0 ; luego ambos son ≤ ∙ f ∙2.
En particular, ∙Ef ∙2 ≤ ∙ f ∙2, ∙Ef ∙ ≤ ∙ f ∙. Que ∙Ef ∙ = 0, de donde Ef = 0, expresa
que f pertenece a E - M, lo sabemos por lo visto en el teorema 11. En cuanto a
170
Fund_MAT_02.indd 170 9/5/18 10:11

∙Ef ∙ = ∙ f ∙, esta relación significa que ∙ f - Ef ∙2 = 0, como demuestra lo estable
cido más arriba, es decir, que Ef = f, es decir, que f es elemento de M.
Si R, S son dos operadores, entendemos por R ± S, aR (a, número complejo)
y RS los operadores así definidos:
(R ± S )f = Rf ± Sf, (aR)f = a · Rf, (RS)f = R(Sf ),
y, naturalmente, pondremos
R0 = 1, R 1 = R, R 2 = RR, R 3 = RRR, …
Es fácil discutir las reglas algorítmicas válidas aquí: Para R ± S y aR se comprueba

sin dificultad que valen todas las leyes elementales del cálculo numérico. No así
para RS. Cierto que valen las leves distributivas (R ± S )T = RT ± ST y R(S ± T ) =
= RS ± RT, como se puede verificar (la última exige el carácter lineal de R; cf. la
observación al teorema 11, y lo que se dirá en el próximo párrafo), y también la
asociativa, (RS )T = R(ST ) = RST; pero la ley conmutativa, RS = SR, no es ya vá
lida en general. [¡No hay ningún motivo para que (RS )f = R(Sf ) y (SR )f = S(Rf )
sean iguales!]. Sin embargo, puede valer para dos R y S particulares. Cuando así
ocurre, diremos de R y S que son permutables. Así por ejemplo, 0 y 1 son permu
tables con cualquier otro operador definido en todo el espacio:
R0 = 0R = 0, R1 = 1R = R;
o R m y R n, pues R m · R n = R m + n, independiente, por lo tanto, del orden en que se
den m, n.*
Teorema 14. Sean E, F los operadores de proyección de las variedades linea

les cerradas M, N. La condición necesaria y suficiente para que EF sea también
operador de proyección es que E, F sean permutables, es decir, que sea EF = FE.
Si así ocurre, la variedad lineal cerrada P a que pertenece EF es la constituida por
los elementos comunes a M y N.** El operador E + F es operador de proyección
siempre y sólo cuando EF = 0 (o también, si es FE = 0). Esto significa que todo
M es ortogonal a todo N y E + F pertenece entonces a M + N = [M, N], que en
este caso coincide con {M, N}. El operador E - F es operador de proyección siem
pre y sólo cuando es EF = F (o también, si FE = F ). Esto significa que N es parte
de M y en tal caso E – F pertenece a M − N.
* De ahí se sigue que dos polinomios cualesquiera en R son permutables. (N. del T.)
** Que la intersección P de los dos conjuntos cerrados M y N es un conjunto cerrado resulta sin
más que considerar que si A es punto de acumulación de P, lo es de M y de N y, por lo tanto, per
tenece a M y a N, es decir, a P. (N. del T.)
171
Fund_MAT_02.indd 171 9/5/18 10:11

Demostración: En el caso del operador. EF debemos comprobar si se cumplen

las dos condiciones del teorema 12:
(EFf, g) = ( f, EFg), (EF )2 = EF.
Puesto que (EFf, g) = (Ff, Eg) = ( f, FEg), la primera nos dice que debe ser
( f, FEg) = ( f, EFg), es decir, (

f, (EF - FE)g) = 0.
Esta última igualdad ha de valer para todo f ; luego (EF - FE )g = 0. Y esto a
su vez ha de valer para todo g ; luego EF - FE = 0, esto es, EF = FE. La permuta
bilidad de E, F es, por lo tanto, necesaria y suficiente para la primera condición ;
pero, además, tiene por consecuencia la segunda:
(EF )2 = EFEF = EEFF = E 2F 2 = EF.
En cuanto a E + F, la condición [(E +F )f, g ] = [ f, (E + F)g] se cumple siempre

(porque tal ocurre con E, F ) y sólo hay que examinar la segunda condición. Dado
que
(E + F )2 = E 2 + F 2 + EF + FE = (E + F ) + (EF + FE ),
ésta nos dice simplemente que EF + FE = 0. Ahora bien, si EF = 0, EF es un

operador de proyección* y, en virtud de lo antes demostrado, EF = FE, es decir,
FE = 0, es decir, EF + FE = 0; EF = 0 es, pues, condición suficiente. Recíproca
mente, de EF + FE = 0 se sigue que
E(EF + FE ) = E 2F + EFE = EF + EFE = 0,

E(EF + FE )E = E 2FE + EFE 2 = EFE + EFE = 2 · EFE = 0,
es decir, EFE = 0 y, por lo tanto, EF = 0. Luego EF = 0 es condición necesaria y

suficiente, o bien, ya que E, F representan el mismo papel, FE = 0.
Finalmente, E - F es operador de proyección siempre y sólo cuando lo es
1 - (E - F ) = (l - E) + F, y pues lo son 1 - E y F, es característico para que lo
sea, según hemos demostrado, que (1 - E )F = 0, esto es, F - EF = 0, EF = F; o
también que F (l - E ) = 0, esto es F - FE = 0, FE = F.
Nos queda aun por demostrar todo lo afirmado de M y N (E = PM, F = PN).
Supongamos primero EF = FE. En estas condiciones, cada EFf = FEf pertenece
a M y a N, por consiguiente a P, y para cada g, elemento de P, es Eg = Fg = g,
por lo tanto, EFg - Eg = g, es decir, g es de la forma EFf. Luego es el dominio de
los valores de EF por lo que, según el teorema 11, EF = PP. Supongamos ahora
* El asociado a la variedad [0]. (N. del T.)
172
Fund_MAT_02.indd 172 9/5/18 10:11

EF = 0 (y por lo dicho, también FE = 0). Cada (E + F )f = Ef + Ff pertenece a
{M, N} y cada g de {M, N} es igual a h + j, donde h es elemento de M y j elemen
to de N, de forma que Eh = h, Fh = FEh = 0, Fj = j. Ej = EFj = 0. Por consiguiente,
(E + F )(h + j) = Eh + Fh + Ej + Fj = h + j, (E + F )g = g,
es decir, g es de la forma (E + F)f. {M, N} es, pues, el dominio de los valores de

E + F; pero como E + F es un operador de proyección, la variedad {M, N} es la
variedad lineal cerrada correspondiente a E + F (teorema 11), es decir, {M, N} =
{M, N} = M + N. Finalmente, si EF = F (y por lo dicho, también FE = F ), y
puesto que E = PM y 1 - F = PE - N, será E - F = E - EF = E (1 - F )* P = PP,
donde P es la parte común a M y E - N, es decir, M - N.
En fin, EF = 0 significa que siempre es (EFf, g) = 0, esto es (Ff, Eg) = 0, o sea,
que todo M es ortogonal a todo N. Y EF = F = FE indica que F(l - E) = 0, es
decir, todo N es ortogonal a E - M o también: N es parte de E - (E - M) = M.
Cuando N es parte de M diremos de F = PN y E = PM que F es parte de E, y,
simbólicamente, que E ≥ F, o F ≤ E. (Esta relación significa, pues, que EF = F, o
también que FE = F y tiene por consecuencia la permutabilidad de E y F. Se re
conoce, bien sea mediante la consideración de M y N, bien por medio del cálcu
lo directo, que: siempre es 0 ≤ E ≤ 1; de E ≤ F, E ≤ E se deduce E = F; de E ≤ F
y F ≤ G se sigue E ≤ G. Nuestro ≤ posee, por lo tanto, las propiedades de una
ordenación según las relaciones de igual, mayor y menor. Obsérvese, además, que
las relaciones E ≤ F, 1 - E ≥ 1 - F y que E sea ortogonal a 1 - F son, las tres,
equivalentes entre sí. Además, nótese que de la ortogonalidad de E, F se sigue la
de E', F', cuando E' ≤ E, F' ≤ F ). Si M y N son ortogonales, diremos también de
E y F que son ortogonales. (Esta relación significa pues, que EF = 0 o también
que FE = 0.) Recíprocamente, cuando E, F son permutables, calificaremos también
de permutables a sus correspondientes variedades M, N.
Teorema 15. E ≤ F equivale a que siempre sea ∙Ef ∙ ≤ ∙Ff ∙.

Demostración: De E ≤ F se deduce E = EF, es decir que ∙Ef ∙ = ∙EFf ∙ ≤ ∙Ff ∙
(cf. teorema 13). Recíprocamente, es consecuencia de esta relación que si Ff = 0,
sea ∙Ef ∙ ≤ ∙Ff ∙ = 0, de donde Ef = 0. Pero F(1 - F )f = (F − F 2 )f = 0 cualquiera
que sea f ; luego se tiene, idénticamente, E(1 - F )f = 0, es decir, E(1 - F ) = E - EF,
E = EF, por consiguiente, E ≤ F.
Teorema 16. Sean E1, …, Ek operadores de proyección. La suma E1 + … + Ek

lo será también siempre y sólo cuando todos los Em, E1(m, l = 1, …, k, m ≠ l ) sean
ortogonales entre sí. Otra condición para ello necesaria y suficiente es que sea
∙E1 f ∙2 + … + ∙Ek f ∙2 ≤ ∙ f ∙2,
* E(1 - F ) es un operador de proyección porque E(1 - F ) = E - EF = E - F = E - FE =

= (1 - F )E. (N. del T.)
173
Fund_MAT_02.indd 173 9/5/18 10:11

para todo f. En estas condiciones, E1 + … + Ek es el operador de proyección de

M1 + … + Mk = [M1, …, Mk], que en este caso coincide con {M1, …, Mk}. (Se
supone E1 = PM , …, Ek = PM ).
1 k
Demostración: El último aserto resulta de la aplicación reiterada del teorema 14,

como también la suficiencia del primer criterio. Cuando el segundo queda satis
fecho, también lo queda el primero. En efecto: Para m ≠ l y Emf = f es
∙ f ∙2 + ∙El f ∙2 = ∙Emf ∙2 + ∙El f ∙2 ≤ ∙E1f ∙2 + … + ∙Ek f ∙2 ≤ ∙ f ∙2,
de donde,
∙E1 f ∙2 = 0, E1 f = 0 (l ≠ m).
Pero como Em(Em f ) = Em f, cualquiera que sea f, se tendrá El (Em f ) = 0, es decir,
El Em = 0. Finalmente, la segunda condición es necesaria, ya que si E1 + … + Ek es
un operador de proyección, entonces (teorema 13)
∙E1 f ∙2 + … + ∙Ek f ∙2 = (E1 f , f ) + … + (Ek f , f ) =

= [(E1 + … + Ek)f , f ] = ∙(E1 + … + Ek)f ∙2 ≤ ∙ f ∙2.
Tenemos así el siguiente esquema lógico:
E1 + … + Ek es operador de proyección → segundo criterio →

→ primer criterio → E1 + … + Ek es operador de proyección.
Los tres criterios, por lo tanto, son equivalentes.

Para terminar demostremos un teorema relativo a la convergencia de los ope
radores de proyección:
Teorema 17. Sea E1, E2, … una sucesión creciente o decreciente de operado
res de proyección: E1 ≤ E2 ≤ … o E1 ≥ E2 ≥ … Tales sucesiones convergen hacia
un operador de proyección E en el sentido de que, para todo f, En f → E f ; además,
todos los En son ≤ E o todos los En ≥ E, respectivamente.
Demostración: Basta examinar el segundo caso, porque a él se reduce el prime
ro sin más que sustituir E1, E2, …, E por 1 - E1, 1 - E2, …, 1 - E. Sea, pues, E1
≥ E2 ≥ … En virtud del teorema 15, se tiene ∙E1 f ∙2 ≥ ∙E2 f ∙2 ≥ … ≥ 0; luego exis
2
te lim Em f y, por consiguiente, existe para cada e > 0 un N = N(e) tal que para
m→ ∞
m, l ≥ N es ∙∙Em f ∙2 - ∙El f ∙2∙ < e. Ahora bien, para m ≤ l es Em ≥ E, y, por lo
tanto, Em - El es operador de proyección, de forma que
∙Emf ∙2 - ∙El f ∙2 = (Em f , f ) - (El f , f ) = [(Em - El )f , f ] =

= ∙(Em - El )f ∙2 = ∙Em f - El f ∙2,
174
Fund_MAT_02.indd 174 9/5/18 10:11

de donde se deduce Em f − El f < ε . La sucesión E1 f, E2 f, … satisface, pues,

el criterio de convergencia de Cauchy y posee un límite f * (¡D, en II.1!). Por
medio de Ef = f * definimos, según esto, un operador con sentido en todo el es
pacio.
De (En f, g) = (f, Emg) se sigue, pasando al límite, que (Ef, g) = ( f, Eg) y de (Enf,
Eng) = (En f, g), que (Ef, Eg) = (Ef, g). Por consiguiente (E 2f, g) = (Ef, g), E 2 = E.
E es, pues, un operador de proyección. Para l > m se tiene ∙Em f ∙ > ∙El f ∙ y, ha
ciendo que l → ∞, de aquí resulta ∙Em f ∙ ≥ ∙Ef ∙, es decir, Em > E (teorema 15).
Si E1, E2, … son operadores de proyección ortogonales dos a dos, E1, E1 + E2,
E1 + E2 + E3, … lo son asimismo (teorema 16) y, considerados en este orden, cons
tituyen evidentemente una sucesión creciente. Luego, según el teorema 17, con
vergen hacia un operador de proyección que es ≥ que todos ellos y al que podemos
indicar con E1 + E2 + … Sea, por ejemplo, E1 = PM , E2 = PM , … > E1 + E2 +
1 2
+ … = PM. Porque todos los Em son ≤ E, Mm es parte de M y, por consiguiente,

M contiene también a [M1, M2, …] = M1 + M2 + … = M'. Recíprocamente,
todos los Mm son parte de M', de donde Em ≤ PM' = E'. Por razones de continui
dad (cf. las consideraciones hechas en la anterior demostración), deducimos de
ello que E < E', es decir, que M es parte de M'. Luego M = M', E = E', esto es,
M = M1 + + M2 + …; o escrito de otra manera
PM 1 + M2 + … = PM + PM + …
1 2
Con esto damos por terminadas nuestras consideraciones acerca de los opera
dores de proyección.
5. Operadores en el espacio de Hilbert

Ahora estamos ya suficientemente orientados acerca de las circunstancias
geométricas que se dan en el espacio de infinitas dimensiones (hilbertiano) E∞ para
poder dedicar nuestra atención a sus operadores lineales, es decir, a las transfor
maciones lineales de E∞ sobre sí mismo. Para ello debemos introducir algunos
conceptos, que, ciertamente, ya en el último párrafo anticipamos en parte.
De acuerdo con lo dicho inmediatamente antes del teorema 11, definiremos
los operadores del siguiente modo:
Definición 6. Un operador R es una función definida en un conjunto parte

de E cuyos valores son puntos de E, esto es, una correspondencia que a ciertos
elementos f de E vincula ciertos elementos R f asimismo de E.
Nos referimos aquí tanto a E∞ como a los En. Nótese que cuando E∞ es un FW,
el operador R está definido para los elementos de FW, es decir, para las funcio
nes ordinarias del espacio de los estados, y que sus valores son funciones de esta
clase. Los operadores son, pues, en tal caso, las llamadas «funciones dependientes
175
Fund_MAT_02.indd 175 9/5/18 10:11

de funciones» o «funcionales»* (cf. los ejemplos de 1, 2, 4). La clase de los elemen

tos f para los cuales tiene sentido Rf , el dominio de definición** de f , puede no
coincidir con todo el E; pero si coincide, diremos que R tiene sentido en cualquier
parte. Además, la clase de los R f , el dominio de los valores de R, la imagen que
nos da R de su dominio de definición, no tiene por qué estar contenido en este
último, es decir, cuando R f tiene sentido no por esto va a tenerlo necesariamente
R(R f ) = R 2f .58
Indicamos en el último párrafo qué debe entenderse por R ± S, aR, RS, R m
(R, S son operadores, a un número complejo, m = 0, 1, 2, …):
(R ± S)f = Rf ± Sf , (aR)f = a · Rf , (RS)f = R(Sf ),

R 0 = 1, R 1 = R, R 2 = RR, R 3 = RRR, …
En cuanto a la delimitación de los dominios de definición, claro está que es

necesario atender al hecho de que los primeros miembros (es decir, los operadores
R ± S, aR, RS) tienen sentido sólo cuando lo tienen los segundos miembros. Así,
por ejemplo, R ± S únicamente tiene sentido en la parte común a los dominios de
definición de R y S, etc.*** Cuando R f toma una sola vez cada uno de los valores de
que es susceptible, R posee un inverso R -1: R -1f tiene sentido cuando existe una
solución g de Rg = f , en cuyo caso su valor es precisamente g. De las reglas del
cálculo válidas para R ± S, aR, RS tratamos ya en el último párrafo y aquí nos li
mitaremos a indicar que los operadores que allí calificamos de iguales tienen tam
bién los mismos dominios de definición, mientras que las ecuaciones entre opera
dores, como 0 · R = 0, no son válidas para tales dominios: 0f tiene sentido siempre;
*** Advierta el lector que el concepto de «funcional» no es el mismo aquí que aquél a que nos
referíamos en nuestra Nota de la página 20. Neumann entiende por «funcional» una correspondencia
entre funciones de dos clases, mientras que para Hadamard, al que seguíamos, una funcional es una
correspondencia entre las funciones de una cierta clase, de una parte, y números de otra. He aquí un
ejemplo de cada concepción: Considérese la clase de todas las funciones f (t) integrables en el inter
valo (0, 1) (en el sentido de Riemann, por ejemplo):
La variable numérica La variable funcional

1 x
∫0
f (t ) dt ∫0
f (t ) dt(0 ≤ x ≤ 1)
es una funcional en el sentido de Hadamard (a es una funcional en el sentido de Neumann (a

cada f (t) le corresponde un número). cada f (t) le corresponde una función).
Un operador es una funcional en este último sentido. G. Julia (Introduction mathématique awx
théories quantiques; Paris, Gauthier-Villars, 1938) habla, en el primer caso, de funciones escalares, en
el segundo, de funciones vectoriales (volumen II, p. 68). (N. del T.)
*** No se trata, en general, de dominios en sentido estricto (conjunto de puntos todos interiores),
sino de conjuntos que, en Mecánica cuántica, son de ordinario doquiera densos. (N. del T.)
*** El dominio de definición de aR coincide con el de R; el de RS es la parte común al dominio
de definición de R y al dominio de los valores de S (en particular, el de R m es la intersección del
dominio de definición de R y el de los valores de Rm - 1). (N. del T.)
176
Fund_MAT_02.indd 176 9/5/18 10:11

(0 · R) f , por el contrario, lo tiene, por definición, solamente cuando tiene sentido
Rf [pero si lo tiene, (0 · R) f y 0f son = 0]. En cambio, 1 · R = R · 1 = R, y asimis
mo R m · R l = R m + l, valen incluso respecto de los dominios de definición.
Cuando R, S poseen inversos, posee también inverso RS y éste es precisa
mente, como con facilidad se reconoce, (RS )-1 = S -1 R -1. Además, para a ≠ 0 es
1
(aR )-1 = R -1, Si R -1 existe, igualmente podemos formar las restantes potencias
a
negativas de R:
R -2 = R -1 R -1, R -3 = R -1 R -1 R -1, …
Tras estas consideraciones de carácter general, pasemos a estudiar más deteni

damente aquellas clases de operadores que son para nosotros de particular impor
tancia.
Definición 7. Un operador A se califica de lineal cuando su dominio de de

finición es una variedad lineal (esto es, una variedad que junto con f1, …, fk con
tiene a1 f 1 + … + ak f k ), y además se tiene
A(a1 f 1 + … + ak f k) = a1 Af 1 + … + ak Af k .
En lo que sigue consideraremos sólo operadores lineales y precisamente aquéllos

cuyo dominio de definición es doquiera denso en E.
La última observación nos proporciona algo que, para muchos efectos, susti
tuye suficientemente la cualidad de los operadores de estar definidos en todo el
espacio, cualidad ésta a la que debemos renunciar en Mecánica cuántica. Este
punto tiene la importancia suficiente para que lo examinemos con alguna minu
ciosidad. Consideremos, p. e., el espacio de los estados de la Mecánica ondulato
ria de Schrödinger, espacio que, para mayor sencillez, supondremos unidimen
+∞
∫−∞ ϕ (q)
2
sional: -∞ < q < +∞. Las funciones de onda son las ϕ(q) cuya dq es
finita y forman un espacio de Hilbert (cf. II.3). Consideremos, además, los ope
h d …
radores q … y . Ambos son operadores lineales, pero sus dominios de
2pi dq
definición no son en modo alguno todo el espacio de Hilbert. No lo es para q …,
+∞ +∞
∫−∞ qϕ (q) ∫−∞ q 2 ϕ (q)
2 2
porque dq = dq puede muy bien ser infinita incluso cuan
+∞
∫−∞ ϕ (q)
2
do dq es finita, de forma que qϕ(q) no pertenece ya al espacio de Hilbert;
h d
no lo es para …, porque existen en él funciones no derivables, y también
2pi dq +∞
porque hay funciones cuya ∫−∞ ϕ (q) dq es finita, mientras no lo es
2
2 2
+∞ h d h2 +∞ d
∫ −∞ 2 π i dq
ϕ (q) dq = − 2
4π ∫−∞ dq
ϕ (q) dq
177
Fund_MAT_02.indd 177 9/5/18 10:11

[p. e., ∙ q ∙½ e-q o e-q sen (eq )]. Sin embargo, los dominios de definición son densos
2 2
doquier, pues ambos operadores se pueden aplicar, con seguridad, a cada ϕ (q) que
sea diferente de cero sólo en un intervalo finito - c ≤ q ≤ c y continua y derivable
en todo el espacio. Y es el caso que este conjunto de funciones es doquiera denso.59
Definición 8. Dos operadores A, A* se denominan adjuntos cuando poseen

el mismo dominio de definición y en éste es siempre
(Af, g) = ( f, A*g), (A*f, g) = ( f, Ag).
[Permutando f, g entre sí y formando las expresiones complejas conjugadas de
ambos miembros, se deduce cada una de estas igualdades de la otra. Es claro, ade
más, que la relación A, A* es una relación simétrica, es decir, que también son
adjuntos A*, A. Luego (A*)* = A.]
Nótese que de A existe un solo adjunto, esto es, si A es adjunto de A*1 y A*2,
debe ser A*1 = A*2. En efecto, para todo g para el cual tenga sentido Ag, es
(A*1 f, g) = ( f, Ag) = (A*2 f, g),
y pues el conjunto de los g y de los f es doquier denso,* A*1 f = A*2 f, A*1 = A*2.
Luego A determina unívocamente a A* y del mismo modo A* a A.
Se advierte sin dificultad que 0, 1 y, en general, todos los operadores de pro
yección E son adjuntos de sí mismos (autoadjuntos, cf. teorema 12), es decir, 0*,
1*, E * existen y son respectivamente iguales a 0, 1, E. Además es (aA)* = aA*, y
en tanto puedan formarse en general A ± B [es decir, su dominio de definición sea
doquiera denso), (A ± B)* = A* ± B*. Con limitaciones que fácilmente se deter
minan, vale finalmente (AB)* = B *A* (es a saber, (ABf, g) = (Bf, A*g) = ( f, B *A*g)],
como también (A-1)* = (A*)-1 [ya que (A-1f, g) = (A-1f, A* A*-1 g) = (AA-1 f, A* -1g) =
= ( f, A* -1g)].
En particular, en el caso de la Mecánica ondulatoria de Schrödinger (el que an
tes considerábamos, aunque ahora suponemos k-dimensional el espacio de los esta
dos), en el cual el espacio de Hilbert está constituido por las funciones ϕ(q1, …, qk)
tales que
+∞ +∞
∫ ∫
2
… ϕ (q1 … qk ) dq1 … dqk
−∞ −∞
h ∂
es finita, los adjuntos de los operadores ql… y … son, respectivamente,
2pi ∂ql
⎛ h ∂ ⎞* h ∂
(ql )* = ql , ⎜ ⎟ = .
⎝ 2π i ∂ql ⎠ 2π i ∂ql
* Recuérdese, y no se pierda de vista a lo largo del libro, que sólo considera operadores cuyo
dominio de definición es doquier denso. (N. del T.)
178
Fund_MAT_02.indd 178 9/5/18 10:11

Lo primero es claro, porque

+∞ +∞
∫ −∞
… ∫ −∞
ql ⋅ ϕ (q1 ,…, qk )φ (q1 ,…, qk ) ⋅ dq1 … dqk =
+∞ +∞
= ∫ −∞
… ∫ −∞
ϕ (q1 ,…, qk )ql φ (q1 ,…, qk ) ⋅ dq1 … dqk .
Por lo que a la segunda relación se refiere, ésta nos dice que
+∞ +∞ h ∂
∫ −∞
… ∫ −∞ 2π i ∂ql
ϕ (q1,…, qk ) ⋅ φ (q1,…, qk ) ⋅ dq1 … dqk =
+∞ +∞ h ∂
= ∫ −∞
… ∫ −∞
ϕ (q1,…, qk )
2π i ∂ql
φ (q1,…, qk ) ⋅ dq1 … dqk ,
o sea,
+∞ +∞
⎧ ∂ ∂ ⎫
∫ −∞
… ∫ −∞
⎨ ϕ (q1,…, qk )⋅φ (q1,…, qk )+ ϕ (q1,…,qk )
⎩ ∂ql ∂ql
φ (q1,…,qk )⎬dq1 …dqk = 0,
⎭
+∞ +∞
∫ ∫
ql =+ A
lim … ⎡⎣ϕ (q1,…, qk ) ⋅ φ (q1,…, qk )⎤⎦q =− B dq1 … dql − 1 dql + 1 … dqk = 0.
A→+∞ −∞ −∞ l
B→+∞
El límite debe existir, porque es segura la convergencia de todas las integrales

+∞ +∞
∫−∞ ∫
…
−∞
… dq1 …dqk
∂ ∂
(pues j, φ, j, φ pertenecen al espacio de Hilbert); sólo se trata así de su
∂ql ∂ql
anulación. Si fuese ≠0, el límite de
+∞ +∞
∫−∞
… ∫ −∞
ϕ (q1 , …, qk )φ (q1 , …, qk ) dq1 … dql −1 dql +1 … dqk
para ql → +∞ ó ql → -∞, límite que con seguridad existe, sería ≠0, lo que es in
compatible con la convergencia absoluta de la integral
+∞ +∞
∫ −∞
… ∫ −∞
ϕ (q1 , …, qk )φ (q1 , …, qk ) dq1 … dql −1 dql dql +1 … dqk
(¡j, φ pertenecen al espacio de Hilbert!).
179
Fund_MAT_02.indd 179 9/5/18 10:11

Cuando A es el operador integral

+∞ +∞
Aϕ (q1 , …, qk ) = ∫
−∞
…∫ −∞
K (q1 , …, qk ,q'1, …, q'k )ϕ (q'1, …, q'k )dq'1 … dq'k ,
A* es también un operador integral, como se reconoce fácilmente, sólo que su

núcleo integral no es K(q1, …, qk; q'1, …, q'k), sino
K (q'1, …, q'k ; q1 , …, qk ).
Consideremos ahora las circunstancias que se dan en la teoría de las matrices,

en la cual el espacio de Hilbert está constituido por todas las sucesiones x1, x2, …
∞
tales que ∑ xµ es finita. Un operador lineal A transforma {x1, x2, …} en {y1, y2, …}:
2
µ =1
A{x1, x2, …} = {y1, y2, …},
donde, a causa del carácter lineal de A, las y1, y2, … han de depender linealmente
de las x1, x2, … :
∞
yµ = ∑ aµν xν .60
µ =1
La matriz amn caracteriza, por consiguiente, al operador A. Desde luego se ve

que a A* corresponde la matriz amn (la transpuesta de la matriz compleja conjugada).60
La analogía que acabamos de exponer con lo que ocurre en la teoría de las
matrices, sugiere definir el concepto de operador hermítico como lo haremos a
continuación. Introduciremos a la vez otros dos conceptos que son de gran im
portancia para nuestros fines ulteriores.
Definición 9. El operador A se califica de hermítico cuando es A* = A y de

definido si siempre es (Af, f ) ≥ 0.61 El operador U se denomina operador unitario,
cuando es UU * = U*U = 1.62
Si U es unitario, tenemos, pues, U* = U -1. Por definición,
(Uf, Ug) = (U*Uf, g) = ( f, g),
de donde resulta, en particular (para f = g), que ∙Uf ∙ = ∙ f ∙. De esta última pro
piedad se deduce recíprocamente el ser unitario U supuesto que éste tenga sentido
en todo el espacio y que tome cada valor del mismo una vez y sólo una.* (Cf.
Nota 63.) En efecto: por hipótesis,
∙Uf ∙ = ∙ f ∙, es decir, (Uf, Uf ) = ( f, f ), (U*Uf, f ) = ( f, f ).
* Esto equivale a postular la existencia de U -1 y su definición en todo el espacio. (N. del T.)
180
Fund_MAT_02.indd 180 9/5/18 10:11

f+g f-g
Sustituyamos f, primero por después por y restemos; resulta así, como
2 2
se calcula fácilmente, Re (Uf, Ug) = Re ( f, g). Si aquí sustituimos f por if, en vez
de Re ( f, g) obtenemos Im ( f, g). Por lo tanto, vale en general
(Uf, Ug) = ( f, g), es decir, (U*Uf, g) = ( f, g).
Para un valor fijo de f, esta igualdad es válida cualquiera que sea g, por lo que
podemos afirmar que U*Uf = f, y como a su vez esta relación es cierta para todo
f, debe ser U*U = 1. Nos queda por demostrar que UU * = 1. Por hipótesis, para
cada f existe una g (y sólo una) tal que Ug = f ; luego
UU*f = UU* ⋅ Ug = U U*Ug = Ug = f, esto es, UU* = 1,
como queríamos demostrar.

Todo operador unitario U es continuo, ya que, por ser lineal
∙Uf - Ug ∙ = ∙U( f - g)∙,
y por ser unitario
∙U( f - g)∙ = ∙ f - g ∙.
Los operadores hermíticos, por el contrario, no hay motivo alguno para que lo
h d
sean y así, por ejemplo, justamente los operadores q … y …, tan importan
2pi dq
tes para la mecánica cuántica, son discontinuos63.
De nuestras normas generales para el cálculo relativas a A*, se deduce inme
diatamente: que si U, V son unitarios, lo son también U-1, U V y, por lo tanto,
todas las potencias de U; que si A, B son hermíticos, lo son también A ± B, mien
tras que aA lo es sólo cuando a es real (excepto para A = 0) y AB sólo si A, B son
permutables, esto es, si AB = BA. Sabemos, además, que todos los operadores de
h ∂
proyección (en particular, 0 y 1) y los operadores ql…, …, de la teoría de
2pi ∂ql
Schrödinger son hermíticos. A la vez que A, son hermíticos todos los operadores
potencias de A (incluso A-1 supuesto que exista) y todos los polinomios en A cuyos
coeficientes sean reales. Es notable que para A hermítico y cualquier X, el operador
XAX* es asimismo hermítico:
(XAX*)* = X**A*X* = XAX*,
por ejemplo todos los XX*(A = 1) y X*X (X* en vez de X). Cuando U es unitario,
UAU -1 es hermítico (porque U -1 = U*).
La continuidad es en los operadores una propiedad de fundamental importan
cia, cual lo es en las funciones numéricas estudiadas en el Análisis. Por este moti
181
Fund_MAT_02.indd 181 9/5/18 10:11

vo indicaremos, para el caso de los operadores lineales, algunas condiciones que

caracterizan la -existencia de dicha propiedad.
Teorema 18. Un operador lineal R es continuo en todo el dominio de defi

nición, DR, cuando lo es en el punto f = 0.* Condición necesaria y suficiente para
que R sea continuo en todo el dominio de definición, es que exista una constante
C tal que para todo f de dicho dominio sea ∙Rf ∙ ≤ C ⋅ ∙ f ∙. A su vez, esta condición
es equivalente a la validez de
∙(Rf, g)∙ ≤ C ⋅ ∙ f ∙ ⋅ ∙ g ∙
para cualesquiera f de DR y g de E. Si R es hermítico, basta que esta condición se

cumpla para f = g : ∙(Rf, f )∙ ≤ C ⋅ ∙ f ∙2, o, puesto que (Rf, f ) es real (Nota61),
-C ⋅ ∙ f ∙2 ≤ (Rf, f ) ≤ C ⋅ ∙ f ∙2.
Observación. El concepto de continuidad en los operadores fue introducido

por Hilbert64 en la forma de «acotación» y lo definió por medio de nuestro penúl
timo criterio. Si de los dos signos ≤ que aparecen en el último vale sólo uno, de
cimos de R que es semi-acotado, inferiormente si vale el de la izquierda, superior
mente si el de la derecha. Así, por ejemplo, todo R definido es inferiormente
semi-acotado (con C = 0).
Demostración: Decir que R es continuo para f = 0 es decir que para cada e > 0
existe un d < 0 tal que ∙ f ∙ < d implica ∙Rf ∙ < e. En tal caso, de ∙ f - f0∙ < d se
sigue que
∙R( f - f0)∙ = ∙Rf - Rf0∙ < e
es decir, también para f = f0 es R continuo y como f0 es cualquiera en DR , R es

continuo en todo su dominio de definición (e incluso uniformemente).
e
Si ∙Rf ∙ ≤ C ⋅ ∙ f ∙ (naturalmente, C > 0), R es continuo: basta hacer d = .
2 C
Recíprocamente, cuando R es continuo podemos tomar C = , donde d corres
ponde a e = 1. Para este valor de C, d
∙Rf ∙ ≤ C ⋅ ∙ f ∙
* Es fácil ver que en el origen están definidos todos los operadores lineales. Hemos de advertir,
además, que hemos precisado lo del dominio de definición aunque Neumann dice que «ein linearer
Operator R ist überall stetig, wenn er es im Punkte f = 0 ist» y es patente que este überall sólo puede
referirse a dicho dominio, pues sólo para sus puntos tienen sentidos los Rf que aparecen en el enun
ciado y en la demostración. (N. del T.)
182
Fund_MAT_02.indd 182 9/5/18 10:11

½d
vale sin más si f = 0, y si f ≠ 0, por consiguiente ∙ f ∙ > 0, el elemento g = f es
tal que ∙ g ∙ = ½d, y así ∙ f ∙
½d ∙ f ∙
∙Rg ∙ = ⋅ ∙Rf ∙ < 1, de donde, ∙Rf ∙ < = C ⋅ ∙ f ∙.
∙ f ∙ ½d
De la relación ∙Rf ∙ < C ⋅ ∙ f ∙ se sigue ∙(Rf, g)∙ ≤ ∙Rf ∙ ⋅ ∙ g ∙ < C ⋅ ∙ f ∙ ⋅ ∙ g ∙.
Recíprocamente, de ∙(Rf , g)∙ < C ⋅ ∙ f ∙ ⋅ ∙ g ∙ se deduce, al hacer g = Rf , ∙Rf ∙2 <
< C ⋅ ∙ f ∙ ⋅ ∙Rf ∙ y, por lo tanto,
∙Rf ∙ ≤ C ⋅ ∙ f ∙.
Finalmente, demostremos que, en los operadores hermíticos,
∙(Rf , f )∙ ≤ C ⋅ ∙ f ∙2
trae consigo que
∙(Rf , g)∙ ≤ C ⋅ ∙ f ∙ ⋅ ∙ g ∙.

f + g f - g
Con este objeto, escribamos la primera de estas relaciones para y para
en vez de f . Se tendrá 2 2
f + g f + g⎞ ⎛ f − g f − g⎞
Re(Rf , g) = ⎛ R , − R , ≤
⎝ 2 2 ⎠ ⎝ 2 2 ⎠
2 2
⎛ f+g 2 f−g ⎞
2
f + g 65
≤C⎜ + ⎟⎠ = C .
⎝ 2 2 2
1
Como en la demostración del teorema 1, sustituyamos f y g por af , g(a > 0) y
a
minimicemos el último miembro; resulta así ∙Re(Rf, g)∙ ≤ C ⋅ ∙ f ∙ ⋅ ∙ g ∙. Si en esta
relación sustituimos f por eía f (a real), obtenemos para el máximo del primer
miembro
∙(Rf, g)∙ ≤ C ⋅ ∙ f ∙ ⋅ ∙ g ∙,
que es la condición de continuidad. A decir verdad, hemos llegado a ella apoyán

donos en la existencia de Rg ; pero como el conjunto de estas g es doquiera denso
y en el resultado final no aparece Rg, ése vale en general por razones de c ontinuidad.
A continuación demostramos un teorema relativo a los operadores hermíticos
definidos.
183
Fund_MAT_02.indd 183 9/5/18 10:11

Teorema 19. Si R es un operador hermítico y definido, siempre es
(Rf , g) ≤ (Rf , f )(Rg, g).
De (Rf , f ) = 0 se sigue en este caso Rf = 0.

Demostración: La anterior desigualdad se deduce de la (Rf , f ) ≥ 0, que traduce
el carácter definido de R, como la desigualdad de Schwarz ( f , g) ≤ ( f , f )(g, g)
(es decir, ≤ ∙ f ∙ ⋅ ∙ g ∙) se dedujo de ( f , f ) ≥ 0 en el teorema 1. Si es (Rf, f ) = 0, de
aquélla se sigue que también (Rf, g) = 0, supuesto que Rg tenga sentido. Esto vale,
pues, para los elementos de un conjunto doquiera denso y, por continuidad, para
todo g ; luego Rf = 0.
Finalmente, insistiremos una vez más sobre el importante concepto de permu
tabilidad de dos operadores R, S, es decir, sobre la relación RS = SR.
De RS = SR se deduce que
S … SSR = S … SRS = S … RSS = … = RS … SS,
esto es, R y S n son permutables entre sí (n = 1, 2, …). Esta relación vale también
para n = 0, puesto que R1 = 1R = R y S0 = 1. Cuando existe S -1, se tiene S -1 ⋅ SR ⋅
⋅ S -1 = S -1 ⋅ RS ⋅ S -1 y por consiguiente, dado que
S -1 ⋅ SR ⋅ S -1 = S -1S ⋅ RS -1 = RS -1, S -1 ⋅ RS ⋅ S -1 = S -1R ⋅ SS -1 = S -1R.
también es RS -1 = S -1R. Luego en S nR = RS n es lícito hacer n = -1 y, por lo tan
to, n = -2, -3, … Resumiendo: R es permutable con todas las potencias de S. La
aplicación reiterada de este resultado permite demostrar que cada potencia de R
es permutable con cada una de las de S. Si R es permutable con S y T lo es también
con aS, cualquiera que sea a, con S ± T y con ST. De esto y del anterior resultado
se sigue que si R, S son entre sí permutables, lo son asimismo todos los polinomios
en R con todos los polinomios en S. En particular, basta hacer R = S para llegar
a la conclusión de que todos los polinomios en R son permutables entre sí.
6. El problema de valores propios

Hemos llegado ya suficientemente lejos como para poder dedicarnos, en el caso
del espacio de Hilbert abstracto, al problema que, en las realizaciones FZ y FΩ del
mismo, fue la cuestión capital de la Mecánica cuántica: la resolución de las ecua
ciones E1 y E2 de I.3. Es el llamado problema de valores propios problema que
debemos formular de nuevo dándole unidad.
En I.3, lo mismo en E1 que en E2 se pedía hallar todas las soluciones j ≠ 0 de
E· Hj = lj,
184
Fund_MAT_02.indd 184 9/5/18 10:11

donde H es el operador hermítico correspondiente a la función de Hamilton (cf.

dicho §), j un elemento del espacio de Hilbert, y l un número real (H dado, j
y l incógnitos). Pero, además, se imponían ciertos requisitos en cuanto al núme
ro de soluciones: se pedía hallarlas en número tal que
1. En la teoría de las matrices, a partir de estas soluciones
j1 = {s11, s12, …}, j2 = {s21, s22, …}, …
(¡estamos en FZ !) se pudiese formar una matriz S = {smn}que posea una inversa S -1
(cf. I.3);
2. En la teoría ondulatoria, cada una de las funciones de onda j (q1, …, qk)
(que no ha de ser necesariamente una solución) pueda desarrollarse en serie de
soluciones
j1 = j1(q1, …, qk), j2 = jn(q1, …, qk), …
(j1, j2, … pueden corresponder a diferentes l):

∞
ϕ (q1, …, qk ) = ∑ cnϕn(q1, …, qk ).
n =1
(En verdad, nada se dijo acerca de este punto en I.3; pero esta condición es indis
pensable para el ulterior desarrollo de la teoría ondulatoria, en particular para la
«teoría de las perturbaciones» de Schrödinger.66)
En estas condiciones, 1 viene a ser lo mismo que 2 ; pues la matriz S transfor
ma {1, 0, 0, …}, {0, 1, 0, …}, …, respectivamente en
{s11, s12, …}, {s21, s22, …}, …
y, por lo tanto, todo el espacio de Hilbert E∞ en la variedad lineal cerrada definida

por j1, j2, …; y para que S -1 exista, debe esta última coincidir con E∞. Pero jus
tamente lo mismo dice 2: también se pide aquí que cada j pueda ser aproximada
tanto cuanto se quiera por medio de combinaciones lineales de las j1, j2, …67.
Precisemos el alcance de esta condición, a la vez que examinamos las propiedades
de la ecuación E con ayuda del instrumento formal del que ahora podemos dis
poner.
En primer lugar, es claro que podemos limitarnos a las soluciones ∙j ∙ = 1,
porque debe ser j ≠ 0, y junto con j es también solución aj. En segundo lugar,
no necesitamos exigir la realidad de l, puesto que ésta se deduce de Hj = lj:
(Hj, j) = (lj, j) = l (j, j) = l
185
Fund_MAT_02.indd 185 9/5/18 10:11

(cf. II.5, Nota 61). En tercer lugar, dos soluciones, j1, y j2, correspondientes a
valores diferentes de l, l1, y l2, son ortogonales entre sí:
(Hj1, j2) = l1(j1, j2), (Hj1, j2) = (j1 · Hj2) = l2(j1, j2);
luego, dado que l1(j1, j2) = l2(j1, j2) y l1 ≠ l2, se tiene (j1, j2) = 0.
Sean l1, l2, … todos los valores de l distintos entre sí para los cuales E tiene
solución. (Si para cada valor de l para el cual es resoluble Hj = lj, elegimos una
solución jl de módulo unidad, las jl constituyen un sistema ortonormal, según
lo dicho antes. En virtud de II.2, teorema 3(∞) el conjunto de las jl es, por ende,
o finito o infinito numerable, es decir, en ambos casos una sucesión; luego también
podemos disponer las l formando sucesión, eventualmente finita.) Para cada
l = lr, todas las soluciones de Hj = lj componen una variedad lineal, y preci
samente cerrada.68 Según el teorema 9 existe, por este motivo, un sistema ortonor
mal jr, 1, …, jr, n de tales soluciones que define justamente esta misma variedad
r
lineal cerrada. El número nr es, evidentemente, el número máximo de soluciones

linealmente independientes para l = lr y por esto se le llama también multiplici-
dad del valor propio lr (n = 1, 2, …, ∞; puede presentarse el valor n = ∞, por
ejemplo para H = 1, l = 1). De acuerdo con lo antes dicho, las jr, 1, …, jr, n r
asociadas a diferentes valores r son también ortogonales entre sí; por lo tanto, en
conjunto, forman asimismo un sistema ortonormal
jr, n (r = 1, 2, …, n = 1, 2, nr).
Se ve que, por razón de su origen, este sistema define la misma variedad lineal
cerrada que el conjunto de todas las soluciones j de E.
Numeremos las jr, n de modo que formen una sucesión única: ψ1, ψ2, …, y
sean l(1), l(2), … las correspondientes lr. La condición antes formulada —que la
extensión lineal cerrada del conjunto de todas las soluciones de E debe coincidir
con E∞ —nos dice, por consiguiente, que lo mismo deben hacer ya y1, ψ2, …
(¡un conjunto parcial de soluciones!), esto es, según el teorema 7 a, que este siste
ma ortonormal ha de ser completo.
Resolver el problema de valores propios en el sentido de la Mecánica cuántica
sería, según esto, hallar tantas soluciones
j = y1, y2, … y l = l1, l2, …
de E cuantas sean necesarias para poder formar con ellas un sistema ortonormal
completo. Pero esto es en general de todo punto imposible. Así, por ejemplo, en
la teoría ondulatoria se ve que para una parte de las soluciones de E (es decir, E2
en I.3) no es finita la integral del cuadrado de su valor absoluto,69 no pertenecen,
por lo tanto, al espacio de Hilbert* y es el caso que necesitamos de todas para
* Aunque hable Neumann de soluciones de E, cuide el lector de no confundir el concepto de

solución a que aquí alude con el que ha sentado antes. ¿Cómo va a ser solución en el primer sentido
186
Fund_MAT_02.indd 186 9/5/18 10:11

poder desarrollar una función de onda cualquiera en serie de soluciones (cf. más
arriba). En el espacio de Hilbert (¡y sólo él consideramos en E!) no se encuentra,
pues, ningún sistema ortonormal completo de soluciones.
Por otra parte, la teoría de Hilbert relativa al problema de valores propios
muestra que este hecho no representa algo excepcional en el comportamiento de
los operadores (ni tan sólo en el de los continuos).70 Deberemos, pues, analizar las
consecuencias a que da lugar su aparición. (Qué significado físico le corresponde,
lo veremos más adelante, cf. III.3.) Cuando así ocurre, cuando el sistema ortonor
mal entresacado del conjunto de las soluciones de E no es completo, se dice que
existe un «espectro continuo de H» (l1, l2, … constituyen el «espectro discreto de
H»).
Desde el momento que en E no se cumplen las condiciones requeridas, nues
tra misión es ahora hallar una formulación adecuada para el problema de valores
propios relativo a los operadores hermíticos y aplicarla luego a la Mecánica cuán
tica. Por de pronto, siguiendo a Hilbert, hemos de precisar y aclarar esta formu
lación (cf. loc. cit. Nota 70).
7. Continuación
Vamos a someter aquí la ecuación
Hj = lj,
como también la pretensión de que a partir de sus soluciones se pueda formar un

sistema ortonormal completo, a un proceso de simple analogía, partiendo del caso
de un número finito de dimensiones, esto es, de los En.
En En, H es una matriz {hmn }, m, n = 1, …, n, hnm = hmn, y que las soluciones
j = {x1, …, xn} de Hj = lj, es decir, de
∞
∑ hµν xν = λ xµ , (µ = 1, …, n),
ν =1
contienen un sistema ortonormal completo, es un hecho algébrico sobradamente

conocido.71
Esta propiedad del En, conforme vimos, no se puede transferir al E∞ mediante
el paso al límite n → ∞, de donde resulta que el problema de valores propios debe
formularse en éste de otra manera. Veremos a continuación que la formulación de
dicho problema en el En admite un cierto giro, y que en su nueva forma (equiva
lente a la primitiva en En) permite la extensión al E∞. Es decir: ambas expresan lo
una función que no es de cuadrado sumable? Entiende por solución, en este punto concreto, una
función f, aunque no pertenezca al FΩ, para la que tenga sentido la aplicación a ella de H, y tal, ade
más, que exista una constante l que junto con f satisfaga la ecuación H f = lf. (N. del T.)
187
Fund_MAT_02.indd 187 9/5/18 10:11

mismo en cada En (n = 1, 2, …) (a saber, la posibilidad de la reducción de las

matrices hermíticas a sus ejes principales); pero mientras la una puede hacerse
extensiva al E∞, la otra no.
Sea {x11, …, x1n}, …, {xn1, …, xnn}, el sistema ortonormal completo de so
luciones de la ecuación de valores propios, y l1, …, ln, las correspondientes l.
Los vectores {x11, …, x1n}, …, {xn1, …, xnn}, forman, por lo tanto, un sistema de
coordenadas cartesiano en En. Las fórmulas de transformación de las coordenadas
X1, …, Xn en este sistema de referencia en las coordenadas x1, …, xn relativas al
sistema primitivo se expresan del siguiente modo:
{x1, …, xn} = X1{x11, …, x1n} + … + Xn{xn1, …, xnn},

es decir,
n n
x1 = ∑ X µ xµ1, …, xn = ∑ X µ xµn,
µ =1 µ =1
e inversamente
n n
X 1 = ∑ x1µ xµ , …, X n = ∑ xnµ xµ.
µ =1 µ =1
Con ayuda de las variables X1, …, Xn y otra nueva serie de variables y1, …, yn
(junto con las Y1, …, Yn que a éstas corresponden de acuerdo con las anteriores
n
fórmulas), podemos escribir las condiciones ∑ hµν xρµ = λρ xρµ así:
ν =1
n
⎛ n ⎞ n
∑ ⎜ ∑ hµν xρν ⎟ X ρ yµ = ∑ λρ x ρµ X ρ yµ , (*)
ρ, µ =1 ⎝ ν =1 ⎠ ρ, µ =1
*
o sea
n n
⎛ n ⎞⎛ n ⎞
(D). ∑ hµν xν yµ = ∑ λρ ⎜ ∑ xρµ xµ ⎟ ⎜ ∑ xρµ yµ ⎟ .
µ,ν =1 ρ =1 ⎝µ =1 ⎠ ⎝µ =1 ⎠
El carácter cartesiano de nuestro sistema de coordenadas, pero encuentra su

expresión en
n n
⎛ n ⎞⎛ n ⎞
(O). ∑ xµ yµ = ∑ ⎜ ∑ xρµ xµ ⎟ ⎜ ∑ xρµ yµ ⎟ .
µ =1 ρ =1 ⎝ µ = 1 ⎠ ⎝µ =1 ⎠

* Es claro que el imponer a esta relación la condición de que quede satisfecha cualesquiera que
sean las Xr, yμ, equivale a las n condiciones anteriores. (N. del T.)
188
Fund_MAT_02.indd 188 9/5/18 10:11

Por consiguiente, hallar una matriz {xmn} que posea las propiedades D, O, equi
vale en En a la resolución del problema de valores propios. Y es el caso que en esta
forma se malogra el tránsito al E∞. No debe sorprendernos este fracaso, sin embar
go, y ello por el siguiente motivo: las condiciones D, O no determinan completa
mente las incógnitas lr, xmn. A decir verdad, y conforme muestra la teoría de estas
«reducciones a los ejes principales» (cf. loc. cit. en la Nota 71), las lr están unívo
camente determinadas salvo en su orden de sucesión, y mucho peor es lo que
sucede con las xmn. Evidentemente, se puede multiplicar cada fila xr1, …, xrn por
un factor θr de valor absoluto igual a la unidad, y si algunos lr coinciden, ¡inclu
so es lícito efectuar una transformación unitaria cualquiera de las correspondientes
filas xr1, …, xrn entre sí! Intentar el delicado paso al límite n → ∞ con tales can
tidades no unívocamente determinadas, es enteramente inútil, pues ¡cómo va a
resultar convergente el proceso, si durante su desarrollo las lr, xmn pueden sufrir a
capricho grandes variaciones hechas posibles por su incompleta determinación!
Con todo, esto nos indica cómo hay que abordar el asunto: hemos de intentar
sustituir las condiciones D, O y las incógnitas lr, xmn por otras que posean la uni
vocidad que echamos de menos, y se verá entonces que bien pocas dificultades
ofrece ya el paso al límite.
Si l es un valor cualquiera tomado por una o más de una lr la expresión
⎛ n ⎞⎛ n ⎞
∑ ⎜ ∑ xρµ xµ ⎟ ⎜ ∑ xρµ yµ ⎟
λρ = l ⎝ µ = 1 ⎠⎝µ =1 ⎠
es invariante respecto de los cambios arriba detallados (compatibles con D, O). Si

l es diferente de todos los lr, la tomaremos igual a cero, invariante con mayor
motivo por consiguiente. Por ende, también la forma hermítica (x, y representan
los sistemas x1, …, xn, y1, …, yn respectivamente)
⎛ n ⎞⎛ n ⎞
E (l; x, y) = ∑ ⎜ ∑ x ρµ xµ ⎟ ⎜ ∑ x ρµ yµ ⎟
λρ ≤l ⎝ µ = 1 ⎠⎝µ =1 ⎠
es invariante (¡l arbitrario!). Cuando se conocen las E (l; x, y) (es decir, sus coefi
cientes), es fácil a partir de ellas volver a las lr ⋅ xmn. Luego si formulamos el pro
blema de valores propios (esto es, D, O) de modo que en la nueva formulación
intervengan sólo las E (l; x, y), en vez de las lr, xmn, entonces habremos conseguido
la deseada formulación unívoca.
Sea, por lo tanto, E (l ) la matriz de la forma hermítica E (l; x, y).72 ¿Qué nos
dicen D, O acerca del haz de matrices E (l )?
O significa que cuando l es suficientemente grande (a saber, mayor que todas
las lr), es E (l ) = 1 (la matriz unidad). De la naturaleza de E (l ) se sigue que si l es
suficientemente pequeño (a saber, menor que todas las lr), es E (l ) = 0, y que
cuando l crece de -∞ a +∞, E (l ) es siempre constante excepto en un número fi
189
Fund_MAT_02.indd 189 9/5/18 10:11

nito de puntos (los ocupados por aquellas de entre las l1 …, ln que son diferentes
entre sí y a los que llamaremos l 1 < l 2 < … < l m, m ≤ n) en los que cambia expe
rimentando un salto. Y es el caso que la discontinuidad se da siempre a la izquier
da del punto en que dicho salto tiene lugar, porque la ∑ , considerada como
λρ ≤l
función de l, es continua a la derecha. (Si hubiésemos elegido ∑ ocurriría al
λρ <l
revés.) Finalmente, vamos a demostrar que, para l' < l", es
E (l' )E (l" ) = E (l" )E (l' ) = E (l' ),
(¡se trata de productos de matrices!).

La demostración es más cómoda si E (l'; x, y), E (l"; x, y) se refieren al sistema
de coordenadas de las X1, …, Xn, e Y1, …, Yn. Tras la introducción de estas varia
bles, E (l'; x, y), E (l"; x, y) toman la forma
∑ X ρY ρ y ∑ X ρY ρ .
λρ ≤l' λρ ≤l"
Las matrices asociadas presentan, por lo tanto, el siguiente aspecto: fuera de la

diagonal principal, sólo ceros ; sobre la diagonal, en la r-ésima casilla, la unidad,
si lr ≤ l' o lr ≤ l", respectivamente, si no, también cero. Pero para estas matrices
es patente la verdad de nuestra afirmación.
En cuanto a D, ésta nos dice, evidentemente, que
n m
∑ hµν xν yµ = ∑ lτ {E (lτ ; x, y) − E (lτ −1; x, y)}
µ,ν =1 τ =1
(l0 es un número cualquiera < l1). Pero como E (l ; x, y) es constante en cada uno
de los segmentos
-∞ < l < l 1; l 1 ≤ l < l 2; …; l m-1 ≤ l < l m; l m ≤ l < +∞,
para cada sistema de números
Λ0 < Λ1 < Λ2 < … < Λk,
supuesto que entre ellos figuren l 1, …, l m , se tendrá
n k
∑ hµν xν yµ = ∑ Λτ {E (Λτ ; x, y) − E (Λτ −1; x, y)}.
µ,ν =1 τ =1
190
Fund_MAT_02.indd 190 9/5/18 10:11

Si aplicamos al segundo miembro de esta igualdad la noción de integral de Stielt

jes,73 podremos también escribirla del siguiente modo:
n +∞
∑
µ,ν =1
hµν xν yµ =
∫ −∞
λdE(λ ; x, y).
(∫−∞
+∞ b
)
puede sustituirse por cualquier ∫a , con tal que a < l1 y b > lm . Cabe asimis
mo considerar los coeficientes de uno y otro miembros de esta última, y escribir
la ecuación válida para todos ellos como ecuación entre matrices. Se obtiene en
tonces
+∞
H= ∫ −∞
λdE(λ),
donde es H = {hmn}.
Con esto ha resultado el siguiente problema: Dada una matriz hermítica
H = {hmn}, hallar un haz de matrices hermíticas E (l)(-∞ < l < +∞) que posea las
siguientes propiedades:
pequeños 0
S1. Para valores de l suficientemente
grandes { }
es E (l) =
1 {}
. E(l), con
cebida como función de l, es constante, salvo en un número finito de puntos
excepcionales en los que sufre una variación brusca. El salto se produce siempre
precisamente a la izquierda de dichos puntos.
S2. Siempre es E (l' ) E (l'' ) = E [Min (l' , l'' )].74
S3. Es válida la igualdad
+∞
H= ∫ −∞
λdE(λ),
cuyo segundo miembro debe entenderse en el sentido de una integral de Stieltjes.

No vamos a entretenernos ahora en retroceder de S1-S3, a las soluciones de D, O
(aunque sería fácil), pues es únicamente esta forma del problema de valores propios
de la que necesitaremos en la Mecánica cuántica, antes bien pasamos sin más a la
generalización de S1-S3, efectuando el tránsito de un número finito de variables
a infinitas variables, esto es, de En a E∞.
En E∞ habremos de considerar H y E (l) corno operadores hermíticos, eviden
temente —es decir, dado un tal H, intentaremos determinar un haz de operadores
hermíticos E (l) que guarde con H una cierta relación que sea el trasunto de S1-S3.
Hay que hallar, pues, lo análogo a éstas en dicho espacio.
La condición S2 la tomaremos sin modificar, porque en ella el número de di
mensiones de En no representa papel ninguno. Sin embargo, y sirviéndonos de
los resultados que obtuvimos relativos a los operadores de proyección (II.4), la
191
Fund_MAT_02.indd 191 9/5/18 10:11

enunciaremos de un modo algo distinto. En primer lugar, S2 nos dice que, para
l' = l" = l, E (l)2 = E(l), esto es, que los E (l) deben ser operadores de proyección.
Pero en tal caso, S2 significa que para l' ≤ l" es E (l' ) ≤ E (l" ) (cf. teorema 14 y
el texto que a él sigue en II .4. Nos hemos limitado a l' ≤ l", porque de lo que
ocurre en este supuesto se deduce lo que corresponde a l' ≥ l").
En+∞ lo que concierne a S3, es conveniente andar con una cierta cautela
H = ∫−∞ λdE(λ) carece, en rigor, de sentido, pues la integral de Stieltjes se define
para números y no para operadores. Con todo, es fácil sustituir H y E(l) por nú
meros, de modo que la relación entre operadores pedida resulte de nuevo, pero
ahora con pleno sentido: se trata de que
+∞
(Hf , g) = ∫
−∞
λd[E(λ) f , g]
valga para todos los f, g de E∞, con tal que Hf tenga sentido; hay que ver
+∞
H = ∫−∞ λdE(λ) un símbolo, la cifra de lo que acabamos de decir.
S1, finalmente, es alterado en su esencia por el tránsito a un número infinito
de dimensiones. El punto hasta llegar al cual es E (l) = 0, el punto a partir del
cual es E (l) = 1 y los puntos en los que E (l) efectúa sus saltos discontinuos, son
efectivamente en En los valores propios de H, y los intervalos en los que E(l) se
mantiene constante, aquellos en que no aparecen dichos puntos. Pero ahora, cuan
do n → ∞, las cosas pueden ocurrir de un muy otro modo, a saber: el menor
valor propio puede tender a -∞, el mayor a +∞, y en cuanto a los restantes, dado
que son cada vez más y más numerosos, acaso se distribuyan siempre con mayor
densidad, hasta el extremo que los intervalos en que es constante E (l) se contrai
gan eventualmente y tiendan a reducirse a puntos. (Esto último, en particular, es
el síntoma que, en la teoría de Hilbert, anuncia la aparición del llamado espectro
continuo.75) Luego, en el paso de En a E∞, debemos modificar esencialmente S1.
hay que tener en cuenta la eventual desaparición del carácter discreto, a saltos, de
la variabilidad.
Desde este punto de vista, es muy plausible prescindir de la pretensión de que
los valores 0 y 1 sean accesibles a E (l) e imponer simplemente la convergencia a
0 y a 1 para l → -∞ y l → +∞, respectivamente ; del mismo modo, junto a aquel
comportarse E (l) como constante a lo largo de ciertos segmentos y al carácter
discontinuo en los extremos de los mismos, surge la licitud de un crecimiento
continuo. En cambio, la condición menos radical de que en los posibles puntos
de discontinuidad ésta se presente a la izquierda, podemos conservarla por vía de
ensayo. Por consiguiente, formularemos S1 en los siguientes términos: para l → -∞,
E (l) → 0, para l → +∞, E (l) → 1, para l → l0 y l ≥ l0, E (l) → E (l0).76
Acerca de S3, hay que observar aún algo más. En el En, si Ft es la matriz E (lt) -
m
- E (lt - 1), se tenía H = ∑ lτ Fτ . En virtud de S2, es por otra parte,
τ =1
192
Fund_MAT_02.indd 192 9/5/18 10:11

para s ≥ t Ft E (ls) = E (lt )E (ls) - E (lt - 1)E (ls)

= E (lt ) - E (lt - 1) = Ft ,
para s ≤ t - 1 Ft E (ls) = E (lt )E (ls) - E (lt - 1)E (ls)

= E (ls) - E (ls) = 0,
de donde, ya que Fs = E (ls) - E (ls - 1),
⎧Fτ , para τ = σ ,
Fτ − Fσ = ⎨
⎪⎩0, para τ ≠ σ .
Luego vale la igualdad
2
⎛m ⎞ m m
H2 = ⎜ ∑ lτ Fτ ⎟ = ∑ lτ lσ Fτ Fσ = ∑ lτ2 Fτ ,
⎝ τ =1 ⎠ τ ,σ =1 τ =1
m
y del mismo modo H p = ∑ lτp Fτ . Por lo tanto, la misma transformación que en el
τ =1
caso de sólo H nos dará
+∞
H2 = ∫−∞
λ 2 dE (λ).
De acuerdo con esto, supondremos la validez en E∞ de la ecuación simbólica aná

logamente construida, esto es, numéricamente,
+∞
(H2 ⋅ f , g)= ∫ −∞
λ 2 d[E(λ )f , g],
que, por otra parte, comprobaremos en lo que sigue. Para f = g, y pues
(H2f, f ) = (Hf · Hf ) = ∙Hf ∙2, [E (l)f , f ] = ∙E (l)f ∙2,
se sigue de ahí que

+∞
∫ λ 2 d ⎡⎣ E(λ )f ⎤⎦ .
2 2
Hf =
−∞
Esta fórmula, pero, permite contar con que las E ( l ) no sólo fijen el valor de
Hf cuando éste tiene sentido, sino también cuándo lo tiene, pues el integrando de
193
Fund_MAT_02.indd 193 9/5/18 10:11

+∞
la ∫−∞ λ 2 d ⎡⎣ E(λ )f ⎤⎦ es constantemente no negativo (l2 ≥ 0) y la expresión que
2
sigue al signo d (es decir, ∙E (l)f ∙2, cf. S2 y el teorema 15 en II.4) es no decrecien

te ; por consiguiente, dicha integral es de por sí convergente, esto es, cero o finita
y positiva, o propiamente divergente, es decir, +∞.77 Y es el caso que esto vale
independientemente de la relación con H, sin atender a que Hf tenga sentido o
no. Por esto cabe esperar que Hf tenga sentido (Hf elemento de E∞) cuando y
+∞ 2
sólo cuando el presunto valor de ∙Hf ∙2, es decir, la expresión ∫−∞ λ 2 d E(λ )f , que
tiene sentido para todo f, sea finito.
Resumiendo, la nueva formulación de S1-S3 reza así:
Dado un operador hermítico H, determinar un haz E(l) de operadores de
proyección (-∞ < l < +∞) que tenga las siguientes propiedades:
S1. Para l → -∞, E (l) f → 0; para l → +∞, E (l) f → f ; para l → l0, sien
do l ≥ l0, E (l) f → E (l0) f. Todo ello cualquiera que sea f.
S2. De l' ≤ l" se sigue E (l' ) ≤ E (l" ).
S3. La integral
+∞
∫ λ 2 d ⎡⎣ E(λ )f ⎤⎦,
2
−∞
que de suyo es convergente (0 o finita y positiva) o propiamente divergente, de

termina el dominio de definición de H : Hf tiene sentido siempre y sólo cuando
dicha integral es convergente, en cuyo caso, además, para todo g es
+∞
(Hf , g) = ∫
−∞
λ d[E(λ )f , g].
(La última integral es absolutamente convergente cuando la primera es finita.78)

En las propiedades S1, S2 no aparece en modo alguno H. Un haz de operado
res de proyección E (l) que goce de ellas lo llamaremos una descomposición de la
unidad. De una tal descomposición que guarde con H la relación S3, diremos que
corresponde a H.
Por lo dicho, podemos formular el problema de valores propios del E∞, en los
siguientes términos: Dado un operador hermítico H, ¿existen siempre descompo
siciones de la unidad que le correspondan y cuántas? (Sería de desear que la res
puesta fuera: existe siempre exactamente una.) Además, será menester que exami
nemos cómo se comporta nuestra definición del problema de valores propios
respecto de los métodos en general seguidos en Mecánica cuántica (en particular,
en la teoría ondulatoria) para la determinación de los valores propios de los ope
radores hermíticos.
194
Fund_MAT_02.indd 194 9/5/18 10:11

8. Consideraciones generales relativas al problema

de valores propios
Ante nuestra definición del problema de valores propios, la primera cuestión
que se plantea es ésta: Son tan distintas S1-S3 del problema de que partimos al
empezar el último párrafo, que ya no es posible reconocer en modo alguno qué
pueden tener que ver con él. Verdad es que en el En pudimos deducir S1-S3 de las
condiciones que en aquél se daban; pero las circunstancias son muy otras en el E∞
las dos formulaciones no son ya equivalentes, mientras sí lo eran en el En. Es, por
consiguiente, todo el problema lo que se plantea de un modo nuevo, y hay que
averiguar hasta qué punto la nueva formulación comprende a la anterior, esto es,
cuándo y cómo nuestras E (l) determinan las l1, l2, … y las j1, j2, … de antes.
Si al operador hermítico A le corresponde la descomposición de la unidad E(l),
¿cuándo es resoluble la ecuación
Af = l0f ?.
Veamos: A f = l0 f significa lo mismo que (A f , g) - l0( f, g) = 0 para todo g, es
decir,
+∞ +∞ +∞
0= ∫
−∞
λ d[E(λ) f , g] − λ0( f , g) = ∫ −∞
λ d[E(λ) f , g] − λ0 ∫ −∞
d[E(λ) f , g] =
+∞
= ∫ −∞
(λ − λ0 )d[E(λ) f , g],
cualquiera que sea g.

Hagamos primero g = E (l0) f ; resulta entonces
+∞ +∞
∫ ∫
2
0= (λ − λ0 )d[E(λ) f , E (λ0 )f ] = (λ − λ0 )d[ E (min (λ, λ0 )f ].
−∞ −∞
+∞ λ0 +∞ λ0
La integral ∫−∞ podemos descomponerla en ∫−∞ + ∫λ . En la ∫−∞ podemos sustituir
0
+∞
min (l, l0) por l, en la ∫λ0
, por l0. En esta última integral, por ende, aparece
detrás del signo d una constante, y, por tal razón, es nula. Queda así para la pri
mera, una vez cambiado el signo al integrando,
λ0
∫
2
(λ0 − λ)d[ E (λ)f ] = 0.
−∞
Hagamos, en segundo lugar, g = f ; resulta entonces

+∞ +∞
∫ ∫
2
0= (λ − λ0 )d[E(λ) f , f ] = (λ − λ0 )d[ E (λ)f ].
−∞ −∞
195
Fund_MAT_02.indd 195 9/5/18 10:11

Si a esta ecuación sumamos la que inmediatamente precede, obtenemos

+∞
∫
2
(λ − λ0 )d[ E (λ)f ] = 0.
λ0
Consideremos algo más detenidamente las dos integrales
λ0 ∞
∫ ∫
2 2
(λ − λ0 )d[ E (λ)f ], (λ − λ0 )d[ E (λ)f ].
−∞ λ0
En ambas el integrando es ≥ 0 y tras el signo d aparece una función de l mo

nótona no decreciente. Por consiguiente, tenemos, para cada e > 0,
λ0 λ0 − ε λ0 − ε
∫ ∫ ∫
2 2 2
0= (λ0 − λ)d[ E (λ)f ] ≥ (λ0 − λ)d[ E (λ)f ] ≥ ε d[ E (λ)f ] =
−∞ −∞ −∞
2
= ε E (λ0 − ε )f ,
∞ ∞ ∞
∫ ∫ ∫
2 2 2
0= (λ − λ0 )d[ E (λ)f ] ≥ (λ − λ0 )d[ E (λ)f ] ≥ ε d[ E (λ)f ] =
λ0 λ0 + ε λ0 + ε
2 2 2
= ε[ f − E (λ0 + ε )f ] = ε f − E(λ0 + ε )f .
Los últimos miembros son, pues, ≤0; pero como, de otra parte, son idénticamen
te ≥0, deben ser nulos. Por consiguiente,
E(l0 - e)f = 0, E(l0 + e)f = f,
cualquiera que sea e > 0. Por razón de la continuidad a la derecha de E(l), en la

segunda de estas dos ecuaciones cabe hacer que e → 0: E (l0) f = f. Si ahora, en la
misma ecuación, hacemos e = l - l0 ≥ 0, supuesto l ≥ l0, resulta E(l)f = f, mien
tras que, para l < l0 y haciendo e = l0 - l, de la primera se sigue que E (l)f = 0.
Resumiendo: para todo f solución de Af = l0 f es
⎪⎧ f para λ ≥ λ0,
E (λ) f = ⎨
⎩⎪0 para λ < λ0.
Esta condición, pero, no es sólo necesaria, sino también suficiente, pues de

cumplirse ella se deduce que será
+∞
(Af , g) = ∫ −∞
λ d[E (λ)f , g] = λ0( f , g)
196
Fund_MAT_02.indd 196 9/5/18 10:11

(no se pierda de vista la definición de la integral de Stieltjes dada en la Nota 73)

cualquiera que sea g, es decir, (Af - l0 f , g) = 0 para todo g, o sea, Af = l0 f .
Ahora bien: ¿cómo debemos interpretarla? En primer lugar implica una dis
continuidad de E (l) en el punto l = l0. Según el teorema 17 de II.4, E (l) debe
tender a un operador de proyección tanto para l → l0, l < l0, cuanto para
l → l0, l > l0. Sean E (1) (l0) y E (2) (l0) estos límites, respectivamente.79 De acuer
do con S1, E (2) (l0) = E (l0); pero si l0 es punto de discontinuidad, E (1)(l0) ≠ E(l0).
Para l < l0 es E (l) ≤ E (l0), en virtud de S2, y, por lo tanto, siempre es E (1)(l0) ≤
≤ E (l0). Luego E (l0) - E (1)(l0) es un operador de proyección y para que l0 sea
un punto de discontinuidad de E (l) es necesario y basta que este operador sea ≠0.
El ser E (l)f = 0 para todo l < l0 trae consigo que E (1)(l0)f = 0, y esto último
a su vez tiene como consecuencia lo primero, pues cualquiera que sea l < l0
es E(l) < E (1)(l0). Por otra parte, que E(l)f = f , para todo l ≥ l0, se sigue de
E(l0)f = f, porque en estas condiciones E (l0) ≤ E (l), E (l)E (l0) = E(l0) y, por
lo tanto, E (l)f = E (l)E (l0) f = E (l0) f = f . Luego, que E (1)(l0) f = 0 y E (l0) f = f ,
o lo que es lo mismo (teorema 14, II.4), que [E (l0) - E (1)(l0)] f = f , es condición
necesaria y suficiente para que Af = l0 f . De otro modo, si hacemos E(l0) - E(1)(l0) =
= PM , es necesario y basta para que Af = l0f el que f pertenezca a Ml .
l0 0
Queda así demostrado que Af = lf tiene una solución f ≠ 0 sólo en los pun
tos de discontinuidad l0 de E (l) y las soluciones correspondientes a l0 forman la
variedad lineal cerrada Ml poco ha definida.
0
Resulta, pues, que el sistema ortonormal completo constituido por soluciones de

Af = lf , que buscábamos en II.6, existe siempre y sólo cuando las Ml (-∞ < l0 < ∞)
0
tomadas en conjunto definen como variedad lineal cerrada asociada precisamente

al E∞ [Hemos discutido ya en II.6 cómo debe en tal caso llevarse a cabo la cons
trucción de dicho sistema. Que las Ml son entre sí ortogonales, podemos verlo
0
nuevamente: de l0 < m0 se sigue

PM ⋅ PM = [E (l0) - E (1)(l0)] [E (m0) - E (1)(m0)] = 0,
l0 m0
ya que
E (l0) - E (1)(l0) ≤ E (l0) ≤ E (1)(m0), E (m0) - E (1)(m0) ≤ 1 - E (1)(m0).]
Sin averiguar qué condiciones son las precisas para un tal comportamiento, pode
mos en todo caso fijar el siguiente extremo: la identificación de aquella extensión
lineal cerrada con el E∞ es imposible cuando existe un intervalo m1, m2 en el que
E (l) crece de modo continuo [esto es, m1 < m2, E (l) continuo en m1 ≤ l ≤ m2
y E (m1) ≠ E (m2)]. En efecto: para l ≤ m1 es E (l) - E (1)(l) ≤ E (l) ≤ E (m1); para
m1 < l ≤ m2 es E (l) - E (1)(l) = 0, a causa de la continuidad supuesta; para m2 < l
es E (l) - E (1)(l) ≤ 1 - E (1)(l) ≤ 1 - E (m2). Luego E (l) - E (1)(l) es siempre or
togonal a E (m2) - E (m1). Sea PN = E (m2) - E (m1); entonces todas las Ml son orto
gonales a N. Si fuera posible extraer del conjunto de las Ml un sistema ortonormal
completo, N contendría como único elemento el 0, es decir, sería E (m2) - E (m1) = 0,
contra la hipótesis.
197
Fund_MAT_02.indd 197 9/5/18 10:11

Llamaremos espectro discreto del operador hermítico A, al que corresponde la

descomposición de la unidad E (l), al conjunto de los puntos de discontinuidad
de E (l), es decir, aquellos puntos l para los cuales tiene solución f ≠ 0 la ecuación
Af = lf . Si en cada Ml ≠ 0 elegimos un f de módulo unidad, ∙ f ∙ = 1, obtendre
mos un sistema ortonormal, por razón de la ortogonalidad de las Ml. Según el
teorema 3 del II.2, este sistema es finito o infinito numerable; luego las l del es
pectro discreto de A forman como máximo una sucesión infinita.
Todos aquellos puntos en cuyos entornos no es constante E (l) constituyen,
por definición, el espectro de A. Vimos que si existen intervalos en los que penetra
el espectro de A, pero no el espectro discreto —esto es, intervalos de continuidad
de E (l) en los cuales no es éste constante—, el problema de valores propios no es
resoluble en el sentido en que fue formulado al principio de II.6. No seguiremos
investigando las condiciones precisas en las que el problema no se puede resolver:
así ocurre también, eventualmente, cuando el espectro discreto penetra en todos
los intervalos en los que existen puntos del espectro; la separación del espectro
discreto del resto es en tal caso considerablemente ardua, y ya no pertenece pro
piamente a nuestro objeto. (El lector encontrará el estudio de estas cuestiones en
las citadas memorias de Hilbert.)
Lo que sí haremos, en cambio, es indicar cómo hay que construir los E(l)
cuando existe un sistema ortonormal completo j1, j2, … de soluciones de Aj = lj
(con l = l1, l2, … para j = j1, j2, …, respectivamente), es decir, en el caso que
llamaremos caso del espectro discreto puro. Los E(l). son precisamente
E (λ) = ∑ P[ϕρ ]. 80
λρ ≤ λ
(La suma ∑ puede no contener ningún sumando, y entonces es E (l) = 0; o un

número finito, y su significado es entonces claro; o una infinidad numerable, en
cuyo caso converge según lo dicho al final del II.4.)
En efecto: S2 es evidente, pues, para l' ≤ l".
E (λ") − E (λ') = ∑ P[ϕρ ]

λ' < λρ ≤ λ"
es un operador de proyección, y, por lo tanto, E (l' ) < E (l" ) (teorema 14). S1 se

demuestra así: Para cada f es
∑ = ∑ f , ϕ ρ = Nota 81 = f
2 2 2
P[ϕρ ] f
ρ ρ
∑ P[ϕ ] f
2
(teorema 7), o sea, la ρ
es convergente. Por consiguiente, para cada e > 0
ρ
podemos hallar un número finito de sumandos tal que la ∑ relativa sólo a éstos
ν
198
Fund_MAT_02.indd 198 9/5/18 10:11

sea ya >∙ f ∙2 - e y, por lo tanto, que cada extendida ∑' a sumandos de entre los
ν
que faltan en la anterior sea <e. Entonces es también
2
∑' P[ϕ ] f = ∑' P[ϕρ ] f
2
ρ
< ε.
ρ ρ
De aquí resulta, en particular, que

2 2 2
∑ P[ϕρ ] f < ε, ∑ P[ϕρ ] f < ε, ∑ P[ϕρ ] f <ε
λρ ≤ λ λρ > λ λ0 < λρ ≤ λ
si se elige l, respectivamente, suficientemente pequeño, suficientemente grande,

o lo bastante próximo a l0(l ≥ l0). Luego, en efecto,
E(λ)f = ∑ P[ϕρ ] f → 0 para λ → −∞,

λρ ≤ λ
f − E(λ)f = ∑ P[ϕρ ] f → 0 82 para λ → +∞,

λρ > λ
E(λ)f − E(λ0 )f = ∑ P[ϕρ ] f → 0 para λ → λ0 , λ ≥ λ0 ,

λ0 < λρ ≤ λ
es decir; S1 se cumple.
Para cerciorarnos de la validez de S3, pongamos f = x1j1 + x2j2 + …, por ende
∞
∑ λρ2 xρ
2
Af = l1x1j1 + l2x2j2 +… Para que Af tenga sentido, debe ser finita la .
Pero ρ =1
∞ ∞ ∞
∫ ∫ λ 2 d ⎛ ∑ xρ ⎞ = Nota83 = ∑ λρ2 xρ ,
2 2 2
λ 2 d E (λ)f =
−∞ −∞
⎝ λρ ≤ λ ⎠ ρ =1
∞ ∞ ∞
∫−∞
λ 2 d[E (λ)f , g]2 =
∫ −∞
λ d ⎛ ∑ xρ yρ ⎞ = Nota83 = ∑ λρ xρ yρ = (Af , g).
⎝λρ ≤λ ⎠ ρ =1
Por lo tanto, también S3 queda satisfecha.

A continuación examinaremos dos casos de espectro continuo puro, esto es,
dos casos en que no existe espectro discreto. Sea E∞ el espacio de todas las funcio
nes f (q1, …, qk) tales que la
∞ ∞
∫ ∫
2
… q1, …, qk dq1 … dqk
−∞ −∞
es convergente, y A el operador qj…, cuyo carácter hermítico es evidente (cf. II.5).
199
Fund_MAT_02.indd 199 9/5/18 10:11

Nótese que Af = lf significa que debe ser (qj - l)f (q1, …, qk) = 0, es decir,
f (q1, …, qk) = 0 en todo el espacio, salvo acaso en el plano de k - 1 dimensiones
qj = l. Sin embargo, lo que en él le suceda a f carece de importancia (según lo
dicho en II.3 al tratar de la condición B), porque la medida −L de dicho plano
(es decir, su volumen) es cero: luego f ≡ 0.84 Nunca existe, pues, en este caso, una
solución de Af = l f que sea ≠0. Pero también se ve (¡inexacto!) dónde hay que
presumir la solución. Una combinación lineal de soluciones correspondientes a
varias l, por ejemplo l = l', l", …, l(s), sería un f que sólo para
qj = l', l", …, l(s)
es ≠0. Cabe considerar, por consiguiente, como combinación lineal de todas las
soluciones para las que l ≤ l0, un f que sólo para l < l0 es ≠0. Pero en el caso
del espectro discreto puro teníamos que
E(λ0 ) = ∑ P[ϕρ ] = PNλ0, Nλ0 = [ϕ ρ (λρ ≤ λ0) ],

λρ ≤ λ0
esto es, Nl se compone de las combinaciones lineales de todas las jr tales que
lr < l0, es decir, de todas las soluciones de Af = lf con l ≤ l0. Luego hay que
esperar —naturalmente esto es inexacto y debe considerarse sólo desde el punto
de vista heurístico —que ahora será E (l0) = PN , donde Nl está constituida por l0 0
aquellos f que sólo para qi < l0 son ≠0. E∞ - Nl consta entonces, evidentemente, 0
de aquellos f que para qi ≤ l0 son siempre =0. Por consiguiente es
⎪⎧ f (q1, …, qk ), para q j ≤ λ0⎪⎫

E(λ0) f (q1, …, qk ) = ⎨ ⎬
⎩⎪ 0 para q j > λ0 ⎭⎪
Hemos hallado así, aunque por vía no rigurosa, un haz de operadores de pro
yección de los que cabe conjeturar que cumplen S1-S3 respecto de nuestro A. Es
obvio que S1 y S2 quedan satisfechas, y aun que en S1 lo queda la condición re
lativa a l → l0 incluso sin la adicional de haber de ser l ≥ l0, es decir, E (l) es
continuo para cualquier valor de l. Para ver que también se cumple S3, basta
probar que subsisten las ecuaciones allí indicadas:
∞
∫−∞ λ 2d E(λ)f
2 ∞
= ∫−∞ λ 2 d (∫−∞
∞ λ ∞
… ∫−∞…∫−∞ f (q1,…, q j ,…, qk ) dq1 … dq j … dqk =
2
)
= ∫−∞ λ 2
∞
(∫ ∞
−∞
∞ 2
… ∫−∞ f (q1,…, q j −1, λ , q j +1,…, qk ) dq1,…, dq j −1dq j +1 … dqk d λ = )
∞ ∞
= ∫−∞… ∫−∞ q 2j f (q1,…, q j −1, q j , q j +1 ,…, qk ) dq1,…, dq j −1dq j dq j +1 … dqk = Af ,
2 2
200
Fund_MAT_02.indd 200 9/5/18 10:11

∫−∞ λ d[E(λ)f , g] = ∫−∞ λ d (∫−∞… ∫−∞…∫−∞ f (q1,…, q j ,…, qk )g(q1,…,q j ,…, qk )dq1 … dq j … dqk ) =
∞ ∞ ∞ λ ∞
∞
= ∫−∞ λ (∫
−∞
∞ ∞
… ∫−∞ f (q1,…, q j −1, λ , q j +1,…, qk )g(q1,…, q j −1, λ, q j +1,… qk ) ⋅
⋅ dq1,…, dq j −1dq j +1 … dqk ) d λ = ∫−∞… ∫−∞ q j f (q1,…, q j −1, q j , q j +1,… qk ) ⋅

∞ ∞
⋅ g(q1,…, q j −1, q j , q j +1,… qk )dq1,…, dq j −1dq j dq j +1 … dqk = (Af , g).
Se reconoce de nuevo que no existe espectro discreto ni puede valer la antigua

definición del problema de valores propios, pues E (l) crece de modo continuo en
toda la recta.
Este ejemplo muestra el camino a seguir en el caso general para hallar E (l) en
el espectro continuo: se determinan (¡incorrecto!) las soluciones de Af = lf (¡estas
f no pertenecen al E∞, ya que l está en el espectro continuo!) y se forman sus
combinaciones lineales para l ≤ l0. Estas pertenecen de nuevo, en parte, a E∞
y constituyen eventualmente una variedad lineal cerrada Nl . Hágase entonces 0
E (l0) = PN . Si el asunto ha sido bien enfocado, se consigue luego verificar S1-S3

l0
[para A y estos E(l)] y hacer así, por fin, de una conclusión a título heurístico una
conclusión exacta.85
El segundo ejemplo que vamos a considerar se refiere al otro importante ope
h ∂
rador de la Mecánica ondulatoria, . Para evitar complicaciones accidenta
2pi ∂qj
les, sea k = j = 1 (igualmente procederíamos de no ser así). Tenemos, pues, el
operador
h d
A'f (q) = f (q),
2pi dq
que es hermítico, conforme vimos en II.5, cuando el campo de variabilidad de q

es (-∞, +∞): -∞ < q < +∞. No sucede así para un campo de variabilidad finito
a ≤ q ≤ b:
h b b h
(A'f , g) − ( f , A'g) =
a 2π i ∫
f ' (q)g(q)dq –
a
f (q) ∫
2π i
g' (q) dq =
h b h h
∫
b
= { f '(q)g(q) + f (q)g'(q)}dq = ⎡⎣ f (q)g(q)⎤⎦a = ⎡ f (b)g(b) − f (a)g(a)⎤⎦ .
2π i a 2π i 2π i ⎣
Para que esta expresión se anule debe restringirse el dominio de definición de

h d
de modo tal que para dos f , g cualesquiera del mismo sea f (a)g(a) = f (b)
2pi dqj
g(b), es decir, f (a) : f (b) = g(b): g (a). Si hacemos variar f manteniendo fijo g, re
f (a)
sulta que debe ser el mismo número q en todo el dominio de definición
f (b)
201
Fund_MAT_02.indd 201 9/5/18 10:11

– 1
(q acaso es 0 ó ∞). Más la sustitución de f por g nos da entonces q = , esto es
h d q
∙q ∙ = 1. Luego, para que sea hermítico, hemos de postular una «condi
2pi dq
ción de contorno» de la forma
f (a) : f (b) = q,
en la que q es un número fijo de valor absoluto 1.

Tomemos primero el intervalo -∞ < q < +∞. Las soluciones de A'j = lj, es
h
decir, j'(q) = lj (q), son las funciones
2pi
2π i
λq
ϕ (q) = ce h ,
que, sin embargo, no podemos aplicar sin más para nuestro objeto, porque
+∞ +∞
∫−∞ ϕ (q) dq = ∫−∞ c dq = +∞ (a menos que c = 0, j ≡ 0). Obsérvese que, en el
2 2
primer ejemplo, encontramos la solución d (q - l), es decir, una función ficticia,
2π i
λq
no existente (cf. Nota 84) ; encontramos ahora e h , por lo tanto una función del
todo ordinaria, la cual, empero, no pertenece a E∞ debido a que la integral del
cuadrado de su valor absoluto es infinita. Desde nuestro punto de vista ambos
casos son equivalentes, pues lo que no pertenece a E∞ no existe para nosotros.86
Como en el primero de ellos, formemos las combinaciones lineales de las so
luciones correspondientes a las l ≤ l0, esto es, las funciones
λ0 2π i
∫
λq
f (q) = c(λ)e h d λ.
−∞
Es de esperar que entre éstas las habrá que pertenezcan a E∞, que, además,
estas últimas formen una variedad lineal cerrada N'l , y, finalmente, que los ope 0
radores de proyección E (l0) = PN' constituyan la descomposición de la unidad

l0
asociada a A'. Se consigue un ejemplo que apoya a la primera conjetura haciendo
⎪⎧1, para λ ≥ λ1
c(λ) = ⎨ λ1 < λ0,
⎪⎩0, para λ < λ1
pues la función
2π i 2π i
λ0q λ1q
λ0 2π i λ q e h −e h
f (q) = ∫λ1
e h dλ =
2π i
q
,
h
202
Fund_MAT_02.indd 202 9/5/18 10:11

1
es dondequiera finita y regular y disminuye como cuando q → +∞± de modo
+∞ q
que ∫−∞ f (q) dq es convergente. Pero es el caso que también las restantes presun
2
ciones se confirman, como resulta de la teoría de la integral de Fourier. Esta afirma

lo siguiente:87 ∞
Sea f (x) una función cualquiera cuya ∫−∞ f (x) dx es finita; en este supuesto,
2
la función
1 ∞
Lf (x) = F (y) ≡
2π ∫ −∞
e ixy f (x)dx
∞ ∞
es tal que la ∫−∞ F(y) dy es asimismo convergente y su valor coincide con ∫−∞ f (x) dx .
2 2
Además es LLf (x) = f (-x). (Esta es la llamada transformación de Laplace, que, por

lo demás, también en la teoría de las ecuaciones diferenciales representa un im
portante papel.)
2π 2π
Si sustituimos x, y por q, p, obtenemos la transformación
h h
2π i
1 ∞
∫
pq
Mf (q) = F(p) ≡ e h f (q)dq,
h −∞
que tiene las mismas propiedades. Por lo tanto, la imagen que del E∞ nos propor
ciona esta transformación coincide con el mismo E∞ [Mf (q) = g (p) tiene solución
para todo g (p) de E∞ : f (q) = Mg (-p)], M deja invariante ∙ f ∙ y es lineal; luego,
según II.5, M es unitario. Dado que M 2f (q) = f (-q), resulta M -1f (q) = M*f (q) =
= Mf (-q) y M es permutable con M 2, es decir, con la transformación f (q) → f (-q).
Todas estas razones justifican la equivalencia de lo que nos proponíamos acer
ca de N'l y el siguiente enunciado: f (q) pertenece a N'l , cuando F (p) = M -1f (q)
0 0
es cero para todo p > l0. (Con la c (l) de antes, es F (p) = √hc(p).) Pero estas F (p),
conforme sabemos, constituyen la variedad lineal cerrada Nl ; luego también N'l 0 0
es una variedad lineal cerrada, en tanto que imagen de Nl dada por M. E'(l0) 0
resulta de E(l0) del mismo modo que N'l resulta de Nl : por transformación de
0 0
todo el E∞, mediante M, así que E' (l0) = ME(l0)M-1. Y pues E(l) tiene las pro
piedades S1, S2, así también E' (l). Sólo queda por demostrar S3, es decir, que la
descomposición de la unidad E' (l) corresponde a A'.
Tocante a este punto, nos limitaremos a demostrar que cuando f (q) y sin pre
2
+∞ h
sentar particulares dificultades de convergencia, es derivable e ∫−∞ f'(q) dq es
2π i
+∞ 2 +∞
finita, la ∫ λ d E'(λ)f es asimismo convergente y (A'f , g) = ∫ λ d (E'(λ)f , g).88
−∞ −∞
h h d h d
En efecto: M f (q) = F(p) y A'f (q) =
-1
f'(q) = [MF(p)] =
2pi 2pi dq 2pi dq
203
Fund_MAT_02.indd 203 9/5/18 10:11

⎛ 1
⎜⎝ ∫ F(p)e
2π i
h
pq
dq
⎞
=
h
⎟⎠ 2π i ∫ F(p)
∂ 2hπi pq
e ( dq =
1
∫ )
F(p)pe
2π i
h
pq
dq = M[pF(p)],
h ∂q h
de forma que, para dicha f , es A' = MAM -1 (A es el operador q…, o bien, puesto
que aquí utilizamos la variable p, el operador p…). S3 vale para A, E (l); luego vale
también para A' = MAM -1, E' (l) = ME (l)M -1, que resultan de aquéllos al trans
formar E∞ mediante M.
h d
Muy otras son las circunstancias para en el intervalo a ≤ q ≤ b (a < b,
2pi dq
a y b finitos), caso éste en el que, conforme sabemos, la conservación del carácter
hermítico hace necesaria una «condición de contorno»
f (a) : f (b) = q (∙q ∙ = 1).
De nuevo es
2π i
λq
f (q) = ce h
h d
la solución de f (q) = lf (q), pero ahora la
2pi dq
b b
∫ ∫
2 2 2
f (q) dq = c dq = (b − a) c
a a
es finita, de modo que f (q) siempre pertenece al E∞. En cambio, hay que cumplir
aún con la condición de contorno
2π i
λ (a −b)
f (a) : f (b) = e h = θ,
o, si ponemos q = e-ia (0 ≤ a < 2p),

2pi
l (a - b) = -ia - 2kpi (k = 0, ±1, ±2, …),
h
de donde
h ⎛α *
λ= + k⎞ .
b − a ⎝ 2π ⎠
h
* La diferencia entre dos valores propios consecutivos es , tanto menor cuanto mayor es
b-a
la diferencia b - a. En cualquier intervalo de la recta l, aumenta el número de valores propios en él
contenidos a media que crece b - a. Nos acercamos así al espectro continuo que aparece, para este
operador, cuando a = -∞, b = +∞. (N. del T.)
204
Fund_MAT_02.indd 204 9/5/18 10:11

Nos encontramos, pues, ante un espectro discreto y las soluciones normaliza

1
das responden a un valor c tal que (b - a)|c |2 = 1, es decir, c = :
b−a
2π i 2π i ⎛ α ⎞
1 λq 1 ⎜ + k⎟ q
ϕk (q) = e h = e b − a ⎝ 2π ⎠ , (k = 0, ±1, ±2,…).
b−a b−a
El conjunto de las jk es, por consiguiente, un sistema ortonormal e incluso

αi
q
completo, porque si f (q) es ortogonal a todas las jk(q), e b − a f (q) lo será a todas
2π i αi
kq x ⎛b − a ⎞
las e b − a , o sea, e 2π f x será ortogonal a todas las eikx, es decir, a 1, cos x,
⎝ 2π ⎠
sen x, cos 2x, sen 2x, … en el intervalo homólogo en x del (a, b):
b-a
a≤ x ≤ b,
2p
esto es, en un intervalo de longitud 2p, lo que exige, según un conocido teorema,
que esta última función se anule.89 Luego también es f (q) ≡ 0.
Resumiendo: A' presenta en el intervalo finito (a, b) un espectro discreto puro,
caso éste que hemos resuelto en general al principio del presente párrafo. Obsér
vese cuánto influye la «condición de contorno» —es decir, q ó a —en los valores
propios y en las funciones propias.
Finalmente, podemos considerar todavía el caso en que el intervalo está sólo
en parte acotado, por ejemplo 0 ≤ q < +∞. Otra vez hay que examinar en primer
lugar el carácter hermítico del operador. Se tiene:
h +∞ h
∫
+∞
(A' f ⋅ g) − ( f , A' g) = [ f ' (q)g(q) + f (q)g' (q)]dq = ⎡⎣ f (q)g(q)⎤⎦0 .
2π i 0 2π i
Como en II.5, en el caso del intervalo -∞, +∞, se demuestra que, para q → +∞,
f (q) g(q) → 0. Por lo tanto debe ser f (0) g(0) = 0. Basta hacer f = g para ver que
aquí la «condición de contorno» es f (0) = 0.
Graves dificultades se originan en este caso. Las soluciones de A'j = lj son
2π i
λq
las mismas que en el intervalo -∞ < q < +∞, a saber, las ce h —que ni pertene
cen al E∞ ni cumplen la condición de contorno—. Ya esto último es sospechoso.
Pero es aún más singular que, de poderse seguir el procedimiento antes esbozado,
deberíamos llegar a las mismas E (l) que en el intervalo -∞ < q < +∞, pues las
soluciones (impropias, esto es, no pertenecientes al E∞) son las mismas. ¿Cómo
hacer compatible este resultado con el hecho de ser otro el operador? Definamos
+∞
(
en el espacio de Hilbert FΩ, de las funciones f (q) 0 ≤ q < +∞, ∫0 f (q) dq finita
las transformaciones
2
)
205
Fund_MAT_02.indd 205 9/5/18 10:11

1 +∞ 2π i pq
Mf (q) = F(p) =
h ∫ 0
h e f (q)dq,
1 +∞ − 2π i pq
M −1F(p) = f (q) =
h ∫−∞
eh F(p)dq [= MF(−p)].
La transformación M da una imagen del espacio de Hilbert FΩ, constituido

por todas las f (q) tales que
+∞
∫
2
0 ≤ q < +∞, f (q) dq finita
0
en otro espacio de Hilbert: el espacio FΩ" de todas las F (p) para las que es
+∞
∫
2
−∞ < p < +∞ y finita la F(p) dp.
−∞
Mientras que, naturalmente, todavía se tiene para cualquier f (q) de FΩ' ∙Mf (q)∙ =
= ∙ f (q)∙ (como se sigue del teorema antes citado cuando se hace f (q) = 0 para
-∞ < q < 0), en modo alguno es, en general, ∙M -1F (p)∙ = ∙F (p)∙. En efecto: En
fuerza del repetidamente citado teorema, cuando definimos f (q) incluso para va
1 ∞ − 2hπi pq
h ∫−∞
lores q < 0 mediante f (q) = e F(p)dq, es
∞ ∞
∫ ∫
2 2 2
F = F(p) dp = f (q) dq,
−∞ −∞
mientras que
∞
∫
2 2 2
M −1F = f = f (q) dq;
0
luego ∙M -1F ∙ < ∙F ∙, a no ser que casualmente fuese nula la f (q), tal como la aca
bamos de definir, para q < 0. El haz de operadores E' (l) = ME (l)M -1 no es, por
lo tanto, una descomposición de la unidad,90 el método no es aplicable.
Pronto veremos (en la Nota 105) que la razón de esta no aplicabilidad descansa
en el propio ser de la cosa, porque a este operador no corresponde ninguna des
composición de la unidad.
Antes de dar fin a estas consideraciones preliminares, indicaremos algunas re
glas formales relativas al cálculo con operadores considerados en su expresión
simbólica
∞
A= ∫ −∞
λ dE(λ),
obtenida ésta merced a la correspondiente descomposición de la unidad.
206
Fund_MAT_02.indd 206 9/5/18 10:11

En primer lugar, sea F un operador de proyección permutable con todos los

E(l). En este supuesto, para todos los l' < l" es
∙E (l" )F f - E (l' )F f ∙2 = ∙[E (l" ) - E (l' )]F f ∙2 =

= ∙F [E (l" ) - E (l' )]f ∙2 ≤ ∙[E (l" ) - E (l' )]f ∙2,
y, por consiguiente, dado que E (l" ), E (l' ), E (l" ) - E (l' ), como también
E (l" )F, E (l' )]F, E (l" )F - E (l' )F = [E (l" ) - E (l' )]F,
son operadores de proyección,
∙E (l" )Ff ∙2 - ∙E (l' )Ff ∙2 ≤ ∙E (l" )f ∙2 - ∙E (l' )f ∙2.
∞ 2 ∞ 2
Por este motivo es ∫−∞ λ 2d E (λ) f ≥ ∫−∞ λ 2 d E (λ)Ff , es decir, según S3, AFf
tiene sentido si lo tiene Af. Además, se tiene entonces
∞ ∞
AF = ∫ −∞
λ d[E (λ)F ] = ∫
−∞
λ d[FE (λ)] = FA,91
esto es, A y F son entre sí permutables. En particular podemos tomar para F cada
E(l) (a causa de S2), en cuyo caso será
∞ ∞
AE (λ) = ∫ −∞
λ'd[E (λ')E (λ)] = ∫ −∞
λ'd[E (Min(λ , λ'))] =
λ ∞ λ ∞
= ∫ +∫ =∫ λ'dE (λ ') + ∫ λ'dE (λ),
−∞ λ −∞ λ
∞
pues ∫λ = 0, porque detrás del signo d aparece un operador constante,
λ
AE (λ) = E(λ)A = ∫ −∞
λ'dE (λ').
De aquí se deduce por último que
λ
∞ ∞
⎛ ⎞ ∞
A2 = ∫−∞
λd[E(λ)A] = ∫−∞
λd
⎝ ∫ −∞
λ'dE(λ') = Nota 92 =
⎠ ∫
−∞
λ 2 dE(λ),
y en general se tiene
∞
An = ∫−∞
λ n dE(λ),
207
Fund_MAT_02.indd 207 9/5/18 10:11

ya que de ser cierta esta relación para n - 1, se sigue que lo es para n:

λ
∞ ∞
⎛ ⎞
An = An −1 ⋅ A = ∫ −∞
λ n −1d[E(λ)A] = ∫−∞
λ n −1d
⎝ ∫
−∞
λ'dE(λ') = Nota 92 =
⎠
∞ ∞
= ∫ −∞
λ n −1λdE(λ) = ∫−∞
λ n dE(λ).
Por consiguiente, si p(x) = a0 + a1x + … + anxn es un polinomio cualquiera y

si usamos del símbolo p(A) para indicar el operador
p(A) = a01 + a1A + … + anAn,
tendremos
∞
p(A) = ∫−∞
p(λ)dE(λ),
∞
⎛ ⎞
⎝ ∫ −∞
dE (λ) = 1 se deduce de S1 .
⎠
Sean, en segundo lugar, r (l) y s(l) dos funciones cualesquiera y B y C dos

operadores definidos simbólicamente por
∞ ∞
B= ∫ −∞
r(λ)dE(λ), C = ∫ −∞
s(λ)dE(λ).93
Se tiene entonces
∞
BC = ∫ −∞
r(λ)s(λ)dE(λ) = CB .
La demostración se lleva a cabo exactamente como en el caso particular en el que

B = C = A:
∞ ∞
BE (λ) = ∫ −∞ ∫ r(λ')d[E(Min (λ , λ'))] =
r(λ')d[E(λ')E(λ)] =
−∞
λ ∞ λ ∞ λ
= ∫ + ∫ = ∫ r(λ')dE(λ') + ∫ r(λ')dE(λ) = ∫ r(λ')dE(λ'),
–∞ λ –∞ λ −∞
∞
⎛ ⎞ ∞ λ
CB = ∫ s(λ)d[BE(λ)] * = ∫ s(λ)d ⎜ ∫ r(λ') dE(λ')⎟ =
( )
−∞ ⎝ ⎠ −∞ −∞
∞ ∞
= ∫ s(λ) ⋅ r(λ)dE(λ) = ∫ s(λ)r(λ)dE(λ) = BC . *
−∞ −∞
∞
* En rigor es CB = ∫−∞ s(λ)d[E(λ)B], pero B y E (l) son permutables. Al mismo resultado final
que en el texto se llega si se parte de CE(l) y se calcula BC. En el fondo ni aun esto es necesario,
dada la simetría del mismo. (N. del T.)
208
Fund_MAT_02.indd 208 9/5/18 10:11

Es inmediata la verificación de las siguientes relaciones:

∞ ∞ ∞
B* = ∫
−∞
r(λ)dE(λ), aB = ∫−∞
ar(λ)dE(λ), B ± C = ∫−∞
[r(λ) ± s(λ)]dE(λ).
No existe, por lo tanto, obstáculo formal ninguno que se oponga a que se es
criba, también para tales funciones r (l), B = r (A).94 Particularmente dignas de
atención son las funciones (¡discontinuas!)
⎧⎪1, para λ' ≤ λ

eλ (λ') = ⎨
⎪⎩0, para λ' > λ
En virtud de S1, vale para éstas:

∞ λ
eλ (A) = ∫
−∞
eλ (λ')dE (λ') = ∫−∞
dE(λ') = E(λ).
(Al comienzo de este párrafo discutimos el operador A = qi…, cuyo E(l) era la
multiplicación por 1 para qi ≤ l, la multiplicación por 0 para qi > l, es decir, la
multiplicación por el(qi). Se tiene, por tal razón, el(qi…) = el(qi)…, resultado éste
que permite ilustrar esos conceptos).
9. Digresión acerca de la unicidad y existencia

de la solución del problema de valores propios
El último párrafo contiene solamente un estudio sumario de carácter cualita
tivo, orientado por algunos ejemplos particulares, de la cuestión relativa a qué
descomposiciones de la unidad E(l) pertenecen a un operador hermítico dado, A,
pero nos falta todavía una investigación sistemática de este problema. Llevarla a
término hasta el último pormenor en lo matemático, es algo que sale fuera del
marco de este libro. Tendremos que limitarnos, pues, a demostrar sólo algunos
puntos particulares y únicamente reseñar los demás. Esta posición se justifica tan
to más cuanto que para la inteligencia de la Mecánica cuántica no es absolutamen
te necesario el conocimiento exacto de esas circunstancias.95
En el teorema 18 se demostró que, en los operadores lineales, la relación
(Cn) ∙ Af ∙ ≤ C · ∙ f ∙
expresa la continuidad (C arbitrario, pero fijo). Y hay más: vimos en él que existen
aún algunas formas equivalentes a la (Cn), a saber:
(Cn1) ∙(Af , g)∙ ≤ C · ∙ f ∙ · ∙ g ∙,

(Cn2) ∙(Af , f )∙ ≤ C · ∙ f ∙2,
209
Fund_MAT_02.indd 209 9/5/18 10:11

la última de las cuales, sin embargo, vale sólo para operadores hermíticos.
La condición (Cn1), equivalente a la continuidad, responde al concepto hil
bertiano de «acotación», y el mismo Hilbert ha formulado y resuelto el problema
de valores propios en el caso de los operadores hermíticos acotados, esto es, con
tinuos (cf. Nota 70). Pero antes de abordar tal extremo, debemos introducir un más
amplio concepto:
De un operador hermítico A diremos que es cerrado cuando, dada una sucesión
f 1, f 2, … tal que todos los Af n tengan sentido, el cumplimiento de las condiciones
f n → f y Af n → f * justifica la existencia de Af y su coincidencia con f *. Nótese
que podríamos definir la continuidad de un modo íntimamente ligado con la an
terior definición; cabe decir: el operador A es continuo cuando el que todos los Af n
y Af tengan sentido y el que f n → f trae consigo que exista el límite de la sucesión
Af n y su coincidencia con Af .* La diferencia entre ambas definiciones reside en
que, en un operador cerrado A, de la existencia del límite f * de la sucesión Af n se
deduce la existencia de Af y la relación Af = f * y mientras que, si el operador es
continuo, de la existencia de Af = f * se sigue la del límite de Af n, igual a f *.
He aquí algunos ejemplos: Sea de nuevo E∞. el espacio de todas las f (q) tales
∞
que la ∫−∞ f (q) dq es convergente (-∞ < q < ∞); A, el operador q…, definido para
2
∞ ∞
todas las f (q) que cumplen la condición de ser finitas las dos integrales ∫−∞ f (q) dq , ∫−∞ qf (q) dq
2 2
∞ ∞ h d
∫−∞ f (q) dq , ∫−∞ qf (q) dq ; A', el operador
2 2
, definido para todas las funciones doquiera
2pi dq 2
∞ ∞ h
derivables y tales que las integrales ∫ f (q) 2 dq , ∫ f '(q ) dq sean conver
−∞ −∞ 2π i
gentes. Vimos ya que ambos operadores son hermíticos. De ellos, A es cerrado:

∞ ∞
fn → f y A fn → f * significa que ∫−∞ f n(q) − f (q) dq → 0 e ∫−∞ qf n(q) − f *(q) dq → 0.
2 2
Ahora bien, por razón de lo dicho en II.3 al demostrar D, existe una sucesión
parcial fn , fn , …, contenida en f 1, f2, …, doquier convergente, excepción hecha
1 2
de los puntos q de un cierto conjunto de medida-L nula: f n (q) → g (q). Se tiene,
n
∞ ∞
∫−∞ g(q) − f (q) dq = 0, ∫−∞ qg(q) − f *(q) dq = 0, es decir, g (q) =
2 2
por consiguiente,
f (q) y qg(q) = f *(q) salvo en los puntos de un conjunto de medida-L nula; esto es,
qf (q) y f *(q) no son esencialmente distintas. Pero como f *(q) pertenece a E∞, por
hipótesis, también pertenece a él qf (q) y, por lo tanto, tiene sentido Af (q) y coin
* Se tiene así el siguiente esquema lógico:

Premisas Conclusiones
{ } {
(1) (1)
Existencia de Afn & convergencia de Afn → f * → existencia de Afn = f *
convergencia de fn → f & (2) (2)
existencia de Af = f * convergencia de Afn = f *
(1) operadores cerrados; (2) operadores continuos (acotados en el sentido de Hilbert). (N. del T.)
210
Fund_MAT_02.indd 210 9/5/18 10:11

1
− q2 +
cide con qf (q) = f *(q). A', en cambio, no es cerrado: pongamos f n(q) = e n y
-∙q∙
f (q) = e . Evidentemente tienen sentido todas las A'f n, pero no A'f ( f no es deri
vable en q = 0); y, sin embargo, es fácil comprobar que f n → f, A'f n → f *, siendo
f *(q) = -Sgn(q)e-∙q∙ [Sgn(q) = -1, 0, +1 según que sea q<, =, >0].
En oposición a la continuidad, el que un operador sea cerrado es algo que, sin
grandes dificultades, podemos conseguir siempre en el caso de los operadores her
míticos mediante el llamado proceso de prolongación, proceso que consiste en dejar
invariable la definición del operador en aquellos lugares del E∞ en que está ya
definido, mientras que en otros algunos en los que así no ocurre todavía, se le
define convenientemente.
En efecto: sea A un operador hermítico cualquiera y definamos un operador
A como sigue: Af tiene sentido cuando existe una sucesión f 1, f 2, … tal que todos
los Af n tienen sentido, existe el límite f de f n y existe el límite f * de Afn; entonces
es, por definición Af = f *. Claro está que esta definición es lícita sólo si es uní
voca, esto es, si de f n → f, gn → f, Af n → f *, Agn → g *, se deduce f * = g *. Tal
sucede, en efecto; porque cuando Ag tiene sentido,
(f *, g) = lim (Af n, g) = lim (f n, Ag) = (f , Ag),

(g *, g) = lim (Agn, g) = lim (gn, Ag) = (f , Ag);
por lo tanto (f *, g) = ( g*, g), y pues el conjunto de estos g es doquiera denso, es f *
= g*. La definición de A, por ende, es correcta. El operador A es una prolongación
de A, es decir, cuando Af tiene sentido, lo tiene también Af y es Af = Af (para
verlo, basta hacer todas las fn = f y f * = Af ); además, A es lineal y hermítico, por
que lo es A, finalmente, A es cerrado: en efecto, si tienen sentido todas los Afn y f n
→ f, Af n → f *, y existen sucesiones f n, 1, f n, 2, … tales que lo tienen todos los Af n, m,
que f n, m → fn, que Afn, m → f *n y que Af n = f *n. Para cada n existe entonces un N n
1 1
tal que si m ≥ Nn, se tiene ∙ f n, m - fn∙ ≤ , ∙Af n, m - f *n ∙ ≤ ; luego f n,N - f n → 0,
n n n
Af n, N - f *n → 0, de donde fn, N - f → 0 o sea, en virtud de la definición, Af = f *.
n n
(Obsérvese que jamás de un operador discontinuo se hará, por prolongación,

un operador continuo.)
Cuando un operador B sea prolongación de un operador A, es decir, cuando
siempre que Af tiene sentido lo tiene Bf y es Bf = Af , escribiremos B ≻ A o
A ≺ B. Lo que acabamos de demostrar se expresa con A ≺ A, donde A es hermí
tico y cerrado. Es claro sin más, que para cada operador cerrado B tal que A ≺ B,
debe valer A ≺ B. Luego A es la menor prolongación cerrada de A; por lo tanto,
A = A.
La estrecha relación entre A y A sugiere sustituir en todos los razonamientos
A por A, ante todo porque éste ensancha el dominio de definición de A hasta sus
límites razonables; y también porque el dominio de definición de A, respecto del
de A, aparece restringido sin razón ninguna. Así lo haremos y, por lo tanto, en lo
que sigue se podrá suponer que todos los operadores hermíticos son cerrados.
211
Fund_MAT_02.indd 211 9/5/18 10:11

Consideremos ahora un operador hermítico continuo, A. Que éste sea cerrado,

equivale a que lo sea su dominio de definición. La condición característica de la
continuidad ∙Af ∙ ≤ C ⋅ ∙ f ∙ vale asimismo para A, evidentemente; luego A es con
tinuo, y pues, de una parte, su dominio de definición es entonces cerrado y, de
otra, debe ser doquiera denso, dicho dominio coincide con E∞. O sea: A está de
finido en todo el espacio y como él lo están todos los operadores hermíticos con
tinuos y cerrados. Recíprocamente: si un operador cerrado hermítico está definido
en todo el espacio, es un operador continuo. (Este es el teorema de Toeplitz,96
en cuya demostración no podemos entrar.)
Pues bien, en este orden de ideas demostró Hilbert el siguiente teorema: A
cada operador hermítico continuo corresponde una y sólo una descomposición de
la unidad (cf. loc. cit. Nota 70). Admitido este resultado v dado que un opera
dor continuo tiene sentido en todo el espacio, ∫l2d ∙E (l)f ∙2 es siempre finita en
este caso; además, porque esta integral coincide con ∙Af ∙2 y, por consiguiente, es
≤ C 2∙ f ∙2 (cf. Cn.), tenemos
∞ ∞
∫ ∫
2 2 2 2
0 ≥ Af −C2 f = λ 2 d E(λ)f −C2 d E (λ)f =
−∞ −∞
∞
∫
2
= (λ 2 − C 2 )d E(λ) f .
−∞
En particular, si f = E (-C - e)g, será E (l)f = E {Min [l, (-C - e)]} g, es decir,
−C − ε
una constante para l ≥ -C - e, de modo que basta considerar la ∫−∞ . En este
intervalo, E (l)f = E (l)g y l2 - C 2 ≥ (C + e)2 - C 2 > 2Ce; luego
−C − ε
∫
2 2
0 ≥ 2C ε d E (λ)g = 2C ε E (−C − ε )g ,
−∞
∙E(-C - e)g ∙2 ≤ 0, de donde E (-C - e)g = 0.
Igualmente se demuestra que
g - E(C + e)g = 0,
sin más que partir de f = g - E (C + e)g.

Para todo e > 0 es, pues, E (-C - e) = 0, E (C + e) = 1, o sea, E (l) = 0 para
l < -C y E (l) = 1 para l > C. (A causa de S2, esto último vale incluso para l = C.)
En otros términos: E (l) es variable sólo en -C ≤ l ≤ C. Recíprocamente, si E (l)
es variable sólo en -C ≤ l ≤ C, el operador A asociado es continuo:
∞ C C
∫ ∫ ∫
2 2 2 2
Af = λ 2 d E(λ)f = λ 2 d E(λ)f ≤C2 d E(λ)f =
−∞ −C −C
∞
∫
2 2
= C2 d E(λ)f = C 2 f , de donde Af ≤ C ⋅ f .
−∞
212
Fund_MAT_02.indd 212 9/5/18 10:11

Vemos así que con las descomposiciones de la unidad que son variables sólo
en intervalos l finitos, se agotan los operadores hermíticos continuos. ¿Qué pasa,
empero, con los operadores hermíticos discontinuos? Cabe disponer aún de todas
las descomposiciones de la unidad que son variables por grande (y por pequeño)
que sea l. ¿No los agotarán ellas acaso?
Ante todo debemos aquilatar correctamente la circunstancia de que tales ope
radores pueden no estar definidos en todo el espacio.
Es claro de suyo que un operador hermítico acaso no esté definido en puntos
del espacio hilbertiano en los cuales sería posible hacerlo de modo racional: así.
h d
por ejemplo, nuestro operador A' = no está definido para f (q) = e-∙q∙ y ha
2pi dq
h d
bríamos incluso podido limitar al conjunto de las funciones analíticas en
2pi dq
-∞ < q < +∞ (q real). Cierto es que tomamos ya nuestras medidas contra limi
97
taciones asaz arbitrarias del dominio de definición, al imponer a este dominio la

condición de ser doquiera denso, y que, además, podemos limitarnos a los opera
dores cerrados.* Sin embargo, tampoco esto es suficientemente eficaz: Tomemos,
h d
por ejemplo, el operador A' = en el intervalo 0 ≤ q ≤ 1. Las f (q) se supo
2pi dq 1 1
∫ ∫
2 2
nen derivables en este intervalo y tales que f (q) dq, f'(q) dq sean finitas.
0 0
Para que A' sea hermítico es preciso imponer todavía una condición de contorno:
f (0): f (1) = e-ia (0 ≤ a < 2p). Sea Aa el conjunto de estas f (q) y A'a el propio
operador A' considerado como transformación en Aa. Consideremos, por otra
parte, la condición de contorno f (0) = f (1) = 0 y sean A° el conjunto de las f (q)
que la cumplen, y A'° el operador A' actuando en A°. Todos los A'a son prolonga
ciones de A'° (que es hermítico y posee un dominio de definición denso doquier)98
y, por lo tanto, también lo son de A'° los operadores cerrados A'a. Ahora bien,
todos los A'a son diferentes entre sí y de A'°. En efecto: la operación evidentemen
hb
te unitaria f (q) → e ibqf (q) transforma A'a en A'a + b - 1, Aa en Aa + b y A° en
2p
hb hb
A°; por consiguiente A'a en A'a - b + 1, A'° en A'° + 1, y por lo tanto, A'a
2p 2p
hb hb
en A'a - b + 1, A'° en A'° + 1; luego, de ser A'a = A'° se seguiría A'a - b = A'°,
2p 2p
es decir, la igualdad entre sí de todos los A'g . Basta demostrar, pues, que A'a ≠ A'g
si a ≠ g ; y éste es el caso cuando A'a, A'g no poseen en común ninguna prolonga
ción hermítica, es decir, cuando A' no es hermítico en la reunión de Aa, Ag . Es
patente que así sucede, porque eiaq pertenece a Aa, eigq pertenece a Ag y
* Recuérdese que al pasar de un operador hermítico A a su prolongación mínima A, el dominio

de definición no se restringe, antes bien se amplía en general. (N. del T.)
213
Fund_MAT_02.indd 213 9/5/18 10:11

hα 1 hγ 1
(A'e iα q ,e iγ q ) − (e iα q , A'e iγ q ) =
2π ∫
0
e i(α − γ )q dq −
2π ∫e
0
i(α − γ )q
dq =
h 1 h i(α − γ )
=
2π i ∫e0
i(α − γ )q
i(α − γ )dq =
2π i
(e − 1) ≠ 0.
Por lo tanto, el operador hermítico cerrado A'° está definido en un conjunto

demasiado restringido, pues existen de él prolongaciones hermíticas cerradas pro
pias (esto es, diferentes de A'°). Pero hay más aún, conforme hemos visto: el pro
ceso de prolongación puede realizarse de infinidad de maneras diferentes, y cada
una da lugar a una solución del problema de valores propios con un espectro
discreto puro, que depende, empero, del valor de a, ya que está constituido por
⎛α ⎞
el conjunto de valores h ⎜ + k⎟ , donde k = 0, ±1, ±2, … En cambio, no cabe
⎝ 2π ⎠
esperar una solución del problema de valores propios para el mismo A'°; y en efec
to, demostraremos en el curso de este párrafo que un operador hermítico que
corresponde a una descomposición de la unidad (esto es, uno para el cual es reso
luble el problema de valores propios) no posee ninguna prolongación propia. Si
convenimos en llamar operador máximo a un operador que no posee prolongación
propia alguna —un operador, por ende, que está ya definido en todos aquellos
puntos en que podría serlo de modo racional, esto es, sin quebrantar su carácter
de hermítico—, el resultado anterior puede enunciarse diciendo que sólo a los
operadores máximos puede pertenecer una descomposición de la unidad.*
Por otro lado, se demostrará que todo operador hermítico admite como pro
longación un operador hermítico máximo ; y precisamente, si se trata de un ope
rador cerrado no máximo, aquélla puede llevarse a cabo de infinidad de maneras
distintas, o sea, que la única etapa unívoca en el proceso de prolongación es la
A → A (cf. loc. cit. Nota 95). Por todas estas razones, la más favorable solución del
problema que cabe esperar es la siguiente: a cada operador hermítico máximo co
rresponde una y sólo una descomposición de la unidad. (Repárese en que todo
operador cerrado y continuo tiene sentido en todo el E∞ y por consiguiente, es
máximo.)
Se trata, pues, de contestar a las siguientes preguntas: A un operador hermíti
co máximo, ¿le corresponde siempre una descomposición de la unidad? ¿Pueden
corresponder al mismo operador eventualmente más de una?
* Resumiendo: el dominio de definición de un operador hermítico A está excesivamente restrin

gido —aun cuando es denso en todo el E. H.— si cabe hallar una prolongación hermítica propia de
A. Llamemos dominio natural de A al dominio de definición de A. La prolongación de A fuera de
su dominio natural se efectúa mediante una prolongación hermítica propia de A; pero esta prolon
gación, claro está, no es posible de modo unívoco si existen más de una prolongaciones distintas que
guarden con A dicha relación. Dado que un operador hermítico que corresponde a una descompo
sición de la unidad no posee ninguna prolongación propia, un tal operador no está ni puede estar
definido razonablemente más allá de su dominio natural. (N. del T.)
214
Fund_MAT_02.indd 214 9/5/18 10:11

Anticipemos el resultado: a un operador hermítico máximo dado o le corres

ponde una sola descomposición de la unidad o no le corresponde ninguna —es
decir, el problema de valores propios es con seguridad unívoco, pero eventualmen
te irresoluble. Con todo, este último caso debe considerarse, en un cierto sentido,
como excepcional. Bosquejaremos a grandes rasgos el método que conduce a sen
tar lo que precede.
Cuando aplicamos una función racional f (l) a una matriz A de un número
finito de dimensiones, susceptible de ser reducida a la forma diagonal mediante
una transformación unitaria, se conservan los vectores propios, mientras que los
valores propios l1, … ln se transforman en f (l1), …, f (ln).99 Ahora bien, si f (l)
efectúa (en el plano de los números complejos) la representación del eje real sobre
la circunferencia del círculo unidad, las matrices cuyos valores propios sean todos
reales se transformarán en matrices cuyos valores propios son todos ellos de valor
absoluto igual a la unidad —esto es, las hermíticas se transformarán en las unita
l-i
rias.100 De esta propiedad goza, por ejemplo, la función f (l) = ; la corres
pondiente transformación matricial l + i
A - i1 U+1
U= , A = -i ,
A + i1 U-1
ha recibido el nombre de transformación de Cayley. Ensayémosla en los operado

res hermíticos del E∞, es decir, veamos de definir un operador U del siguiente
modo: Uf tiene sentido siempre y sólo cuando existe un j tal que f = (A + i1)j =
= Aj + ij, y entonces es, por definición, Uf = (A - i1)j = Aj - ij. Decimos ver
de definir, porque esperamos que Uf sea único y que U sea unitario —de nada
nos sirve, claro está, la demostración en el En, ya que ésta presupone la reductibi
lidad a la forma diagonal, es decir, que es resoluble el problema de valores propios
e incluso con espectro discreto. Supongamos de momento que efectivamente es
así.* En estas condiciones el problema de valores propios relativo a A podemos
resolverlo como sigue:
Consideremos primero el problema de valores propios correspondiente al ope
rador unitario U. Este problema es resoluble en la forma siguiente: Existe un
único haz de operadores de proyección E(s) (0 ≤ s ≤ 1) que cumple las siguientes
condiciones:
S1. E (0) = 0. E (1) = 1; y, para s → s0(s ≥ s0), E (s)f → E (s0)f.

S2. De s' ≤ s" se sigue E (s' ) ≤ E (s" ).
S3. Siempre es
1
(Uf , g) = ∫e
0
2π iσ
d[E(σ ) f , g].
* Véase la demostración más adelante, p. 115. (N. del T.)
215
Fund_MAT_02.indd 215 9/5/18 10:11

(Cualquiera que sea f, Uf tiene sentido y la integral de la derecha es siempre ab

solutamente convergente.)101
La demostración se lleva a cabo dentro del marco y con los recursos de la teo
ría de Hilbert, cosa factible por el hecho de ser siempre continuo el operador
unitario U (cf. loc. cit. Notas 70, 101). Salta a los ojos la analogía con la formulación
S1-S3 relativa a los operadores hermíticos. Las únicas diferencias son, de una par
te, que en vez del integrando real l(-∞ < l < +∞) se trata de un integrando
complejo e2pis que recorre la circunferencia del círculo unidad (la relación hermí
tico-unitario, ya en el En, es en gran parte semejante a la relación eje real-circun
ferencia del círculo unidad. Cf. Nota 100) y, de otra, que la descripción del dominio
de definición que aparece en S3 es aquí superflua, porque los operadores unitarios
tienen sentido dondequiera.
En virtud de S1, E(s)f → E(0)f = 0 para s → 0 (¡s es de suyo ≥ 0!), mientras
que no hay motivo alguno para que E (s)f → E (1)f = f para s → 1, puesto que
es s ≤ 1. Cuando E (s)f no tiende a E (1)f , E (s) es discontinuo en s = 1; pero
como existe un operador de proyección E' tal que para s → 1, s < 1, se tiene que
E (s)f → E'f (cf. teorema 17 en II.4, como también la Nota 79), dicha disconti
nuidad significa que E' ≠ E (1) = 1, es decir, que existen soluciones no nulas de
E'f = 0.* Ahora bien, porque es E(s) ≤ E', de E'f = 0 se deduce que para todo
s < 1 es E (s) f = 0; y el recíproco también vale, por la propia definición de E'.
Pero, y ello se reconoce del mismo modo que al principio de II.8, si para todo
s < 1 es E (s) f = 0, cualquiera que sea g es (Uf , g) = ( f, g), esto es, Uf = f. Recí
procamente, si es Uf = f , se tendrá:
1
∫e0
2π iσ
d[E(σ ) f , f ] = (Uf , f ) = ( f , f ),
de donde
1 1
Re ∫0
e 2π iσ d[E(σ ) f , f ] = ( f , f ), ∫ (1 − cos 2πσ )d [E(σ )f , f ] = 0 **
0
y, finalmente,
1
∫ (1 − cos 2πσ )d ⎡⎣ E(σ )f ⎤⎦ = 0.

2
De aquí se sigue, exactamente como en el lugar antes citado (II.8), que E (s)f = 0
para todo s < 1 y > 0 (para s = 0, vale desde luego), es decir, la discontinuidad
* 1 - E' es operador de proyección, porque E' < E(1) = 1. Las soluciones de E'f = 0 son los
elementos de la variedad lineal cerrada que corresponde a 1 - E'. (N. del T.)
** [E(s)f , f ] es esencialmente no negativo: [E(s)f , f ] = ∙E(s)f ∙2 (cf. p. 58). (N. del T.)
216
Fund_MAT_02.indd 216 9/5/18 10:11

de E (s) en s = 1. Por lo tanto, la discontinuidad de E(s) en s = 1 es condición

necesaria y suficiente para que exista un f ≠ 0 tal que Uf = f .
Si consideramos ahora nuestra transformación de Cayley en la que, si j = Af +
+ if , es, por definición, Uj = Af - if , veremos que Uj = j implicaría f = 0, j = 0.
Luego, en el caso particular de ser el operador unitario U, no uno cualquiera, sino
el que resulta de aplicar dicha transformación al operador hermítico A, debe ocu
rrir que E(s)f → f para s → 1.
Resulta así que mediante la transformación
e2pis + 1 1
l = -i = -cotg ps, s = arc cotg (-l),
e2pis - 1 p
que establece una correspondencia biunívoca y monótona entre los intervalos
0 < s < 1 y -∞ < l < +∞, podemos construir una descomposición de la unidad
F (l) en el sentido de S1, S2 a partir de E(s):
⎛ 1 ⎞
(C). F (λ) = E ⎜ − arc cotg λ⎟ , E = F (−cotg πσ ).
⎝ π ⎠
Pues bien, como demostraremos, esta descomposición F (l) cumple S3 respec

to de A siempre y sólo cuando E (s) satisface S3 relativamente a U. Con esto, la
cuestión de la unicidad y existencia de la solución del problema de valores propios
correspondiente a un operador hermítico A (eventualmente discontinuo), queda
reducida a la~ misma cuestión en el terreno de un operador unitario U, caso éste,
conforme dijimos, que está resuelto en sentido afirmativo.
Sea, pues, A un operador hermítico, U su transformado de Cayley. Trataremos
primero el caso en que U es unitario, de forma que existe E(s) con las propiedades
S1, S2, S3. Formemos F (l) de acuerdo con (C), por lo cual se cumplen S1 y S2.
j - Uj
Cuando tiene sentido Af , es Af + if =j y Af - if = Uj; por lo tanto, f = ,
2i
j + Uj
Af = . Efectuando el cálculo, en parte simbólicamente, resulta:102
2
1 1⎛ 1
⎞ 1 − e 2π iσ
1
f =
2i
(ϕ − U ϕ) =
2i ⎝
ϕ− ∫0
e 2π iσ dE (σ )ϕ =
⎠ ∫0 2i
dE(σ )ϕ ,
1 − e 2π iσ'
1 1 1 − e 2π iσ'
E(σ )f = ∫
0 2i
d[E(σ )E(σ')ϕ ] = ∫ 0 2i
d (E[Min(σ ,σ')]ϕ ) =
σ 1 − e 2π iσ'
=∫ 0 2i
dE(σ')ϕ ,
σ 1 − e 2π iσ'
∫
2
E(σ )f = [E(σ )f , f ] = d[E(σ')ϕ, f ] =
0 2i
217
Fund_MAT_02.indd 217 9/5/18 10:11

σ 1 − e 2π iσ' σ 1 − e 2π iσ' ⎛ σ' 1 − e 2π iσ" ⎞

= ∫0 2i
d[E(σ') f , ϕ] = ∫ 0 2i
d⎜
⎝ ∫
0 −2i
d[E(σ")ϕ, ϕ] ⎟ =
⎠
1 − e 2π iσ' 1 − e −2π iσ'
σ
0
= ∫2i
⋅
−2i
d[E(σ')ϕ, ϕ] =
σ (1 − e 2π iσ' ) ⋅ (1 − e −2π iσ' ) σ
∫ d ⎡⎣ E(σ')ϕ ⎤⎦ = sen2πσ' ⋅ d ⎡⎣ E(σ')ϕ ⎤⎦∫

2 2
=
0 4 0
y, por consiguiente, la integral que aparece en S3 vale
∞ 1
∫ ∫ cotg πσ d E(σ )f
2 2
λ 2 d F(λ)f = 2
−∞ 0
σ
1
⎛ ⎞
= ∫ cotg πσ d ∫ sen πσ'd E(σ')ϕ
2 2 2
0 ⎝ 0 ⎠
1
= ∫ cotg πσ sen πσ d E(σ )ϕ
2 2 2
0
1
= ∫ cos πσ d E(σ )ϕ ,
2 2
1
∫0 d
2 2
integral esta última que admite la mayorante E(σ )ϕ = ϕ y es, por ende,
finita. Además se tiene
1 1⎛ 1
⎞ 1 1 + e 2π iσ
Af = (ϕ + U ϕ) = ϕ + e 2π iσ dE (σ )ϕ =
2 2 ⎝ 0 ⎠ ∫ ∫ 0 2
dE(σ )ϕ =
1 e 2π iσ + 1 1 − e 2π iσ
0 e ∫
= −i 2π iσ
− 1 2i
dE (σ )ϕ
1
⎛ σ 1 − e 2π iσ' ⎞
= ∫
0
−cotg πσ d ⎜
⎝ ∫
0 2i
dE(σ')ϕ ⎟
⎠
σ ∞
= ∫
0
−cotg πσ dE (σ ) f = ∫ −∞
λ dF(λ )f ,
es decir, la relación final de S3 es también válida. Por consiguiente, A es en todo

caso prolongación del operador que pertenece a F(l) según S3; pero dado que éste,
como veremos, es un operador máximo, A debe coincidir con él.103
Discutamos ahora el caso recíproco: sea F(l) una descomposición de la unidad
que corresponde a A según S1-S3. ¿Qué ocurre con U ? El haz E(s) construido
mediante (C) cumple S1-S2. Sea j cualquiera, y hagamos (de nuevo simbólica
mente)
218
Fund_MAT_02.indd 218 9/5/18 10:11

∞ 1 1 1 1 − e 2π iσ
1
f = ∫ −∞ λ + i
dF (λ)ϕ = ∫ 0 −cotg πσ + i
dE (σ )ϕ = ∫ 0 2i
dE (σ )ϕ .
1 1 - e2pis
(Todas estas integrales son convergentes, porque y están acotados.)
Se tiene entonces: l+i 2i
1 − e 2π iσ'
1
F(λ)f = E(σ )f = ∫ 0 2i
dE (σ )E (σ')ϕ
11− e 2π iσ' σ 1 − e 2π iσ'
= ∫ 0 2i
dE[Min(σ , σ')]ϕ = ∫0 2i
dE(σ')ϕ ,
∞ 1
Af = ∫ −∞
λ dF (λ) f = ∫ −cotg πσ ⋅ dE(σ )f
0
1 e2π iσ
+1 ⎛ 1 − e 2πiσ'
1
⎞
= ∫ 0
−i
e 2π iσ
d⎜
−1 ⎝ ∫ 0 2i
dE(σ')ϕ ⎟
⎠
1 e 2πiσ + 1 1 − e 2πiσ 1 1 + e 2πiσ
= ∫ 0
−i
e 2πiσ − 1 2i
dE(σ )ϕ = ∫ 0 2
dE(σ )ϕ ;
por lo tanto,
1 1
Af + if = ∫ 0
dE(σ )ϕ = ϕ, Af − if = ∫e 0
2π iσ
dE (σ )ϕ,
1
esto es, Uj existe y coincide con la ∫0 e 2πiσ dE (σ )ϕ . Pero j era arbitrario; luego U
tiene sentido doquier. Basta formar el producto interior (Uj, y), y arbitrario, y
1
tomar el complejo conjugado, para reconocer que U*y es igual a ∫0 e −2πiσ dE (σ )ψ .*
El cálculo con que acaba II.8 demuestra entonces que UU* = U*U = 1, es decir,
U es unitario y pertenece a E(s).
Resumiendo: Que el problema de valores propios a que da lugar A sea resolu
ble, equivale a que el transformado de Cayley U de A sea unitario, y en este su
puesto queda sentada la unicidad de la solución. Sólo nos falta, pues, decidir los
siguientes extremos: ¿Podemos formar siempre el operador U ? ¿Cuándo es U
unitario? Para resolver estas cuestiones, partamos nuevamente de un operador
hermítico cerrado, A.
1 1 1
* (U ϕ, ψ ) = ∫e
0
2π iσ
d[E (σ )ϕ, ψ ] =
1
∫e 0
2π iσ
d[E (σ )ψ , ϕ] = ∫e
0
−2π iσ
d[E (σ )ϕ, ψ ] = (U *ψ , ϕ), de don
de, simbólicamente,

U* = ∫e 0
−2π iσ
dE(σ ). (N. del T.)
219
Fund_MAT_02.indd 219 9/5/18 10:11

Recordemos ante todo la definición de U : Uj tiene sentido cuando existe un

f tal que j = Af + if y sólo entonces, siendo su valor en este caso Uj = Af - if.
Para que esta definición sea aceptable hay que demostrar antes que a un j dado
no pueden corresponderle más de un f , es decir, que de Af + if = Ag + ig se sigue
f = g; o lo que es lo mismo (por razón del carácter lineal de A), que de Af + if = 0
se deduce f = 0. Es fácil demostrar esto último: Se tiene, en efecto,
∙Af ± if ∙2 = (Af ± if , Af ± if ) = (Af , Af ) ± (Af , if ) ± (if , Af ) + (if , if ) =
= ∙Af ∙2 i(Af , f ) ± i(Af , f ) + ∙ f ∙2 = ∙Af ∙2 + ∙ f ∙2
±
de donde
∙ f ∙ ≤ ∙Af ± if ∙;
luego efectivamente, de Af + if = 0 se sigue que también f = 0, o sea nuestra de
finición es correcta. Pero es que, además, ha resultado que
∙Af + if ∙ = ∙Af - if ∙,
es decir,
∙j ∙ = ∙Uj ∙;
luego el operador U es continuo en su dominio de definición (teorema 18). Esto

sentado, sea D el dominio de definición de U (el conjunto de todos los Af + if )
y F su dominio de los valores (el conjunto de todos los Af - if ). D y F son varie
dades lineales, porque lineales son A y U; pero, además, son cerradas. En efecto:
sea j punto de acumulación de D (o de F); existe entonces una sucesión j1, j2,
… integrada por elementos de D (o de F) que converge hacia j, jn → j, siendo
jn = Af n + if n (o jn = Af n - if n). La validez de D (cf. II.1) y la convergencia de jn
permiten asegurar que en jn se cumple la condición de convergencia de Cauchy.
Pero, de una parte,
∙ f m - f n ∙ ≤ ∙ A( f m - f n) ± i( f m - f n)∙ = ∙jm - jn∙,
y, de otra,
∙ Af m - Af n ∙ = ∙ A( f m - f n )∙ ≤ ∙ A( f m - f n) ± i( f m - fn )∙ = ∙jm - jn ∙;
luego con mayor motivo la cumplen f n y Af n, y, en fuerza de D, resultan ser asi
mismo convergentes tanto f n como Af n : f n → f , Af n → f *. Ahora bien, A es
cerrado; por consiguiente existe Af y coincide con f *. Tenemos, pues, que
jn = Af n ± if n → f * ± if = Af ± if ,
220
Fund_MAT_02.indd 220 9/5/18 10:11

y como
jn → j,
es j = Af ± if , esto es, j es elemento de D (o de F).

El operador U, por lo tanto, es un operador definido en la variedad lineal ce
rrada D que transforma ésta en la variedad lineal, también cerrada, F; es, además,
un operador lineal dotado de la propiedad de hacer ∙Uf - Ug ∙ = ∙U( f - g)∙ =
= ∙f - g∙, propiedad ésta que expresaremos diciendo de U que conserva las longi
tudes. De ella se sigue que si f ≠ g, también Uf ≠ Ug; luego la transformación que
U define es biunívoca. Se tiene, en fin, que ( f , g) = (Uf , Ug), lo cual se demuestra
exactamente como en II.5 al tratar de los operadores unitarios. U, por ende, con
serva también los productos interiores. Pero, evidentemente, sólo cuando sea
D = F = E∞ y siempre que así ocurra, será U unitario.
Sean ahora A y B dos operadores hermíticos cerrados, U y V sus transformados
de Caylev, y D, F y G, H los conjuntos antes definidos relativos a U y V respecti
vamente. Se ve desde luego que cuando B es prolongación propia de A, también
V lo es de U y, por consiguiente, D es parte propia de G y F parte propia de H, es
decir, D ≠ E∞, F ≠ E∞. En tal caso, U no es unitario y el problema de valores pro
pios correspondiente a A es insoluble. Hemos demostrado así el tantas veces cita
do teorema: Cuando tiene solución el problema de valores propios relativo a A,
no existe ninguna prolongación propia de A, es decir, A es un operador máximo.
Volvamos de nuevo a nuestro operador hermítico cerrado A, a su transformado
de Cayley, U, y a los dominios de definición y de los valores, D y F, del operador U.
Cuando Af tiene sentido, lo tiene asimismo Uj = Af - if, siendo j = Af + if . Af
1 1
y f pueden expresarse en función de j y Uj: f = (j - Uj), Af = (j + Uj),
j 2i 2
o también, haciendo y = , f = y - Uy, Af = i(y + Uy). Recíprocamente,
2i
si Uy tiene sentido, lo tiene Af para f = y - Uy; pues, porque existe Uy, exis
te un f' tal que Af' tiene sentido y y = Af' + if', Uy = Af' - if' y, por lo tanto,
f = y - Uy = 2if'. El dominio de definición de A, por ende, es el conjunto de
todos los y - Uy y precisamente para f = y - Uy es Af = i(y + Uy). Luego, U,
D y F determinan unívocamente a A. Al mismo tiempo vemos que el conjunto
y - Uy es denso doquier como dominio de definición de A.
Al revés, partamos ahora de dos variedades lineales cerradas D y F y de una
representación U de D sobre F que sea lineal y conserve las longitudes. ¿ Existe un
operador hermítico A cuyo transformado de Cayley sea precisamente U ? Para esto
es necesario que y - Uy sea denso doquier en E∞, y tal supondremos que es. El
A en cuestión queda entonces unívocamente fijado según lo antes dicho, y sólo
falta ver si esta definición es posible, si A realmente es hermítico y si verdadera
mente es U su transformado de Cayley. Lo primero quedará sentado tan pronto
se demuestre que en f = j - Uj, f determina a j unívocamente (supuesto que j
exista); es decir, se pruebe que de j - Uj = y - Uy se sigue j = y: o lo que es
221
Fund_MAT_02.indd 221 9/5/18 10:11

lo mismo, que de j - Uj = 0 se deduce j = 0. Sea, en efecto, j - Uj = 0 y

g = y - Uy ; se tendrá:
(j, g) = (j, y) - (j, Uy) = (Uj, Uy) - (j, Uy) = (Uj - j, Uy) = 0,
y como el conjunto de estos g es doquiera denso, será j = 0.

Por lo que al segundo punto se refiere, hemos de demostrar que (Af , g) =
= ( f , Ag), es decir, que al permutar f y g entre sí en (Af , g), éste se transforma en el
complejo conjugado. Sea f = j - Uj, g = y - Uy, de donde Af = i(j + Uj) y
(Af , g) = [i(j + Uj), y - Uy] = i(j, y) + i(Uj, y) - i(j, Uy) - i(Uj, Uy) =
= i[(Uj, y) - (Uy, j)] = i(Uj, y) + i(Uy, j)
Permutar entre sí f y g en el primer miembro equivale a hacerlo en el último

con j y y, y éste se cambia entonces en su conjugado. Finalmente, se reconoce la
verdad del tercer extremo del siguiente modo: sea V el transformado de Cayley de
A; su dominio de definición es el conjunto de todos los
Af + if = i(j + Uj) + i(j - Uj) = 2ij,
esto es, el correspondiente de U. En ese dominio es
V(2ij) = V(Af + if ) = Af - if = i(j + Uj) - i(j - Uj) = 2iUj,
o sea, Vj = Uj, de donde V = U.

Existe, por lo tanto, una correspondencia biunívoca entre los operadores her
míticos cerrados A y los operadores lineales U que conservan las longitudes y tales
que los conjuntos j - Uj sean doquiera densos en E∞, correspondencia en que el
U vinculado al A es su transformado de Cayley.104 Es fácil ahora darse cuenta de
cuáles son todas las prolongaciones hermíticas B de A, pues se encuentran sin es
fuerzo todas las prolongaciones V de U que conservan las longitudes (el conjunto
de los j - Vj es denso doquier, por cuanto contiene al conjunto de los j - Uj
que se encuentra en este caso). Para que A sea máximo debe serio U, y recíproca
mente. Si U no es máximo, entonces es D ≠ E∞ y F ≠ E∞; y al revés, de D ≠ E∞ y
F ≠ E∞ se sigue que U no es máximo: En efecto, al ser E∞ - D ≠ 0 y E∞ - F ≠ 0
podemos elegir un j0 ≠ 0 en el primer conjunto y un y0 ≠ 0 en el segundo e in
ϕ ψ
cluso suponerlos de módulo unidad (si no lo son, se sustituyen por 0 , 0 ⎞⎟ .
ϕ0 ψ 0 ⎠
Definamos ahora en [D, j0] un operador V de forma que para f = j + aj0 (j ele
mento de D, a un número) sea Vf = Uj + ay0. Este operador es evidentemente
lineal, y pues j es ortogonal a j0 y Uj lo es a y0, será ∙ f ∙2 = ∙j ∙2 + ∙a∙2, ∙Vf ∙2 =
= ∙Uj ∙2 + ∙a∙2, de donde ∙Vf ∙ = ∙ f ∙, es decir, V conserva las longitudes. Por últi
222
Fund_MAT_02.indd 222 9/5/18 10:11

mo, es claro que V es una prolongación propia de U. Podemos, pues, afirmar que
D = E∞ o F = E∞ es condición necesaria y suficiente para que A sea máximo.
De lo que acabamos de ver resulta, sin más, que si A no es máximo, las varie
dades lineales cerradas E∞ - D, E∞ - F son ambas ≠0. Sean j1, …, jp y y1, …, yq
los sistemas ortonormales cuyas extensiones lineales cerradas coinciden con E∞ - D
y E∞ - F, respectivamente (cf. teorema 9, II.2; las sucesiones jn y ym pueden ser
finitas o infinitas), y r = Min (p, q). En la variedad lineal cerrada [D, j1, …, jr]
r
definamos un operador V del siguiente modo: para f = ϕ + ∑ aνϕν (j elemento
ν =1
r
de D; a1, …, ar son números complejos) es, por definición, Vf = U ϕ + ∑ aνψ ν . Es
ν =1
fácil reconocer que V es lineal y conserva las longitudes, como también que es
prolongación propia del operador U. Su dominio de definición es [D, j1, …, jr],
el cual, para r = p, coincide con [D, E∞ - D] = E∞; su dominio de los valores es
[F, y1, …, yr] igual, por consiguiente, para r = q, a [F, E∞ - F] = E∞. Luego uno
por lo menos de los dos conjuntos asociados a V se identifica con E∞ y, por lo
tanto, si es B el operador hermítico cuyo transformado de Cayley es precisamen
te V, B es prolongación propia de A y, además, máximo. Obsérvese que los j y
los y pueden elegirse de infinidad de maneras (p. e., y1 puede sustituirse por
cualquier θy1, ∙θ ∙ = 1) y, por lo mismo, también V y B.
Con esto hemos discutido hasta el fin el problema de valores propios y llegado
a la siguiente conclusión: Cuando este problema es resoluble posee una solución
; para los operadores no máximos, es con seguridad insoluble. Los operadores no
máximos pueden siempre ser prolongados hasta hacer de ellos un operador máxi
mo, y esto de infinitas maneras (se trata aquí sin excepción de operadores hermí
ticos cerrados). Sin embargo, la condición para que sea máximo un operador no
es exactamente la misma que para la existencia de la solución del problema de
valores propios: la primera es que D = E∞ o F = E∞; la segunda, que D = E∞ y
F = E∞.
No entraremos en detalles acerca de aquellos operadores en los que se da la
primera circunstancia, pero no la segunda, operadores para los que el problema de
valores propios carece de solución y que, por ser máximos, no admiten ya prolon
gación propia alguna. Se trata de algo que no podemos remediar. Están caracteri
zados por las condiciones D = E∞ y F ≠ E∞ o las D ≠ E∞ y F = E∞. Tales operado
res existen realmente y proceden todos ellos de dos formas normales simples, de
modo que cabe considerarlos como casos de excepción en oposición a los opera
dores máximos cuyo problema de valores propios es resoluble. Tocante a este
punto, el lector encontrará más detalles en la Memoria del autor citada en la
Nota 95. Sea como fuere, tal como están hoy las cosas, esos operadores hay que
excluirlos de las cuestiones de Mecánica cuántica, pues la descomposición de la
unidad correspondiente a un operador hermítico representa en ellas un papel tan
esencial, que no podemos renunciar a la existencia de dicha descomposición, esto
es, a la resolubilidad del problema de valores propios.105 Por este motivo, sólo to
223
Fund_MAT_02.indd 223 9/5/18 10:11

maremos en consideración por regla general aquellos operadores hermíticos cuyo

problema de valores propios tiene solución. Dado que esta propiedad traduce algo
que es una sublimación del carácter de máximo, los llamaremos operadores hiper
máximos:106 son aquellos que están en correspondencia biunívoca con las descom
posiciones de la unidad.
Para terminar, indicaremos dos clases de operadores hermíticos cerrados que
son con certeza hipermáximos: primero, los continuos, porque tienen sentido en
todo el espacio —son máximos, por lo tanto—, y su problema de valores propios
tiene solución, conforme demostró Hilbert (cf. loc. cit. Nota70) ; segundo, cual
quier operador real máximo del E∞, porque la única diferencia entre las definicio
nes de D y F reside en el signo de i y éste poco importa si todo lo demás es real:
si es D = E∞, también F = E∞ y recíprocamente ; o en otros términos, en este caso
el ser máximo justifica el ser hipermáximo. De todos modos, aunque se prescinda
de la hipótesis de que el operador real en cuestión sea máximo, lo que sí puede
afirmarse es que E∞ - D y E∞ – F tienen igual número de dimensiones. Por con
siguiente es p = q (cf. la notación antes utilizada al tratar de la prolongación), o
sea r = p = q y
[D, j1, …, jr] = [D, E∞ - D] = E∞,

[F, y1, …, yr] = [F, E∞ - F] = E∞.
La prolongación antes obtenida, pues, es ahora hipermáxima: los operadores reales

poseen siempre prolongaciones que son hipermáximas. En el lugar citado en la
Nota 95 se demuestra que este mismo resultado vale para todos los operadores de
finidos.
10. Operadores permutables
Según la definición dada en II.4, dos operadores R, S son permutables cuando
es RS = SR; además, si alguno de los dos no está definido en todo el espacio, los
dominios de definición del primero v segundo miembros deben coincidir. Nos
limitaremos de momento a los operadores hermíticos, y aun entre éstos a los que
tienen sentido en todo el espacio —es decir, los continuos— con el fin de evitar
las dificultades inherentes a los dominios de definición. A la vez que R v S consi
deremos sus correspondientes descomposiciones de la unidad E (l) y F (l).
La permutabilidad de R y S significa que para todo par f, g es (RSf , g) = (SRf , g),
es decir, (Sf , Rg) = (Rf , Sg). Además, de ella se sigue la de R n y S(n = 0, 1, 2, …)
y, por lo tanto, también la permutabilidad de p(R) y S, donde p(R) es el operador
asociado al polinomio cualquiera p(x) = a0 + a1x + … + anxn.*
* Aun siendo hermítico R, no lo será en general p(R), a menos que los coeficientes ak sean rea
les. (N. del T.)
224
Fund_MAT_02.indd 224 9/5/18 10:11

Usando de símbolos ya conocidos, podemos escribir

C C
R= ∫ −C
λdE(λ), r(R) = ∫ −C
r(λ) dE (λ).
(C es la constante introducida en II.9 para el operador continuo R, que allí era

el llamado A; r(x) es una función cualquiera. Cf. II.8, en particular la Nota 94.) Si
r(x) es un polinomio, se tendrá [r(R )f, Sg] = [Sf, r(R )*g] y, por lo tanto,
C C
*.
∫−C
r(λ)d[E(λ)f , Sg] = ∫
−C
r(λ)d[Sf , E(λ)g].
La igualdad *. vale también para cualquier función continua r(x), porque cual
quiera que sea ésta podemos aproximarla cuanto queramos (uniformemente en el
intervalo -C ≤ x ≤ C) mediante polinomios. Tomemos en particular
⎧λ0 − x, para x ≤ λ0 ⎫
r(x) = ⎨ ⎬;
⎩λ0 − 0, para x ≥ λ0 ⎭
de *. resulta entonces
λ0 λ0
∫ −C
(λ0 − λ)d[E(λ)f , Sg] = ∫ −C
(λ0 − λ)d[Sf , E(λ)g].
Sustituyamos aquí l0 por l0 + e (e > 0), restemos de la igualdad que así se
obtiene la anterior y dividamos finalmente por e; resulta así
λ0 λ0 + ε − λ λ0 + ε
∫−C
d[E(λ)f , Sg] +
λ0 ε∫ d[E(λ)f , Sf ] =
λ0 λ0 + ε λ + ε − λ
= ∫ d[Sf , E(λ)g] + ∫ d[Sf , E(λ)g],
0
−C λ0 ε
y haciendo que e → 0 (¡téngase en cuenta S1!)*
λ0 λ0
∫−C
d[E(λ)f , Sg] + ∫ −C
d[Sf , E(λ)g],
[E(λ0 )f , Sg] = [Sf , E(λ0 )g].
* Aunque tras el símbolo d- aparece una función en general compleja de la variable real l y las
∫ se entienden en el sentido de Stieltjes, es fácil ver que para cada e existen q1 y q2 (0 ≤ qi ≤ 1, i = 1, 2)
tales que
λ0 + ε λ0 + ε − λ λ0 + ε
∫ λ0 ε
d[Re(E(λ)f , Sg)] = θ1
λ0 ∫
d[Re (E(λ)f , Sg )] =
= θ1 Re [(E(λ0 + ε )f , Sg) − (E(λ0 )f , Sg)]
225
Fund_MAT_02.indd 225 9/5/18 10:11

Por consiguiente, todos los E (l0) tales que -C ≤ l0 ≤ C son permutables con
S; y no digamos ya los E (l0) que corresponden a l0 < -C, que son todos nulos,
y los correspondientes a l0 > C, que coinciden con el operador 1.
En resumen: cuando R es permutable con S, lo son también todos los E(l).
Recíprocamente: si todos los E (l) son permutables con S, vale *. para cada función
r(x) y, por lo tanto, todos los r (R ) son permutables con S. De aquí podemos de
ducir, primero, que R es permutable con S siempre y sólo cuando lo son todos los
E (l), y, segundo, que en este caso toda función r (R ) de R, es asimismo permuta
ble con S.
Ahora bien, un E (l) es permutable con S cuando es permutable con todos los
F (m) y sólo entonces (para cerciorarse de ello, basta aplicar nuestro teorema al par
S, E (l) en vez del R, S ); luego, para la permutabilidad de R, S es necesario y bas
ta que todos los E (l) sean permutables con todos los F (m). Además, en virtud de
lo que precede, la permutabilidad de R, S tiene como consecuencia la de r (R) y S,
y de ésta a su vez se deduce, sin más que sustituir R, S por S, r(R), la permutabi
lidad de s (S ) y r (R ).
La situación se presenta más complicada cuando los operadores R y S no están
sujetos a la condición de continuidad, pues las relaciones entre los dominios de
definición de RS y SR acaso sean intrincadas. Así, por ejemplo, R ⋅ 0 tiene siempre
sentido [0f = 0, R ⋅ 0f = R (0f ) = R 0 = 0, cualquiera que sea f ], y en cambio 0 ⋅ R
lo tiene sólo cuando tal ocurre con R (cf. lo dicho acerca de esto en II.5), de modo
que si R no está definido en todo el espacio, es R ⋅ 0 ≠ 0 ⋅ R como consecuencia
de ser diferentes los dominios de definición, es decir, R y 0 no son permutables
en sentido estricto. Un tal estado de cosas resulta muy enojoso para nuestros fines
ulteriores: 0 debiera ser permutable, no ya sólo con los continuos, sino con todos
los operadores hermíticos.107 Es esta la razón por la cual vamos a definir de otra
manera la permutabilidad de dos operadores R, S cuando sean discontinuos, si
bien en la nueva definición nos limitaremos a los operadores hipermáximos que
son, por lo demás, los únicos interesantes conforme dijimos en II.9. En el nuevo
sentido, dos operadores R y S hipermáximos son permutables si lo son en el primer
sentido todos los E (l) con todos los F (m) [E (l) y F (m) son las correspondientes
descomposiciones de la unidad]. Esta definición equivale a la primitiva cuando R
y S son continuos, según sabemos; no así, quizá, si R o S o ambos son disconti
nuos. Ejemplo de esto último lo es el par R, 0: no son permutables en el primer
y análogamente
λ0 + ε λ0 + ε − λ
∫λ0 ε
d[Im(E(λ)f , Sg)] = θ2 lm[(E(λ0 + ε )f , Sg) − (E(λ 0)f , Sg)].
Cuando e, que es positivo, tiende a cero
[(E(λ 0 + ε )f , Sg] → [E(λ 0)f , Sg], [ S1 en II.7 y II.1],

λ0 + ε λ0 + ε − λ
∫ λ0 ε
d [E(λ)f , Sg] → 0. ( N. del T .)
226
Fund_MAT_02.indd 226 9/5/18 10:11

sentido, pero sí en el segundo, pues para el operador 0 es F(m) = 0 o = 1 (Nota 108)

y por lo tanto todo F(m) es permutable con todo E(l).
Hemos demostrado más arriba que si R, S son dos operadores hermíticos con
tinuos permutables, toda función r(R) de R es permutable con cada función s(S)
de S. Pues la premisa se cumple siempre para R = S, dos funciones r (R ), s(R ) de
un mismo operador hermítico continuo son siempre permutables [lo que se sigue
también de la fórmula de multiplicación dada al final del II.8: r (R ) s (S ) = t (R ),
con r (x) s(x) = t (x)]. Cuando r (x) y s (x) son reales, r (R ) y s (R ), por otra parte, son
hermíticos [según II.8, cuando r (x) es real es [r (R )]* = r (R ) = r (R )].
De esta proposición vale también la recíproca: si A, B son dos operadores her
míticos permutables, existe un operador R del que ambos son función, es decir,
A = r (R ), B = s(R ). Pero hay más: dado un conjunto finito o una infinidad nume
rable de operadores hermíticos A, B, C, …, existe un operador hermítico R del
que son función todos los A, B, C, … No cabe demostrar aquí este teorema en
toda su generalidad;109 pero sí lo haremos en el supuesto de que se trate de un
número finito de operadores que posean espectros discretos puros, caso éste que
es el único que se nos presentará más adelante. Acerca del caso general, sólo po
demos dar algunas indicaciones a modo de orientación.
Sean, pues, A, B, C, … un conjunto finito de operadores hermíticos que pre
sentan espectros discretos puros. Si l es un número cualquiera, usaremos del sím
bolo Ll para indicar la extensión lineal cerrada del conjunto de las soluciones de
Af = lf , y del El para representar el correspondiente operador de proyección. El
número l es valor propio de A siempre y solamente cuando existe por lo menos
una solución f ≠ 0 de la ecuación Af = lf , esto es, para Ll ≠ 0, o lo que es lo
mismo, para El ≠ 0. Análogamente, sean Ml, Nl … las variedades lineales cerradas
que corresponden a B, C, …, y Fl, Gl, … sus operadores de proyección. De
Af = lf se deduce que ABf = BAf = B(lf ) = lBf , es decir, si f pertenece a Ll,
también pertenece a ella Bf ; luego, y dado que El f siempre pertenece a Ll, igual
sucede con BEl f , o sea El BEl f = BEl f , igualdad ésta que debiendo valer idénti
camente prueba que El BEl = BEl, de donde, sin más que tomar los adjuntos de
ambos miembros, El BEl = (El BEl)* = (BEl)* = El B, es decir, BEl = El B. Exac
tamente igual a como de la permutabilidad de A, B hemos deducido la de B, El,
podemos concluir de la de éstos la permutabilidad de El, Fm. Y pues los operado
res A, B eran dos cualesquiera de nuestro conjunto, podemos afirmar que todos
los El, Fm, Gn, … son permutables entre sí, de forma que el operador K(l, m, n, …) =
= El Fm Gn es también un operador de proyección. Si K(l, m, n, …) es la variedad
lineal cerrada que a éste corresponde, esta variedad, en virtud del teorema 14 (II.4),
es la intersección de Ll, Mm, Nn, …, es decir, el conjunto de las soluciones comu
nes a Af = lf , Bf = mf , Cf = nf , …
Sentado esto, sean l, m, n, … y l', m', n', … dos diferentes sistemas de nú
meros, esto es, l ≠ l' o m ≠ m', o n ≠ n', … Si f pertenece a K(l, m, n, …) y f' a
K(l', m', n', …), f y f' son ortogonales entre sí: para l ≠ l', por ser Af = lf y
Af' = l'f'; para m ≠ m', por ser Bf = lf y Bf' = lf', … Luego todo K(l, m, n, …)
es ortogonal a todo K(l', m', n', …).
227
Fund_MAT_02.indd 227 9/5/18 10:11

Ahora bien, puesto que A posee un espectro discreto puro, la extensión lineal
cerrada del conjunto de todas las Ll coincide con E∞. Un f ≠ 0, por lo tanto, no
puede ser ortogonal a todas ellas, es decir, para por lo menos una Ll debe ser no
nula su proyección en Ll: El f ≠ 0. Por el mismo motivo, existe un m tal que
Fm f ≠ 0, un n tal que Gn f ≠ 0, etcétera. Dado, pues, un f ≠ 0, es posible hallar un
l tal que El f ≠ 0 un m tal que Fm(El f ) ≠ 0, un n tal que Gn(FmEl f ) ≠ 0, …, con
lo que, finalmente, … GnFmEl f ≠ 0, ElFmGn … f ≠ 0, K(l, m, n, …)f ≠ 0, es de
cir, f no es ortogonal a K(l, m, n, …). Por lo tanto, un f que sea ortogonal a todas
las variedades K(l, m, n, …) es necesariamente nulo; o lo que es equivalente: las
variedades lineales cerradas K(l, m, n, …), tomadas en conjunto, poseen como
extensión lineal cerrada el E∞.
Sea j (1)
(l, m, n, …), j (l, m, n, …), … un sistema ortonormal cuya extensión lineal cerra
(2)
da es K(l, m, n, …) [esta sucesión es finita o infinita según sea finito o infinito el

número de dimensiones de K(l, m, n, …), , respectivamente; si es K(l, m, n, …) = 0,
naturalmente no consta de ningún término]. Cada j (n) (l, m, n, …), pertenece a un
K(l, m, n, …) y es por ello función propia de A, B, C, … Dos j (n) (l, m, n, …) distintos
son siempre ortogonales entre sí: por su origen, si l, m, n, … son iguales en uno
que en otro; porque pertenecen a diferentes K(l, m, n, …), si los dos sistemas l, m,
n, … no lo son. La extensión lineal cerrada del conjunto de todos los j (n) (l, m, n, …)
coincide con la del conjunto de todas las K(l, m, n, …), es decir, con el E∞; luego
j (n)
(l, m, n, …) es un sistema ortonormal completo.
De este modo hemos construido un sistema ortonormal completo con funcio
nes propias comunes a A, B, C, … En adelante llamaremos y1, y2, … a los ele
mentos de este sistema y escribiremos las correspondientes ecuaciones de valores
propios a que satisfacen en la forma
Aym = lmym, Bym = mmym, Cym = nmym, …
Elijamos ahora un conjunto cualquiera de números diferentes entre sí c1, c2, c3, …
y formemos un operador hermítico R con el espectro discreto puro c1, c2, c3, … y
las funciones propias asociadas y1, y2, y3, …Es decir, sea
⎛ ∞ ⎞ ∞
R ⎜ ∑ xmψ m ⎟ = ∑ xm χmψ m . 110
⎝ m =1 ⎠ m =1
Sea F(c) una función definida en -∞ < c < +∞ para la cual F(cm) = lm(m = 1, 2,
…; en los demás puntos c, F(c) puede ser cualquiera); del mismo modo, sean
G(c) una función tal que G(cm) = mm, H(c) otra función tal que H(cm) = nm, …
Vamos a demostrar que
A = F(R), B = G(R), C = H(R), …
En efecto: todo se reduce a probar que si un operador R presenta un espectro

discreto puro c1, c2, … con las funciones propias y1, y2, …, el operador F(R)
228
Fund_MAT_02.indd 228 9/5/18 10:11

posee asimismo un espectro discreto puro F (c1), F (c2), … con las mismas funcio
nes propias y1, y2, … Mas como éstas constituyen un sistema ortonormal, basta
la demostración de que F (R )ym = F (cm)ym.
Sea E(λ) = ∑ Pψ m la descomposición de la unidad que según II.8 correspon
χm ≤ λ
de a R. Sabemos que entonces es, simbólicamente,
∫
R = ldE (l)
y, por definición,
∫
F(R ) = F(l)dE (l).
Además,
⎧ψ m, para χm ≤ λ ⎫
E(λ)ψ m = ⎨ ⎬.
⎩ 0, para χm > λ ⎭
De esto se sigue que
∫
[F (R)ym, g] = F(l)d [E (l)ym, g] = F (cm) · (ym, g),
cualquiera que sea g, es decir, F (R )ym = F (cm)ym efectivamente.

Conforme habíamos anunciado, el caso del espectro discreto puro puede con
esto darse por resuelto. En el de un espectro continuo, debemos contentarnos
con la referencia dada en la Nota 109, pues sólo se pondrá de relieve aquí un caso
particular característico.
Sea E∞ el espacio de todas las f (q1, q2) tales que sea convergente la ∫∫∙ f (q1,
q2)∙2dq1dq2, donde el dominio de variabilidad de q1, q2 es el cuadrado 0 ≤ qr ≤ 1
(i = 1, 2). Los operadores A = q1…, B = q2… son hermíticos y permutables, e inclu
so continuos en este dominio (¡pero no en -∞ < qr < +∞!). Por lo tanto, deben
ser ambos funciones de un cierto R, que así resulta ser permutable con A y B. De
aquí se puede deducir que R es de la forma s(q1, q2)…, [s(q1, q2) es una función
acotada]; por consiguiente, R n(n = 0, 1, 2, …) es igual a [s (q1, q2)n]… y F (R) =
= F [s(q1, q2)]… cuando F (c) es un polinomio. Aunque tampoco en este punto
podamos entrar en detalles, es el caso que esta fórmula es posible hacerla extensi
va a toda función F (c). Luego, que F (R) = A y G(R ) = B tiene como c onsecuencia
F [s(q1, q2)] = q1, G [s(q1, q2)] = q2,111
es decir, las representaciones s(q1, q2) = c y F (c) = q1, F (c) = q2, entre sí r ecíprocas,
deberían transformar biunívocamente el cuadrado 0 ≤ qi ≤ 1 (i = 1, 2) en el con
junto numérico lineal c —algo esto que contradice la intuición geométrica.
229
Fund_MAT_02.indd 229 9/5/18 10:11

Pero la demostración nuestra antes citada nos enseña que, sin embargo, ello
debe ser posible —y efectivamente, la llamada curva de Peano proporciona una
representación de esa clase.112 Un examen más preciso de la demostración citada
en la Nota 109 muestra que ella conduce en el presente caso a la curva de Peano o
a figuras parecidas.
11. La traza
Definiremos en este párrafo algunos notables invariantes de los operadores. En
n
el En la traza ∑ aµµ una matriz {amn} es un invariante unitario, esto es, su valor
µ =1
no se altera cuando se refiere la matriz {amn} a otro sistema de referencia cartesia
no.113 Sustituyamos la matriz {amn} por el correspondiente operador A:
∞
A{x1 ,…, xn } = { y1 ,…, yn }, yµ = ∑ aµν xν .
ν =1
Esto nos permite expresar los amn mediante A, puesto que los vectores j1 = {1, 0, …, 0},
j2 = {0, 1, 0, …, 0}, …, jn = {0, 0, …, 1}, constituyen un sistema ortonormal
completo, y evidentemente amn = (A jn, jm) (cf. II.5, en particular la Nota 60). La
n
traza, por lo tanto, es igual a ∑ (Aϕµ ⋅ ϕµ ) y su carácter de invariante unitario nos
µ =1
dice que su valor es el mismo para todo sistema ortonormal completo.
El establecimiento de un concepto análogo en el E∞ podemos llevarlo a cabo
del siguiente modo: Sea A un operador lineal j1, j2, … un sistema ortonormal
completo para el que todos los Ajm tengan sentido (lo que siempre se puede con
seguir si el dominio de definición de A es doquiera denso; basta tomar en él una
sucesión f 1, f 2, … densa en él y ortogonalizarla de acuerdo con II.2, teorema 8).
n
Hagamos entonces traza (A)= ∑ (Aϕ µ , ϕ µ ). Hay que demostrar que este número
µ =1
realmente depende sólo de A (¡y no de los jm!).
Para ello introduzcamos primero dos sistemas ortonormales completos j1, j2,
… y y1, y2, … y pongamos
∞
traza (A; ϕ, ψ ) = ∑ (Aϕµ , ψ ν )(ψ ν , ϕµ ).
µ,ν =1
∞
Del teorema 7.γ (II.2) se deduce que esto es igual a ∑ (Aϕµ , ϕµ ), de forma que
µ =1
sólo en apariencia depende de las yn. Además se tiene
∞ ∞ ∞
∑ (Aϕµ , ψ ν )(ψ ν , ϕµ ) = ∑ (ϕµ , A*ψ ν )(ψ ν , ϕµ ) = ∑ (A*ψ ν , ϕµ )(ϕµ , ψ ν ),
µ,ν =1 µ,ν =1 µ,ν =1
230
Fund_MAT_02.indd 230 9/5/18 10:11

es decir, traza (A; j, y) = traza (A*; j, y ). Pues el segundo miembro, por lo que
precede, depende de los jm sólo aparentemente, igual sucede con el primero, y
dado que tampoco depende de los yn, es independiente de unos y de otros y sí
tan sólo dependiente de A. Podemos así expresar traza (A; j, y) con la notación
∞
traza (A). Que es invariante unitario, resulta de su misma expresión ∑ (Aϕµ , ϕµ ).
µ =1
Además, de la ecuación anterior se deduce que traza (A) = traza (A*).

Son evidentes las relaciones
traza (aA) = a traza (A), traza (A ± B) = traza (A) ± traza (B).
No tanto lo es ya que
traza (AB) = traza (BA),
sean o no permutables A y B, pero es fácil demostrarlo:

∞ ∞
traza (AB) = ∑ (ABϕ µ ,ϕ µ ) = ∑ (Bϕ µ , A* ϕ µ ) =
µ =1 µ =1
∞ k
= ∑ (Bϕ µ ,ψ ν )(ψ ν , A* ϕ µ ) = ∑ (Bϕ µ ,ψ ν )(Aψ ν , ϕ µ ),
µ ⋅ν =1 µ ⋅ν =1
donde j1, j2, … y y1, y2, … son dos sistemas ortonormales completos cuales
quiera. Es suficiente permutar en el último miembro A y B y a la vez los j y y
para que quede de manifiesto la simetría del primer miembro respecto del par A,
B. En particular, si los operadores A y B son hermíticos,
traza (AB) = traza [(AB)*] = traza (B*A*) = traza (BA) = traza (AB),
esto es, traza (AB) es real y con mayor motivo traza (A).
Es fácil determinar traza (E) cuando E es el operador de proyección de una
variedad lineal cerrada B: Sea y1, …, yk, un sistema ortonormal cuya extensión
lineal cerrada coincida con B y c1, …, ci, otro sistema ortonormal que se halle en
las mismas condiciones respecto de E∞ - B (claro está que k, o l o ambos pueden
ser infinitos); y1, …, yk, c1, …, ci poseen en conjunto como extensión lineal
cerrada el E∞ y, por consiguiente, forman un sistema ortonormal completo (teore-
ma 7.a. en II.2.). Luego
k l k ι k
traza (E) = ∑ (Eψ µ , ψ µ ) + ∑ (E χ µ , χ µ ) = ∑ (ψ µ ,ψ µ ) + ∑ (0, χ µ ) = ∑ 1 = k,
µ =1 µ =1 µ =1 µ =1 µ =1
esto es, la traza (E) es igual al número de dimensiones de B.
231
Fund_MAT_02.indd 231 9/5/18 10:11

Si A es definido, todos los productos (Ajm, jm) son ≥ 0, y, por lo tanto, traza
(A) ≥ 0. Si traza (A) = 0, todos los (Ajm, jm) deben anularse y, por ende (teorema 19
en II.5) Ajm = 0. Dado un j cualquiera tal que ∙j ∙ = 1, cabe encontrar un siste
ma ortonormal completo j1, j2, … en el que j1 = j (sea f 1, f 2, … una sucesión
densa doquier y «ortogonalicemos» j, f 1, f 2, … —cf. la demostración del teorema 7
en II.2.—; resulta así un sistema ortonormal completo cuyo primer elemento es
el j dado); luego es Aj = 0. Si ahora es f arbitrario, es claro que Af = 0 si f = 0;
f
y si es f ≠ 0, basta hacer j = para que se obtenga Af = 0. En resumen: si A
∙ f ∙
es definido y diferente de cero, forzosamente es traza (A) > 0; y si A es definido y
traza (A) = 0, necesariamente es A = 0.
Con toda su brevedad y simplicidad, nuestras consideraciones relativas a la
traza de un operador no son matemáticamente correctas. En efecto, hemos susti
tuido una por otra las series
∞ ∞
∑ (Aϕµ , ψ ν ) ⋅ (ψ ν , ϕµ ) y ∑ (Aϕµ , ϕµ )
µ,ν =1 µ =1
y agrupado términos sin atender a su convergencia* —en una palabra, hemos

hecho algo que no cabe cuando se procede correctamente. Cierto es que tales fal
tas de esmero se advierten en otros puntos de la Física teórica y que aquéllas no
causarán grandes daños en nuestras aplicaciones de la Mecánica cuántica —pero
como al fin y a la postre se trata de una inexactitud, debe hacerse constar.
Hay que subrayar lo que precede tanto más cuanto que en las proposiciones
estadísticas fundamentales de la Mecánica cuántica la traza se aplica sólo en el caso
de un producto de operadores, A B, ambos definidos, y que este concepto puede
fundamentarse entonces correctamente. Por tal razón, en el resto de este párrafo
* Los pasos que habría que justificar se ven claramente en el siguiente razonamiento, desarro
llado en el texto y aquí detallado:
∞ ∞
⎛∞ ⎞
traza (A; ϕ, ψ ) = ∑ (Aϕ µ , ϕν ) = ∑ ⎜ ∑ (Aϕ µ , ψ ν )(ψ ν ,ϕ µ )⎟ =
µ =1 µ =1 ⎝ ν =1 ⎠
∞
⎛∞ (1) ⎞ ∞ ⎛∞ ⎞
= ∑ ⎜ ∑ (ϕ µ , A*ψ ν )(ψ ν ,ϕ µ )⎟ = ∑ ⎜ ∑ (A*ψ ν , ϕ µ )(ϕ µ , ψ ν )⎟ =
µ =1 ⎝ ν =1 ⎠ µ =1 ⎝ ν =1 ⎠
(2)
∞
⎛∞ ⎞ ∞
= ∑ ⎜ ∑ (A*ψ ν , ϕ µ )(ϕ µ , ψ ν )⎟ = ∑ (A*ψ ν , ψ ν ) = traza (A*; ψ , ϕ).
ν =1 ⎝ µ =1 ⎠ ν =1
∞
Supuesto que ∑ (Aϕµ , ϕµ ) sea convergente, debería admitirse, primero, la existencia de A* (en
µ =1
[1]) y, segundo, la licitud de la inversión de sumas en [2]. (N. del T.)
232
Fund_MAT_02.indd 232 9/5/18 10:11

se reunirá todo lo relativo a la traza que sea demostrable con rigor matemático
absoluto.
Consideremos en primer término la traza de A*A [A arbitrario; A*A es hermí
tico (II.4.), y porque (A*Af , f ) = (Af , Af ) ≥ 0, es además definido]. Se tiene
∞ ∞ ∞
traza (A *A) = ∑ (A *Aϕ µ , ϕ µ ) = ∑ (Aϕµ , Aϕµ ) = ∑
2
Aϕ µ ,
µ =1 µ =1 µ =1
serie ésta que por tener todos sus términos ≥0, es convergente o divergente hacia
+∞, es decir, sea como fuere tiene pleno sentido. Independientemente de lo visto
hasta aquí, demostraremos, ahora que su suma no depende de la elección de los
j1, j2, … En la demostración intervendrán solamente series cuyos términos son
≥0, todas las cuales tienen, pues, sentido y admiten la permutación de los símbo
los ∑.
Sean j1, j2, …, y y1, y2, … dos sistemas ortonormales completos y, por de
finición,
∞
∑ (A; ϕµ , ψ ν ) = ∑
2
(Aϕ µ , ψ ν ) .
µ,ν =1
∞
∑
2
Según el teorema 7.g en II.1, esta expresión es igual a Aϕ µ , o sea, que
µ =1
∑(A; jm, yn) sólo en apariencia depende de los yn. Además (supuesto que tengan
sentido los Ajm y A*yn),
∞ ∞
∑ (A; ϕµ , ψ ν ) = ∑ ∑
2 2
(Aϕ µ , ψ ν ) = (ϕ µ , A*ψ ν ) =
µ,ν =1 µ,ν =1
∞
∑ (A*ψ ν , ϕ µ ) = ∑ (A*; ψ ν , ϕ µ ).
2
=
µ,ν =1
Luego, también la dependencia de los jm es sólo aparente, pues tal es el caso en el

último término de la fórmula. Por lo tanto, ∑(A; jm, yn) depende únicamente
de A y la designaremos con ∑(A). Según lo antes demostrado es
∞ ∞
∑ (A) = ∑ ∑
2 2
(Aϕ µ ) = (Aϕ µ , ψ ν )
µ =1 µ,ν =1
y ∑(A) = ∑(A*). A través de ∑(A), y como igual a ella, queda con esto correc
tamente definida la traza (A*A).
Demostremos directamente algunas propiedades de ∑(A), que también se
siguen de las generales de traza (A) ya deducidas.
233
Fund_MAT_02.indd 233 9/5/18 10:11

De la propia definición resulta que siempre es ∑(A) ≥ 0 y que, cuando ∑(A) = 0,

deben ser todos los Ajm = 0, de donde se sigue como antes que A = 0; es decir,
para A ≠ 0 es ∑(A) > 0.
Evidentemente es ∑(aA) = ∙a∙2∑(A). Si A*B = 0, resulta
∙(A + B)jm ∙2 - ∙Ajm ∙2 - ∙Bjm ∙2 = (Ajm, Bjm) + (Bjm, Ajm) =

= 2 Re (Ajm, Bjm) = 2 Re (jm, A*B jm) = 0,
⎛ ∞⎞
y sumando ⎜ ∑⎟ ,
⎝ µ =1⎠
∑(A + B) = ∑(A) + ∑(B).
Esta relación subsiste cuando permutamos entre sí A y B ; luego vale también
para B*A = 0. Además, dado que en ella podemos sustituir A y B por A* y B*, es
claro que AB* = 0 y BA* = 0 son asimismo suficientes. Si A (o B) es hermítico,
podemos escribir, por ende, AB = 0 o BA = 0.
Sean E el operador de proyección de la variedad lineal cerrada B y y1, y2, …,
c1, c2, … sistema ortonormal completo considerado ya al tratar de la determina
ción de traza (E ); se tendrá
k l k l k
∑ (E) = ∑ Eψ µ + ∑ E χµ = ∑ ψµ + ∑ 0 = ∑ 1 = k,
2 2 2 2
µ =1 µ =1 µ =1 µ =1 µ =1
es decir, también ∑(E ) coincide con el número de dimensiones de B (no otra cosa
cabía esperar, pues E*E = EE = E ).
Sentado esto, es fácil reducir la traza (A B) al ente ∑, si A y B son dos opera
dores hermíticos definidos. En estas condiciones, en efecto, existen dos operadores
hermíticos definidos A' y B' tales que A' 2 = A, B' 2 = B,114 operadores que llamare
mos √A y √B . De modo puramente formal podemos escribir
traza (AB) = traza (√A √A √B √B ) = traza (√B √A √A √B )
traza [(√A √B )*(√A √B )] = ∑(√A √B ).
Y es el caso que esta ∑(√A √B ), en virtud de su propia definición y sin acudir
a su conexión con el concepto de traza, tiene todas las propiedades que se esperan
de traza (AB), a saber:
∑(√A √B ) = ∑(√B √A )

∑(√A √B + C ) = ∑(√A √B ) + ∑(√A √C )
∑(√A + B √C ) = ∑(√A √C ) + ∑(√B √C ).
234
Fund_MAT_02.indd 234 9/5/18 10:11

La primera se deduce del hecho de ser simétrica respecto de X, Y la ∑ (X, Y ):

∞ ∞
∑ (XY ) = ∑ ∑
2 2
XY ϕ µ , ψ ν = (Y ϕ µ , Xψ ν ) ;
µ,ν =1 µ,ν =1
la segunda resulta de la tercera por razón de la primera; luego sólo es menester

demostrar esa, es decir, que ∑(√A √B ) es aditiva respecto de A. Pero esto es fácil
de reconocer cuando se escribe ∑(√A √B ) en la forma
∞ 2 ∞
∑( A B) = ∑ A B ϕµ = ∑ ( A B ϕµ, A B ϕµ ) =
µ =1 µ =1
∞ ∞
= ∑( A. A Bϕ µ , Bϕ µ ) = ∑ (A Bϕ µ , Bϕ µ ),
µ =1 µ =1
De este modo hemos llevado a término la fundamentación rigurosa del concepto

de traza dentro de los límites que nos habíamos marcado. La última fórmula, por
lo demás, permite también deducir que cuando A y B son definidos, AB = 0 es
consecuencia de traza (AB) = 0; pues lo último nos dice que ∑(√A √B ) = 0, de
donde √A √B = 0 (cf. lo dicho en la página 132 o también las consideraciones
que siguen relativas a ∑) y, por lo tanto, AB = √A √A √B √B = 0.
Si el operador A es hermítico y definido, el cálculo de la traza es correcto in
cluso en su forma primitiva. En efecto: sea j1, j2, …, un sistema ortonormal
∞
completo; entonces ∑ (Aϕµ , ϕµ ) (¡la suma que debiera definir a la traza!) es una
µ =1
suma cuyos términos son todos ≥0, convergente o propiamente divergente (ha
cia +∞) por lo tanto. Son entonces posibles dos casos: o cualquiera que sea el
sistema j1, j2, … elegido es infinita dicha suma, con lo que su valor es efectiva
mente independiente de j1, j2, …, o por lo menos para una cierta elección de j1,
j2, …, por ejemplo, para j1, j2, … es finita. En este último supuesto y dado que
2
⎛∞ ⎞ ∞ ∞
⎜⎝ ∑ ∑ µ µ ν ν ∑ (Aϕµ , ϕν ) = ∑ (A),
2
(Aϕ µ , ϕ )
µ ⎟ = (Aϕ , ϕ )(Aϕ , ϕ ) ≥
µ =1 ⎠ µ,ν =1 µ,ν =1
también 2 (A) es finita, igual a C 2, por ejemplo. Sea y1, y2, … un sistema orto
normal completo cualquiera ; respecto de este sistema es asimismo
∞
∑ (A) = ∑
2 2
Aψ µ = C 2, Aψ 1 ≤ C 2, Aψ 1 ≤ C,
µ =1
y como cada y para el que ∙y ∙ = 1 puede elegirse como y1, de un tal sistema, se
sigue de ∙y ∙ = 1 que ∙Ay ∙ ≤C. Por consiguiente es en general ∙Af ∙ ≤ C. ∙ f ∙: ello
235
Fund_MAT_02.indd 235 9/5/18 10:11

f
es evidente para f = 0, y para f ≠ 0 basta hacer y = . Resulta así que el opera
∙ f ∙
dor A cumple la condición Cn de II.9 y, por lo tanto, es continuo. Pero algo hay
aún más importante.
Por razón de la finitud de ∑(A), A pertenece a la clase de los llamados opera
dores completamente continuos, tocante a los cuales demostró Hilbert la exis
tencia de la solución del problema de valores propios en su forma primitiva, esto
es, la de un sistema ortonormal completo de soluciones y1, y2, …, siendo
Aym = lmym (y precisamente lm → 0 para m → ∞).115 Dado el carácter definido
de A, lm = (Aym, ym) es ≥0; además,
∞ ∞
∑ λµ2 = ∑ = ∑ (A) = C 2.
2
Aψ µ
µ =1 µ =1
Si j1, j2, … es un sistema ortonormal completo cualquiera,
∞ ∞
⎛∞ ⎞ ∞
⎛∞ ⎞
∑ (Aϕµ , ϕµ ) = ∑ ⎜ ∑ (Aϕµ , ψ ν )(ψ ν , ϕµ )⎟ = ∑ ⎜ ∑ (ϕµ , Aψ ν )(ψ ν , ϕµ )⎟ =
µ =1 µ =1 ⎝ ν =1 ⎠ µ =1 ⎝ ν =1 ⎠
∞
⎛∞ ⎞ ∞ ⎛∞ 2⎞
= ∑ ⎜ ∑ λν (ϕ µ , ψ ν )(ψ ν , ϕ µ )⎟ = ∑ ⎜ ∑ λµ (ϕ µ , ψ ν ) ⎟ ,
µ =1 ⎝ ν =1 ⎠ µ =1 ⎝ ν =1 ⎠
y pues todos los términos son ≥0, podemos permutar las ∑ y escribir
∞ ∞ ∞
⎛∞ ⎞ ∞ ∞
∑ (Aϕµ , ϕµ ) = ∑ λν (ϕµ , ψ ν ) = ∑ λν ⎜ ∑ (ϕµ , ψ ν ) ∑ ∑
2 2 2
=
⎟⎠ ν =1 λν ψ ν = λν.
µ =1 µ,ν =1 ν =1 ⎝ µ =1 ν =1
∞
De nuevo es en este caso ∑ (Aϕµ ,ϕµ ) independiente de j1, j2, … e igual preci
µ =1
samente a la suma de los valores propios. Pero para j1, j2, … la primera serie es
convergente ; luego lo es siempre, es decir, traza (A) tiene una significación intrín
seca como en el caso anterior, pero ahora su valor es finito. El cálculo con la traza,
por ende, queda justificado en ambos casos.
Es fácil comprobar las siguientes acotaciones: Para cualquier A tal que ∑(A)
sea finita es ∙Af ∙ ≤ √∑ A ∙ f ∙; para todo A hermítico y definido cuya traza sea fi
nita es ∙Af ∙ ≤ traza (A) ∙ f ∙. Supongamos ahora que A, además de definido, es tal
que traza (A) = 1 y que para un cierto j, tal que ∙j ∙ = 1, se tiene ∙Aj ∙2 ≥ 1 - e
ó (Aj, j) ≥ 1 - e. Puesto que por ser (Aj, j) ≤ ∙Aj ∙ ⋅ ∙j ∙ = ∙Aj ∙ de la segunda
desigualdad resulta la primera [con (1 - e)2 ≥ l - 2e en vez de 1 - e, o lo que es
lo mismo, 2e en vez de e], basta considerar ésa.
236
Fund_MAT_02.indd 236 9/5/18 10:11

Sea y ortogonal a j y ∙y ∙ = 1. Podemos entonces encontrar un sistema orto

normal completo c1, c2, … en el que c1 = j, c2 = y, de suerte que
∞ ⎧= ∑ (A) ≤ [traza (A)]2 = 1

2⎪
∑ Aχµ ⎨ 2 2 2
µ =1 ⎪⎩≥ Aϕ + Aψ ≥ 1 − 2ε + Aψ ,
2
Aψ ≤ 2ε, Aψ ≤ 2ε .
De aquí se deduce para un f cualquiera ortogonal a j, ∙ Af ∙ ≤ √2e ⋅ ∙ f ∙ (es claro
f
si f = 0, y si f ≠ 0, haremos y =
∙ f ∙ )
. Atendiendo a que (Af , g) = (f , Ag), pode
mos también decir: cuando f o g son ortogonales a j, es ∙(Af , g)∙ ≤ √2e ⋅ ∙ f ∙ ⋅ ∙ g ∙.
Aunque f , g sean arbitrarios, siempre podremos escribir que
f = aj + f', g = bj + g'
donde f', g' son ortogonales a j y a = ( f , j), b = (g, j) ; luego
(Af , g) = ab(Aj, j) + a(Aj, g' ) + b(Af', j) + (Af', g' ),
y si hacemos (Aj, j) = c,
∙(Af , g) - cab ∙ ≤ ∙a ∙ ⋅ ∙(Aj, g' )∙ + ∙b ∙ ⋅ ∙(Af', j)∙ + ∙(Af', g' )∙
o bien, en virtud de las anteriores acotaciones,
∙(Af , g) - cab ∙ ≤ √2e [∙a ∙ ⋅ ∙( g' )∙ + ∙b ∙ ⋅ ∙( f' )∙ + ∙( f' )∙ ⋅ ∙(g' )∙]
≤ √2e (∙a ∙ + ∙ f' ∙) + (∙b ∙ + ∙ g' ∙) ≤ 2√2e √∙a∙2 + ∙ f' ∙2√∙b ∙2 + ∙ g' ∙2 =
= 2√2e ∙ f ∙ ∙ g ∙.
Por otro lado se tiene
(Af , g) - cab = (Af , g) - c( f , j) (j, g) = [(A - cP[j]) f , g];
luego vale en general que ∙[(A - cP[j]) f , g]∙ ≤ 2√2e ∙ f ∙ ∙ g ∙ o también, por lo vis
to en II.9,
∙(A - cP[j]) f ∙ ≤ 2√2e ∙ f ∙.
237
Fund_MAT_02.indd 237 9/5/18 10:11

Para f = j, esta relación nos dice que
Aϕ − cϕ ≤ 2 2ε ,
⎧⎪≤ Aϕ − cϕ + Aϕ ≤ 2 2ε + 1
c = cϕ ⎨
⎪⎩≥ − Aϕ − cϕ + Aϕ ≥ −2 2ε + (1 − ε ),
1 − (ε + 2 2ε ) ≤ c ≤ 1 + 2 2ε
[c = (Aj, j) es real y ≥0]. Por lo tanto
∙(A - P[j])f ∙ ≤ ∙(A - cP[j])f ∙ + ∙(c - 1)P[j])f ∙

≤ 2√2e ∙ f ∙ + (e + 2√2e )∙P[j] f ∙ ≤ (e + 4√2e ) ∙ f ∙,
esto es, A converge uniformemente hacia P[j] cuando e → 0.

Para terminar, consideremos traza (A) y ∑(A) en los modelos FZ y FΩ del E∞
(cf. I.4 y II.3), ya que es en éstos donde se presentan las aplicaciones físicas.
∞
(
En FZ conjunto de todos los {x1, x2, …} con ∑ xµ
µ =1
2
)
finita , A está represen
tado por una matriz {amn}:
∞
A{x1, x2, …} = {y1, y2, …}, yµ = ∑ aµν xν ,
ν =1
{1, 0, 0, …}, {0, 1, 0, …} forman un sistema ortonormal completo j1, j2, … y

∞ ∞
es Ajm = {a1m, a2m, …} = ∑ aρµϕ ρ ; por consiguiente (Ajm, jm) = amm, Aϕ µ = ∑ aρµ ,
2 2
ρ =1 ρ =1
de donde se sigue desde luego
∞ ∞
traza (A) = ∑ aµµ , ∑ (A) = ∑
2
aµν .
µ =1 µ,ν =1
En FΩ (conjunto de todas las funciones f (P) definidas en Ω tales que es con

vergente la ∫Ω∙ f (P)∙2dv), consideremos únicamente los operadores integrales
Af (P) = ∫ Ω
a(P, P') f (P') dv',
en los cuales a(P, P' ), núcleo integral de A, es una función de las dos variables P,
P' definida en Ω (cf. I.4). Sea j1(P), j2(P), … un sistema ortonormal completo
cualquiera; se tiene entonces
238
Fund_MAT_02.indd 238 9/5/18 10:11

∞ ∞
traza (A) = ∑ [Aϕ µ(P ), ϕ µ(P)] = ∑
µ =1 µ =1
∫ ⎡⎣⎢∫
Ω Ω
a(P, P')ϕ µ (P')dv' ⎤ϕ µ (P)dv
⎦⎥
y porque en general [teorema 7.b en II.2 aplicado a g (P)]
(∫ g(P') ϕ (P')dv' )ϕ (P) = g(P),

∞
∑ µ µ
µ =1 Ω
∑ (∫ g(P')ϕ (P')dv' )ϕ (P) = g(P),

∞
µ µ
µ =1 Ω
resulta
traza (A) = ∫ Ω
a(P, P)dv.
Además
∞ 2
∑ (A) = µ∑=1 ∫Ω ∫Ω a(P, P')ϕµ (P')dv' dv ,
y pues (cf. teorema 7.γ, II.2)

∞ 2 ∞ 2
µ = 1 ∫Ω µ = 1 ∫Ω
∑ g(P')ϕµ (P')dv' = ∑ g(P') ϕµ (P')dv' =
∫ ∫
2 2
= g(P') dv' = g(P') dv',
Ω Ω
obtenemos en definitiva
∑ (A) = ∫Ω ∫Ω a(P, P')

2
dv dv' .
Se ve así que en traza (A) y ∑(A) se lleva a efecto lo que se perseguía en I.4
con la aplicación de artificios matemáticamente muy delicados: en el paso de FZ
∞
a FΩ, la ∑ es sustituida por la ∫Ω … dv.
µ =1
Con esto damos por terminada nuestra exposición matemática relativa a los
operadores hermíticos. El lector que se interese por el aspecto matemático de estas
cuestiones obtendrá más pormenores consultando la literatura especial.116
239
Fund_MAT_02.indd 239 9/5/18 10:11

Fund_MAT_02.indd 240 9/5/18 10:11
III
La estadística de la Mecánica cuántica
1. Los enunciados estadísticos

de la Mecánica cuántica
Volvamos al análisis de las teorías mecánico-cuánticas que hubimos de inte-
rrumpir por las consideraciones matemáticas de la segunda parte. Examinóse allí
tan sólo cómo la Mecánica cuántica da medios para la determinación de todos los
valores posibles de una cierta magnitud física, la energía, valores que son precisa-
mente los valores propios del operador correspondiente H (esto es, los números
que integran su espectro). Resta aún por discutir, qué está en condiciones de de-
cirnos tocante a los valores de las otras magnitudes, como también acerca de la
conexión causal o estadística entre los de varias de ellas. Hay, pues, que fijar
la atención en los correspondientes enunciados de la teoría. Con tal motivo toma-
remos como base la concepción ondulatoria, cuya equivalencia con el modelo
matricial quedó ya establecida.
Desde su punto de vista, es claro que todo cuanto se afirme del estado de un
sistema debe poderse deducir de la función de onda del mismo ϕ (q1, …, qk). (Su-
ponemos que el sistema posee k grados de libertad y llamamos q1, …, qk a sus
coordenadas en el espacio de los estados.) Y al decir esto no nos referimos preci-
samente a los estados estacionarios (trayectorias cuánticas, en las que ϕ es función
propia de H : H ϕ = λϕ, cf. 1.3), sino a estados cualesquiera, esto es, funciones
ϕ (q1, …, qk; t) que evolucionan en el decurso del tiempo de acuerdo con la ecua-
h ∂ϕ
ción temporal de Schrödinger: H ϕ = − (cf. I.2).
2πi ∂t
¿Qué podemos decir en estas condiciones de un sistema que se encuentra en
el estado ϕ ?
Observemos ante todo que ϕ está normalizada (I, 3) por la condición
∞ ∞
∫ ∫
2
… ϕ (q1, …, qk dq1, …, dqk = 1,
−∞ −∞
es decir, usando de la terminología introducida, ϕ es un punto del espacio hilber-

tiano E∞ de todas las funciones f (q1, …, qk) tales que la
∞ ∞
∫ ∫
2
… f (q1, …, qk dq1, …, dqk
−∞ −∞
es convergente (¡punto de un FΩ!) sujeto a la condición ∙∙ϕ ∙∙ = 1; o con otras pa-

labras: ϕ está situado en la esfera del E∞ de radio unidad.117 Sabemos ya que un
241
Fund_MAT_03.indd 241 7/5/18 14:18

factor constante (esto es, independiente de (q1, …, qk) en la expresión de ϕ carece

de significación física (o lo que es lo mismo, está falto de ella el sustituir ϕ o por
aϕ, cuando a es un número complejo. Si en esta sustitución se ha de conservar
∙∙ϕ ∙∙ = 1, debe ser ∙a ∙ = 1). Hay que hacer observar, además, que ϕ, aparte de su
dependencia de las coordenadas q1, …, qk del sistema en el espacio de los estados,
depende también del tiempo, aunque éste no interviene en la construcción del
espacio de Hilbert, la cual se lleva a cabo atendiendo sólo a las q1, …, qk (a éstas
solamente se refería, en efecto, la normalización): no hemos de tomar en cuenta
a t en dicha construcción, sino más bien debemos concebirlo como un parámetro.
La función ϕ, como punto del E∞, depende, por lo tanto, sólo de t y es indepen-
diente de las q1, …, qk; y ello es así, porque en ϕ se piensa la totalidad de sus
valores al recorrer q1, …, qk el espacio de los estados, en atención a lo cual pon-
dremos de manifiesto el parámetro t en ϕ, concebido como punto del E∞, con la
notación ϕt.
Consideremos ahora el estado ϕ (q1, …, qk). El enunciado estadístico que es-
tamos entonces en condiciones de formular reza así: ∙ϕ (q1, …, qk)∙2 define la den-
sidad de probabilidad de presencia del sistema en los puntos q1, …, qk del espacio
de los estados; es decir, la probabilidad de que se encuentre en la porción V de
dicho espacio es:
∫ … ∫ ϕ (q ,…, q ) dv
2
1 k
V
(Este es uno de los primeros y más sencillos ejemplos en los que se recono-
ció el carácter estadístico de la Mecánica cuántica;118 es clara, por lo demás, la
conexión de este enunciado con la hipótesis de Schrödinger relativa a la dis
tribución de la carga, cf. I, 2.) Además, cuando la energía del sistema posee el
operador H y éste a su vez los valores propios λ1, λ2, … y las funciones propias
ϕ1, ϕ2, …, la probabilidad en el estado ϕ del valor de la energía λn es igual a
2
∫ … ∫ ϕ (q1 ,…, qk )ϕn (q1 ,…, qk )dq1 … dqk (cf. las memorias citadas en la Nota 118.)
Veamos de transformar ambos enunciados y reducirlos a una forma común.
Sea V el cubo k-dimensional
q'1 < q1 ≤ q" … q

1 'k < qk ≤ q'',
k
e Il …, Ik los intervalos {q1', q1"}, …, {q',

k q''},
k respectivamente. A las coordenadas
q1 …, qk corresponden los operadores q1…, …, qk…, cuyas descomposiciones de la
unidad están así definidas (cf. II.8): llamemos Ej(l) la perteneciente a qj… ( j = 1,
2, …, k); se tiene en tal caso
{
Ej(l) f (q1, …, qk) = f (q1, …, qk), para qj ≤ l
0 , para qj > l
242
Fund_MAT_03.indd 242 7/5/18 14:18

Convengamos en que si F (l) es una descomposición de la unidad e I un interva-

lo {l', l'' }, F(I) signifique el operador F (l'' ) − F (l' ), el cual, supuesto l' < l'', de
donde F (l' ) ≤ F (l'' ), es un operador de proyección.
La probabilidad de que el sistema se encuentre en el V arriba definido, es de-
cir, q1 en I1 …, qk en Ik es:
q''1 q''k
∫ …∫ ϕ (q ,… q ) dq … dq =
2
1 k 1 k
q'1 q'k
= ∫ … ∫ E (I )… E (I )ϕ (q ,… q ) dq … dq =
2
1 1 k k 1 k 1 k
2
= E1(I1)… Ek (I k )ϕ .
ya que E1(I1) … Ek(Ik) j (q1, …, qk) es igual a j (q1, …, qk) cuando q1 pertenece a
I1, … y qk a Ik, e igual a 0 en los restantes casos.
Consideremos ahora la probabilidad de que la energía se halle en el intervalo
I = {l' l'' }. La descomposición de la unidad E(l) que corresponde a H es (cf. II.8)
E(l) = ∑ P ⎡⎣ϕn ⎤⎦ y, por consiguiente,
λn ≤ λ
E (I ) = E (λ'' ) − E ( λ' ) = ∑ P ⎡⎣ϕn ⎤⎦

λ' < λn ≤ λ''
Ahora bien, dado que los únicos valores de la energía que entran en cuenta
son la, l2, …, dicha probabilidad es la suma de las probabilidades de todos los
valores ln tales que l' < ln ≤ l'' y, por ende,
2
∑ ∫ … ∫ ϕ (q1, …, qk )ϕn (q1, …, qk ) dq1 … dqk ∑
2
= (ϕ , ϕn ) =
λ' < λ ≤ λ''
n λ' < λn ≤ λ''
∑ (P[ϕn ]ϕ , ϕ ) = ⎛
{ ∑ }
P[ϕn ] ϕ , ϕ ⎞ = (E (I )ϕ , ϕ ) = E (I )ϕ .
2
=
λ' < λn ≤ λ''
⎜⎝ λ' < λn ≤ λ''
⎟⎠
Tanto en uno como en otro caso hemos obtenido un resultado que puede
formularse en los siguientes términos:
(P). La probabilidad de que en el estado j las magnitudes a las que corres-
ponden los operadores R1, …, Ri119 tomen valores contenidos en los intervalos I1
…, Ii, respectivamente, es
∙∙E1(I1) … Ei(Ii)j ∙∙2,
donde E1(l), …, Ei(l) son las descomposiciones de la unidad correspondientes a

R1 …, Ri.
243
Fund_MAT_03.indd 243 7/5/18 14:18

El primer caso responde a l = k, R1 = q1…, …, Rk = qk…, el segundo a l = 1 y

R1 = H. Admitiremos en calidad de hipótesis la validez general de la proposición P,
que de hecho contiene todos los enunciados de carácter estadístico de la Mecáni-
ca cuántica sentados hasta ahora.
Con todo, es necesaria una limitación a su validez: pues que en el planteo del
problema el orden de sucesión de los R1 …, Ri es totalmente indiferente, tal debe
suceder en el resultado; es decir, los E1(I1), …, Ei(Ii), o también, todos los E1(l1),
…, Ei(li) deben ser permutables entre sí. Esta condición se cumple para q1…, …,
qk…; para l = 1 y R1 = H, carece incluso de objeto.
Por lo tanto, postulamos la validez general de P para todos los operadores
permutables R1, …, Ri. En tal caso E1(I1), …, Ei(Ii) son permutables, y por este
motivo, E(I1) … Ei(Ii) es un operador de proyección (teorema 14, en II.4), de modo
que dicha probabilidad puede escribirse
P = ∙∙E1(I1) … Ei(Ii)j ∙∙2 = [E1(I1) … Ei(Ii)j, j]
(teorema 12 en II.4).
Antes de proseguir, debemos comprobar si se dan en P ciertas propiedades que
ha de presentar toda teoría estadística plena de sentido:
1. El orden de las aserciones es indiferente.

2. Una aserción trivial —esto es, tal que el correspondiente intervalo Ij es
igual a {−∞, ∞}— puede siempre ser añadida sin que se altere por ello el valor de
P, puesto que sólo da lugar a la aparición de un factor
Ej (I ) = E (+∞) − E (−∞) = 1 − 0 = 1.
3. Es válido el teorema de adición de las probabilidades, es decir, si descom-

ponemos un intervalo Ij en dos intervalos I'j, I''j, la antigua probabilidad es suma
de las dos nuevas. En efecto: sean Ij, I'j, I''j, iguales, respectivamente, a {l', l'' }
{l', l}, {l, l'' }; se tiene:
E (l'' ) − E (l' ) = (E (l) - E (l' )) + (E (l'' ) - E (l)),
es decir, E(Ij) = E(I'j) + E(I''j), de lo que resulta, atendiendo a la segunda de las

dos formas dadas para P [que es lineal en E1(I1) … Ej(Ij) … Ei(Ii)], el teorema de
adición de probabilidades.
4. Para una aserción absurda —un Ij = {0}— es P = 0, puesto que entonces
el correspondiente Ej(Ij) = 0. Para una aserción evidente —todos los Ij iguales a
{-∞, ∞}— es P = 1, pues en tal caso todos los Ej(Ij) = 1 y P = ∙∙j ∙∙2 = 1. Por razón
del teorema 13 en II.4, siempre es 0 ≤ P ≤ 1.
Indicaremos finalmente que P implica la proposición según la cual una mag-
nitud Rj únicamente puede tomar como valores sus valores propios, esto es, los
244
Fund_MAT_03.indd 244 7/5/18 14:18

números de su espectro. En efecto: si el intervalo Ij = {l', l'' } es exterior a éste,

Ej(l) es constante en el intervalo y
Ej (Ij) = Ej (l'' ) - Ej (l' ) = 0,
de donde se sigue P = 0.
Hagamos l = 1 y R1 = R, y sea R la magnitud física a la que está coordinado
R (cf. Nota 119). Dada una función F (l) cualquiera, se trata de calcular el valor
medio de F (R).
A este fin, dividamos el intervalo {-∞, +∞} en una sucesión de intervalos par-
ciales {ln, ln + 1}, n = 0, ±1, ±2, … La probabilidad de que R se encuentre en
{ln, ln + 1}* es:
[{E (ln + 1) - E (ln)}j, j] = [E (ln + 1)j, j] - [E (ln)j, j],
y, por consiguiente,
∞
∑ F (λ'n ){[E (λn +1)ϕ , ϕ ] − [E (λn )ϕ , ϕ]}
n = −∞
es el valor medio de F (R), si l'n es un apropiado valor intermedio de {ln, ln + 1}. Si

elegimos cada vez más tupida la división …, l-2, l-1, l0, l1, l2, las sumas conver-
gen hacia la integral de Stieltjes
∫−∞
F (λ)d[E (λ)ϕ , ϕ],
a la que, por lo tanto, es igual el valor medio buscado. Ahora bien, basándonos en
la definición general de las funciones de operador (II.8), podemos afirmar que esta
integral es igual a [F (R) j, j]. Luego, resumiendo:
(V1) Sea R una magnitud física cualquiera, R su operador (cf. Nota 119) y F (l)

una función arbitraria. En estas condiciones, el valor medio de F (R) en el estado
j es:
Vm[F(R); j] = [F (R )j, j].
En particular, sea F(l) = l y
* Para abreviar, diremos que una magnitud física está en o se encuentra en un intervalo cuando
toma uno cualquiera de los valores de dicho intervalo. (N. del T.)
245
Fund_MAT_03.indd 245 7/5/18 14:18

(V2) sean R y R, como antes, una magnitud física y su operador. En tal caso

el valor medio de R en el estado j es:
Vm[R ; j] = [Rj, j].
En lo que sigue debemos investigar las relaciones existentes entre P, V1 y V2.
De estas tres proposiciones, la segunda, V1, la dedujimos de la primera, P, y la
tercera, V2, de la segunda, V1.
Sirvámonos de la letra S para representar el operador de f (R); de la compara-
ción de V1, V2 resulta
(S j, j) = [F (R) j, j]
para todo estado j, es decir, para todo j de ∙∙ϕ ∙∙ = 1. Por consiguiente, en gene-
ral es
(Sf , f ) = [F (R ) f , f ]
⎛ 1 ⎞
⎜⎝ para f = 0 es evidente; si f ≠ 0, basta hacer ϕ = f f ⎟⎠ y de aquí que también sea
(Sf , g) = [F (R) f , g]
⎛ f +g f −g
⎜⎝ para demostrarlo, sustitúyase primero f por , después por y réstese:
2 2
resulta así la igualdad de las partes reales; substitúyase en esta última f y g por if y
g, con lo que quedará de manifiesto la igualdad de las partes imaginarias). Luego
S = F(R).
(F). Si la magnitud R tiene como a operador el R, la magnitud F(R) debe
poseer como a tal el operador F(R).
Supuesto cierta (F), evidentemente se sigue V1 de V2, es decir, V1 y V2, en esta
hipótesis, son equivalentes. Pero hay más: V1 y V no sólo son entre sí equivalentes,
2
sino que cada una equivale a P. Dado que ambas se deducen de P, bastará demos-
trar que ésta se sigue de cualquiera de ellas.
En efecto: sean R1, …, Rl operadores permutables que corresponden a las mag-
nitudes R1, …, Rl , respectivamente. Según II.10, todos ellos son funciones de un
mismo operador hermítico R:
R1 = F1(R), …, Rl = Fl (R).
Admitamos que también R pertenece a una magnitud, R (establecemos, por lo
tanto, la hipótesis de que a cada magnitud R corresponde un operador hermítico
hipermáximo R, y recíprocamente. Cf. Nota 119 y IV.2). En virtud de F es entonces
R1 =F1(R), …, Rl = Fl (R).
246
Fund_MAT_03.indd 246 7/5/18 14:18

Sean I1, …, Ii los intervalos de que se habla en P, y

para l en I
Gj(l) = {01 en caso contrario}
j
(j = 1, …, l )
Introduzcamos
H(l) = G1[F1(l)] … Gi[Fi(l)]
y la magnitud
S = H(R)
Cuando Rj está en Ij, es decir, Fj(R) en Ij, Gj[Fj(R)] es igual a 1, y cuando no,
igual a 0. Por lo tanto, S = H(R) es igual a 1 si todas las Rj están en sus respectivos
Ij (j = 1, …, l ), e igual a cero cuando así no ocurre. El valor medio de S, por ende,
es igual a la probabilidad P de que R1, esté en I1 R2 en I2, …, y Ri en Il, esto es,
P = Vm(S, j) = [H(R)j, j] = {G1[F1(R)] … Gi[Fi(R)]j, j }
= [G1(R1) … Gi(Ri)j, j].
Ahora bien, si Ej(l) es la descomposición de la unidad asociada a Rj e Ij es el
intervalo {l'j, l''j} por lo dicho al final de II.8 y con la notación allí usada podre-
mos escribir:
Gj (l) = el'' (l) - el' (l)
j j
Gi(Ri) = el'' (Rj) - el' (Rj) = Ej(l''j) - Ej(l'j) = Ej (Ij);

j j
luego
P = [E1(I1) … Ei(Ii)j, j]
que es justamente P.
Por la simplicidad de su forma, V2, y F son particularmente apropiadas para
considerarlas como los fundamentos sobre los que se construye toda la teoría.
Hemos visto cómo de ellas se sigue el más general enunciado probabilístico posi-
ble, P, enunciado éste que resulta chocante en dos aspectos:
1. P es de carácter estadístico y no causal, es decir, no se precisa qué valores
poseen R1 …, Ri en el estado j, sino con qué probabilidad toman los diferentes
valores posibles.
2. La cuestión que se plantea en P no puede ser contestada para magnitudes
cualesquiera R1, …, Rl , sino para aquéllas solamente cuyos operadores R1 …, Rl
son permutables entre sí.
Nuestra misión inmediata es, precisamente, discutir el significado de estos dos
hechos.
247
Fund_MAT_03.indd 247 7/5/18 14:18

2. La interpretación estadística
La Mecánica clásica es una disciplina causal, esto es, en ella, cuando se conoce
exactamente el estado del sistema —para lo cual, si es k el numero de grados de
libertad, son necesarios 2 k datos numéricos: las k coordenadas q1, …, qk en el
dq dq
espacio de los estados y sus k derivadas temporales 1 …, k , o, en vez de éstas,
dt dt
los k impulsos p1 …, pk— se puede precisar exacta y unívocamente el valor numé-
rico de cada una de las magnitudes físicas (energía, momento cinético, etc.). Cier-
to es que existe una manera de proceder estadística en Mecánica clásica; pero ésta
es, por decirlo así, un lujo, un aderezo: cuando no se conocen los 2 k parámetros
determinantes (q1 …, qk, p1 …, pk), sino tan sólo algunos de entre ellos y aun és-
tos no del todo exactamente, cabe sentar enunciados por lo menos de carácter
estadístico relativos a todas las magnitudes físicas, promediando en cierto modo
sobre los que permanecen desconocidos. Algo por este estilo vale para los estados
del sistema pasados o futuros: si se conocen los valores de q1 …, qk, p1, …, pk co-
rrespondientes al instante t = t0, las ecuaciones del movimiento clásicas permiten
calcular (causalmente) sus valores en cualquier otro instante t; si sólo se conoce
una parte de los mismos, hay que promediar sobre los demás y los únicos enun-
ciados que es posible establecer relativos a otro instante son de carácter estadís
tico.120
Las proposiciones estadísticas que encontramos en la Mecánica cuántica tienen
un muy otro carácter. En ésta (en el caso de k grados de libertad) el estado del
sistema se caracteriza por una función de onda j (q1, …, qk), es decir, por un pun-
to j del E∞ convenientemente construido (∙∙ϕ ∙∙ = 1; un factor numérico en j de
valor absoluto igual a la unidad carece de importancia). Y aunque suponemos que
tras especificar j se conoce ya por completo el estado del sistema, sin embargo j
justifica sólo enunciados estadísticos acerca de los valores de las magnitudes físicas.
Es menester advertir, con todo, que este carácter estadístico está limitado a las
previsiones de valores de magnitudes físicas, pues los estados pretéritos y por venir
ϕt se pueden calcular causalmente a partir de ϕt = j la ecuación temporal de
Schrödinger (Cf. 1.2) lo hace posible en efecto, porque
h ∂
jt = j, j = -Hjt,
0
2πi ∂t t
determinan la evolución toda de ϕt. La resolución de esta ecuación diferencial es

posible, incluso en forma explícita, merced a la fórmula
2πi (t - t )H
jt = e - h 0
j
2πi
(el operador e - h (t - t )H es unitario)121 cuando H es independiente del tiempo. De
0
todos modos, y aun cuando H dependa de él, jt está unívocamente determinado,

pues la ecuación es de primer orden en t; no existe, empero, en este caso una fór-
mula de resolución tan sencilla.
248
Fund_MAT_03.indd 248 7/5/18 14:18

Cuando se quiere explicar el carácter no causal del enlace entre ϕ y los valores
de las magnitudes físicas según el ejemplo de la Mecánica clásica, la interpretación
evidentemente más indicada es la que sigue: En realidad ϕ no determina en modo
alguno el estado exactamente; para conocer éste en su integridad son necesarios
todavía otros datos numéricos. Es decir, junto a ϕ el sistema posee aun otros ele-
mentos determinantes, otras coordenadas; si se conocieran todos, cabría indicar
exactamente y con certeza los valores de todas las magnitudes físicas; con sólo la
ayuda de ϕ, por el contrario, y al igual que sucedía en la Mecánica clásica a base
de una parte de las q1 …, qk, p1, …, pk, únicamente son posibles enunciados esta-
dísticos. Claro está que esta interpretación es meramente hipotética; es una tenta-
tiva cuyo valor depende de si se consigue de hecho dar con las otras coordenadas
asociadas a ϕ y construir con su ayuda una teoría causal que concuerde con la
experiencia y de la que, cuando se parte de ϕ como único dato (y se promedie
sobre las restantes coordenadas), resulten de nuevo las proposiciones estadísticas
de la Mecánica cuántica.
Se suelen llamar «coordenadas ocultas» o «parámetros ocultos» a esas otras
coordenadas hipotéticas, porque deberían desempeñar un papel muy encubierto
al lado de ϕ, la única que ha puesto de manifiesto hasta ahora la investigación. El
acudir a parámetros ocultos, ha permitido en la Física clásica reducir al principio
causal de la Mecánica más de un comportamiento en apariencia estadístico —un
ejemplo típico lo constituye la teoría cinética de los gases— (cf. Nota 120).
Es una cuestión muy debatida la de si viene al caso una tal explicación para la
Mecánica cuántica. La opinión de que día vendrá en que deberá ser contestada en
sentido afirmativo, tiene aun hoy distinguidos mantenedores. De estar justificada,
debiera considerarse como estadio provisional la forma que en la actualidad mues-
tra la teoría, pues la descripción de los estados mediante la función ϕ sería esen-
cialmente incompleta.
Demostraremos más adelante (IV.2) que la introducción de parámetros ocultos
es con seguridad imposible, a menos de alterar en su esencia la teoría actual. De
momento nos limitaremos a indicar que ϕ difiere esencialmente de los sistemas
parciales de las q1, …, qk, p1, …, pk de la Mecánica clásica en que su dependencia
del tiempo es causal y no estadística: jt . determina unívocamente, conforme vi-
0
mos, todas las ϕt.

Hasta tanto un análisis más exacto de los enunciados de la Mecánica cuántica
no nos ponga en condiciones de examinar objetivamente la posibilidad de la in-
troducción de parámetros ocultos, lo que ocurrirá en el lugar citado más arriba,
renunciamos a esta posible explicación.
Adoptaremos, pues, el punto de vista opuesto, es decir, nos someteremos al
hecho de ser de carácter estadístico aquellas leyes de la Naturaleza que regulan los
procesos elementales, esto es, las leyes de la Mecánica cuántica. (La causalidad del
mundo macroscópico puede resultar, en todo caso, como apariencia provocada por
la acción niveladora de la «ley de los grandes números», acción que llega a ser
sensible cuando muchos de tales procesos actúan a la vez. Cf. la observación hecha
al final de las notas 120 y 175.) En atención a lo que precede, reconoceremos la pro-
249
Fund_MAT_03.indd 249 7/5/18 14:18

posición P (o también V2) como el más amplio enunciado relativo a los procesos
elementales.
Es precisamente a esta concepción de la Mecánica cuántica, concepción que
reconoce en los enunciados estadísticos de la misma la forma real de las leyes na-
turales y en la que se renuncia a la causalidad, a la que nos referimos cuando ha-
blamos de una interpretación estadística de dicha Mecánica. Esta interpretación,
debida a M. Born,122 de la Mecánica cuántica, es decir, de la suma de nuestras
experiencias relativas a los procesos elementales, es la única hoy susceptible de un
desarrollo consecuente y a ella nos atendremos en lo que sigue hasta tanto no po-
damos emprender la discusión detallada de ese estado de cosas.
3. Mensurabilidad simultánea y mensurabilidad

en general
La segunda circunstancia que habíamos señalado como chocante al final
de III.1., se hallaba en íntima relación con el hecho de que P no sólo nos in
formaba acerca de las probabilidades de que una magnitud tome ciertos valores
dados, sino también acerca de las conexiones probabilísticas entre varias magnitu-
des R1, …, Rl : P, en efecto, nos indicaba las probabilidades de que, en un mismo
estado j, dichas magnitudes tomasen simultáneamente ciertos valores prefijados
(más exactamente, de que R1, …, Rl estuviesen en determinados intervalos I1 …, Ii).
Pero estas magnitudes veíanse sometidas a una singular limitación: sus operadores
R1, …, Rl debían ser permutables. En cambio, ninguna información nos daba P
acerca de la interdependencia probabilística de R1, …, Rl cuando R1, …, Rl no son
permutables. En este caso, sólo cabía aplicar P a la determinación de la distri
bución de probabilidad para cada una de las magnitudes en sí, sin atender a las
demás.
Lo más sencillo sería admitir que eso no es sino una imperfección de P y que
debe haber una fórmula más general que abarque también esos casos. Porque, aun
cuando la Mecánica cuántica proporcione tan sólo informaciones de carácter es-
tadístico tocante a la Naturaleza, con todo lo menos que podemos esperar de ella
es que describa, no únicamente las estadísticas de las magnitudes por separado,
sino que incluya asimismo las correlaciones entre varias de ellas.
Sin embargo, en contra de esta concepción que a primera vista parece razona-
ble, veremos desde luego que una tal generalización de P no es posible, y que
junto a motivos formales (que descansan en la propia estructura del instrumento
matemático de la teoría), los cuales hablan en favor de semejante limitación, los
hay también, y de mucho peso, de índole física. Su necesidad, como también su
interpretación física, nos permitirán incluso un examen somero aunque esencial
de la naturaleza íntima de los procesos elementales.
Para conseguir una cierta claridad sobre este punto, hay que considerar más
de cerca qué significación tiene para el modo de describir propio de la Mecánica
cuántica el proceso de medición de una magnitud R acerca del cual P permite
enunciados probabilísticos.
250
Fund_MAT_03.indd 250 7/5/18 14:18

Señalemos primero un importante experimento que llevaron a cabo Compton

y Simons aun antes del establecimiento de la Mecánica cuántica.123 En él se hizo
difundir luz por los electrones y el examen cuantitativo del proceso de difusión se
efectuó captando luego la luz difusa y los electrones dispersados y midiendo su
energía y su impulso. Es decir, en el curso del experimento ocurrían choques entre
quanta luminosos y electrones, y el observador podía determinar si se cumplían
las leyes del choque elástico midiendo sus trayectorias después del choque. (No
cabía considerar sino choques elásticos, pues se supuso que ni el electrón ni el
quantum de luz pueden tomar energía en otra forma que no sea en la de energía
cinética. Tanto el uno como el otro, en toda experiencia parecen comportarse,
efectivamente, como estructuras invariables. El cálculo debe conducirse, claro está,
relativísticamente).123 Una tal comprobación numérica a posteriori era posible de
hecho, pues se conocían las trayectorias antes del choque y eran observadas después
de éste; se poseían, por lo tanto, incluso más datos de los que requiere el problema.
Para resolverlo desde el punto de vista mecánico bastan, en efecto, dos de estas
cuatro trayectorias y la «línea central» del choque (la dirección en que se produce
la transferencia de impulso), en todo caso, por ende, tres trayectorias: la cuarta es
la que sirve de comprobación. El experimento mostró una plena confirmación de
las leyes mecánicas del choque.
Si se acepta la validez de estas leyes y se consideran conocidas las trayectorias
antes del choque, este resultado puede también formularse diciendo que tanto la
medición de la trayectoria del quantum de luz después del choque como la medi-
ción de la correspondiente al electrón, bastan para poder calcular el lugar y la línea
central del choque. Ahora bien, el experimento de Compton-Simons muestra que
estas dos observaciones dan lugar al mismo resultado. Formulado de modo gene-
ral: la misma magnitud física (a saber, una coordenada cualquiera del punto en
que se produce el choque, o de la dirección de la línea central) es medida de dos
maneras diferentes (capturando el quantum de luz y capturando el electrón), pero
el resultado es siempre el mismo.
Estas dos mediciones no tienen lugar del todo simultáneamente (el quantum
de luz y el electrón no llegan a la vez, e incluso mediante una disposición apro-
piada del aparato de medición puede recibirse primero aquel de los dos que se
quiera; por supuesto que se trata de diferencias de tiempo pequeñísimas, 10-9 a
10-10 segundos); sean M1 la primera, M2 la segunda y R la magnitud medida. Es
esencial advertir que, aunque todo el dispositivo es tal que antes de la medición
sólo se pueden hacer previsiones estadísticas acerca de R, es decir, acerca de M1,
M2 (cf. loc. cit. Nota 123), la correlación estadística entre M1 y M2 es absolutamen-
te precisa (causal): el valor R de M1 es exactamente igual al de M2. Antes de las
mediciones M y M2, ambos resultados son, por consiguiente, ampliamente inde-
1
terminados; sin embargo, después que M1 ha tenido lugar, pero aun no M2, el
resultado de M2 está ya unívoca y causalmente determinado.
Desde un punto de vista sistemático podemos decir que son concebibles tres
grados de causalidad o no-causalidad. Primero: el valor de R pudiera ser del todo
estadístico, es decir, sólo estadísticamente previsible el resultado de una medición;
251
Fund_MAT_03.indd 251 7/5/18 14:18

y cuando inmediatamente después de la primera medición se llevase a cabo una

segunda, acaso ésta, independientemente del valor hallado en aquélla, muestre de
nuevo un carácter disperso; por ejemplo, podría eventualmente presentar una dis-
persión tan fuerte como la primera. Segundo: cabe concebir que el valor de R es
ciertamente disperso en la primera medición, pero cualquiera otra que la siga in-
mediatamente, se ve constreñida a dar un resultado que coincida con el de la
primera.121 Tercero: R podría estar causalmente determinada de antemano.
El experimento de Compton y Simons muestra que en una teoría estadística
sólo entra en consideración el segundo caso. Por lo tanto, cuando el sistema se
halla inicialmente en un estado en el cual no puede predecirse con seguridad el
valor de R, el efectuar una medición M de R (M1 en el anterior ejemplo) provoca
el paso a otro estado, precisamente a uno en que el valor de R está fijado unívo-
camente. El nuevo estado al que M lleva al sistema depende, no sólo de cómo se
ha dispuesto M, sino también de la medida que de ella resulta, medida que no era
previsible causalmente en el estado primitivo; y ello es así, porque el valor de R en
el nuevo estado debe ser igual precisamente al resultado de la medición M.
Sentado esto, sea R una magnitud a cuyo operador R corresponde un espectro
discreto puro l1, l2, … y las funciones propias j1, j2, …, las cuales, por ende,
constituyen un sistema ortonormal completo. Supongamos, además, que cada
valor propio es simple (es decir, de orden de multiplicidad igual a 1, cf. II.6), de
modo que lm ≠ ln para m ≠ n, y que hemos medido R y hallado un valor l*. ¿Cuál
es el estado del sistema después de la medición?
Por lo que hemos dicho, este estado j debe ser tal que al repetir la medición
de R resulte con certeza l*. (Claro está que la nueva medición ha de efectuarse
2πi
inmediatamente, pues al cabo de t segundos j se ha convertido en e - h t ⋅ H j,
donde H es el operador de la energía. Cf. III.2.)
Contestaremos a esta cuestión, de cuándo en el estado j la medición de R da
como resultado l*, de modo general, sin hacer hipótesis restrictivas acerca del
operador R.
Sea, pues, E(l) la descomposición de la unidad que pertenece a R e I un in-
tervalo {l', l'' }. Nuestro supuesto puede también formularse diciendo que R está
en I con probabilidad 0, si éste no contiene l*; o, si se quiere, con probabilidad
1, si l* pertenece a I, es decir, si es l' < l* < l''.
En virtud de P, esto equivale a que ∙∙E(I )j ∙∙2 = 1, o también, pues ∙∙j ∙∙ = 1 a
que ∙∙E(I )j ∙∙ = ∙∙j ∙∙. Ahora bien, dado que tanto E(I ) cuanto 1 - E(I ) son opera-
dores de proyección, el teorema 13 (II.4) nos permite escribir
∙∙j - E(I )j ∙∙2 = ∙∙j ∙∙2 - ∙∙E(I )j ∙∙2 = 0,

j - E(I )j = 0
de donde
E(l'' )j − E(l' )j = E(I )j = j
252
Fund_MAT_03.indd 252 7/5/18 14:18

y por lo tanto, para l' → -∞,
E(l'' )j = j,
y para l'' → +∞,
E(l' )j = 0
(Cf. S1, II.7). Por consiguiente,
E(l)j = ϕ, para l ≥ l* ,
{ ∣
0, para l < l*
condiciones éstas que, de acuerdo con II.8, caracterizan precisamente la validez de

la igualdad Rj = l*ϕ.
Otro camino para llegar a la demostración de Rj = l*ϕ descansa en V1 (esto
es, en V2). Decir que R tiene con certeza el valor l*, es decir que es cero el valor
medio de (R - l*)2, magnitud ésta a la, que corresponde el operador F(R), si F(l)
= (l - l*)2, o sea F(R) = (R - l*. 1)2; luego, debe ser
[(R - l* · 1)2j, j] = [(R - l* · 1)j, (R - l* · 1)j] = ∙∙(R - l* · 1)j ∙∙2 =

= ∙∙(Rj - l*j ∙∙2 = 0,
de donde
Rϕ = l*ϕ.
Vemos, pues, que en el caso particular antes tratado debe ser Rϕ = l*ϕ, lo que
tiene por consecuencia, conforme se vio en II.6, el haber de coincidir l* con un
lm (por ser ∙∙j ∙∙ = 1 es ϕ ≠ 0) y ϕ con ajm. El factor a debe ser tal que ∙a∙ = 1,
porque ∙∙j ∙∙ = 1 = ∙∙jm∙∙; luego podemos prescindir de él sin alterar la definición
del estado. Resumiendo: en el caso de un espectro discreto puro, necesariamente
es l* = lm y ϕ = ϕm para un cierto m = 1, 2, … (El resultado relativo a l* pudie-
ra también deducirse directamente de P, pero no el correspondiente a ϕ .)
En la hipótesis anterior acerca de R, una medición de R, por lo tanto, provoca
la transición de cada estado y a uno de los estados j1, j2, …, que se encuentran
vinculados a las medidas posibles l1, l2 … Las probabilidades de estos tránsi-
tos son iguales, por tal razón, a las probabilidades de que de la medición resulten
l1 ó l2, …, y pueden así ser calculadas a partir de P.
La probabilidad de que el valor de R pertenezca a I es, según P, ∙∙E(I )y ∙∙2 y
también
∑ ∑
2 2
P = E (I )ψ = [E (I )ψ , ψ ] = (P[ϕn ]ψ ,ψ ) = (ψ , ϕn ) ,
λn en I λn en I
253
Fund_MAT_03.indd 253 7/5/18 14:18

si tenemos en cuenta que, de acuerdo con (II.8), E (I) = ∑ P[ϕn]. Cabe, pues, sos-
λn en I
pechar que la probabilidad del valor ln sea ∙(y, jn)∙2. Siempre que podemos ele
gir I de modo que la única lm que exista en él sea justamente ln, nuestra conje-
tura se trueca en certeza a consecuencia de la fórmula que precede. Cuando así no
ocurre (es decir, cuando ln es un punto de acumulación de valores propios lm)
se procederá, por ejemplo, de la siguiente manera: Sea F(l) = 1 para l = ln e
igual a 0 para l ≠ ln; la probabilidad buscada Pn es el valor medio de F(R), esto
es [F(R)y, y ] (según V2 ó V1). Ahora bien, por definición
∞
∫ F (λ)d ⎡⎣ E (λ)ψ ⎤⎦ ,
2
[F (R)ψ , ψ ] =
−∞
y se reconoce con facilidad, al recordar la noción de integral de Stieltjes, que (F(R)

y, y) es cero si E(l)y es continua para l = ln (¡continua respecto de l!), e igual
al salto de la función de l monótona no decreciente: ∙∙E(l)y ∙∙2 en el punto l = ln,
en general. Este salto vale precisamente ∙∙PMy ∙∙2, si M es la variedad lineal cerrada
definida por todas las soluciones de Rj = lnj (cf. II.8). En el caso que considera-
mos es M = [jn] y, por lo tanto,
Pn = ∙∙P[j ]y ∙∙2 = ∙(y, jn)∙2.

n
Con esto queda contestada la pregunta acerca de qué acontece cuando se mide
una magnitud R en cuyo operador R se cumplen las hipótesis arriba indicadas.
Cierto es que el «cómo» queda sin aclarar: ese tránsito discontinuo, a modo de
salto desde hasta uno de los estados j1, j2, …, (independientes éstos de y, pues
sólo en las respectivas probabilidades Pn = ∙(y, jn)∙2, n = 1, 2, …, de dichos saltos
figura el estado y), con seguridad es de una muy otra índole que el descrito por
la ecuación temporal de Schrödinger: ¡ésta da lugar siempre a un cambio continuo
de y, cuyo resultado final está unívocamente determinado y depende de y ! (Cf.
lo dicho en III.2). Mucho más adelante, en VI, intentaremos tender un puente
sobre este abismo.125
Admitamos ahora que R, aun poseyendo un espectro discreto puro, acaso pre-
sente en él valores propios múltiples. De nuevo podemos formar j1, j2, … y l1, l2,
…, pero entre los ln puede haberlos iguales entre sí. Tras una medición de R de la
que resultó el valor l*, el estado j del sistema es tal que Rj = l*j y, por lo tanto,
l* coincide con alguno de los ln. Por lo que respecta a j, sólo cabe afirmar que, si
ln1, ln2, … son los ln guales a l* (en número finito o infinito), necesariamente es
ϕ = ∑ aν ϕnν .
ν
(Si n = 1, 2, …, ∞, debe ser convergente la serie ∑ aν ). Dos de tales j represen-

2
ν
tan el mismo estado sólo cuando difieren en un factor numérico, es decir, cuando
254
Fund_MAT_03.indd 254 7/5/18 14:18

la razón a1 : a2 : … es la misma. Luego, tan pronto como exista más de un nn, esto
es, cuando l* sea múltiple, no queda unívocamente fijado el estado j subsiguien-
te a la medición por el conocimiento de la medida.
Exactamente igual que antes (aplicando P, o también V1 o V2) se calcula la
probabilidad de l*:
∑ (ψ , ϕn ) = ∑ (ψ , ϕnν )
2 2
P(λ *) =
λn = λ * ν
He aquí cómo se presentan las cosas cuando R no posee un espectro discreto

puro:
El conjunto de todas las soluciones f de Rf = lf define como extensión— li-
neal cerrada una variedad Ml, y todas las Ml, a su vez, otra más amplia— M .
Lo que caracteriza
– — la no existencia de un espectro discreto puro es que M ≠ E∞, es
decir, N = E∞ - M ≠ (0). (Cf. II.8, tanto por lo que respecta a este punto como a
lo que sigue.) Ml es ≠ (0) como máximo para un conjunto numerable de valores
de l, valores éstos que constituyen el espectro discreto de R. Si se mide R en el
estado y la probabilidad de que resulte el valor l* es:
P(l*) = ∙∙PM * y ∙∙2 = (PM * y, y );

l l
a esta relación se llega del modo más cómodo aplicando el resultado utilizado más
arriba, que se apoya en V2 (o V1) y en la función
F(l) = 1, para l = l* .
{ ∣
0, para l ≠ l*
La probabilidad de que el valor de R sea un l* cualquiera del espectro discreto D

de R es, conforme a esto,
∑
2
P= (PMλ *ψ , ψ ) = (PMψ , ψ ) = PMψ ,
λ *en D.
lo que puede verse también directamente con ayuda de la función
{
F(l) = 1, para l* punto de D .
0, en caso contrario ∙
Ahora bien, cuando medimos R exactamente, inmediatamente después de la
medición debe presentarse un estado ϕ tal que Rj = l*j, es decir, su resultado l*
debe pertenecer al espectro discreto D; luego, la probabilidad de conseguir una
—y ∙∙2. Este número, empero, no siempre es igual
medida exacta es, a lo sumo, ∙∙PM –
a 1, e incluso es 0 para los y que son elementos de N. Con otras palabras: una
medición exacta no siempre es posible.
255
Fund_MAT_03.indd 255 7/5/18 14:18

Resumiendo: la condición necesaria y suficiente para que una magnitud R sea

siempre exactamente medible (esto es, en cada estado y) es que posea un espectro
discreto puro. Cuando no lo posee, sólo cabe medirla con una exactitud limitada,
es decir, se puede dividir la recta numérica -∞ < l < +∞ en intervalos …, I (-2),
I (-1), I (0), I (1), I (2), … y decidir en qué intervalo se encuentra R (si …, l(-2), l(-1),
l(0), l(1), l(2), … son los puntos de división, es I (n) = {l(n), l(n + 1)}; la longitud de
intervalo máxima, e = Máx (l(n + 1) - l(n)), o amplitud de la malla, representa la
precisión de la medida). Este último proceso puede seguirse analíticamente. Sea,
en efecto, F(l) = l'n cuando l está en I (n) (l'n es un valor intermedio cualquiera
de I (n) que podemos elegir arbitrariamente para cada n = 0, ±1, ±2, …, pero fijo
en lo que sigue). La medición aproximada de R equivale, en estas condiciones, a
la medición exacta de F(R). Se tiene
+∞ +∞ λ (n +1)
F (R) = ∫ −∞
F (λ)dE (λ) = ∑
n = −∞
∫ λ (n)
F (λ)dE (λ) =
+∞ λ (n +1) +∞
= ∑ λ'n
n = −∞
∫ λ (n)
dE (λ) = ∑ λ'n E (I (n)).
n = −∞
Evidentemente, F(R) f = l'n f para todo f de la variedad lineal cerrada asociada al

operador de proyección E(I (n)), es decir, esta variedad está contenida en la Ml' n
correspondiente a las soluciones de F(R)g = l'n g; luego PM ≥ E(I (n)) y, por lo tanto, l'n
+∞ +∞ +∞
PM ≥ ∑ PMλ'n ≥ ∑ E (I (n)) = ∑ [E (λ (n +1)) − E (λ (n))] = 1 − 0 = 1,
n = −∞ n = −∞ n = −∞
de donde se deduce
+∞
∑ PMλ'n = PM = 1, PMλ'n = E (I (n)),
n = −∞
es decir, el espectro de F(R) es un espectro discreto puro constituido por los l'n.
La magnitud F(R) es en verdad, por ende, exactamente medible y la probabi-
lidad de que sea l'n su valor, es decir, de que R esté en I (n), es
∙∙PM y ∙∙2 = ∙∙E(I (n))y ∙∙2,

l'n
en consonancia con lo que P nos dice de R.

Este resultado, dicho sea de paso, puede también interpretarse físicamente, y
deja ver una excelente coincidencia de la teoría con lo que muestra la ordinaria
experiencia física.
256
Fund_MAT_03.indd 256 7/5/18 14:18

En el modo de considerar las cosas propio de la Mecánica clásica (sin condición

cuántica alguna), en cada estado se atribuye a cada magnitud R un valor perfecta-
mente determinado, si bien se reconoce que cualquier aparato de medida imagi-
nable permite determinarlo sólo hasta un cierto límite de error a consecuencia de
lo imperfecta que resulta la capacidad de observación del hombre (capacidad que
le permite comprobar la posición de un índice o localizar el ennegrecimiento en
una placa fotográfica sólo con una limitada precisión). Este límite de error puede
hacerse retroceder cuanto se quiera hacia el cero mediante un perfeccionamiento
suficiente del dispositivo de medición, pero nunca se conseguirá que dicho error
llegue a ser exactamente cero. Cabe esperar que lo mismo sucederá en la Mecánica
cuántica con aquellas magnitudes R que, según la imagen intuitiva que de tales
cosas se solía tener —particularmente antes del descubrimiento de dicha Mecáni-
ca—, no están cuantificadas: por ejemplo, las coordenadas cartesianas de un elec-
trón, cuyo espectro es un espectro continuo, por cuanto pueden tomar cualquier
valor entre -∞ y +∞. En cambio, todo lo contrario sucede con aquellas magnitudes
que, de acuerdo con la representación intuitiva, están «cuantificadas»; porque des-
de el momento que estas magnitudes son susceptibles de tomar únicamente valores
discretos, bastará observarlas con tanta exactitud que no subsista duda ninguna
acerca de cuál es el valor «cuantificado» de que se trata; R lo toma entonces, con
seguridad, exactamente. Así, por ejemplo, si de un átomo de hidrógeno se sabe que
su energía es menor que la del segundo de los más bajos niveles de energía, cono-
cemos con absoluta precisión su contenido energético: es el correspondiente al más
bajo nivel de energía. Esta clasificación de las magnitudes en «cuantificadas» y «no
cuantificadas» corresponde, conforme muestra la «teoría matricial» (cf. I.2 y II.6),
a su clasificación en magnitudes R cuyo operador R posee un espectro discreto puro
y magnitudes en las que no es éste el caso, respectivamente. Y precisamente para
las primeras, y sólo para ellas, encontramos la posibilidad de una observación ab-
solutamente exacta, mientras que las últimas pueden observarse únicamente con
una exactitud arbitrariamente grande, pero nunca por modo absoluto.126
La introducción de funciones «impropias» o que no pertenecen al espacio hil-
bertiano, introducción que señalábamos en los preliminares y en I.3, justamente
en este punto reproduce la realidad, dicho sea entre paréntesis, peor que nuestro
método. Pues simula la existencia de estados tales que, en ellos, magnitudes con
espectro continuo toman exactamente ciertos valores, a pesar de que precisamen-
te esto jamás ocurre. Consideramos que, junto a su inconsistencia desde el punto
de vista matemático, también por este motivo hay que rechazar tales idealizaciones,
con todo y que repetidas veces fueron propuestas.
Con esto hemos llevado a un término provisional la cuestión relativa al pro-
ceso que se da en la medición de una magnitud y podemos, por lo tanto, dedicar-
nos al problema de la medición simultánea de varias magnitudes.
Sean, en primer lugar, R y S dos magnitudes que supondremos simultánea-
mente medibles, y R, S sus correspondientes operadores. ¿Qué se sigue de esto?
Postulemos primero la absoluta exactitud de las mediciones, de modo que R
y S han de tener espectros discretos puros: l1, l2, … y m1, m2, …, respectivamen-
257
Fund_MAT_03.indd 257 7/5/18 14:18

te. Sean j1 j2, … y y1, y2, … los correspondientes sistemas ortonormales com-
pletos de funciones propias.
Para empezar con el caso más sencillo, supondremos que todos los valores
propios de uno de los dos operadores, por ejemplo R, son simples, es decir, lm ≠ ln
para m ≠ n.
Cuando medimos R, S simultáneamente, tras la medición nos encontramos
ante un estado y en el que con seguridad, tanto R cuanto S tienen los valores que
de ella han resultado, por ejemplo, lm–, mn– y y debe ser tal que se cumplan las
ecuaciones Ry = lm–y, Sy = mn–y. De la primera se deduce que y = ym– (salvo un
factor numérico constante, del que podemos prescindir) y de la segunda se sigue
que ψ = ∑ aνψ nν si mn , mn , …, son todos los mn iguales a mn–. Si j era el estado
1 2
ν
inicial, la probabilidad de lm–, jm– es ∙(j, jm– )∙2. Por consiguiente, para j = jm la
probabilidad se convierte en certeza si m = m –, de modo que para cada m pode-
mos decir que jm es un estado ∑ aνψ nν , donde todos los mn son iguales, esto es:
n
ν
Sjm = m–jm (con m– = mn = mn = …). Para todo f = ϕm (m = 1, 2, …) vale, por
ende, la relación RSf = SRf (ambos miembros son iguales a l m–j ); luego ésta
1 2
m m
vale también para sus combinaciones lineales y, supuestos continuos R y S, asimis-
mo para sus puntos de acumulación; es decir, para todo f , R y S son, pues, per-
mutables.
Cuando dichos operadores no sean continuos, razonaremos del siguiente
modo: las descomposiciones de la unidad E(l), F(m) correspondientes a R, S están
definidas por
E (λ ) = ∑ P[ϕm] , F ( µ ) = ∑ P[ψ ] ,n
λm ≤ λ µn ≤ µ
de forma que F (m)ϕm es igual a ϕm o a cero, según que m sea ≥ ó < que el valor
m– antes introducido. Por otra parte, E (l)jm = jm ó = 0 en correspondencia con
ser l ≥ ó < que lm. Luego, en todo caso E (l) F (m)jm = F (m) E (l)jm. De aquí se
sigue, como va vimos, la permutabilidad de E (l) y F (m), y por consiguiente (según
II.10), también la de R y S.
Ahora bien, según II.10, existe entonces un sistema ortonormal completo de
funciones propias comunes a R y S, es decir, podemos suponer jm = ym Dado que
para m ≠ n es lm ≠ ln, cabe construir la función
F(l) = mn para l = ln, n = 1, 2, …,

{ ∣
arbitrario, en caso contrario
y es claro que S = F(R), o sea S = F(R). Las magnitudes R, S, por lo tanto, no sólo
son simultáneamente medibles, sino que incluso cada medición de R lo es asimis-
mo de S, pues ésta es función de aquélla, es decir, R determina causalmente a S.127
Pasemos ahora al caso más general, en el que nada se presupone acerca del
orden de multiplicidad de los valores propios de R, S, caso éste en el cual aplica-
remos un método esencialmente distinto del antes seguido.
258
Fund_MAT_03.indd 258 7/5/18 14:18

Consideremos primeramente la magnitud R + S. Una medición simultánea de

R y S es también una medición de R + S, porque la suma de las medidas resultan-
tes da el valor de R + S. Por esto el valor medio de R + S en cada estado y es la
suma de los valores medios de R y de S. Adviértase que esto vale independiente-
mente de que R y S sean estadísticamente independientes, o entre ellos existan
correlaciones y de cuáles sean éstas, o incluso de que uno determine causalmente
al otro, pues la proposición
Valor medio de la suma = suma de los valores medios
es notoriamente cierta en general. Luego, si T es el operador de R + S, este valor

medio es, de una parte, (Ty, y ) y, de otra,
(Ry, y ) + (Sy, y ) = [(R + S)y, y ],
es decir, para todo y se tiene
(Ty, y ) = [(R + S )y, y ],
o sea T = R + S. El operador de R + S es, por ende, el R + S.128 Del mismo modo

se demuestra que aR + bS es el operador correspondiente a aR + bS (a, b números
reales), aunque cabe también deducirlo directamente de la fórmula primera susti-
tuyendo R, S y R, S en las funciones F (l) = al, G(m) = bm.
Una medición simultánea de R y S lo es asimismo de
2 2 2 2
R + S ⎛ R + S⎞ R − S ⎛ R − S⎞ ⎛ R + S⎞ ⎛ R − S⎞
, , , , − = R ⋅ S,
2 ⎝ 2 ⎠ 2 ⎝ 2 ⎠ ⎝ 2 ⎠ ⎝ 2 ⎠
cuyos operadores son, por consiguiente (aplicando el teorema, según el cual si T es

el operador de T, el de F (T) es F (T ), en particular T2 posee como operador el T 2)
2 2
R + S ⎛ R + S⎞ R 2 + RS + SR + S 2 R − S ⎛ R − S ⎞ R 2 − SR − RS + S 2
, = , , = ,
2 ⎝ 2 ⎠ 4 2 ⎝ 2 ⎠ 4
2 2
⎛ R + S ⎞ − ⎛ R − S ⎞ = RS + SR ;
⎝ 2 ⎠ ⎝ 2 ⎠ 2
RS + SR
es decir, a R · S le corresponde el operador . Este resultado subsiste para
2
todo par de magnitudes F (R), G(S) (que también son medidas juntamente con R
F (R)G(S ) + G(S )F (R)
y S), de modo que el operador de F (R) · G(S) es .
2
259
Fund_MAT_03.indd 259 7/5/18 14:18

Sentado esto, sean E (l), H (m) las descomposiciones de la unidad correspon-

dientes a R, S, y además:
– –
F (l) = 1, para l ≤ l– , G (m) = 1, para m ≤ m– .
{ ∣ { ∣
1, para l > l 1, para m > m
–
Sabemos que F (R) = E (l ) y G (S ) = H(m–), con lo que el operador de F (R) · G (S)
EH + HE –
será (donde hemos escrito para abreviar E, H en vez de E (l ), H (m–)).
2
La magnitud F(R) es siempre o cero o la unidad; luego F(R)2 = F(R), es decir,
F (R) · [F (R) · G (S)] = F (R) · G (S).
Si ahora aplicamos nuestra fórmula de multiplicación a F(R) y F(R) · G(S),

magnitudes éstas todas ellas simultáneamente mensurables, obtendremos para este
producto el operador
EH + HE EH + HE
E + E E 2 H + EHE + EHE + HE 2 EH + HE + 2EHE
2 2 = =
2 4 4
EH + HE
que debe ser igual, por otra parte, a . De esto se sigue que
2
EH + HE = 2 EHE.
Si multiplicamos a la izquierda por E, resulta
E 2H + EHE = 2 E 2HE, EH + EHE = 2 EHE, EH = EHE,
y si lo hacemos a la derecha:
EHE + HE 2 = 2 EHE 2, EHE + HE = 2 EHE HE = EHE,

–
de donde EH = HE, es decir, todos los E (l ), H (m–) son permutables y, por lo tan-
to, también lo son R, S.
La condición de permutables de R y S equivale, según II.10, a la existencia de
un operador hermítico T, del que son funciones dichos operadores: R = F (T ),
S = G (T ). Si es T la magnitud a que corresponde, se tendrá R = F (T) y S = G (T).
Pero es el caso que esta ultima condición es también suficiente para la mensura-
bilidad simultánea, pues en una medición de T (medición absolutamente precisa,
ya que T posee un espectro discreto puro, cf. II.10) se miden a la vez sus funciones
R y S. Luego la permutabilidad de R, S es condición necesaria y suficiente para
una tal mensurabilidad.
260
Fund_MAT_03.indd 260 7/5/18 14:18

Dadas varias magnitudes R, S, … (aunque en número finito) a las que co-

rresponden los operadores R, S, …, si postulamos de nuevo una medición en
absoluto exacta, la cuestión de la mensurabilidad simultánea se resuelve de la
siguiente manera: cuando todas las magnitudes R, S, … son a la vez mensurables,
han de serlo asimismo cada par de ellas, es decir, todos los operadores R, S, …
son entre sí permutables. Recíprocamente, si R, S, … son entre si permutables,
existe según II.10 un operador T del que todos son funciones: R = F(T ),
S = G(T ), …, y, por lo tanto, vale para la. magnitud T : R = F(T ), S = G(T), …
Una medición exacta de T (que también aquí presenta un espectro discreto puro,
cf. II.10) es por esto a la vez una medición simultánea de R, S, … En resumen:
la permutabilidad de R, S, … es necesaria y basta para la mensurabilidad simul-
tánea de R, S, …
Consideremos ahora mediciones que no son absolutamente exactas, sino tan
sólo de una precisión prefijada, si bien arbitrariamente grande. En este supuesto,
R, S, … no tienen ya por qué poseer un espectro discreto puro.
Puesto que las mediciones de precisión limitada de las magnitudes R, S, …
equivalen a mediciones exactas de F(R), G(S), … —donde F (l), G (l), … son
ciertas funciones cuya ley de formación fue descrita al comienzo de este párrafo
(al discutir la medición de exactitud acotada, aunque allí nos referíamos, claro está,
a una sola función F (l))— las magnitudes R, S, … son sin duda simultáneamen-
te medibles cuando lo son todas las F (R) G (S), … con precisión absoluta. Pero
esto equivale a la permutabilidad de F (R), G (S ), …, permutabilidad que se si-
gue de la de R, S, …; luego, que R, S, … sean permutables es en cualquier caso
una condición suficiente.
Recíprocamente, supongamos que R, S, … son mensurables simultáneamente. – –
Una medición de R de suficiente precisión, permite decidir si su valor es >l ó ≤l
(cf. nuestra definición de «precisión limitada», discutida – particularmente en la
Nota 126). Por consiguiente, si F (l) = 1 ó 0 para l ≤ ó >l , respectivamente, F (R)
está medido en estas condiciones con precisión absoluta. Del mismo modo, para
G (m) = 1 ó 0, según que sea m ≤ ó >m– G(S) es exactamente medidle y, además,
esta magnitud y la F (R) son mensurables a la vez. Luego F(R) y G(S) son permu-
tables. Esto sentado, sean E (l), H (m) Las– descomposiciones de la unidad asocia-
–
das a R, S; se tiene entonces F (R) = E (l ), G (S) = H– (m–); por lo tanto, E (l ) y
H(m–) son permutables, y esto para todo par de valores l , m–. De aquí se sigue que
también lo serán R, S, y pues ello sucede para cada par de operadores del conjun-
to R, S, …, todos éstos son entre sí permutables. La permutabilidad es, por esta
razón, una condición necesaria.
Vemos así que la condición característica para la mensurabilidad simultánea
de las magnitudes R, S, … en número finito, es la de permutabilidad de los co-
rrespondientes operadores R, S, … Esta proposición vale lo mismo para medicio-
nes exactas en absoluto que para mediciones arbitrariamente precisas, aunque en
el primer caso hay que postular, además, lo que caracteriza la posibilidad de una
medición precisa en absoluto: los operadores han de poseer un espectro discreto
puro.
261
Fund_MAT_03.indd 261 7/5/18 14:18

Con esto queda matemáticamente demostrado que en P se encierra la más

general afirmación posible en esta teoría (mejor dicho, en toda teoría en que P
valga), pues presupone tan sólo la permutabilidad de los operadores R1, …, R2 y
sin ésta no cabe hablar de resultados de medición simultáneos de las magnitudes,
R1, …, Ri, porque en tal caso no son posibles en modo alguno las mediciones si-
multáneas de R1, …, Ri.
4. Relaciones de indeterminación
En el párrafo que precede hemos logrado esenciales resultados relativos al pro-
ceso de medición cuando se trata de una sola magnitud, o de varias simultánea-
mente medibles. Hay que ver ahora qué comportamiento muestran las magnitudes
no mensurables a la vez cuando nos interesamos por su estadística en el mismo
sistema y en el mismo estado j.
Sean, pues, R, S dos de tales magnitudes y R, S sus operadores (¡no permuta-
bles!). A pesar de esa hipótesis, pueden existir estados en que los valores de una y
de otra sean precisos (dispersión nula) es decir, puede haber funciones propias
comunes, sólo que a partir de éstas no cabe formar un sistema ortonormal com-
pleto, pues de lo contrario, R y S serían permutables. (Cf. la construcción de
las correspondientes descomposiciones de la unidad E (l), F (l) indicada en II.8:
si j1, j2, … es el sistema ortonormal completo común, tanto E (l) como F (l) son
sumas de operadores P[j ] permutables por lo tanto, pues tal son los P[j ].) Es fácil
r r
darse cuenta de lo que esto significa: la extensión lineal cerrada M del conjunto
de esas j debe ser menor que E∞, ya que de coincidir con éste, se podría construir
el sistema ortonormal completo en cuestión, al igual que sucedía en el caso de un
solo operador al principio de II.6.
Para los estados que integran M, R y S son simultáneamente medibles, lo que
se comprueba con la mayor facilidad presentando un modelo de esta mensurabi-
lidad simultánea: Dado que las funciones propias j, comunes a R, S definen a M,
existe en M un sistema ortonormal de tales funciones j cuya extensión lineal
cerrada es igualmente M (sistema que, por lo tanto, es completo en dicha varie-
dad). Este sistema j1, j2, … —que se obtiene también a base de la construcción
antes citada y que se indicó en II.6— lo ampliaremos añadiéndole otro sistema
ortonormal y1, y2 … cuya extensión lineal cerrada sea E∞ - M, y se conseguirá
así un sistema ortonormal completo j1, j2, …, y1, y2, … Sea ahora lr, l2, …,
m1, m2, … un conjunto de números distintos entre sí, T el operador definido por
T
(∑ χ ⋅ ϕ + ∑ y ⋅ψ ) =∑ λ χ ⋅ ϕ +∑ µ y ⋅ ϕ ,
n
n n
n
n n
n
n n n
n
n n n
y T la magnitud asociada a T.
Una medición de T determina la aparición de uno de los estados j1, j2, …
y1, y2, …, conforme sabemos por lo dicho en III.3. Si es un jn el estado que
262
Fund_MAT_03.indd 262 7/5/18 14:18

surge (lo que se reconoce en que la medida es un ln), por él sabemos de los valo-
res de R y de S, pues en el estado jn, ambas magnitudes poseen valores precisos,
por hipótesis, y se puede predecir con certeza que en una medición desde luego
subsiguiente de R y S, se encontrarán estos valores y no otros. Por el contrario, si
el estado que se origina es un yn nada semejante podemos afirmar (yn no perte-
nece a M, por lo que no es posible hablar de un valor preciso de R, S en este es-
tado). Ahora bien, la probabilidad de que resulte yn es (P[y ]j, j) y la de encontrar
n
un yn cualquiera (n = 1, 2, …) vale
∑ (P[ψ ]ϕ ,ϕ ) =
2 2
n
PE ∞ −Mϕ ,ϕ = ϕ − PMϕ
n
Esta probabilidad es 0, es decir, R y S son con seguridad simultáneamente medibles

cuando j = PMj, esto es, cuando ϕ es elemento de M,129 como queríamos de-
mostrar.
Puesto que lo que ahora nos interesa es la cuestión de las magnitudes no men-
surables simultáneamente, supondremos que se da el caso extremo de ser M = (0),
es decir, que en ningún estado es posible medirlas al mismo tiempo; o si se quie-
re, que no existe ninguna función propia común a R, S.
Si E (l), F (m) son las descomposiciones de la unidad que corresponden a los
operadores R, S, los valores medios de R y S en el estado ϕ son (cf. III.1)
r = (Rj, j), s = (Sj, j),
y sus dispersiones, es decir, los valores medios de (R - r)2, (S - s)2,
e 2 = [(R - r ⋅ 1)2j, j] = ∙∙(R - r ⋅ 1)j ∙∙2 = ∙∙Rj - rj ∙∙2,
h2 = [(S - s ⋅ 1)2j, j] = ∙∙(S - s ⋅ 1)j ∙∙2 = ∙∙Sj - sj ∙∙2.
(Cf. la discusión de la medición precisa en absoluto en III.3.) De aquí resulta,

merced a una conocida transformación,130
e2 = ∙∙Rj ∙∙2 - (Rj, j)2, h2 = ∙∙Sj ∙∙2 - (Sj, j)2,
igualdades éstas cuyos segundos miembros son ≥0 por razón de la desigualdad de

Schwarz (teorema 1, II.1) y de ser ∙∙j ∙∙ = 1, Se nos plantea ahora la siguiente cues-
tión: puesto que nunca pueden ser a la vez e = 0 y h = 0, mientras que e puede
hacerse por su parte tan pequeño como se quiera, al igual que h; por la suya (R,
S son medibles, por separado, con precisión arbitraria, incluso quizá con precisión
absoluta), deben existir entre e y h ciertas relaciones que impidan su tendencia
simultánea a cero. ¿Cuáles son estas relaciones?
263
Fund_MAT_03.indd 263 7/5/18 14:18

La existencia de tales relaciones fue descubierta por Heisenberg131 y son de

la mayor importancia para la comprensión de las indeterminaciones a que la Me-
cánica cuántica da lugar en la descripción de la Naturaleza, en atención a lo cual
han recibido el nombre de relaciones de indeterminación. En primer lugar, dedu-
ciremos matemáticamente la más importante de entre ellas, para volver luego a su
significado fundamental y a su comparación con la experiencia.
En la teoría matricial representan un esencial papel los operadores P, Q que
gozan de la propiedad
h
PQ - QP = 1,
2pi
por ejemplo los operadores correspondientes a las coordenadas y a sus impulsos

conjugados (cf. I.2); o más general, los que corresponden a dos magnitudes cua-
lesquiera que son canónicamente conjugadas en la Mecánica clásica. (Cf. por ejem-
plo las Memorias citadas en la Nota 2). Consideremos, con algo más de generalidad,
dos operadores hermíticos P, Q tales que
PQ - QP = a · 1
(Puesto que (PQ - QP)* = QP - PQ, habrá de tenerse (a · 1)* = –a · 1 = -a · 1,

–a = -a, es decir, a debe ser imaginario puro. Es claro que la ecuación entre ope-
radores supuesta no vale para los dominios de definición: PQ - QP no está nece-
sariamente definido doquier). Para cada j se tiene entonces
2Im(Pj, Qj) = -i[(Pj, Qj) - (Qj, Pj)] = -i[(QPj, j) - (PQj, j)] =

= (i{PQ - QP}j, j) = ia ⋅ ∙∙j ∙∙2,
de donde, si a ≠ 0, y en virtud del teorema I (II.1)
2i 2 2
∙∙j ∙∙2 = - Im(Pj, Qj) ≤ ∙(Pj, Qj)∙ ≤ ∙∙Pj ∙∙ ⋅ ∙∙Qj ∙∙;
a ∙a∙ ∙a∙
en particular, para ∙∙j ∙∙ = 1, resulta
∙a∙
∙∙Pj ∙∙ ⋅ ∙∙Qj ∙∙ ≤ .
2
Ahora bien, a la vez que P, Q, también P - r · 1, Q - r . 1 presentan aquella

propiedad; luego igualmente es
∙a∙
∙∙Pj - rj ∙∙ ⋅ ∙∙Qj - sj ∙∙ ≥ ,
2
264
Fund_MAT_03.indd 264 7/5/18 14:18

e introduciendo los valores medios y las dispersiones
r = (Pj, j), e2 = ∙∙Pj - r ⋅ j∙ ∙2,

r = (Qj, j), h2 = ∙∙Qj - s ⋅ j ∙∙2,
queda en fin
∙a∙
(I.) eh ≥ .
2
Para que valga el signo de igualdad es necesario y basta que en las desigualdades ≤
utilizadas en la deducción (I.) se conserve el signo =. Si P' = P - r · 1, Q' = Q - s · 1
tendremos por lo tanto
i∙a∙
- I (P'j, Q'j) = ∙(P'j, Q'j)∙ = ∙∙P'j ∙∙ ⋅ ∙∙Q'j ∙∙.
a m
Según el teorema I, II.1, lo último significa que P'j y Q'j difieren en un factor
∙a∙
constante c, que debe ser distinto de cero porque ∙∙P'j ∙∙ ⋅ ∙∙Q'j ∙∙ ≥ > 0 implica
2
P'j ≠ 0 y Q'j ≠ 0. Pero lo primero nos dice que (P'j, Q'j) = c∙∙Q'j ∙∙2 es imagi-
∙a∙
nario puro y que su coeficiente de i tiene el mismo signo que - i (¡real!), es
a
decir, el signo opuesto al del coeficiente de i en a; luego c = ig, donde g es real y
> a
< 0 según sea i <> 0. Por lo tanto es
(lg.) P'j = ig Q'j, g real y <

> 0 para ia <
> 0.
La definición de r y s exige que, además, (P'j, j) = 0 y (Q'j, j) = 0; pero como

de (lg.) se deduce P'j, j) = ij (Q'j, j), donde el primer miembro es real y el
segundo imaginario puro, dichas condiciones se cumplen efectivamente. Es fácil
calcular los valores de e, h en este caso; se tiene:
∙a∙
e : h = ∙∙P'j ∙∙ : ∙∙Q'j ∙∙ = ∙c∙ = ∙g ∙, eh =
2
de donde, pues e, h son ambos positivos,
a ⋅γ a
ε= , η= .
2 2γ
265
Fund_MAT_03.indd 265 7/5/18 14:18

h
En la Mecánica cuántica es a = y, por consiguiente, (I.) se escribirá
2pi
h
(I.') e⋅h≥
4p
Cabe discutir
…
también (lg.) cuando P y Q son, por ejemplo, los operadores
h ∂
P = , Q = q… de la teoría de Schrödinger. (Cf. I.2; suponemos que se tra-
2pi ∂q
ta de un sistema con un solo grado de libertad y que q es su única coordenada.)
En tal caso (lg.) nos dice que
⎛ h d ⎞
⎜⎝ 2π i dq − ρ⎟⎠ ϕ = iγ ⋅ (q − σ )ϕ ,
h
donde por ser ia = > 0 es g > 0; luego
2p
dϕ
dq
2π
{
= − γ ⋅q +
h
2π
h
γσ +
2π
h
ρ ⋅ i ϕ, }
es decir
ϕ = ε∫
q
{
−
2π
h
2π 2π
γ ⋅q + γ σ + ρ ⋅i dq
h h } =
πγ 2πγ 2πρ πγ 2πρ
− q2 + σq+ iq − (q − σ )2 + iq
= Ce h h h = C'e h h .
+∞
∙∙j ∙∙2 = ∫−∞ ∙j (q)∙2dk es de hecho finito, ya que g > 0, y la condición ∙∙j ∙∙ = 1
determina C':
+∞ +∞ − 2πγ (q − σ )2 h +∞
∫ ∫ ∫
2 2 2 2
ϕ = ϕ (q) dq = C'
2
eh dq = C' e − x dx
−∞ −∞ 2πγ −∞
2 h 2 h
= C' π = C' = 1,
2πγ 2γ
1/4
⎛ 2γ ⎞
C' = ⎜ ⎟ .
⎝ h⎠
266
Fund_MAT_03.indd 266 7/5/18 14:18

Prescindiendo de un factor de valor absoluto igual a 1, carente de sentido físico,

1/4
⎛ 2γ ⎞
podemos, pues, tomar C' = ⎜ ⎟ , es decir,
⎝ h⎠
1/4 πγ 2πρ
⎛ 2γ ⎞ − (q − σ )2 + iq
ϕ = ϕ (q) = ⎜ ⎟ e h h .
⎝ h⎠
Por lo que a e y h se refiere, de los antes visto se sigue que
hγ h
ε= , η= .
4π 4πγ
h
Dejando aparte la condición eh = , estos valores, por consiguiente, son cuales-
4p h
quiera cuando g varía entre 0 y +∞. Toda cuaterna p, s, e, h tal que eh = se
4p
presenta, por ende, en exactamente una j. Estas j fueron estudiadas primero por
Heisenberg y aplicadas a la dilucidación de las circunstancias que se dan en Me-
cánica cuántica, finalidad para la que se muestran extraordinariamente apropiadas
por cuanto representan el más alto grado de aproximación en ella posible al esta-
do de cosas con que nos encontramos en la Mecánica clásica (en la que ni p ni q
son de carácter disperso), y, además, por ser posible atribuir a e o a h valores pre-
fijados al arbitrio (cf. loc. cit. Nota 131).
Las consideraciones que preceden nos han permitido captar uno de los aspec-
tos de las relaciones de indeterminación, es a saber, el formal. Para llegar a su in-
teligencia completa, es menester considerarlas desde otro punto de vista todavía:
desde el punto de vista de la experiencia física inmediata. Y ello es así, porque los
vínculos que las ligan a ésta son más patentes y de mayor simplicidad que muchos
otros de los hechos sobre los que fue construida la Mecánica cuántica. Una discu-
sión de tipo intuitivo es tanto más necesaria cuanto que, a primera vista, acaso se
tenga la impresión de que aquí se presenta una contradicción con lo que la intui-
ción nos muestra: es un poco fuerte el tener que reconocer, sin más, la imposibi-
lidad de medir simultáneamente y con cuanta exactitud queramos la posición y la
velocidad (esto es, las coordenadas y el impulso) de un cuerpo material, incluso si
se poseen instrumentos de medida suficientemente delicados. Por tal razón con-
viene darse cuenta de que así es en efecto mediante un análisis detenido de los más
delicados procedimientos de medición (quizá tan sólo realizables en el sentido de
un experimento ideal). Veremos que las conocidas leyes de la Óptica ondulatoria,
de la Electrodinámica y de los procesos elementales atómicos, más bien cierran el
camino a una medición exacta con dificultades insuperables y precisamente en
aquellos puntos en que lo exigen las relaciones de indeterminación. Y es el caso
que esto puede ya reconocerse al investigar dichos procesos desde un punto de
vista puramente clásico (¡no cuántico!). Este hecho es de fundamental importancia,
267
Fund_MAT_03.indd 267 7/5/18 14:18

pues nos muestra que en el dominio clásico (es decir, donde lo cuántico no deter-
mina corrección alguna al antiguo modo de ver), dominio que está justificado
independientemente de la validez de la Mecánica cuántica —el único propiamen-
te que es accesible a nuestra intuición inmediata132—, no cabe entrar en colisión
con las relaciones de indeterminación en apariencia paradójicas de la nueva Me-
cánica.
Hay, pues, que demostrar lo siguiente: si p, q son dos magnitudes canónica-
mente conjugadas y un sistema se halla en un estado en el cual es posible indicar
el valor de p con una exactitud e (es decir, tras una medición de p con e como
límite de error), en estas condiciones q no puede ser conocido con una precisión
h
mayor que h = : e. En otros términos: una medición de p de exactitud e in-
4p h
troduce en el valor de q una indeterminación h = : e.
4p
Claro es que en estas consideraciones meramente cualitativas no podremos dar
h
cuenta exactamente de cada pormenor; así, en vez de eh = sólo cabrá probar
que en la más precisa medición posible es 4 p
s
s
s
s
β
L
s´ β2
β1
s´
Pn s´ Pn
s´
2 1
Figura 1
eh ~ h (es decir, que eh es del orden de h). Como ejemplo típico, trataremos del
par conjugado posición-impulso de un corpúsculo C.133
Primero, la determinación de la posición: ésta se logra observando a C, es de-
cir, se ilumina la partícula y se absorbe en la retina la luz que aquélla difunde. El
268
Fund_MAT_03.indd 268 7/5/18 14:18

proceso consiste, pues, en el choque con C de un quantum luminoso L emitido

por el foco l, lo que provoca una desviación de la trayectoria bb1 de aquél que pasa
a ser la bb2 y al final de ésta el quantum desaparece por absorción en la Pantalla
Pn, que sustituye aquí al ojo o a una placa fotográfica (fig. 1). La medición se
efectúa al fijar que L encuentra la pantalla Pn, no en 1 (al término de su trayecto-
ria natural bb1), sino en 2 (al final de bb2). Pero es claro que para poder averiguar
a partir de esto el lugar del choque (es decir, la posición de C), deben conocerse
las rectas b y b2 (esto es, la trayectoria de L antes y después del mismo), lo que se
consigue colocando adecuados sistemas de diafragmas ss y s's'. (En rigor, lo que así
se lleva a cabo es, no una medición de las coordenadas de C, sino que simplemen-
te se determina si éstas tienen o no ciertos valores; a saber, los de las coordenadas
del punto de intersección de las rectas b y b2 que se pueden situar a voluntad
disponiendo convenientemente los diafragmas. La superposición de varias de tales
determinaciones, es decir, la colocación de más de un diafragma s's', equivale jus-
tamente a dicha medición.) ¿Pero, qué hay, por lo que a la exactitud de la medición
se refiere?
Esta encuentra en las leyes ópticas de la formación de imágenes un límite fun-
damental: es imposible, en efecto, conseguir con luz de longitud de onda l una
imagen nítida de un objeto de dimensiones menores que l, e incluso por lo menos
reducir la difracción hasta tal punto que quepa hablar de una imagen, aunque sea
deformada. Cierto es que no pretendemos, en rigor, una imagen óptica, pues el
simple hecho de la desviación de L basta para fijar la posición de C. Pero es que,
además, tampoco los diafragmas ss y s's' pueden ser más estrechos que l, porque de
serlo no pasaría L sencillamente a su través, antes bien resultaría un haz de bandas
de interferencia y ya no cabría deducir de las direcciones determinadas por los su-
cesivos diafragmas ss, s's' las trayectorias b, b2 del rayo luminoso. Por lo tanto no es
posible ni apuntar ni acertar con el proyectil L con una precisión superior a l.
Resulta así que la longitud de onda l es a la vez la medida del error que acom-
paña a la medición de las coordenadas: l ~ e. Otras características de L son: su
–
frecuencia v, su energía E y su impulso p–; y es sabido que entre ellas existen las
relaciones
–
c – hc E hn h
n= , E = hn = , p– = = = ,
l l c c l
hn
donde c es la velocidad de la luz.134 Se tiene, por esto, p– ∼ . Ahora bien, en el
e
proceso del choque, no exactamente conocido, tiene lugar una transferencia de
h
impulso que evidentemente es del orden de p–, es decir, del orden de , y por este
h e
motivo surge una inseguridad en el impulso de C tal que h ∼ .
e
Con esto estaría demostrado que eh ~ h, si no hubiésemos pasado por alto
una circunstancia, a saber, que el proceso del choque no es tan desconocido como
269
Fund_MAT_03.indd 269 7/5/18 14:18

hemos dado en suponer: conocemos las trayectorias de L antes y después del mis-
mo (b y b2), por consiguiente también su impulso; pero de aquí se sigue cuál es
el impulso cedido a C. Por lo tanto p– no es una medida de h, sino más bien lo es
la eventual inseguridad en el conocimiento de los rayos b y b2. Para poder deter-
minar más exactamente los vínculos que ligan el apuntar al pequeño
t t
ε
C
Figura 2
objeto C con la inseguridad en la dirección, es conveniente aplicar un dispositivo

de puntería más perfecto que las rendijas ss: una lente. En este caso habrá que
atender a la conocida teoría del microscopio según la cual, para poder iluminar
una porción de superficie de extensión lineal e (es decir, para acertar a C con L
con una precisión e), son necesarias una longitud de onda l y una apertura j
λ
entre las que exista la relación  ε (fig. 2 135). La indeterminación en la
ϕ
2sen
2
componente tt * del impulso de L es debida a que sólo sabemos que la dirección
j j j l
de éste está comprendida entre - y + . Su valor es, por ende, 2 sen –p = ⋅
2 2 2 e
h h h
= . Esta es la correcta medida de h y, por lo tanto, de nuevo es h ∼ , es de-
l e e
cir, eh ∼ h.
* Es ésta la única componente a considerar, pues es la que corresponde a la dirección del corri-
miento e (normal al eje de la lente). (N. del T.)
270
Fund_MAT_03.indd 270 7/5/18 14:18

Este ejemplo muestra muy claramente el mecanismo de los principios de in-

determinación: para apuntar bien necesitamos grandes aperturas y luz de longitud
de onda muy corta —es decir, grandes y muy indeterminados impulsos del quan-
tum luminoso—, los cuales motivan enormes choques con el objeto observado C
(efecto Compton) y «enmascaran» así el impulso de éste.
Consideremos ahora el proceso inverso: la medición de la velocidad (del im-
pulso). El método natural a seguir consiste en determinar la posición de C en dos
instantes diferentes, 0 y t, por ejemplo, y dividir por t la variación de las coorde-
nadas. Claro está que esto vale en el supuesto de que la velocidad sea constante
durante el intervalo (0, t). Si no sucede así, si la velocidad cambia, es esta variación
una medida de la diferencia entre la velocidad media antes calculada y la velocidad
real (por ejemplo en el instante t), es decir, una medida de la indeterminación de
la medición; lo mismo vale para el impulso. Si ahora se determinan las coordena-
das con una precisión e, ésta no influye en la precisión de la medida del impulso
medio, pues t puede ser elegido tan grande cuanto se quiera; sin embargo, ello
h
provoca variaciones del impulso ~ , y, por consiguiente, una indeterminación
h e
relativa al impulso final h ~ . Resulta así en todo caso eh ~ h. Sólo podrían
e
mostrarnos algo nuevo, por lo tanto, aquellas mediciones de impulso que no vayan
unidas a ninguna medición de posición. Tales mediciones son del todo posibles e
incluso aplicadas a menudo en Astronomía: su fundamento es el efecto Doppler.
Es sobradamente conocido en qué consiste este efecto: la luz emitida por un

cuerpo C en movimiento con velocidad v , luz de frecuencia n0 medida en el cuer-
po en movimiento, es percibida por un observador en reposo como luz de frecuen-
n - n0 v
cia n ligada con n0 por la relación = cos θ (θ es el ángulo entre la direc-

ción v la de emisión. n0 c
v
Esta fórmula es no-relativista, es decir, válida sólo para pequeños valores de ,
c
si bien sería fácil corregirla). La determinación de la velocidad es posible, por lo
tanto, cuando se observa n y se conoce n0 porque se trata de una determinada raya
espectral de un elemento conocido, ponemos por caso. De un modo más riguro-
so: es posible medir la componente de la velocidad en la dirección de observación
c(n - n0)
(de emisión) v cos θ = , o también la correspondiente componente de
n0
mc(n - n0)
impulso p' = p cos θ = (m es la masa de C). La dispersión h de p' está
n0 mc∆n mc∆n
ligada evidentemente con la ∆n de n, de modo que h ∼ ∼ . Realmen-
n0 n
te, el impulso de C varía por causa de la emisión de un quantum luminoso de
hn
frecuencia n, de impulso –p = por consiguiente; pero la inseguridad en el valor
h∆n c
de esta magnitud, , puede dejarse de lado en las circunstancias normales fren-
mc∆n 136 c
te a .
n
271
Fund_MAT_03.indd 271 7/5/18 14:18

La medición de n cabe efectuarla acudiendo a una figura de interferencia cual-

quiera; pero ésta naturalmente dará un valor preciso para n sólo si se trabaja con
un tren de ondas monocromático puro. Un tren de ondas de estas características
⎡ ⎛q ⎞ ⎤
es de la forma a sen ⎢2π ⎜ − ν t ⎟ + α ⎥ (q es la coordenada, t el tiempo, a la am-
⎣ ⎝ λ ⎠ ⎦
plitud, a la fase; la expresión dada es la de una componente cualquiera del campo,
eléctrico o magnético) de infinita extensión temporal y espacial, por lo tanto. Para
c
evitarlo, debemos sustituir esta expresión —que por ser l = puede también
n
⎡ ⎛q ⎞ ⎤ ⎛ q ⎞
escribirse a sen ⎢2πν ⎜ − t ⎟ + α ⎥— por otra F ⎜ − t ⎟ que sólo sea ≠0 en un
⎣ ⎝c ⎠ ⎦ ⎝c ⎠
intervalo finito relativo a su argumento. Una onda luminosa que presente esta
estructura es posible representarla por una integral de Fourier
+∞
F (x) = ∫
0
aν sen(2πν x + aν )d ν,
y la imagen de interferencias hace patentes todas las frecuencias cuya an es ≠ 0 de

modo tal, que la intensidad relativa correspondiente al intervalo de frecuencia
(n, n + dn) es an2dn. Hay que calcular la dispersión ∆n de n a partir de esta distri-
bución.
Es fácil ver que cuando nuestro tren de ondas tiene la longitud t en x (es de-
1
cir, la longitud t en t y la ct en q), la dispersión de n es ∼ .137 Ahora bien, dado
t
hn
que en cada acto de emisión C experimenta un impulso de retroceso en la
h c
dirección de observación, es decir, un cambio de velocidad , y que el proceso
mc
de emisión requiere el tiempo t, no es posible localizar el instante en que tiene
lugar la alteración de la velocidad con una precisión superior a t ; luego en este
hn
método la posición aparece, afectada de una indeterminación e ~ t y, por lo
tanto, mc
hn mc∆v mc 1
e~ t, h ~ = , eh ~ h.
mc v v t
Si C no es de suyo luminoso, cual lo hemos supuesto, sino que difunde una
luz a él extraña (es decir, cuando se le ilumina), el cálculo se desarrolla de modo
análogo.
5. Los operadores de proyección como enunciados

Al igual que en III.1, consideremos un sistema físico S con k grados de liber-
tad, de forma que su espacio de los estados se describe mediante k coordenadas
272
Fund_MAT_03.indd 272 7/5/18 14:18

q1 …, qk (cf. también I.2). La Mecánica clásica concibe todas las magnitudes físi-
cas R que pueden integrarse en el sistema S, como funciones de q1 …, qk y de los
impulsos conjugados p1 …, pk: R = R(q1 …, qk; p1, …, pk) [así, por ejemplo, la
energía, que es la función de Hamilton H(q1, …, qk; p1, …, pk)]. En la Mecáni-
ca cuántica, en cambio, conforme ya indicábamos en III.1, las magnitudes R es-
tán coordinadas unívocamente a los operadoras hermíticos hipermáximos R; en
particular, q1, …, qk corresponden a los operadores Q1 = q1…, …, Qk = qk… y
h ∂ h ∂
p1, …, pk a los operadores P1 = …, …, Pk = … . Que en general
2pi ∂q1 2pi ∂qk
y por razón de la no permutabilidad de Ql, Pl, no es posible definir R = R(Q1, …,
Qk, P1, …, Pk) es algo que dilucidamos ya en I, 2 en el caso de la función de Ha-
milton. Sin poder afirmar algo definitivo tocante a la conexión entre las funciones
R(q1, …, qk, p1, …, pk) y los operadores R, de todos modos quedaron establecidos
en III.1 y III.3 los siguientes extremos:
L. Si los operadores R, S corresponden a las magnitudes observables simul-
táneamente R, S, a la magnitud aR + bS (a, b son números reales) corresponde el
operador aR + bS.
F. Si el operador R corresponde a la magnitud R, a la magnitud F (R) [F (l)
función real arbitraria] corresponde al operador F(R).
L. y F. admiten una cierta generalización. La de F se impone de suyo:
F*. Si a las magnitudes simultáneamente observables R, S, … corresponden
los operadores R, S, … (que son, por lo tanto, entre sí permutables) en número
finito, a la magnitud F (R, S, …) corresponde el operador F(R, S, …).
En efecto: supondremos que F (l, m, …) es un polinomio real en l, m, … con
el fin de que aparezca claro el sentido de F (R, S, …) —R, S, … son permutables—,
aunque pudiera establecerse F* asimismo para una función F cualquiera [por lo
que concierne a la definición del F (R, S, …) general, cf. loc. cit. Nota94]. Ahora
bien, puesto que todo polinomio resulta de la repetición de las tres operaciones
1
al, l + m, lm, basta considerar estas tres, y como lm = [(l + m)2 - (l - m)2],
es decir, 4
1 ⎛ 1⎞
λµ = (λ + µ )2 + ⎜ − ⎟ [λ + (−1)µ] ,
2
4 ⎝ 4 ⎠
podemos sustituirlas por al, l + m, l2. Pero las dos primeras caen bajo L, y bajo
F la última. Luego queda demostrado F*.
L, por el contrario, se hace extensiva en Mecánica cuántica al caso en que R,
S no son simultáneamente medibles. No discutiremos este punto hasta más tarde
(en VI.1) y nos limitaremos por el momento a sentar que no está nada claro que
pueda significar aR + bS cuando R y S no son mensurables simultáneamente.
Junto a las magnitudes físicas R, empero, existe algo más que es objeto de la
Física: las propiedades de los estados del sistema S. Una propiedad es, por ejemplo,
273
Fund_MAT_03.indd 273 7/5/18 14:18

que una cierta magnitud R tome el valor l; o que el valor de R sea positivo; o que
los valores de dos magnitudes simultáneamente medibles R, S sean respectivamen-
te l y m; o que la suma de los cuadrados de estos valores sea >1, etc. Así como
designábamos las magnitudes con las letras R, S, … usaremos de los símbolos E,
F, … para representar las propiedades. A las magnitudes correspondían los opera-
dores hermíticos hipermáximos R, S, …; ¿qué corresponde a las propiedades?
A cada una de ellas podemos vincular una magnitud que definiremos del si-
guiente modo: toda medición que decida entre la presencia o la no presencia de
la propiedad E, hay que considerarla como una medición de la magnitud asociada;
el valor de ésta es 1 cuando efectivamente se da E y 0 en el caso opuesto. La mag-
nitud así coordinada a E la representaremos con el mismo símbolo.
La magnitud ligada a una propiedad toma tan sólo los valores 0 y 1*. Recípro-
camente, cada magnitud R susceptible de tomar únicamente los valores 0 y 1 está
asociada evidentemente a la propiedad «el valor de R es ≠ 0». El criterio que pre-
cede permite, por ende, caracterizar las magnitudes vinculadas a las propiedades.
Que E tome sólo los valores 0 y 1 puede también expresarse diciendo que E
anula idénticamente el polinomio F (l) = l - l2. Si E es el operador de E, el ope-
rador de F (E) es F (E) = E - E 2, es decir, la anterior condición se traduce en
E - E 2 = 0, o bien E = E 2. Luego el operador E de E es un operador de proyección.
Resumiendo: a las propiedades E corresponden, por mediación de las magni-
tudes asociadas E antes definidas, los operadores de proyección E. De otro modo:
a cada propiedad va ligada una multiplicidad lineal cerrada M, que es la definida
por E = PM.
Se trata ahora de examinar con alguna detención esos entes E, E y M que
entre sí se corresponden.
Cuando queremos decidir si en el estado ϕ se da o no la propiedad E, es me-
nester medir la magnitud E y determinar si su valor es 1 ó 0, por definición. La
probabilidad de que ocurra lo primero, es decir, de que en ϕ se presente E, es, por
lo tanto, igual al valor medio de E, esto es:
(Ej, j) = ∙∙Ej ∙∙2 = ∙∙PMj ∙∙2
y la probabilidad de que suceda lo segundo, es decir, de que en ϕ no se presente

E, es igual al valor medio de 1 - E, esto es,
((1 ~ E ) j, j) = ∙∙(1 - E ) j ∙∙2 = ∙∙j - PMj ∙∙2.
[La suma es, naturalmente, igual a (ϕ, ϕ), es decir, 1]. Por consiguiente, E se pre-
senta en el estado ϕ o no se presenta, según sea cero la segunda o la primera pro-
babilidad, es decir, según sea PMϕ = ϕ o PMϕ = 0, respectivamente. O en otros
términos, cuando ϕ pertenece a M o es ortogonal a M; o bien, cuando j es ele-
mento de M o de E∞ - M.
* Tales magnitudes han recibido el nombre de magnitudes o variables dicotómicas. (N. del T.)
274
Fund_MAT_03.indd 274 7/5/18 14:18

La variedad M puede así definirse como conjunto de todos los j que con se-
guridad poseen la propiedad E. [En rigor queda definida de este modo únicamen-
te la parte de M cuyos elementos son de módulo 1; M, en conjunto, resulta de
ella multiplicando por constantes positivas y añadiendo el elemento 0.]
Si convenimos en llamar «non E» la propiedad contradictoria de E (la negación
de E), de lo que precede resulta desde luego que si a E corresponden E y M, a
«non E» pertenecen 1 - E y E∞ - M.
Al igual que para las magnitudes, se plantea para las propiedades la cuestión
de su mensurabilidad simultánea (en sentido estricto, la de poder ser decidida su
presencia o no presencia simultáneamente). Es claro que la condición necesaria y
suficiente para que las disyuntivas que plantean E y F se puedan decidir al mismo
tiempo, es que las correspondientes magnitudes E y F sean simultáneamente me-
dibles, bien sea con precisión arbitrariamente grande o con exactitud absoluta
—lo mismo da, pues dichas magnitudes son susceptibles de tomar sólo los valores
0 y 1. La condición es, por lo tanto, que EF = FE. Lo mismo vale para varias
propiedades E, F, G, …
A partir de dos propiedades E, F simultáneamente demostrables* pueden for-
marse las propiedades «E y F» y «E o F». La magnitud correspondiente a «E y F»
toma el valor 1 cuando toman este valor las asociadas a E y F, y el valor 0 cuando
es cero una por lo menos de estas últimas. Dicha magnitud es, por consiguiente,
el producto de las correspondientes a E y F . Su operador será, pues, en virtud de
F*, el producto de los operadores de E y F, es decir, EF, y la variedad lineal cerra-
da la parte común P a M y N (cf. teorema 14, II.4).
Por lo que atañe a «E o F», obsérvese que esta propiedad puede reducirse a la
forma «… y …», ya que «E o F» equivale a
«non [(non E) y (non F)]».
Luego su operador es:
1 - (1 - E ) (1 - F ) = E + F - EF,
operador que, por su origen, es un operador de proyección. Ahora bien, dado que
F - EF es asimismo un operador de proyección, la variedad lineal cerrada que
corresponde a E + F - EF es la M + (N - P) (teorema 14, II.4) Esta es parte de
{M, N}, y pues contiene a su vez a M, contendrá también a N por razón de sime-
tría y, por lo tanto, contiene a {M, N}. Luego coincide con {M, N} y su ser cerra-
da conduce a que sea {M, N} = [M, N].
Una propiedad E que se da siempre (es decir, vacía), posee como magnitud
asociada una magnitud igual idénticamente a 1, por lo cual será E = 1 y M = E∞.
Por el contrario, si nunca se da E (es decir, es imposible), su magnitud es igual
* Calificaremos de demostrable una propiedad en un sistema, cuando se puede decidir si se da

o no en él. El autor utiliza el término «entscheidbar», de «entscheiden», decidir. (N. del T.)
275
Fund_MAT_03.indd 275 7/5/18 14:18

idénticamente a 0, y E = 0, M = (0). Si dos propiedades E, F son incompatibles,

deben ser en todo caso simultáneamente demostrables y «E y F» ha de ser impo-
sible; es decir, E, F son permutables y EF = 0. Pero como EF = 0 determina la
permutabilidad de E, F (teorema 14, II.4), EF = 0 caracteriza dicha incompatibi-
lidad. Si E, F se suponen permutables, el que sea EF = 0 nos dice simplemente
que la parte común a M y N se reduce al elemento 0; sin embargo, de esta sola
condición no se sigue la permutabilidad de E y F: EF = 0 traduce más bien la
ortogonalidad de todo M a todo N (teorema 14, II.4).
Sea R una magnitud, R su operador y E(l) la descomposición de la unidad
correspondiente a éste. En este supuesto, el operador de la propiedad «R está en
el intervalo I = {l', m' }» (l' ≤ m' ) es evidentemente E(m' ) - E(l' ) y porque la pro-
babilidad de que así suceda es
([E(m' ) - E(l' )]j, j)
(cf. P en III.1), o, si se quiere, porque la magnitud que a esta propiedad corres-

ponde es e = F(R), donde
F(l) = 1, para l' < l ≤ m'

{
0, en caso contrario
y F(R) es igual a (E(m' ) - E(l' ) (cf. II.8 ó III.1). Este operador es el que en III.1
llamábamos E(I ).
Resumiendo: por lo que concierne a la relación entre propiedades E, sus ope-
radores de proyección E y las correspondientes variedades lineales cerradas M,
hemos comprobado los siguientes extremos:
a) La probabilidad de que la propiedad E se dé en el estado ϕ es
(Ej, j) = ∙∙Ej ∙∙2 = ∙∙PMj ∙∙2,
y la de que no se dé vale
[(1 - E ) j, j ] = ∙∙(1 - E ) j ∙∙2 = ∙∙j - PMj ∙∙2.
b) La presencia de E es segura en los estados j de M y sólo en ellos; la no

presencia lo es en los estados de E∞ - M y sólo en ellos.
g ) La condición necesaria y suficiente para que se pueda decidir simultánea-
mente acerca de la presencia o no presencia de varias propiedades E, F, …, es que
sus correspondientes operadores E, F, … sean permutables.
d) Si E, M pertenecen a E, 1 - E y E∞ - M pertenecen a «non E».
e) Si E, M pertenece a E, F, M a F y E, F son demostrables simultáneamen-
te, a «E y F» le corresponden EF y la parte común a M, N, y a «E o F», el operador
E + F - EF y la variedad {M, N}, que coincide en este caso con [M, N].
276
Fund_MAT_03.indd 276 7/5/18 14:18

h) E vale siempre cuando es E = 1, o también si M = E∞; E es imposible

cuando E = 0, o también si M = (0).
ϑ) E, F son incompatibles cuando EF = 0, o también si todo M es ortogonal
a todo N.
ζ ) Sea R una magnitud, R su operador, I un intervalo. Sea E(l) la descompo-
sición de la unidad que corresponde a R, I = {l' y m' } (l' ≤ m' ) y E (I ) = E (m' ) - E (l' )
(cf. III.1). En estas condiciones, a la propiedad «R está en I» corresponde al ope-
rador E(I ).
Los enunciados de carácter probabilístico P, V1 y V2, como también las pro-

posiciones del III.3, acerca de la mensurabilidad simultánea, pueden deducirse
de a)-ζ ). Que estas últimas son equivalentes a ζ ) es claro; en cuanto a P, éste se
sigue de a), e) y z ) tiene como consecuencias a V1 y V2.
Vemos, pues, que la relación entre propiedades físicas de un sistema, por una
parte, y operadores de proyección, por otra, hace posible un a modo de cálculo
lógico con éstos. Frente al de la Lógica ordinaria, aparece enriquecido nuestro
cálculo lógico con el concepto, característico para la Mecánica cuántica, de «de-
mostrabilidad simultánea».
El cálculo con proposiciones fundado en los operadores de proyección tiene la
ventaja con respecto al cálculo con magnitudes, el cual se basa en el conjunto de
los operadores hermíticos hipermáximos, de que el concepto de «demostrabilidad
simultánea» representa una afinación del de «mensurabilidad simultánea». Así, por
ejemplo, si E (l), F (m) son las descomposiciones de la unidad de los operadores R,
S correspondientes a las magnitudes E, F e I = {l', l'' } y J = {m', m'' }, para que las
preguntas «¿está R en I ?» y «¿está S en J ?» puedan contestarse simultáneamente,
basta, según g ), z ), que los operadores
E (I ) = E (l'' ) - E (l' ), F ( J ) = F (m'' ) - F (m' )
sean permutables, mientras que la mensurabilidad simultánea de R, S exige que

sean permutables todos los E (l) con todos los F (m).
6. Teoría de la luz
A lo largo de los párrafos que preceden hemos ido hallando de nuevo todas las
proposiciones estadísticas que enunciamos en 1, 2, e incluso dotadas de un alcan-
ce esencialmente mayor y sistemáticamente expuestas, todas con una sola excep-
ción: nos falta aún la expresión dada por Heisenberg de la probabilidad de trán-
sito desde un estado estacionario de un sistema cuantificado a otro estado de igual
índole, a pesar de que justamente ésta representó un papel esencial en la génesis
de la Mecánica cuántica (cf. lo dicho en I.2). En lo que sigue mostraremos, si-
guiendo a Dirac,138 cómo estas probabilidades de transición pueden ser deducidas
de las proposiciones estadísticas ordinarias de la nueva Mecánica, o sea, de la teo-
ría que hemos expuesto. Esto es tanto más importante cuanto que, al hacerlo,
277
Fund_MAT_03.indd 277 7/5/18 14:18

profundizaremos en el conocimiento de los mecanismos de transición y en el de

las conexiones entre las relaciones energía-frecuencia de Einstein y Bohr. La teoría
de la luz que sigue, debida a Dirac, es con mucho la más bella aportación al cam-
po de la Mecánica cuántica.
Sea S un sistema (por ejemplo un átomo cuantificado) a cuya energía corres-
ponde el operador hermítico H0. Usaremos la letra ξ para designar abreviadamen-
te las coordenadas de un punto genérico del espacio de los estados de S (p. ej.,
cuando S consta de l partículas, hay 3l coordenadas cartesianas: x1 = q1, y1 = q2,
z1 = q3, …, xl = q3l - 2, yl = q3l - 1, zl = q3l). Además, y para mayor sencillez, se su-
pondrá que H0 posee un espectro discreto puro integrado por los valores propios
W1, W2, …, a los que están vinculadas las funciones propias j1(x), j2(x) … (al-
gunas Wn pueden coincidir entre sí). Un estado cualquiera de S, esto es, una fun-
ción de onda j (x), evoluciona de acuerdo con la ecuación temporal de Schrödin-
ger (cf. III.2):
h ∂
j (x) = -H0jt(x),
2pi ∂t t
∞
es decir, cuando para t = t0 es ϕt (ξ ) = ϕ (ξ ) = ∑ akϕk (ξ ), en cualquier otro instante
2π i k =1
∞
− Wk (t −t0)
es ϕt (ξ )= ∑ ak e h ϕk (ξ ). Un estado j (x) = jk(x), por lo tanto, se transforma
k =1
2π i
− Wk (t −t0)
en e h ϕ (ξ ) y es decir, en sí mismo, puesto que no es esencial la presencia
k
2π i
− Wk (t −t0)
del factor e . Los estados jk(x) son, pues, estacionarios. Al pronto no en-
h
contramos, por consiguiente, ningún tránsito de un jk(x) a otro; ¿cómo es posible

entonces que de ellos se hable? La explicación es sencilla: hemos dejado al margen
el agente que ocasiona esas transiciones: la luz. Ya en la primitiva teoría de Bohr
las trayectorias cuánticas estacionarias se destruyen sólo en el acto de la emisión
de luz (cf. loc. cit. Nota 5) y es muy razonable que cuando de ésta se prescinde
resulte una estabilidad eterna y absoluta. Por consiguiente, debemos ampliar el
sistema que ha de ser estudiado, incluyendo en él la luz que eventualmente emita
S, es decir, toda luz que pueda entrar en interacción con S. Llamemos L el siste-
ma constituido por la luz (o sea, el campo electromagnético de la teoría clásica,
dejando aparte el campo estático motivado por las cargas de los núcleos y electro-
nes): hay que investigar el sistema S + L.
Debemos, pues, encontrar:
1. Una hipótesis que permita la descripción mecánico-cuántica de L; es de-
cir, es menester indicar el espacio de los estados de L.
2. El operador de la energía de S + L, que se descompone en tres partes:
a) La energía de S que existe independientemente de L, es decir, la energía
no perturbada de S; para dicho sistema lo es el operador H0.
278
Fund_MAT_03.indd 278 7/5/18 14:18

b ) La energía de L que existe independientemente de S, es decir, la energía

no perturbada de L. Lamemos Hl su operador.
g ) La energía restante, es decir, la energía de interacción de S y L. Llamemos
Hi su operador.
Como se ve, trátase aquí de cuestiones que, en virtud de los principios funda-
mentales de la Mecánica cuántica, deben recibir primero una respuesta en términos
clásicos, para luego traducir en operadores el resultado así obtenido (cf. I.2). Nos
colocamos así, por lo pronto, en un punto de vista netamente clásico tocante a la
naturaleza de la luz: la concebimos como un estado de vibración del campo elec-
tromagnético (en el sentido de la teoría electromagnética de la luz).139
Para evitar superfluas complicaciones (pérdida de la luz en el espacio infinito,
etc.), imaginemos S y L encerrados en un recinto vacío H, muy grande, de vo
lumen V, cuyas paredes sean, por ejemplo, reflectoras. El estado del campo
e!lectromagnético en H está definido,
! como es notorio, por el campo eléctrico
E = {Ex, Ey, Ez} y el magnético H = {Hx, Hy, Hz}. Todas las magnitudes Ex, …, Hz,
son funciones de las coordenadas cartesianas x, y, z de un punto genérico de H y
del tiempo t. Hay que señalar! que, en lo que !sigue, consideraremos repetidas   ve-
ces vectores espaciales reales a = {ax, ay, az}, b = {bx, by, zz}, etc. (p. ej., E , H ) y
formas de ellos derivadas, cual el producto interior
! !
a × b = ax bx + a y by + az bz ,
que no hay peligro de que se confunda con el producto interior (j, y) en E∞. El
∂ 2 ∂ 2 ∂ 2
símbolo ∆ designará el operador diferencial 2 + 2 + 2 y div, grad, rot las
∂x ∂y ∂z  
conocidas operaciones diferenciales vectoriales. Los vectores E , H , satisfacen las
ecuaciones de Maxwell en el recinto vacío H:

  1 ∂H
div H = 0, rot E + = 0,
c ∂t

  1 ∂E
div E = 0, rot H − = 0,
c ∂t
 !
! La primera ecuación de la primera fila queda satisfecha para H = rot A
( A = {Ax, Ay, Az}, es el llamado potencial vector y también!sus componentes de-
! 1 ∂A
penden de x, y, z, t) y la segunda, entonces, para E = − . Por lo que concier-
c ∂t
ne a las ecuaciones de la segunda fila, éstas implican que
! ! 1 ∂2 !
(A) div A = 0, ΔA − 2 2 A = 0.
c ∂t
279
Fund_MAT_03.indd 279 7/5/18 14:18

La introducción del potencial vector casi siempre se lleva a cabo de un modo

algo diferente con el fin de aumentar la simetría en espacio y tiempo. Que este A
dé lugar a la solución más general de las ecuaciones de Maxwell —acerca de las
cuales es menester observar que de la primera de la segunda fila resulta, en rigor,
∂ ! !
tan sólo div A = 0, es decir, div A = f (x, y, z)— es algo que se demuestra en
∂t
la mayor parte de los tratados referentes a la teoría de Maxwell, por lo que no lo
discutiremos aquí. Cf. loc. cit. Nota 139]. (A) constituye nuestro punto de partida
 sigue. El hecho de ser reflectoras las paredes de H halla su expresión
para lo que
en que A debe ser perpendicular a ellasen el contorno de dicho espacio. El cono-
cido método para encontrar todos los A de esta clase  es el siguiente: puesto que t
no aparece explícitamente en todo el problema, el A más general es combinación
lineal de soluciones que sean productos de un vector dependiente de x, y, z, por
un escalar función de t :
  
A ≡ A(x, y,z,t ) ≡ A(x, y,z ) ⋅ q(t).

Luego, de (A) resulta:

   
(A1) div A = 0,ΔA = η A, A perpendicular a las paredes H en el contorno de H,
d2
(A2)  = c 2ηq(t),
q(t) 
dt 2
donde h depende sólo de x, y, z según (A1) y solamente de t según (A2) y es, por
lo tanto, constante.
(A ), por ende,
1  es un problema de valores propios; h es el parámetro de valo-
res propios y A la función propia más general. La teoría de este problema ha sido
íntegramente desarrollada; de ella indicaremos aquí sólo el resultado:140 (A1) posee
 propios h1, h2, … (cuyas correspon-
un espectro discreto puro; todos los valores
dientes funciones propias llamaremos A , A , …) son negativos y tienden a -∞
1 2
para n → +∞. Un sistema completo A , A , … podemos normalizarlo de modo

1 2
que
! ! ⎧4π c 2, para m = n,
∫∫∫ H
Am × An dx dy dz = ⎨
⎩ 0 para m ≠ n,
(Hemos elegido 4pc2, en vez del en otras ocasiones habitual 1, porque más ade-
lante resultará ese valor algo más práctico que el último). Escribamos hn(<0) en la
280
Fund_MAT_03.indd 280 7/5/18 14:18

4p 2r 2
forma - 2 n (rn > 0; para n → +∞, también rn → +∞); la sustitución en (A2)
nos da c
q~n(t) = g cos 2 prn(t - t) (g, t arbitrarios).


Luego, la solución más general A de (A) es
! ! ∞ ! ∞ !
A = A(x, y, z, t) ≡ ∑ A(x, y, z) ⋅ q"n (t) = ∑ An (x, y, z) ⋅ γ n cos 2πρn(t − τ n )
n =1 n =1
(g1, g2, …, t1, t1, … constantes reales arbitrarias). La energía de un campo arbi-
! ∞ ! 
trario A = ∑ A (x, y, z) ⋅ q"n(l ) [ A no se supone solución de (A), es decir, las qn(t)
n =1
son cualesquiera] vale
 
1     1 ⎛ ∂A ∂A  ⎞
E=
8π
H
∫∫∫
(E × E + H × H)dxdydz =
8π
H
⎜⎝ ×
∂t ∂t ∫∫∫ + rot A × rot A⎟ dxdydz =
⎠
1 ∞ ⎛1 d d    ⎞
= ∑
8π m,n =1 ∫∫∫
⎜⎝ 2 qm(t) ⋅ qm(t) Am × An + qm (t)qn(t)rot Am × rot An ⎟⎠ dxdydz.
c dt
H
dt
Acudiendo a la integración por partes se encuentra:141

   
∫∫∫ H
rot Am × rot An dxdydz = ∫∫∫ H
rot (rot Am ) × An dxdydz =
   4π 2 ρm2  
= ∫∫∫
H
(−ΔAm + grad div Am ) × An dxdydz =
c2 ∫∫∫
H
Am × An dxdydz ,
y, por ende,
1 ∞
⎛1 d d 4π 2 ρm2 ⎞ ! !
E=
8π
∑ ⎜⎝ c 2
m,n =1 dt
q!m(t) ⋅ q!n(t) +
dt c 2
q!m(t) ⋅ q!n(t)⎟
⎠ ∫∫∫ H
Am × An dxdydz =
1 ⎡⎛ d ⎤
∞ 2
⎞
= ∑ ⎢⎝ q!m(t)⎠ + 4π ρm[q!m (t)] ⎥.
2 m −1 ⎣ dt
2 2 2
Ahora bien, podemos considerar q1, q2, … como coordenadas que definen el es-
tado instantáneo del campo, es decir, como coordenadas en el espacio de los esta-
281
Fund_MAT_03.indd 281 7/5/18 14:18

dos de L, cuyos impulsos conjugados pn se determinan (¡al igual que en Mecánica
clásica!) a partir de la expresión de la energía
1 ∞ ⎡⎛ d ⎞ ⎤
2
E= ∑ ⎢⎝ q!n ⎠ + 4π ρn q!n ⎥ :
2 n =1 ⎣ dt
2 2 2
⎦
∂ ∂ 1 ∞ 2
p!n =
⎛d !⎞
E = q!n,
∂t
E= ∑ ( p!n + 4π 2 ρn2q!n2),
2 n =1
∂ q
⎝ dt n ⎠
(cf. I.2). De aquí se derivan, siguiendo la pauta de la Mecánica clásica, las ecua-
ciones del movimiento:
d ∂ d ∂
p!n = − E = −4π 2 ρn2 q!n, q!n = E = p!n,
dt ∂q!n dt ∂ p!n
es decir,
d2
qn + 4π 2 ρn2 qn = 0,
dt 2
resultado éste exactamente igual a la ecuación (A2) deducida de las ecuaciones de

Maxwell. Vale, pues, el siguiente teorema de Jeans:
El campo de radiación L puede definirse mediante las coordenadas
 q1, q2, …,
las cuales están ligadas con el potencial vector instantáneo A que lo fija por la
relación
! ! ∞ !
A ≡ A(x, y, z) ≡ ∑ q"n An(x, y, z),
n =1
y la función de Hamilton (expresión de la energía)
1 ∞ 2
E = ∑
2 n =1
( p!n + 4π 2 ρn2 q!n2 ),
de forma tal, que obedece a las ecuaciones canónicas de la Mecánica clásica.

Un punto de masa 1 sujeto a moverse sobre una recta y sometido a un campo
que deriva del potencial C q 2 (C = 2p 2r2, q es la coordenada del punto), tiene la
1 ⎡⎛ d ⎞ ⎤
2
d
energía ⎢⎜ q⎟ + 4π 2 ρ 2 q 2 ⎥ , o si se quiere, puesto que p = q , la energía

⎝
2 ⎣ dt ⎠ ⎦ dt
282
Fund_MAT_03.indd 282 7/5/18 14:18

1 2 d2
( p! + 4π 2 ρ 2 q! 2 ). Su ecuación del movimiento es, por lo tanto, 2 q! + 4π 2 ρ 2 q! = 0,
2 dt
cuya solución general es de la forma q = g cos 2 pr (t - t) (g, t arbitrarios). En
atención a esta su forma de movimiento, este sistema ha recibido el nombre de
«oscilador lineal de frecuencia r». Por consiguiente, hay que considerar L como
reunión de una infinidad numerable de osciladores lineales cuyas frecuencias son
las frecuencias propias del recinto vacío H: r1, r2, …
Esta descripción «mecánica» del campo electromagnético es importante, por-
que puede traducirse desde luego al lenguaje de la Mecánica cuántica en virtud de
los métodos habituales: el espacio de los estados de L se describe mediante las coor-
denadas q1, q2, … y en la expresión de E hay que sustituir pn, qn por los operadores
h ∂… …
, q!n , respectivamente, operadores que llamaremos Pn y Q  n. Con esto que-
2π i ∂q!n
dan resueltas las cuestiones I. y 2. b); en particular, el operador por el que se pedía
en esta ultima es
1 ∞ !2
Hl = ∑ (Pn + 4π 2 ρn2Q!n2).
2 n =1
2.a) estaba de antemano resuelta, pues supusimos conocido H0. Por lo tanto,
nos queda por contestar tan sólo 2.g ), lo cual ahora no puede ocasionar ya difi-
cultad ninguna.
Desde el punto de vista de la Electrodinámica clásica, la interacción de S y L
se calcula de la siguiente manera: Supongamos que S consta de l partículas (por
ejemplo, protones y electrones) con cargas e1, …, el y masas m1, …, ml ; sean
x1 = q1, y1 = q2, z1 = q3, …, xl = q3l - 2, yl = q3l - 1 zl = q3l sus coordenadas cartesianas
(resumidas en el símbolo x antes introducido) y p1x, p1y, p1z, …, plx, ply, plz los co-
rrespondientes impulsos. En estas condiciones, el valor de la energía de interacción
es (de modo suficientemente aproximado)
l 142
e
∑ cmν [pνx Ax (xν , yν , zν ) + pνy Ay (xν , yν , zν ) + pνz Az (xν , yν , zν )].
ν =1 ν
El correspondiente operador de la Mecánica cuántica se obtiene sustituyendo en

esta expresión pnx, pny, pnz, xn, sn yn, zn(n = 1, …, l ) por los operadores
h ∂ … h ∂ … h ∂ … … … …
, , , xν , yν , zν ,
2π i ∂xν 2π i ∂ yν 2π i ∂zν
que llamaremos Pvx, Pvy, Pvz, Qvx, Qvy, Qvz… Si, además, tenemos presente que
! ∞ !
A(x, y, z) = ∑ q"n An (x, y, z),
n =1
283
Fund_MAT_03.indd 283 7/5/18 14:18

resulta el operador buscado Hi:
∞ l
eν ! x
Hi = ∑ ∑ Qn {Pν An, x (Qνx , Qνy , Qνz ) +
n =1 ν =1 cmν
+Pν y An, y (Qνx , Qνy , Qνz ) + Pνz An,z (Qνx , Qνy , Qνz )}.
Sin embargo, acerca de esto hay que observar que, en la sustitución de los produc-
–
tos pnx A n, x(xn, yn, zn), … por operadores, hemos fijado arbitrariamente el orden de
–
sucesión Pnx A n, x (Qnx, Qny, Qnz), … —aunque igualmente hubiésemos podido elegir
–
el A n, x (Qn , Qny, Qnz)Pnx, …— y que para asegurar el carácter hermítico del operador
x
resultante sería necesario, en rigor, dar a tales productos una forma simétrica cual
1 – –
la [Pnx A n, x (Qnx, Qny, Qnz) + A n, x (Qnx, Qny, Qnz) Pnx], … Afortunadamente, ello no
2
da lugar a diferencia alguna, pues
[Pνx An, x (Qνx , Qνy , Qνz ) + …] − [ An, x (Qνx , Qνy , Qνz )Pνx + …]
= [Pνx An, x (Qνx , Qνy , Qνz ) − An, x (Qνx , Qνy , Qνz )Pνx ] + … 143
h ∂ h 
= An, x (Qνx , Qνy , Qνz ) + … = div An(Qνx , Qνy , Qνz ) = 0.
2π i ∂x 2π i
La energía total de nuestro sistema S + L y su correspondiente operador
H = H0 + Hl + Hi
quedarían así determinados exactamente. Pero antes de proceder a la ulterior trans-

formación de H, conviene observar que el espacio de los estados de S + L está
descrito por las coordenadas x (es decir, q1, …, q3l o también x1, y1, z1 …, xl , yl , zl )
y q1, q2, …, y que, por consiguiente, de ellas depende asimismo la función de onda.
Ahora bien, formalmente es incómodo y delicado el trabajar con sistemas de infi-
nitos grados de libertad y, por ende, con funciones de onda de infinitos argumen-
tos, pues cuanto llevamos visto se refiere a un número finito de coordenadas. Por
esto consideraremos por lo pronto sólo las N primeras  qn : q1 …, qN (es decir, nos
limitaremos a las combinaciones lineales de A1 …, AN) y solamente en el r esultado
final efectuaremos el paso al límite, N → + ∞ efectivamente necesario. Se escribi-
rá así
1 N 2 N l
e
H = H0 + ∑
2 n =1
(Pn + 4π 2 ρn2Qn2 ) + ∑ ∑ v Qn {Pνx An, x (Qνx , Qνy , Qνz ) +
n =1 ν =1 cmv
+Pν y An, y (Qνx , Qνy , Qνz ) + Pνz An,z (Qνx , Qνy , Qνz )}.
284
Fund_MAT_03.indd 284 7/5/18 14:18

Resulta conveniente introducir en lugar de Pn, Qn el operador Rn y su adjunto Rn*
(¡no hermíticos!) definidos por
1 1
R!n = (2πρnQ!n + iP!n ), R!n* = (2πρnQ!n − iP!n )
2h ρn 2h ρn
1 h ! h
Se tiene entonces Q!n (Rn + R!n*), y pues P!nQ!n − Q!n P!n = 1,
2π 2 ρn 2π i
1 !2 1
R!n R!n* = (Pn + 4π 2 ρn2Q!n2 ) + ⋅1,
2h ρn 2
1 !2 1
R!n* R!n = (Pn + 4π 2 ρn2Q!n2 ) − ⋅1,
2h ρn 2
en particular, por lo tanto, RnRn* - Rn*Rn = 1. En función de estos operadores, la

expresión de la energía es
N N l
ev h !
H = H0 + ∑ h ρn ⋅ R!n* R!n + ∑ ∑ (Rn + R!n*) ⋅
n =1 n =1 ν =1 2π cmν 2 ρν
⋅[P An, x(Q , Q , Qνz ) + Pν y An, y(Qνx , Qνy , Qνz ) + Pνz An,z(Qνx , Qνy , Qνz )] + C,
ν
x
ν
x
ν
y
1 N
donde C es una constante, igual a ∑ h ρn. Y a que una constante aditiva en la
2 n =1
expresión de la energía carece de sentido físico, podemos prescindir de C; y esto
es tanto más indispensable cuanto que C → ∞ para N → +∞, divergencia que
perturbaría la correcta ultimación de la teoría*.
Se demuestra que el operador hermítico Rn*Rn es hipermáximo y que su espec-
tro es un espectro discreto puro constituido por los números 0, 1, 2, … Llamemos
Ψ0n(qn), Ψ1n(qn), Ψ2n(qn)… las correspondientes funciones propias.
* Es un hecho sobradamente conocido que los niveles de energía de un oscilador lineal de fre-
1 1
cuencia r son de la forma (n + ) h r. donde el nivel mínimo h r aparece como energía en el
2 2
cero absoluto en determinadas teorías de la radiación negra. La constante C es precisamente la suma
de estas energías mínimas, correspondientes a las funciones propias del recinto H hasta la N-sima.
No le parece bien a De Broglie ese prescindir de la constante (que en último término daría un
valor infinito a la energía) por aquello de que se trata en la teoría sólo de diferencias de energía,
1
antes se inclina a creer que estos términos h r no existen realmente en el caso de los fotones (Une
2
nouvelle théorie de la lumière, vol. I, París, Hermann, 1940, p. 245). (N. del T.)
285
Fund_MAT_03.indd 285 7/5/18 14:18

1 h
[Es preferible escribir q en lugar de las variables qn, con los que
2π ρn
1 ρn 1 h ∂ 1 h 1 ∂
2πρn qn = 2π qn y = se transforman
2h ρn 2h 2h ρn 2π i ∂qn 2π
! 2 ρn i ∂q!n
1 1 1 ∂
en qy y, por lo tanto,
2 2 i ∂q
1 ⎛ ∂⎞ 1 ⎛ ∂⎞
R!n = ⎜ q + ⎟ , R!n* = ⎜ q− ⎟
2⎝ ∂q ⎠ 2⎝ ∂q ⎠
1 ∂2 1 1
R!n R!n* = − + q2 + ,
2 ∂q 2
2 2
1 ∂2 1 1
R!n*R!n = − + q2 − ,
2 ∂q 2
2 2
La teoría de valores propios de estos operadores la encontrará el lector, p. e., en

Courant-Hilbert, p. 261, fórmulas (42), (43) y siguientes, y en la p. 76,
fórmulas (60), (61); o en Weyl: Gruppen-theorie und Quantenmechanick, pp. 74
y ss.].
Puesto que las funciones Ψ1(ξ), Ψ2(ξ), forman un sistema ortonormal com-
pleto en el espacio –ξ, y las Ψ0n(qqn), Ψ1n(qn), … lo constituyen en el espacio –qn,
las funciones ΦkM … M (ξ, q1, … qn) = Ψk (x)Ψ1M (qN) … ΨNM (qN), (k = 1, 2, …;
1 N 1 N
M1, …, MN = 0, 1, 2, …) forman un sistema ortonormal completo en el espa-

cio x, q1, … qN, es decir, en el espacio de los estados. Por consiguiente, podemos
desarrollar las funciones de onda Φ = Φ (ξ, q1, … qN) en serie de la forma
∞ ∞ ∞
Φ(ξ q1,…, qN ) = ∑ ∑…∑ akM1…MN ΦkM1 …MN (ξ, q1,… , qN ) =
k =1 M1 = 0 MN = 0
∞ ∞ ∞
=∑ ∑… ∑ akM1…MN Ψk (ξ )Ψ1M1(q1)… Ψ NM N (qN ).
k =1 M1 = 0 MN = 0
Carece de importancia el que aquí los elementos del sistema ortonormal comple-
to y los coeficientes del desarrollo aparezcan afectados de N + 1 índices en vez de
uno solo. El caso es que en virtud de las consideraciones hechas en II.2, podemos
afirmar que cabe concebir el espacio hilbertiano de las funciones de onda Φ como
espacio de las sucesiones N + 1 - múltiples akm … M cuyos elementos son tales que
1 N
286
Fund_MAT_03.indd 286 7/5/18 14:18

∞ ∞ ∞
∑∑ ∑
2
resulta convergente la serie … akM1…M N . Sentado esto, ¿qué operador
k =1 M1 = 0 M N =1
es H en el espacio de Hilbert así concebido ? Para poder responder a esta pregun-
ta, calculemos primero H ΦkM … M : dado que H0 opera sólo sobre las x y Ψk(x) es
1 N
función propia de H0, con Wk, como valor propio, y dado que Rn*Rn opera sólo
sobre qn y Ψ(n)
M (qn) es función propia de Rn*Rn con Mn como valor propio, tendre-
n
mos
⎛ N
⎞ N l
e h
HΦkM1…M N = ⎜Wk + ∑ Mn ⋅ h ρn ⎟ ΦkM1…M N + ∑ ∑ ⋅
⎝ n =1 ⎠ n =1 ν =1 2π cmν 2 ρn
⋅[Pνx An, x (Qνx , Qνy , Qνz ) + Pν y An, y (Qνx , Qνy , Qνz ) + Pνz An,z (Qνx , Qνy , Qνz )]Ψk (ξ) ⋅
⋅Ψ1M1(q1)…(Rn + Rn* )ΨnMn (qn )… Ψ NM N (qN ).
Para todos los operadores A que, cual la expresión […], sólo afectan a la va-
riable ξ, es válido aplicar el desarrollo
∞ ∞
AΨk (ξ ) = ∑ (A Ψk ,Ψ j )Ψ j (ξ ) = ∑ (A) jk ⋅ Ψ j (ζ ),
j =1 j =1
donde, por lo tanto, (A)jk está definido por (A)jk = (A Ψk, Ψj). Además, conforme
se demuestra en el lugar antes citado,
R!n ΨnM (q!n ) = M ΨnM −1(q!n ), R!n*ΨnM (q!n ) = M + 1 ΨnM +1(q!n ) *
* Las matrices de R n* y R n en el esquema ψ n0(qn), ψ n1(qn) son, pues,
⎛ 0 1 0 0 …⎞ ⎛ 0 0 0 0 …⎞
⎜ 0 0 2 0 …⎟ ⎜ 1 0 0 0 …⎟
R!n = ⎜ 0 0 0 3 … ⎟ , R!n* = ⎜ 0 2 0 0 … ⎟
⎜ 0 0 0 0 …⎟ ⎜ 0 0 3 …⎟
⎜⎝ .............................⎟⎠ ⎜⎝ .............................⎟⎠
y en el esquema Ψ 1M1(q1) … Ψ NMN (qN)
( Rn )M1…M N , M'1…M'N = M'n δ Mn, M'n −1 Π δ Ml , M'l (l =1,2,…,n −1,n+1,…,N )

l ≠n
( Rn* )M1…Mn, M'1…M'N = M'n + 1 δ Mn −1, M'n Π δ Ml , M'l .

l ≠1
Es fácil comprobar que

N
(Rn* Rn )M1 …MN , M'1…M'N = Mn Π δ Ml , M'i ,
l =1
287
Fund_MAT_03.indd 287 7/5/18 14:18

(para M = 0, el segundo miembro de la primera fórmula debe considerarse igual

a cero, sin atender al símbolo sin sentido Ψn-1 que en él aparece entonces). Por
consiguiente será
∞ N
⎛ N
⎞ h
HΦkM1 …M N = ⎜Wk + ∑ Mn ⋅ h ρn ⎟ ΦkM1…M N + ∑ ∑ ⋅
⎝ n =1 ⎠ j =1 n =1 2 ρn
⎛ l eν ⎞
⎜⎝ ν∑
=1 2π cmν
[Pνx An, x (Qνx , Qνy , Qνz ) + …]jk ⎟ ⋅
⎠
⋅ ( Mn + 1 Φ jM1…Mn +1…M N + Mn Φ jM1…Mn −1…M N ).
Podemos ahora determinar ya la forma de H en cuanto operación sobre las akM … M : 1 N
se tiene
H ∑ akM1…M N ΦkM1…M N = ∑ a'kM1…M N ΦkM1…M N ,

kM1 …M N kM1 …M N
donde
⎛ N
⎞
HakM1…M N = a'kM1…M N = ⎜Wk + ∑ Mn ⋅ h ρn ⎟ akM1…M N +
⎝ n =1 ⎠
∞ N
h ⎛ l eν ⎞
+∑ ∑ ⎜ ∑ [Pνx An, x (Qνx , Qνy , Qνz ) + …]kj ⎟ ⋅
j =1 n =1 2 ρn ⎝ ν =1 2π cmν ⎠
⋅ ( Mn a jM1…Mn −1…MN + Mn + 1 a jM1…Mn +1…M N ). *
Con esto hemos llevado la discusión relativa a H a un punto en que es ya

oportuno efectuar el paso al límite N → +∞. Al hacerlo cambia, claro está, el nú-
mero de subíndices que determinan cada clase de componentes akM … M y nos 1 N
lo que era de prever, porque Mn = 0, 1, 2, … son los valores propios de R n* y R n y ψ n(qn) sus fun-
ciones propias. Además es
R n R n' - R n' R n = R n* R n'* - R n'* R n* = 0
y
R n R n'* - R n'* R n = dnn' ,
relación esta última en parte indicada en el texto. (N. del T.)
* Téngase muy en cuenta que con la notación H akM1 … MN designa Neumann la componente
kM1 … MN, ... del vector a' transformado del a mediante el operador H, los elementos hkM1 … MN,
k' M'1 … M'N, de cuya matriz son, más explícitamente,
288
Fund_MAT_03.indd 288 7/5/18 14:18

encontramos ante un nuevo operador H. Es menester, por ende, introducir com-

ponentes akM M … afectadas de una infinidad numerables de índices M1, M2, …;
1 2
∞
pero para tener la seguridad de que converge la suma ∑ h ρn ⋅ Mn que aparece en
n =1
H, deberemos limitarnos a aquellas sucesiones M1, M2, …, en las que los elemen-
tos distintos de cero son en número finito. A partir de este momento, el espacio
de Hilbert que entra en juego está formado por todas las sucesiones de elementos
akM M tales que
1 2
∞ ∞ ∞
∑ ∑ ∑ … akM M …
2
1 2
k =1 M1 = 0 M 2 = 0
es convergente, elementos cuyos subíndices recorren los siguientes conjuntos:

k = 1, 2, …; M1, M2, … = 0, 1, 2, …, pero sólo en número finito los Mn ≠ 0 (por
lo demás, en número cualquiera)114. De este modo, la forma definitiva de H es
∞
⎛ ⎞
HakM1M2 … = a'kM1M2 … = ⎜Wk + ∑ Mn ⋅ h ρn ⎟ akM1M2 … +
⎝ n =1 ⎠
∞ ∞
+ ∑ ∑ wkjn ( Mn + 1 a jM1M2 …Mn +1… + Mn a jM1M2 …Mn −1…),
j =1 n =1
⎛ N
⎞ N
hkM1…M N ,k'M'1…M'N = ⎜Wk' + ∑ M'n ⋅ h ρn ⎟ δ kk' ∏ δ M s , M's +
⎝ n =1 ⎠ s =1
N l
eν h
+∑∑ Pνx An, x (Qνx , Qνy , Qνz ) + …]kk' ⋅
n =1 ν =1 2π cmν 2 ρn
⋅ ( M'n δ Mn, M 'n −1 + M'n + 1 δ Mn −1, M'n) ∏ δ M s , M's .
s ≠n
De aquí se deduce
a'kM1…M N = ∑ hkM1…M N ,k'M'1…M'N ak'M'1…M'N =

k'M'1 …M' N
∞
⎛ N
⎞ N l
e h
= ⎜Wk + ∑ Mn ⋅ h ρn ⎟ akM1…M N + ∑ ∑ ∑ ν [Pνx An, x (Qνx , Qνy , Qνz ) + …]kk' ⋅
⎝ n =1 ⎠ n =1 ν =1 k' =1 2π cmν 2 ρn
⋅ ( Mn + 1ak1'M1…Mn +1…M N + Mn ak'M1…Mn −1…M N ),
resultado que coincide con el del texto. La matriz hkM1 … MN, k'M'1 … M'N aparece así como suma de tres:
las dos primeras son matrices diagonales y corresponden a la energía del sistema S (la 1.ª) y a la
radiación (la 2.ª); la tercera no es una matriz diagonal, y corresponde a la energía de interacción
(matriz de perturbación) (N. del T.)
289
Fund_MAT_03.indd 289 7/5/18 14:18

donde wnkj está definido por

l
h e
wkjn =
2 ρn
∑ 2π cm
ν
[Pνx An, x (Qνx , Qνy , Qνz ) + …]kj . *
ν −1 ν *
Antes de deducir de este resultado las consecuencias tísicas que nos interesan,
hay que recordar que fue conseguido merced a la teoría electrodinámica de la luz,
y es natural que pretendamos primero averiguar si esa transformación meramente
formal de índole mecánico-cuántica que hemos operado, basta para reproducir las
discrepancias que en su comportamiento muestra la luz respecto del modelo on-
dulatorio —en particular, su naturaleza en realidad discreto-corpuscular. (Es del
todo concebible, en efecto, que para abarcar este último aspecto, acaso debiera
haberse partido directamente de un modelo corpuscular de la luz, en vez de «cuan-
tificar» el campo electromagnético, cual hemos hecho.)
Se ve desde luego en nuestra expresión de H que incluye elementos que pare-
cen aludir a algo así como corpúsculos de luz. En efecto: si prescindimos de los
términos de la suma doble, que representa una a manera de perturbación y que,
conforme veremos en seguida, provoca los saltos cuánticos del sistema S desde un
estado «estacionario» a otro (este es el fenómeno que propiamente nos interesa,
pero de todos modos es considerablemente más débil que los debidos al sistema
material S y a la radiación preexistente que están representados en la primera
suma), queda el operador
∞
⎛ ⎞
H1akM1M2 … = ⎜Wk + ∑ Mn ⋅ h ρn ⎟ ⋅ akM1M2 …
⎝ n =1 ⎠
* La representación matricial ordinaria del nuevo operador resulta de la indicada en nuestra

anterior nota, sin más que hacer en ella N → +∞:
⎛ ∞
⎞ ∞
hkM1M2 …k'M'1M'2 … = ⎜Wk' + ∑ M'n ⋅ h ρn ⎟ δ kk' ∏ δ M s , M's +
⎝ n =1 ⎠ s =1
∞ ∞
+ ∑Wkk'n ( M'n δ Mn, M'n −1 + M' + 1 δ Mn −1, M'n ) ∏ δ M s , M's .
n =1 s ≠n
Los tres términos de que hablábamos en ella son

∞
(s)
hkM1M 2 …,k'M'1M' 2 …
= Wk' ⋅ δ kk' ∏ δ M s , M's (energía de S),
s =1
⎛∞ ⎞ ∞
(L)
hkM1M 2 …,k'M'1M' 2 …
= ⎜ ∑ M'n ⋅ h ρn ⎟ ⋅ δ kk' ∏ δ M s , M's (energía de L ),
⎝ n =1 ⎠ s =1
∞ ∞
(I)
hkM 1M 2 …,k'M'1 M' 2 …
= ∑Wkk'n ( M'n δ Mn, M'n −1 + M'n + 1 δ Mn −1, M'n ) ∏ d M s , M's
n =1 s ≠1
(energía de interacción). (N. del T.)
290
Fund_MAT_03.indd 290 7/5/18 14:18

Esta energía puede interpretarse como energía Wk del sistema S aumentada en las
energías Mn ⋅ hrn (n = 1, 2, …), donde es natural concebir el número Mn = 0, 1,
2, … como número de partículas de energía hrn. Pero justamente esta energía hrn
es la que hay que atribuir según Einstein, a un quantum de luz de frecuencia rn
(cf. Nota 134). Por lo tanto, la estructura de H1 sugiere la hipótesis de que el campo
electromagnético existente en H (prescindiendo de la parte electrostática), es de-
cir, L, consta en realidad de quanta luminosos de frecuencias r1, r2, … y energías
hr1, hr2, …, y que los números M1, M2, … (= 0, 1, 2, …) representan el núme-
ro de quanta de cada clase. Cabe justificar el que no se consideren otras frecuencias
que precisamente r1, r2, …, ! por el hecho de ser éstas las frecuencias propias de
H: los potenciales vector An(x, y, s). gn cos 2 prn(t - tn) representan, en efecto, las
únicas oscilaciones electromagnéticas estacionarias posibles en H.
De todos modos esas especulaciones e interpretaciones tienen sólo un valor
heurístico. Una respuesta satisfactoria y definitiva a nuestra pregunta no la obten-
dremos hasta tanto no hayamos conseguido llegar a la expresión H de la energía
partiendo de un modelo en que la radiación L aparezca constituida por quanta de
luz. El haber desarrollado en primer lugar el punto de vista clásico, encuentra su
fundamento en que, en realidad, desconocemos la expresión de la energía de in-
teracción quantum luminoso-materia (en este punto no cabe la traducción de la
Electrodinámica clásica al nuevo lenguaje); pero ahora podremos determinarla por
comparación de coeficientes tan pronto el resultado deducido con la energía de
interacción general coincida formalmente con H.
¿Cuál es el espacio de los estados de L (1.ª cuestión) de acuerdo con la hipó-
tesis de los quanta de luz? Un único quantum luminoso (en el recinto vacío H)
puede caracterizarse por ciertas coordenadas, para designar cuyo conjunto usare-
mos del símbolo u.145 Sean Ψ1(u), Ψ2(u) … las funciones de onda correspondien-
tes a sus estados estacionarios (en H), las cuales constituyen un sistema completo,
y E1, E2, … los valores de la energía a ellos vinculados. En el esquema ! ! anterior,
corresponden a aquéllas las oscilaciones electromagnéticas propias A1, A2, … y a
éstos las frecuencias r1, r2, … (En virtud de la hipótesis de Einstein debe ser
En = hrn, lo que también demostraremos.) Es menester hacer observar aquí, que
ya en el estudio electromagnético antes llevado a cabo habíamos normalizado la
energía luminosa de modo que su valor mínimo fuese 0, valor que correspondía
a los índices M1 = M2 = … = 0, con lo que hemos reconocido la no existencia
como uno de los posibles estados de la luz, lo que también justifican los hechos:
los quanta de luz pueden ser efectivamente emitidos y absorbidos, es decir, creados
y aniquilados. Sin embargo, una tal concepción es enteramente extraña a la Me-
cánica cuántica: cada partícula contribuye con sus coordenadas a la estructura del
espacio de los estados del sistema, y forma así parte tan íntimamente de la formal
descripción del sistema total, que es imposible aniquilarla en absoluto. Debemos,
pues, incluso tras su aniquilación, atribuirle una suerte de existencia latente, de
forma que aun entonces pertenezcan sus coordenadas al espacio de los estados. Por
consiguiente, uno de los estados Ψn(u) con una energía En = 0, debe corresponder
291
Fund_MAT_03.indd 291 7/5/18 14:18

a la no-presencia* del quantum de luz, estado que designaremos con Ψ0(u)

(E0 = 0), y de este modo Ψ1(u), Ψ2(u), … estarán vinculados al quantum lumi-
noso presente; pero adviértase que sólo Ψ0(u), Ψ1(u), Ψ2(u), … constituyen un
sistema ortonormal completo.
Pasemos ahora a L, al sistema de todos los quanta de luz. Desde el momento
en que incluimos quanta luminosos no presentes, L consta de tantos quanta que
nunca pueden aparecer en mayor número, es decir, de infinitos. Pero como sería
poco cómodo tener que operar en L desde un principio con infinitos elementos
integrantes, procedamos como sí sólo existieran S quanta de luz (S = 1, 2, …) y
únicamente al final efectuaremos el paso al límite S → +∞.146 A estos S quanta
luminosos les asignaremos los subíndices 1, 2, …, S y llamaremos sus coordenadas
u1, … uS. El espacio de los estados de L está descrito así por u1, …, uS y el de
S + L por ξ, u1, …, uS. La más general función de onda relativa a S + L, por
consiguiente, es de la forma f (ξ, u1 …, uS) y el sistema de funciones jk(ξ)Ψn (u1) 1
… Ψn (uS) (k = 1, 2, …; n1, …, nS = 0, 1, 2, …) es ortonormal y completo.

S
Ahora bien, los quanta de luz tienen la fundamental propiedad de ser comple-
tamente iguales entre sí, esto es, no existe en el mundo medio alguno para poder
diferenciar entre ellos dos de tales quanta cuyas coordenadas coincidan. De otro
modo: un estado en que para el quantum luminoso n.° m es um = u' y para el n.° n
es un = u'', en nada se distingue de aquel estado en que um = u'' y un = u' (¡este
modo de expresarse es propio de la Mecánica clásica, no de la cuántica, ya que
especificamos el valor de u y no la función de onda ϕ (u)!). En términos de Me-
cánica cuántica, esto nos dice que los estados correspondientes a las funciones de
onda f (ξ, u1, …, um …, un, …, uS) y f (ξ, u1, …, un …, um, …, uS) son indiscer-
nibles, es decir, que cada magnitud física R tiene en ambos el mismo valor medio
(y por consiguiente, pues esto es también cierto para las F(R), también la misma
estadística, cf. la discusión de V1 y V2 en III.1). Designemos con Omn la operación
funcional que permuta entre sí um, un (como se reconoce desde luego, O2mn = 1);
el resultado que precede puede enunciarse diciendo que R tiene el mismo valor
medio en f que en Omn f , esto es,
(Rf, f ) = (ROmn f , Omn f ) = (OmnROmn f , f ),
de donde
R = OmnR Omn, OmnR = ROmn.
Esto significa que, en el presente caso, sólo aquellos operadores R que son permu-
tables con todos los Omn (m, n = 1, …, S; m ≠ n), es decir, atendiendo a la defi-
* Tras algunas vacilaciones, y no sé si traicionando un poco el pensamiento del autor, nos hemos
decidido por traducir das Vorhandensein y das Nichtvorhandensein des Lichtquants por presencia y
no-presencia del quantum luminoso, entre otras razones porque, para él mismo, en ambos estados los
quanta existieren (p. 146, 8.º renglón). Oponemos así la no-presencia, y no la ausencia, a la presen-
cia del fotón, aludiendo con ello a ese espacial estado de energía nula (el état d’annihilation de De
Broglie). (N. del T.)
292
Fund_MAT_03.indd 292 7/5/18 14:18

nición de los Omn, sólo aquellos en los cuales todas las coordenadas intervienen
por modo simétrico, correspondan a magnitudes físicas.
Un operador R que se encuentre en este caso transforma una función de onda
f , simétrica respecto de todas las variables u1… uS (es decir, una f tal que Omn f = f ;
m, n = 1, …, S; m ≠ n); en otra de igual naturaleza: OmnR f = ROmn f = R f. Estas
funciones f –constituyen una variedad lineal cerrada, por lo tanto un espacio
hilbertiano E∞(S ), que es parte del espacio
– (S )de Hilbert E∞ de todas las f, y los R dan,
(S )
como imágenes de los elementos de E∞ , elementos de este mismo espacio, de

modo– que cabe concebirlos como operadores en él definidos. Por donde resulta
que E∞(S ) es aplicable a los fines de la Mecánica cuántica de la misma manera que
el E∞(S ) tomado en consideración al principio, y a la vez se plantea la cuestión de
saber si por ventura podemos limitarnos – a las funciones de onda simétricas, es
decir, si podemos sustituir E∞(S ) por E∞(S ) dada la simetría de L respecto de las per-
mutaciones de los quanta de luz. En lo que sigue vamos a proceder cual si fuera
lícita dicha sustitución, y el completo enlace que hay que conseguir con la expre-
sión de H deducida mediante consideraciones electromagnéticas justificará a pos-
teriori nuestra posición.147
Las funciones ϕk(x). Ψn (u1) … Ψn (uS) formaban un sistema ortonormal com-
1 S
pleto en E∞(S ). –Se trata ahora de determinar con su ayuda un sistema ortonormal
completo en E∞(S ). Sean M0, M1 … números cualesquiera iguales a 0, 1, 2, …,
aunque sujetos a la condición de M0 + M1 + … = S; distintos de cero, sólo hay,
pues, un número finito. Usemos de la notación [M0, M1 …] para designar la to-
talidad de los sistemas de índices n1, …, ns en los que aparezca M0 veces el 0, M1
S !
veces el 1, … —el número de tales sistemas entre sí diferentes es . Pon-
gamos M0!M1! …
Φ M0 M1… (u1 , …, us ) = ∑ Ψn1(u1)… ΨnS (uS ).

n1,…,ns en [ M0, M 1…]
S !
Puesto que ΦM M … es suma de sumandos distintos, cada uno de
0 1
M0!M1! …
los cuales está repetido M0! M1! … veces, sumandos que son ortogonales dos a dos
y de módulo unidad, el cuadrado del módulo de ΦM M … es igual a (M0!, M1!, …)2
0 1
S !
, es decir,
M0!M1! …
Φ M0 M1… = S !, M0! M1 ! …
Dos ΦM M … diferentes son sumas de sumandos ortogonales dos a dos, y por ende
0 1
ortogonales. Luego las funciones

1
Φ M0 M1… (u1, …, uS ) = Φ M0 M1… (u1, …, uS )
S! M0 ! M1 !…
293
Fund_MAT_03.indd 293 7/5/18 14:18

constituyen un sistema ortonormal. El producto interior de una función

f (ξ, u1, …, uS), simétrica respecto de u1, …, uS, por cada uno de los sumandos de
jk(ξ) ΦM M … (u1, …, uS) es siempre el mismo; luego es ortogonal a todos ellos
0 1
cuando es ortogonal a jk(ξ) ΦM M … (u1, …, uS), es decir, a jk(ξ) ΨM M … (u1, …, uS).

0 1 0 1
Por consiguiente, si dicha función es ortogonal a todas las jk(ξ) ΨM M … (u1, …, uS) 0 1
es asimismo ortonormal a jk(ξ) Ψn (u1) … Ψn (uS) y, por ende, es 1– (S )≡ 0. Luego las S
funciones ϕk(ξ) ΨM M … (u1, …, uS) –(que de suyo pertenecen a E∞ ) constituyen

0 1
un sistema ortonormal completo en E∞(S ).

Consideremos ahora las distintas energías que se manifiestan en el sistema
S + L. Existe en primer lugar [2a], la energía de S, cuyo operador en el espacio
de los estados de éste es el definido por H0ϕk ξ) = Wkϕk(ξ) y en el de S + L, por
consiguiente, el
H0ϕk(x)ΨM M … (u1, …, uS) = Wkϕk(x) ΨM M … (u1, …, uS).

0 1 0 1
En segundo lugar, [2 b)] cada quantum de luz l' posee la energía Hl' Ψn(u) =
= En Ψn (u), y, por lo tanto, el m-simo (m = 1, 2, …, S ), considerado como ele-
mento de S + L, tiene como operador de energía el
Hlmϕk (x)Ψn (u1) … Ψn (um)… Ψn (uS) =

1 m S
= En ϕk (x) Ψn (u1) … Ψn (um) … Ψn (uS)

m 1 m S
y hay que formar Hl = Hl + Hl + … + Hl . Finalmente [2g )], sea V el operador,

1 2 S
no conocido con exactitud, que traduce la energía de interacción de un quantum

luminoso l' con S, operador que describiremos mediante su matriz
∞ ∞
Vl 'ϕk (ξ )Ψn(u) = ∑ ∑ Vkn/ jpϕ j (ξ ) Ψ p (u).
j =1 p = 0
Considerado éste como operador en el espacio de los estados de S + L y rela-

tivo al m-simo quantum de luz, su expresión es
Vlmϕk (ξ )Ψn1(u1)… Ψnm(um )… ΨnS (uS ) =

∞ ∞
= ∑ ∑ Vknm / jpϕ j (ξ )Ψn1(u1)… Ψ p(um )… ΨnS (uS ) =
j =1 p = 0
∞ ∞
=∑ ∑ δ (n1 − p1) …Vknm / jpm … δ (nS − pS ) ⋅
j =1 p1,… pS = 0
⋅ ϕ j (ξ )Ψ p1 (u1)… Ψ pm (um )… Ψ pS (uS ),
[d (n) es igual a 1 para n = 0, y a 0 para n ≠ 0], y hay que formar Hi = Vl + … + Vl . 1 S
294
Fund_MAT_03.indd 294 7/5/18 14:18

En total resulta, pues,
Hϕk (ξ )Ψn1 (u1)… ΨnS (uS ) = (Wk + En1 + … + EnS )ϕk (ξ )ΨnS (uS ) +
∞ ∞ S
+∑ ∑ ∑ δ (n1 − p1) …Vkn / jp m m
… δ (nS − pS ) ⋅ ϕ j (ξ )Ψ p1 (u1)… Ψ pS (uS ),
j =1 p1,… pS = 0 m =1
de donde se deduce, mediante una fácil transformación,
⎛ ∞
⎞
Hϕk (ξ )ΦM0 M1…(u1, … uS ) = ⎜Wk + ∑ Mn En ⎟ ϕk (ξ )ΦM0 M1…(u1, … uS ) +
⎝ n=0 ⎠
∞ ∞
+∑ ∑ MnVkn/ jpϕ j (ξ )ΦM0 M1…Mn −1…M p +1…(u1, … uS )
j =1 n, p = 0
(para n = p hay que sustituir … Mn - 1 … Mp + 1 … por … Mn …) e introdu-

ciendo las funciones ortonormales ΨM M … 0 1
⎛ ∞
⎞
Hϕk (ξ )Ψ M0M1…(u1, … uS ) = ⎜Wk + ∑ Mn En ⎟ ϕk (ξ )Ψ M0 M1…(u1, … uS ) +
⎝ n=0 ⎠
∞ ∞
+∑ ∑ Mn [M p + 1 − δ (n − p)]Vkn/ jpϕ j (ξ )Ψ M0 M1…Mn −1…M p +1…(u1, … uS ).
j =1 n, p = 0
–
Ahora bien, la más general función f (x, u1, …, us) del E∞(S ) puede ser desarro-
llada en serie de funciones ΨM M …: 0 1
∞ ∞
f (ξ ,…, uS ) = ∑ ∑ akM0 M1…ϕk (ξ ) Ψ M0 M1…(u1, … uS )
k =1 M0, M1,…= 0
M0 + M1 + … = S,
–
lo que permite concebir el E∞(S ) como espacio hilbertiano de las sucesiones
akM M … (k = 1, 2, …; M0, M1, … = 0, 1, 2, …; M0 + M1 + … = S ), tales que la
0 1
∑
2
akM0 M1… sea finita. Desde este punto de vista,
k , M0, M1,…
H akM M … = a'kM M …
0 1 0 1
está definido por
295
Fund_MAT_03.indd 295 7/5/18 14:18

∞ ∞
H∑ ∑ akM0 M1…ϕk (ξ ) Ψ M0 M1…(u1, …, uS )
k =1 M0 , M1,…= 0
(M0 + M1 + … = S)
∞ ∞
=∑ ∑ a'kM0 M1…ϕk (ξ ) Ψ M0 M1…(u1, …, uS )
k =1 M0, M1,…= 0
(M0 + M1 + … = S);
luego
∞
⎛ ⎞
HakM0 M1… = a'kM0 M1… = ⎜Wk + ∑ Mn En ⎟ akM0 M1…
⎝ n=0 ⎠
∞ ∞
+∑ ∑ Mn [M p + 1 − δ (n − p)] V kn/ jp a jM0 M1…Mn −1…M p +1
j =1 n, p = 0
(k, j y n, p truecan entre sí el oficio que desempeñaban en la fórmula correspon-

diente a ϕk(x) ΨM M … (u1, …, uS), en lugar de Vjp/kn hemos escrito, atendiendo al
0
– 1
carácter hermítico de V, V kn/jp).

Es ahora el momento de llevar a cabo los preparativos para el paso al límite
S → +∞. Dado que M0 está determinado por M1, M2, … (M0 = S - M1 - M2 - …),
en vez de akM M … podemos escribir akM M …, donde los subíndices están sujetos a
0 1 1 2
las condiciones k = 1, 2, …; M1, M2, … = 0, 1, 2, …, y M1 + M2 + … ≤ S. Si

consideramos que E0 = 0 e introducimos las notaciones
SVko/ jo = Vk / j , SVko/ jn = Vk / jn, SVkn/ jo = V j /kn
(¡Vkn/jp es hermítica!), tendremos

∞
⎛ ⎞
HakM1M2 … = a'kM1M2 … = ⎜Wk + ∑ Mn En ⎟ akM1M2 …
⎝ n =1 ⎠
S − M1 − M 2 − … ∞
+
S
∑ V k / j a jM1M2 …
j =1
∞ ∞
S − M1 − M 2 − … + 1
+ ∑ ∑ Mn V j /kn a jM1M2 …Mn −1…
j =1 n =1 S
∞ ∞
S − M1 − M 2 − …
+ ∑ ∑ Mn + 1 V j /kn a jM1M2 …Mn +1…
j =1 n =1 S
∞ ∞
+∑ ∑ Mn [M p + 1 − δ (n − p)]V kn/ jp a jM1M2 …Mn −1…Mp +1
j =1 n, p =1
296
Fund_MAT_03.indd 296 7/5/18 14:18

Finalmente, hagamos que S → +∞: las akM M están definidas entonces para todas
1 2
las sucesiones k, M1, M2, … tales que k = 1, 2, …, M1, M2, … = 0, 1, 2, … con

un número finito (por lo demás cualquiera) de Mn ≠ 0 (cf. Nota 144) y H pasa a ser
⎛ ∞
⎞
HakM1M2 … = a'kM1M2 … = ⎜Wk + ∑ Mn En ⎟ akM1M2 …
⎝ n =1 ⎠
∞
+ ∑V k / j a jM1M2 …
j =1
∞ ∞
+ ∑ ∑ (V j /kn Mn a jM1 M2 …Mn −1… + V k / jn Mn + 1a jM1M2 …Mn +1…)
j =1 n =1
∞ ∞
+∑ ∑ Vkn/ jp Mn [M p + 1 − δ (n − p)] a jM1M2 …Mn −1…Mp + 1
j =1 n, p =1
Salta a los ojos la analogía con la ecuación deducida de la teoría electromag-

nética de la luz: para conseguir una completa coincidencia sólo necesitamos hacer
–
En = hrn, Vk/j = 0, Vj/kn = V k/jn = wnkj, Vkn/jp = 0.
Vemos, pues, que la interpretación corpuscular de la luz resulta equivalente a la

concepción electromagnética clásica cuando:
1. Esta última se traduce de acuerdo con el esquema general de la Mecánica

cuántica.
2. La energía de los quanta de luz se iguala a h veces su frecuencia, conforme
a la regla de Einstein.
3. Se fija correctamente la energía de interacción de los quanta luminosos
con la materia (cf. la expresión anterior de V ).
Con esto queda brillantemente resuelta una de las más graves paradojas de las
primeras formas de la teoría de los quanta: la doble naturaleza de la luz (ondas
electromagnéticas, de una parte; corpúsculos discretos, quanta de luz, por otra).148
Realmente es difícil hallar una interpretación directa, intuitiva, de la energía de
interacción entre luz y materia que acabamos de calcular, tanto más cuanto que
los únicos elementos de matriz Vkn/jp distintos de cero (los correspondientes a n = 0,
p ≠ 0 y n ≠ 0, p = 0) dependen del número S de todos los quanta posibles (son
1
proporcionales a ) —aunque al final se debe llevar a cabo el paso al límite
S
S→ +∞. De todos modos, se la puede admitir en atención a que toda descripción
basada en un modelo es siempre sólo algo aproximado, mientras el exacto conte-
nido de la teoría halla su expresión justamente en la del operador H.
297
Fund_MAT_03.indd 297 7/5/18 14:18

Volvamos a lo que es propiamente nuestro problema, la determinación de las

probabilidades de transición. En virtud de la ecuación temporal de Schrodinger,
la variación con el tiempo de akM M … = akM M …(t) está determinada por
1 2 1 2
h d ⎛ ∞
⎞
akM1M2 … = −HakM1M2 … = ⎜Wk − ∑ Mn ⋅ h ρn ⎟ akM1M2 …
2π i dt ⎝ n =1 ⎠
∞ ∞
− ∑ ∑ wkjn ⋅ ( Mn + 1 a jM1M2 …Mn +1 + Mn a jM1M2 …Mn −1…).
j =1 n =1
Dado que los primeros sumandos (los que no contienen las wnkj) constituyen la
parte principal de la variación de akM M , es cómodo separarlos mediante el cambio
1 2
de variables
∞
2π i ⎛ ⎞t
−
h ⎜⎝
∑
⎜ wk + Mn ⋅h ρn ⎟
⎟⎠
akM1M2 … (t) = e n =1
⋅ bkM1M2 … (t),
merced al cual el sistema que precede se escribe
d
dt
bkM1M2 … = −
2π i ∞ ∞ n − 2hπi (w j − wk + hρn)t
∑ ∑ wkj e
h j =1 n =1
(
Mn + 1b jM1M2 …Mn +1 +
+e
−
2π i
h
(w j − wk − h ρn )t
Mn b jM1M2 …Mn −1… . )
El significado físico de los akM M … y de los bkM M … resulta de su propio origen:
para S = M — +M — +M — + … finita, ϕ –(x), Ψ — — (u , …, u ) era aquel estado
1 2 1 2
0 1 2 k MM … 1 S 0 1
de S + L en que S se encuentra en la k-ésima órbita cuántica, y en los estados

ψ0, ψ1, ψ2, … existen, respectivamente, M —, M—, M — , … quanta de luz, es decir,
0 1 2
M — —
— en el estado de «no-presencia» y M , M … en los
0 ! ! 1 2 estados que corresponden
a las oscilaciones propias A1, A2, …, respectivamente. Los akM M … relativos a esta 1 2
función de onda son, por lo tanto,

– — —
akM M … = d (k - k ) d (M1 - M1) d (M2 - M2) …
1 2
(Únicamente un número finito de factores son ≠1, puesto que siempre, con sólo
—
un número finito de excepciones, es Mn = Mn = 0). A este resultado cabe también
atenerse, naturalmente, después del paso al límite S → ∞. Para un estado arbitra-
rio akM M … de S + L, dicha configuración (en el supuesto de que se lleve a cabo la
1 2
medición; cf. lo dicho en III.3 acerca del espectro discreto puro) tiene la probabi-
lidad
298
Fund_MAT_03.indd 298 7/5/18 14:18

2
∑
2 2
akM1M2 …δ (k − k ) δ (M1 − M 1) δ (M 2 − M 2 )… = ak M 1 M 2 … = bk M 1 M 2 … .
kM1M 2 …
–
En particular, la probabilidad total de que S se halle en la k -ésima órbita cuánti-
ca vale
∑
2
θk− = bk M 1 M 2 … .
M 1 M 2…
Supongamos que en el instante inicial (t = 0) el átomo se encuentra en el

– —, M — , … quanta de luz en los estados ! , ! , … res-
k ‑ésimo estado y existen M1 2 A1 A2
pectivamente, es decir,
– — ) d (M - M
— ) …
bkM M … = akM M … = d (k - k ) d (M1 - M
1 2 1 1 2 2 2
El sistema de ecuaciones diferenciales precedente nos indica que, en este caso y en

primera aproximación (es decir, para valores de t tan pequeños que los segun-
dos miembros puedan aún considerarse como constantes), sólo serán ≠0 aquellas
d
b para las cuales un M1, M2, … Mn + 1, … o un M1, M2, … Mn - 1, …
dt kM M … — —
1 2
—, M— , …, M — ± 1, … Integrando
coincida con M1, M2 …, es decir, todos los k, M 1 2 n
las que estén en estas condiciones se obtiene
2π i
− (wk − wk − h ρn )t
1− e h
bk M 1 M 2 …M n +1… = wkkn M n + 1,
Wk − Wk − h ρn
2π i
− (wk − wk + h ρn )t
1− e h
bk M 1 M 2 …M n −1… = wkkn Mn .
Wk − Wk + h ρn
Todas las demás bkM M … son iguales a 0, en esta aproximación, excepto bk–M— M— …,
1 2 1 2
que, salvo términos del orden de t 2, debe ser igual a su valor inicial 1. No obstan-
d
te, es muy delicado el concluir en este caso que bk–M— M— … = 0, puesto que el se-
dt 1 2
gundo miembro de la correspondiente ecuación diferencial contiene infinidad de

términos bk–M— M— … M— ± 1 … que no son nulos dentro de la aproximación que nos hemos
1 2 n
fijado, y en estas condiciones no podemos deducir de la pequeñez de cada uno de

estos sumandos —para pequeños valores de t— la pequeñez de su suma. De hecho,
el cálculo de la segunda aproximación mostraría que bk–M— M— … difiere de 1, no en 1 2
términos del orden de t 2, sino del de t.149 Sin embargo, la determinación directa
de bk–M— M— … no es en modo alguno necesaria, pues de
1 2
2
∑ ∑
2
bkM1M2 … = akM1M2 … = 1,
kM1M 2 … kM1M 2 …
299
Fund_MAT_03.indd 299 7/5/18 14:18

se deduce desde luego
∑
2 2
bk M 1 M 2 … = 1 − bkM1M2 … .
kM1M 2 …≠ k M 1 M 2 …
Es aquí claramente reconocible el aspecto cualitativo del proceso: un bk–M— M— … M— + 1 …
 , 1 2 n
que corresponde a la emisión de un quantum de luz de frecuencia rn (del tipo An),

aumenta tanto más cuanto menor es el denominador Wk– - Wk - hrn, es decir
W – - Wk
cuanto más próxima es a la frecuencia de Bohr k la frecuencia propia de
h
la luz rn; análogamente, el término bk M M … M - 1… correspondiente a la absorción
– — — —
1 2 n
W - Wk–
es tanto mayor cuanto más cerca está rn de k . Resulta de todo esto que la
h
relación de Bohr para las frecuencias no es exactamente válida (entre las rn no
figuran todas las frecuencias posibles), pero sí con una probabilidad abrumadora,
si el tiempo t es pequeño y las rn están muy densamente distribuidas (cual ocurre
n–
en el caso de un gran recinto vacío H). Además, también los wkk aumentan las
frecuencias de estos procesos, tanto, que dentro de poco podremos identificarlos
con las probabilidades de transición.
De nuestras fórmulas relativas a los bk–M— M— … M— ± 1 … se deduce
1 2 n
⎛ W − Wk ⎞
1 − cos 2π ⎜ ρn − k ⎟t
2 2 2 ⎝ h ⎠ , 151
bk M 1 M 2 …M n +1… = 2 (M n + 1) wkkn 2
h ⎛ Wk − Wk ⎞
ρ
⎜⎝ n − ⎟
h ⎠
⎛ W − Wk ⎞
1 − cos 2π ⎜ ρn − k ⎟t
2 2 2 ⎝ h ⎠ , 151
bk M 1 M 2 …M n −1… = M n wkkn 2
h2 ⎛ Wk − Wk ⎞
ρ
⎜⎝ n − ⎟
h ⎠
∙bkM M …∙2 = 0 para kM1M2 … ≠ k–M

—M— —— —
1 2 …, kM1M2 … Mn ± 1…, lo que nos da
1 2
–
para θk (k ≠ k ) el valor
⎛ W − Wk ⎞
1 − cos 2π ⎜ ρn − k ⎟t
∞
2 ⎝ h ⎠
θk = ∑ 2 (M n + 1) wkkn
2
2
n =1 h ⎛ Wk − Wk ⎞
ρ
⎜⎝ n − ⎟
h ⎠
⎛ W − Wk ⎞
1 − cos 2π ⎜ ρn − k ⎟⎠ t
∞
2 ⎝ h
+ ∑ 2 M n wkk
n 2
2
n =1 h ⎛ Wk − Wk ⎞
⎜⎝ ρn − ⎟
h ⎠
300
Fund_MAT_03.indd 300 7/5/18 14:18

∞
(La primera ∑ corresponde a los procesos de emisión, la segunda a los de absor-
n =1
ción.) Para obtener estas 0k en términos finitos deberemos hacer algunas hipótesis
que permitan simplificar la cuestión, admitiendo, de una parte, que H es muy
grande (es decir, que su volumen V → ∞), y, de otra, tratando estadísticamente
las oscilaciones propias del recinto H. Con tal fin, en cada una de las dos sumas
reunamos los términos que corresponden a frecuencias rn comprendidas entre r
y r + dr (dr << r) a la vez que sustituimos wnkk por su valor: la primera suma
nos da
1 ⎡ l
eν x
2
⎤
⎢ ∑ n ∑ [P A (Q
ν n, x ν
x
, Qν
y
, Qν
z
) + …]kk (M n + 1)⎥ ⋅
4π c h ρ ⎢⎣ρ ≤ ρn < ρ + d ρ ν =1 mν
2 2
⎥⎦
⎛ W − Wk ⎞
1 − cos 2π ⎜ ρ − k ⎟t
⎝ h ⎠
⋅
⎛ Wk − Wk ⎞
⎜⎝ ρ − ⎟
h ⎠
— + 1 y Wk– - Wk por M — y
y lo mismo la segunda, salvo la sustitución de M n n
Wk - Wk– h
. Es menester ahora determinar los paréntesis rectangulares […].
h
La manera como se expresan normalmente M1, M2, …, no es indicando sus
valores, sino mucho menos: lo que se da son los valores de las intensidades, esto
es, la energía luminoso I (r) dr correspondiente al intervalo espectral r, r + dr y
a la unidad de volumen, de la que se deduce
∑ M n ⋅ h ρn ≈ hρ ∑ M n = V ⋅ I ( ρ )d ρ ,
ρ ≤ ρn < ρ + d ρ ρ ≤ ρn < ρ + d ρ
VI ( ρ )
∑ Mn =
hρ
d ρ.
ρ ≤ ρn < ρ + d ρ
8pVr2
El número de frecuencias rn comprendidas en el intervalo r ≤ rn + d r es dr,
c3
110
según una fórmula de Weyl (cf. loc. cit. Nota ) válida asintóticamente en gene-
ral*, y en consecuencia
* Para su validez es necesario que el recinto H sea de dimensiones grandes respecto de la lon-
c
gitud de onda l = y que no presente cavidades cuyas dimensiones sean del orden de l. Por lo
r
demás, la forma de H puede ser cualquiera. (Cf. H. Weyl, Math. Ann., t. 71, 1911, p. 441 y M. Von
Laue Ann der Physik, t. 44, 1914, p. 1.197). (N. del T.)
301
Fund_MAT_03.indd 301 7/5/18 14:18

⎛ 8π h ρ 3 ⎞
V ⎜ I (ρ) + ⎟
⎝ c3 ⎠ d ρ.
∑ (M n + 1) ≈ hρ
ρ ≤ ρn < ρ + d ρ
l 2
e
Supuesto que ∑ mν [Pνx An, x(Qνx , Qνy , Qνz ) + …]kk oscile con suficiente rapidez
ν =1 ν
en el intervalo r ≤ rn < r + d r en torno de un valor medio wkk–(r), resultará, por

lo tanto, como valor de los […] antes obtenidos las expresiones siguientes:
⎛ 8π h ρ 3 ⎞
V ⎜ I (ρ) + ⎟
⎝ c3 ⎠ d ρ VI (ρ)
wkk (ρ) y wkk (ρ) d ρ.
hρ hρ
Wk– - Wk Wk - Wk–
Finalmente, si escribimos nk–k , nkk– en lugar de queda, en de-
finitiva, como valor de la suma: h h
V ∞
⎧⎛ 8π h 3 ⎞ 1 − cos 2π (ρ − ν kk )t
θk =
4π 2c 2 h 2 ∫
0
⎨⎜⎝ I (ρ) + 3 ρ ⎟⎠
⎩ c (ρ − ν kk )2
+
1 − cos 2π (ρ − ν kk )t ⎫ wkk (ρ)

+I (ρ) ⎬ ρ 2 d ρ.
(ρ − ν kk )2 ⎭
Para valores de t pequeños, esta integral es del orden de t 2 (debido a la presencia
del factor 1 - cos 2p (r - n)t), excepto en aquellas partes del intervalo de integra-
ción en las que uno de los dos denominadores (r - nk–k )2, (r - nkk–)2 es pequeño.
Allí pueden aparecer contribuciones al valor total de la integral que sean grandes
respecto de t 2, y cuando así suceda son precisamente estas contribuciones lo que
constituye la expresión asintótica de θk. Se demostrará en lo que sigue que así
ocurre en efecto, pues obtendremos contribuciones a dicho valor del orden de t.
Estas son, en consecuencia, las que hay que determinar.
W – - Wk
Dado que nk–k = -nkk– = k , para Wk– > Wk únicamente es pequeño el
h
denominador del primer término, mientras que el del segundo tan sólo lo es para
Wk– < Wk. Por consiguiente, para Wk– < Wk conservaremos sólo el primero, y
para Wk– < Wk el segundo solamente. Además, los valores de r que no pertenecen
al entorno de nkk– o de nk–k contribuyen a la integral con valores del orden de t 2, por
lo cual está justificado el sustituir el integrando por su valor para
Wk − Wk
ρ = ν kk siendo ν kk = ,
h
302
Fund_MAT_03.indd 302 7/5/18 14:18

Iw –(n –) 8ph
es decir, por kk 2 kk , donde I = I (n–kk–) + 3 n–kk–3 en el primer caso e igual a
nkk– c
I (n– –) en el segundo. Resulta así
kk
VIwkk (ν kk ) ∞ 1 − cos 2π ( ρ − ν kk )t
θk
4π 2c 2 h 2vkk2 ∫0 ( ρ − ν kk )2
d ρ.
∞ ∞
Por otra parte, podemos sustituir la ∫0 por la ∫−∞, ya que una tal sustitución
equivale a introducir un valor del orden de t 2. Si llamamos x = 2p (r - n–kk–)t a la
nueva variable de integración, y consideramos que
1 − cos 2π (ρ − ν kk )t
∞ 1 − cos x
∞
∫−∞ (ρ − ν kk )2
d ρ = 2π t ∫−∞ x2
dx = 152 = 2π 2t,
obtenemos, por lo tanto, como valor de θk
V · I · wkk–(n–kk–)
θk = t,
2 h 2n–kk–2
y, además, queda demostrado que θk es del orden de t.
Para poder determinar las wkk– (n–kk–) debemos encontrar para
l 2
e
∑ mν [Pνx An, x (Qνx , Qνy , Qνz ) + …]kk
ν =1 ν
 
una expresión en la que no intervengan los An, lo  que se consigue sustituyendo A n,
debido a sus rápidas variaciones, por un vector γ n de longitud constante orientado
al azar. Su independencia de las Qnx, Qny, Qnz, trae consigo que este vector sea igual
al producto de un vector numérico por la matriz 1; y el valor constante de su
longitud, gn, hay que determinarlo atendiendo a la condición de normalización
! !
∫∫∫ H
An × An dxdydz = 4π c 2
de la que se sigue
4pc2
Vgn2 = 4pc 2, gn2 = .
V
1 ! !
A la componente A2n,x le corresponde por término medio de An × An = An,2 x + An,2 y + An,z
2
= γ n2,
! ! 1 4pc2 3
An × An = An,2 x + An,2 y + An,z
2
= γ n2, y por ende, es igual a gn2 = valor éste que es co-
–2 –2 3 3V
mún a ella y a las otras dos An, y, A n, z. En consecuencia es
303
Fund_MAT_03.indd 303 7/5/18 14:18

l 2
e
wkk (ρ) = promedio de ∑ ν [Pνx An, x (Qνx , Qνy , Qνz ) + …]kk
ν =1 mν
ρ ≤ ρn < ρ + d ρ
4π c 2 ⎡ ⎛ l eν ⎞ 2 ⎤
⋅≈ ⎢⎜∑ Pνx⎟ + …⎥ .
3V ⎢⎣ ⎝ ν =1 mν ⎠ kk ⎥⎦
Ahora bien, la energía H0 del sistema S considerado en sí mismo es igual a la suma

energía cinética + energía potencial y, por lo tanto, de la forma
l
1
H0 = ∑ 2m [(Pνx )2 + (Pν y )2 + (Pνz )2 ] + V (Q 1x, Q 1y, Q1z, …, Q lx, Q ly, Q lz );
ν =1 ν
luego se tiene 153
h 1
H0Qnx - Qnx H0 = ⋅ ⋅ Pnx,
2pi mn
y pues H0 es una matriz diagonal con los elementos no nulos W1, W2, …
[(H0)kj = Wk dkj], resulta de aquí
2pimn 2pimn
(Pnx)kk– = (H0Qnx - QnxH0)kk– = (Wk - Wk–) (Qnx)kk– =
h h
= ± i ⋅ 2pmn n–kk–(Qnx)kk–.
Por consiguiente,
16 π 3c 2 2 ⎛ ⎛ l ⎞
2
x⎞
wkk (ρ) = ν ⎜ ∑
2V h 2 kk ⎝ ⎜⎝ ν =1
eν Q ν ⎟⎠ + …⎟
kk ⎠
y la sustitución en la fórmula relativa a qk conduce a
8π 3 ⎛ ⎛ l ⎞
2
x⎞
θk = 2 ⎜ ⎜ ∑ eν Qν ⎟ + …⎟ ⋅ It.
3h ⎝ ⎝ ν =1 ⎠ kk ⎠
Este resultado puede evidentemente interpretarse así: El átomo S en el k-ésimo

estado efectúa los siguientes tránsitos (saltos cuánticos):
8π 3 ⎛ Wk − Wk ⎞
1. Pasa a un estado más elevado k (Wk > Wk ) wkk I veces por
3h 2 ⎝ h ⎠
segundo, es decir, proporcionalmente a la intensidad del campo de radiación en
W – - Wk
la correspondiente frecuencia de Bohr, k .
h
304
Fund_MAT_03.indd 304 7/5/18 14:18

8π 3 ⎛ Wk − Wk ⎞
2. Pasa a un estado más bajo k (Wk < Wk ) w I veces por
3h 2 kk ⎝ h ⎠
segundo, es decir, proporcionalmente a la intensidad del campo de radiación en
W - Wk–
la correspondiente frecuencia de Bohr, k .
h
3
64 π 4 ⎛ Wk − Wk ⎞
3. Pasa a un estado más bajo k (Wk < Wk ) wkk veces por
3hc 3 ⎝ h ⎠
segundo, es decir, con completa independencia del campo de radiación presente.
1. Corresponde a los procesos de absorción a expensas del campo de radiación;
2, a procesos de emisión motivados por dicho campo; 3, en cambio, son procesos
de emisión espontáneos que siempre puede desarrollar el átomo mientras no ha
encontrado un reposo definitivo en el más bajo de sus estados estacionarios (Wk mí-
nima).
Los tres mecanismos de transición 1-3 fueron hallados por Einstein median-
te consideraciones termodinámicas ya antes del descubrimiento de la Mecánica
cuántica 154, y sólo faltaba encontrar el valor de la «probabilidad de transición»
wkk–. El que precede
2 2 2
⎛ l ⎞ ⎛ l ⎞ ⎛ l ⎞
wkk = ⎜ ∑ eν Qνx⎟ + ⎜ ∑ eν Qνy⎟ + ⎜ ∑ eν Qνz⎟
⎝ ν =1 ⎠ kk ⎝ ν =1 ⎠ kk ⎝ ν =1 ⎠ kk
está implícito, conforme dijimos, en el primer ensayo de interpretación de Hei-

senberg. Por nuestra parte lo hemos establecido siguiendo a Dirac, basándonos
en la teoría general.
305
Fund_MAT_03.indd 305 7/5/18 14:18

Fund_MAT_03.indd 306 7/5/18 14:18
IV
Construcción deductiva de la teoría
1. Establecimiento sistemático de la teoría estadística

En la parte III conseguimos reducir todas las proposiciones de la Mecánica
cuántica a la fórmula estadística (allí llamada V2)
(V) Vm(R, ϕ) = (Rϕ, ϕ),
en la que Vm(R, ϕ) es el valor medio de la magnitud R en el estado ϕ y R el ope-

rador correspondiente a R. En lo que sigue haremos ver cómo esta fórmula puede
ser deducida a partir de algunas hipótesis cualitativas más generales, y a la vez,
apoyándonos en ellas, se revisará nuevamente toda la construcción de la Mecánica
cuántica llevada a cabo en III. Antes, sin embargo, de realizar este programa es
necesaria una observación.
La magnitud R posee, en el estado ϕ, el valor medio r = (Rϕ, ϕ), y como
dispersión e 2 el valor medio de la magnitud (R - r)2, es decir, [(R -–
r1)2ϕ, ϕ] =
= ∙Rϕ ∙ - (Rϕ, ϕ) (cf. Nota ; ¡todo se calcula tomando como base V!), dispersión
2 2 130
que en general es > 0 (sólo es = 0 para Rϕ = r ⋅ ϕ, cf. III.3). Por consiguiente, ya

en un estado homogéneo, como en más de una ocasión hemos hecho constar,
únicamente cabe hablar de una estadística. Pero es el caso que este carácter esta-
dístico puede acentuarse todavía más cuando se ignora en absoluto cuál es el es-
tado de que se trata; como cuando, por ejemplo, entran en consideración varios
estados ϕ1, ϕ2, … con las respectivas probabilidades w1, w2, … (w1 ≥ 0, w2 ≥ 0,
…, w1 + w2 + … = 1). En estas condiciones, y en virtud de los principios de va-
lidez general del cálculo de probabilidades, el valor medio de la magnitud R es
ρ' = ∑ wn (Rϕn, ϕn ).
n
Ahora bien, en general (Rϕ, ϕ) = traza (P[ϕ] ⋅ R); porque, elegido un sistema
ortonormal completo Ψ1, Ψ2, … en el que Ψ1 = ϕ (de forma que Ψ2, Ψ3, … son
ortogonales a ϕ), se tendrá
P[ϕ]Ψn = ϕ, para n = 1
{ , ∣
y, por lo tanto,
traza (P[ϕ] ⋅R) = ∑ (P[ϕ]Ψn, Ψm )(RΨm, Ψn ) = ∑ (ϕ , Ψm )(RΨm, ϕ) = (Rϕ, ϕ).

m,n m,n
307
Fund_MAT_04.indd 307 9/5/18 10:17

Luego, nuestra r' vale r' = traza

({∑n
} )
wn P[ϕn ] ⋅ R . El operador
U = ∑ wn P[ϕn ]
n
es definido, por causa de serlo todos los P[ϕ ] y ser todas las wn ≥ 0; su traza es igual
n
a ∑ wn = 1, pues traza P[ϕ ] = 1; finalmente, U caracteriza por completo la mezcla

n
n
de estados antes definida en lo que atañe a sus propiedades estadísticas:
r' = traza (UR).
Advertido ya que, junto a los estados, debemos dirigir nuestra atención a mez-
clas de ellos, pasemos al estudio general del problema.
Olvidemos por completo toda la Mecánica cuántica y atengámonos a lo que
sigue: Se da un sistema S155, el cual, para el experimentador, está caracterizado por
la indicación de todas las magnitudes en él efectivamente medibles y la de los en-
laces funcionales de unas con otras. Por magnitud hay que entender propiamente
el cómo debe ser medida y cómo hay que leer su valor en las posiciones de los
índicas de los aparatos de medición o calcularlo a partir de ellas.*
Si R es una magnitud y f (x) una función cualquiera, la magnitud f (R) se de-
fine del siguiente modo: para medir f (R), se mide R, y si a es el valor que se en-
cuentra para R, f (R) tiene el valor f (a). Vemos así que junto con R se miden de
una vez todas las magnitudes f (R) (R fijo; f (x), es una función arbitraria), lo que
constituye un primer ejemplo de magnitudes simultáneamente mensurables. De
modo general, de dos magnitudes R, S diremos que son medibles simultáneamen-
te cuando existe un dispositivo que las mide a la vez en el mismo sistema, sólo que
sus respectivos valores hay que calcularlos de modo diferente a partir de las lectu-
ras efectuadas. (En la Mecánica clásica, como es sabido, todas las magnitudes son
* Con esta proposición está íntimamente vinculado uno de los postulados que adopta J. L.
Destouches en su construcción axiomática de la Física teórica. Dice:
«Postulat 4.—a) Il y a plusieurs types de «mesures effectuées par un observateur sur un système
physique observable au moyen d’un appareil de mesure» qu’on peut figurer par des lettres. Nous les
désignerons abréviativement par «grandeurs physiques».
b) Un appareil de mesure suffit pour définir un type, c’est-à-dire une grandeur physique.
Faisons remarquer toutefois qu’éventuellement deux appareils distincts pourront servir à mesu-
rer la même grandeur ce qui revient à dire qu’il est possible que deux appareils distincts définissent
la même grandeur. Un type de mesure n’est donc pas une fonction biunivoque d’un appareil, mais
seulement fonction univoque.» (Jean-Louis Destouches, Principes fondamentaux de Physique théo-
rique, París, Hermann, 1942, p. 20). El cómo se mide es, pues, lo que caracteriza una magnitud.
Ello se echa de ver patentemente, en el texto de Neumann, al definir la magnitud correspondiente
a una propiedad (p. 176) y también en la definición de magnitud igual idénticamente a la unidad
(p. 221). (N. del T.)
308
Fund_MAT_04.indd 308 9/5/18 10:17

simultáneamente mensurables no así en la Mecánica cuántica, conforme tuvimos

ocasión de ver en III.3.) Para tales magnitudes y una función de dos variables
f (x, y), podemos también definir la magnitud f (R, S): para medir f (R, S), se miden
simultáneamente R, S, y si a y b son los valores hallados para éstas, el valor de
f (R, S) es f (a, b). Téngase presente, sin embargo, que carece totalmente de sentido
el querer formar f (R, S) cuando R, S no son medibles a la vez; no existe camino
alguno que conduzca a poder indicar el correspondiente dispositivo de medición.
La investigación de las magnitudes físicas en un solo objeto S no es lo único
que cabe hacer, máxime cuando subsisten dudas acerca de la mensurabilidad si-
multánea de varias magnitudes. En tales casos, lo más indicado es considerar tam-
bién grandes colectividades estadísticas constituidas por gran número de sistemas
S1, …, SN (esto es, N ejemplares de S, siendo N grande)156. En esta colectividad
[S1, …, SN] no se mide, claro está, el valor de una magnitud R, sino la distribución
de sus valores, es decir, para cada intervalo (a', a'' dados, a' ≤ a'' ), el número de
aquellos de entre los sistemas S , …, SN para los cuales el valor de R está en dicho
1
intervalo. La N-sima parte de ese número es la función de probabilidad w(a', a'' )

= w(a'' ) - w(a' ).157 La enorme ventaja de la consideración de tales colectividades
estriba en que
1. Incluso cuando la medición de una magnitud R ha de alterar fuertemen-

te el sistema medido S, el esquema estadístico de la distribución probabilística de
R en la colectividad [S1, …, SN] queda modificado por la medición tan poco
cuanto se quiera, si N es suficientemente grande. (Esa alteración del sistema ob-
servado, como consecuencia de la medición, se presenta en Mecánica cuántica.
Además, vimos en III.4 que en la Física de los procesos elementales así debe ser
por razones de principio, puesto que el elemento activo del proceso de medición
es del mismo orden de magnitud que el sistema o las partes observadas del mismo.)
2. Incluso cuando dos (o más) magnitudes R, S no son simultáneamente
medibles en el sistema único S, sus distribuciones de probabilidad en una y la
misma colectividad [S1, …, SN] pueden determinarse a la vez con precisión arbi-
trariamente grande, si N es suficiente grande.
En efecto: si la colectividad consta de N elementos, basta llevar a cabo los
sondeos relativos a la distribución de los valores de R, no en todos los N elemen-
tos S1, …, SN, sino en un sistema parcial de M(≤ N) elementos, por ejemplo el
[S1, …, SM], supuesto que M, N sean ambos muy grandes, aunque M puede ser
notablemente más pequeño que N.158 Los cambios provocados por la medición
M
afectan así sólo a la parte de la colectividad, parte ésta tan pequeña como se
N
M
quiera si se elige suficientemente pequeño; lo que es posible para un N bastan-
N
te grande, incluso para M grande, de acuerdo con lo dicho en 1. Para medir si-
multáneamente dos (o más) magnitudes R, S, utilizaremos dos sistemas parciales,
por ejemplo [S1, …, SM] y [SM + 1, …, S2M] (2M ≤ N ) tales que el primero se
aplica a la obtención del esquema estadístico de R y el segundo a la del de S. Am-
309
Fund_MAT_04.indd 309 9/5/18 10:17

bas mediciones no se perturban entonces entre sí, aunque tengan lugar en la mis-
ma colectividad [S1, …, SN], y se puede conseguir que la alteración que causan
en ésta se limite a una porción arbitrariamente pequeña de la misma, con tal que
2M
sea bastante pequeño —lo que es posible para un N suficientemente grande,
N
incluso para M grande, de acuerdo con lo dicho en 2.
Vemos, pues, que el recurrir a colectividades estadísticas, es decir, a los métodos
propios del cálculo de probabilidades, se nos sugiere por la posibilidad de que la
medición influya sobre el sistema único y por la eventual imposibilidad de medir
simultáneamente varias magnitudes. Una teoría general, claro está, debe tomar en
consideración estas circunstancias, pues desde el primer momento era de presumir
su aparición en los procesos elementales y hoy ésta se halla fuera de duda tras la
minuciosa discusión de los hechos. Las colectividades estadísticas allanan estas
dificultades y hacen de nuevo posible una descripción objetiva, independiente de
los casos fortuitos, como también de que, en un estado dado, se mida una u otra
de dos magnitudes no medibles simultáneamente.
No es extraño que en tales colectividades una magnitud física acaso no posea
un valor preciso, es decir, que la distribución de sus valores no conste de un único
valor a0,160 sino que sean posibles diferentes valores o intervalos de valores y exis-
ta, por lo tanto, una dispersión positiva.160 Cabe siempre concebir dos razones
distintas para este comportamiento:
I. Los sistemas S1, …, SN de la colectividad en cuestión pueden hallarse en

distintos estados, de modo que la colectividad [S1, …, SN] está definida por las
frecuencias relativas de éstos. Que no consigamos obtener en este caso ningún
valor preciso para las magnitudes físicas, es algo que resulta de nuestra ignorancia:
no sabemos, en efecto, en qué estado del sistema efectuamos la medición, y, por
ende, tampoco podemos predecir cuál será el resultado.
II. Todos los sistemas S1 …, SN se encuentran en el mismo estado, pero las
leyes de la Naturaleza no son causales. No es entonces nuestra ignorancia la causa
de la dispersión, sino la propia Naturaleza, que ha prescindido del «principio de
razón suficiente».
De todos es conocido el caso I; el segundo, por el contrario, constituye una
novedad y es de gran transcendencia. Sin duda que, al pronto, uno se siente mo-
vido al escepticismo por lo que respecta a la posibilidad de su sostenimiento, pero
encontraremos más adelante un criterio objetivo que permite decidir entre el dar-
se o el no darse este caso. A primera vista parece que quepa hacer graves objeciones
a su inteligibilidad y racionalidad, pero no creemos que éstas sean concluyentes y,
por otra parte, II es la única salida a ciertas dificultades (p. e., en la Mecánica
cuántica). Es precisamente éste el motivo por el cual, en lo que sigue, nos dedica-
remos a la discusión de las dificultades conceptuales que plantea II.
A II cabe objetar: la Naturaleza no puede en modo alguno vulnerar el «princi-
pio de razón suficiente», es decir, la causalidad, pues en esta cuestión no se trata
sino de una definición de la igualdad. En otros términos: la proposición que afir-
310
Fund_MAT_04.indd 310 9/5/18 10:17

ma que dos objetos iguales S1, S2—es decir, dos ejemplares del sistema S que se
encuentran en el mismo estado—en cualquier operación imaginable se compor-
tarán igualmente, es cierta, porque es trivial. Pues si en una misma intervención
S1 y S2 se comportasen diversamente (p. e., diesen lugar a valores diferentes en la
medición de una misma magnitud R), no los llamaríamos iguales; por consiguien-
te, en una colectividad [S1, …, SN] que presente dispersión relativamente a una
cierta magnitud R, no todos los sistemas S1, …, SN pueden hallarse, por defini-
ción, en el mismo estado. (La aplicación práctica de esto a la Mecánica cuántica
sería la siguiente: Puesto que en la medición de la misma magnitud R en varios
sistemas, todos ellos en el estado al que corresponde la función de onda ϕ, resultan
valores diferentes —cuando j no es función propia del operador R de R161—,
estos sistemas, por ello precisamente, no son iguales entre sí, esto es, la descripción
que procura la función de onda no es completa. Luego debieran existir otros ele-
mentos determinantes todavía, los «parámetros ocultos», citados en III.2. Veremos
acto seguido que no cabe aceptar esto sin más.) De aquí resulta que en una gran
colectividad estadística, en tanto exista aún una magnitud que muestre en ella
dispersión, cabe la posibilidad de descomponerla en partes diversamente consti-
tuidas atendiendo a los diferentes estados de sus elementos. Eso es tanto más
plausible cuanto que parece existir, en efecto, un método simple para realizar una
tal descomposición, a saber: descomponer la colectividad en partes de acuerdo con
los diferentes valores que ha tomado R en ella. Una colectividad verdaderamente
homogénea debiera obtenerse tras haber llevado a cabo esta subdivisión o descom-
posición respecto de todas las magnitudes R, S, T, … Al final, dichas magnitudes
no mostrarían dispersión en ninguna de las colectividades parciales.
En primer lugar, los asertos contenidos en las últimas proposiciones son falsos,
porque no se ha tenido en cuenta que la medición altera el sistema medido. Cuan-
do se mide R (que, para simplificar, supondremos es susceptible de tomar sólo dos
valores a1, a2) y se obtiene a1, por ejemplo, en S'1, …, S'N y a2 en S''1, …, S''N - N ,
1 1
R no presenta dispersión ni en [S''1, …, S''N ] ni en [S''1, …, S''N - N ] (en ellas es

1 1
siempre igual a a1, a2, respectivamente). Con todo, esto no es meramente una
descomposición de [S1, …, SN] en dichas dos partes, pues cada sistema Si fue
alterado por la medición de R. Cierto es que se encontró, según 1, un método
para determinar la distribución de valores de R de forma que se alterase en muy
poco la colectividad [S1, …, SN] (efectuando la medición sólo en S1, …, SM,
M
donde M es grande, y pequeño
N ) ; sin embargo, este procedimiento no conduce
a ninguna descomposición, pues no se concreta acerca de la mayor parte de los
sistemas S1, …, SN (a saber, acerca de SM + 1, …, SN) qué valor tiene R en cada
uno de ellos. Y es ahora cuando se echa de ver que falla totalmente el método
arriba indicado para formar colectividades completamente homogéneas. Pues, en
efecto, si se mide una segunda magnitud S (susceptible asimismo de tomar sólo
dos valores, b1, b2) en [S'1, …, S'N ] y en [S''1, …, S''N - N ] y se encuentra el valor
1 1
N y S1 , …, S N y el valor b2 en S1 , …, SN - N y S1 , …, S N - N - N ,

b1 en S1III …, SIII V V IV IV VI VI
11 12 1 11 1 12
en las colectividades [S1 , …, S N ], [S1 , …, SN - N ], [S 1, …, SN ], [S1VI, …,

III III
11
IV IV
1 11
V V
12
311
Fund_MAT_04.indd 311 9/5/18 10:17

SVIN - N - N ] ya no presenta dispersión S (su valor es en ellas, respectivamente, b1,

1 12
b2, b1, b2). Pero aunque las dos primeras son partes de [S'1, …, S'N1], y las dos
segundas de [S''1, …, S''N - N1], colectividades éstas en las que no la presentaba R,
en cada una de ellas puede R presentar dispersión, ¡porque la medición de S ha
alterado los sistemas de que se compone cada una! Es decir, no se puede progresar,
porque cada paso deshace el resultado de los que lo preceden,162 y ninguna acu-
mulación de sucesivas mediciones es capaz de establecer un orden causal en este
caos; porque justamente en la esfera de lo atómico, nos encontramos en la linde
del mundo físico, donde cada medición representa una perturbación del mismo
orden de magnitud que lo medido, y de ahí que resulte esencial la influencia sobre
éste; no se puede progresar, en esencia, a causa de las relaciones de indeterminación.
No existe, por lo tanto, método alguno que haga posible en cualquier caso el
subdividir (sin alterar sus elementos) una colectividad que muestra dispersión, o
cuando menos que permita avanzar hasta llegar a colectividades homogéneas, colec-
tividades que solemos concebir integradas por objetos iguales entre sí y causalmente
determinados. Sin embargo cabría intentar mantener la ficción de que cada colecti-
vidad que presente dispersión puede ser descompuesta en dos (o más) partes, dife-
rentes de ella y entre sí, y esto sin alteración de sus elementos, o sea, de forma que la
mezcla de las dos colectividades resultantes diese de nuevo la colectividad primitiva.
Vemos, pues, que el intento de fundamentar la causalidad como definición de la
igualdad ha dado lugar a una cuestión de hecho que puede y debe ser contestada, y
tal vez la respuesta sea negativa. La cuestión es ésta: ¿es realmente posible representar
cada colectividad [S1, …, SN], en la que ciertas magnitudes R presentan dispersión,
como mezcla de dos (o más) colectividades, diferentes entre sí y diferentes de ella?
(El caso de ser el número de partes mayor que 2, por ejemplo n = 3, 4, puede redu-
cirse al de n = 2 sin más que considerar la primera y la mezcla de las n - 1 restantes.)
Si [S1, …, SN ] fuese, por ejemplo, la mezcla de [S'1, …, S'p] y [S''1, …, S''Q],
para cada magnitud R podríase expresar su función de probabilidad wR(a) (cf.
Nota 157) mediante las funciones de probabilidad w'R (a), w''R(a) correspondientes
a estas últimas:
(M1) wR(a) = aw'R(a) + bw''R(a), > a > 0, b > 0, a + b = 1,
P Q
fórmula ésta en la que a = y b = , (N = P + Q) son independientes de R. Se
N N
trata, pues, en último término, de resolver el siguiente problema matemático: Si
en una colectividad, a la que están vinculadas las funciones de probabilidad wR
(a), existen magnitudes R que presentan dispersión, ¿es posible hallar otras dos
colectividades con las funciones de probabilidad w'R(a) y w''R(a), de suerte que
valga M1 cualquiera que sea R? Esta cuestión puede ser formulada de modo algo
distinto cuando caracterizamos la colectividad, no por las funciones de probabili-
dad wR(a) de las magnitudes R, sino por los valores medios de éstas:
∞
Vm (R ) = ∫
−∞
adwR (a).
312
Fund_MAT_04.indd 312 9/5/18 10:17

El problema, entonces, reza así: Una colectividad está libre de dispersión cuan-
do en ella, para cada R, es nulo el
Vm [R - Vm (R)]2 = Vm (R2) - [Vm (R)]2
(cf. Nota 160), es decir, cuando
(R2) = [Vm (R)]2.
(Disp1) Vm
Si no ocurre así, ¿es siempre posible encontrar otras dos colectividades, con los
valores medios V'm (R), V''m (R),
Vm (R) ≢ V'm (R) ≢ V''m (R),
de modo que siempre valga la relación
(M2) Vm (R) = a V'm (R) + bV''m (R),
donde a y b son independientes de R, a > 0, b > 0 y a + b = 1? [Obsérvese que,

para una magnitud dada R, el número Vm (R) no puede reemplazar la función
wR(a); en cambio, el conocimiento de todos los Vm (R) equivale al de todas las
wR(a), porque, si fa(x) es la función definida por:
{ ∣
fa(x) = 1, para x ≤ a, ,
0, para x > a
se tiene wR(a) = Vm (fa(R)).]

Para tratar matemáticamente esta cuestión es más cómodo considerar, en vez
de las colectividades [S1, …, SN], los correspondientes Vm (R). A cada colectividad
corresponde una tal función, la cual está definida para todas las magnitudes R de
S y toma valores reales, función que, recíprocamente, determina completamente
la colectividad en lo que concierne a todas sus propiedades estadísticas. [Cf. lo
antes dicho acerca de la conexión entre Vm (R) y wR (a).] Claro está que todavía
hemos de encontrar qué propiedades debe poseer una función de R para que sea
Vm (R) de una colectividad adecuada. Pero tan pronto las hayamos fijado, tendrán
pleno sentido las definiciones siguientes:
a) Una función de R, que sea un Vm (R), la calificaremos de sin dispersión,

cuando satisface la condición Disp1.
b ) Una función de R, que sea un Vm (R), la calificaremos de homogénea o
pura, cuando para ella M2 implica que
Vm (R) = V'm (R) = V''m (R).
313
Fund_MAT_04.indd 313 9/5/18 10:17

Es claro de suyo que toda función Vm (R) sin dispersión es pura, y en breve
quedará demostrado. Pero nuestro problema, reza así: ¿toda función Vm (R) pura
es sin dispersión?
Evidentemente, toda función Vm (R) debe poseer las siguientes propiedades:
A. Cuando la magnitud R es idénticamente igual a 1 (esto es, cuando la

norma para la medición de R reza así: no es necesario medir nada, pues R tiene
siempre el valor 1), entonces es Vm (R) = 1.
B. Para cada R y cada número real a se tiene
Vm (aR) = aVm (R).163
C. Cuando la magnitud R, por virtud de su naturaleza, no es nunca negativa

(por ejemplo, cuando es el cuadrado de otra magnitud S163) también es Vm (R)
≥ 0
D. Cuando las magnitudes R, S, … son simultáneamente medibles, entonces
es Vm (R + S + …) = Vm (R) + Vm (S) + …163. (Para magnitudes R, S, … no me-
dibles simultáneamente, no está definida R + S + … Cf. supra.)
Todo esto se sigue desde luego de las propias definiciones de las magnitudes
consideradas en cada caso (es decir, de sus normas de medición) y de la definición
de valor medio como media aritmética de todos los resultados de las mediciones
efectuadas en una colectividad estadística suficientemente grande. Respecto a D
hay que observar que su validez descansa en el teorema del cálculo de probabili-
dades, según el cual, el valor medio de una suma es siempre la suma de los valores
medios de los sumandos, independientemente de si existen o no dependencias
estadísticas entre éstos (en oposición a lo que ocurre, por ejemplo, en el caso del
producto). En cambio, es natural que se haya impuesto la condición de mensura-
bilidad simultánea, pues en caso contrario carece de sentido R + S + …
En la Mecánica cuántica, empero, hay un algoritmo que va más allá de lo
hasta aquí considerado: la adición de dos magnitudes cualesquiera, simultánea-
mente mensurables o no. Este algoritmo se apoya en que la suma R + S de dos
operadores hermíticos R, S es, asimismo un operador hermítico, incluso cuando
R y S no son permutables, mientras que el producto RS, por ejemplo, lo es sólo
en caso de permutabilidad (cf. II.5), En cada estado j, los valores medios se su-
man: (R j, j) + (Sj, j) = [(R + S)j, j] (cf. V2, en III.1), y lo mismo vale para
varios sumandos. A este hecho, que aceptamos como tal, se refiere la siguiente
hipótesis (aun no particularizada de momento para el caso de la Mecánica cuán-
tica):
E. Si R, S, … son magnitudes cualesquiera, existe una magnitud R + S + …

(independiente de la elección de la función Vm (R)) tal que Vm (R + S + …) =
= Vm (R) + Vm (S) + …
Cuando R, S, … son medibles simultáneamente esta magnitud R + S + …
debe coincidir con la suma ordinaria, en virtud de D. Pero en general, sólo está
314
Fund_MAT_04.indd 314 9/5/18 10:17

implícitamente definida por E y es apenas posible vincular las normas para la me-
dición de R, S, … a una norma para la medición de R + S + …164.
A lo dicho hasta ahora añadiremos todavía que, a partir de este momento,
admitiremos en nuestros razonamientos, no sólo aquellas funciones Vm (R) que
representan valores medios, sino también las que corresponden a valores medios
relativos, es decir, que se prescindirá de la condición de normalización A. Esto
carece de importancia cuando Vm (1) (que de acuerdo con C es ≥ 0) es finito y
Vm (R)
≠ 0, pues para todo ocurre como en el caso anterior. En cambio, Vm (1) = ∞
Vm (1)
corresponde a una posibilidad esencialmente distinta, en gracia a la cual procede-
mos a esta extensión, posibilidad que se patentiza de la mejor manera mediante
un sencillo ejemplo: Hay casos en los que es preferible operar con probabilidades
relativas a hacerlo con las propiamente dichas, en particular con una probabilidad
total infinita [Vm (1) corresponde a la probabilidad total]. Uno de ellos es el de
una partícula móvil a lo largo de una recta, de modo tal que exista equiprobabili-
dad a lo largo de ésta. En estas condiciones es nula la probabilidad de encontrar-
la en cada intervalo finito; pero no es esto lo que traduce la equiprobabilidad de
todos los lugares, sino el hecho de que la razón de las probabilidades correspon-
0
dientes a dos intervalos finitos es igual a la de sus longitudes. Dado que carece
0
de sentido, sólo es posible concebir lo que acabamos de señalar introduciendo las
longitudes de dichos intervalos con el carácter de probabilidades relativas. Se com-
prende que entonces la probabilidad total relativa pasa a ser ∞.
Teniendo en cuenta lo hasta aquí dicho, resulta como forma definitiva de
nuestras condiciones, la siguiente:
A'. Cuando la magnitud R, por virtud de su naturaleza, no es- nunca nega-
tiva (por ejemplo, cuando es el cuadrado de otra magnitud S), también es
Vm(R) ≥ 0.
B'. Si R, S, … son magnitudes cualesquiera y a, b, … números reales, en-
tonces es Vm (aR + bS + …) = aVm (R) + bVm (S) + … (A' corresponde a C, B'
corresponde a B, D, E).
Conviene subrayar que,
1. Puesto que consideramos valores medios relativos, las funciones Vm (R) y
cVm(R) (¡c > 0, constante!) hay que considerarlas como no esencialmente distintas;
2. Vm (R) = 0 (para todo R) no proporciona ningún enunciado y, por lo
tanto, esta función debe excluirse;
3. Los valores medios son absolutos, es decir, están correctamente normali-
zados, cuando es Vm(1) = 1. El Vm (1) es en todo caso ≥ 0, en virtud de A', y en
1
tanto sea finito y ≠ 0, la condición 1, junto con c = , conduce a la norma-
Vm(1)
lización correcta. Demostraremos que Vm (1) = 0 implica Vm (R) ≡ 0; luego de-
bemos excluir este caso. Finalmente, para Vm (1) = ∞ aparece una estadística
esencialmente no normalizada, esto es, relativa.
315
Fund_MAT_04.indd 315 9/5/18 10:17

Sentado esto, volvamos a nuestras definiciones a), b). M2 puede sustituirse,

atendiendo a 1, por la siguiente condición más simple:
M3 Vm (R) ≡ V'm (R) + V''m (R),
y tocante a Disp1. hay que observar que el cálculo que nos condujo a ella presu-
ponía Vm (1) = 1. Para Vm (1) = ∞, en modo alguno cabe definir la carencia de
dispersión, pues ésta traduce la igualdad
Vm[(R - r)2] = 0,
Vm (R)
donde r es el valor medio absoluto de R, es decir, , que aquí puede ser
∞ Vm (1)
eventualmente , y, por ende, falto de sentido. En consecuencia, a) y b) de-
166
∞
berán formularse en los siguientes términos:
a' ) Una función de R que sea un Vm (R), la calificaremos de sin dispersión

cuando Vm (1) es finito y ≠ 0 —en cuyo caso siempre se puede suponer Vm (1) = 1,
en virtud de 1— y se cumple, además, Disp1.
b' ) Una función de R que sea un Vm(R)y la calificaremos de homogénea o
pura, cuando para ella M3 trae consigo:
V'm (R) = c'Vm (R). V''m
(R) = c''Vm (R),
donde c', c'' son constantes, c' + c'' = 1 y además c' > 0, c'' > 0 en virtud de A',
1, 2.
Por fin estamos en condiciones de poder decidir de modo concluyente, basán-
donos en A', B', a' ) y b' ), acerca de la cuestión de la causalidad tan luego como se
conozcan las magnitudes físicas R, S, … ligadas a S, al igual que las relaciones
funcionales existentes entre ellas. Abordaremos este punto en el próximo párrafo
para el estado de cosas que se presenta en Mecánica cuántica. Daremos fin al pre-
sente con dos observaciones:
La primera concierne al caso Vm(1) = 0. Cuando así ocurre, de B se deduce

que Vm (c) = 0. Si R es una magnitud constantemente ≥ c' y ≤ c'', según A' será
Vm (c'' - R) ≥ 0, y Vm (R - c' ) ≥ 0; luego, en virtud de B', Vm (c' ) ≤ Fm (R) ≤ Vm (c'' ),
es decir, Vm (R) = 0. Supongamos ahora que R es cualquiera y sea f1(x), f2(x), …
una sucesión acotada de funciones tal que
f1(x) + f2(x) + … = x
sen x sen nx sen (n - 1)x

(por ejemplo, f1(x) = , fn(x) = - para n = 2, 3, …). Se
x nx (n - 1)x
tiene entonces Vm [ fn(R)] = 0 para n = 1, 2, … y, según B', también Vm (R) = 0.
316
Fund_MAT_04.indd 316 9/5/18 10:17

Por consiguiente, conforme a la afirmación antes formulada, Vm (1) = 0 debe ex-

cluirse en virtud de 2.
En segundo lugar es raro que, según Disp1., la condición Vm(R2) = [Vm(R)]2
sea característica de la ausencia de dispersión, aunque en este caso debe ser
(Disp2.) Vm [ f (R)] = f [Vm (R)],
pues, si no hay dispersión, Vm (R) coincide con el valor de R y Vm [ f (R)] con el

de f (R). Es claro que Disp1. es un caso particular de Disp2. [ f (x) = x2]; ¿cómo es
posible, en estas condiciones, que Disp1. sea condición suficiente para el cumpli-
miento de Disp2.? La respuesta es ésta: cuando Disp2. vale para f (x) = x2, vale
también cualquiera que sea f (x), e igualmente ocurre cuando Disp2. queda satis-
fecha para cualquiera otra función de x continua y convexa [es decir, tal que para
⎛ x + y ⎞ f (x) + f ( y) ⎤
todo par de valores x ≠ y sea f ⎜ < ⎥⎦ . No abordaremos, sin
⎝ 2 ⎟⎠ 2
embargo, la demostración.
2. Demostración de las fórmulas estadísticas

Sabemos ya que a las magnitudes físicas de un sistema mecánico corresponden
unívocamente los operadores hermíticos hipermáximos (cf., por ejemplo, la dis-
cusión en III.5) y conviene admitir que esta correspondencia es biunívoca, esto es,
que a cada operador hermítico hipermáximo corresponde realmente una magnitud
física (de esto nos valimos incidentalmente en III.3). Tocante a este punto, valen
las siguientes leyes (cf. F y L en III.5 como también lo dicho al final de IV.1):
I. Si la magnitud R posee el operador R, la magnitud f (R) posee el operador

f (R).
II. Si las magnitudes R, S, … poseen los operadores R, S, …, la magnitud
R + S + … posee el operador R + S + … (no se supone la mensurabilidad simul-
tánea de R, S, …; cf. acerca de esto lo dicho en otro lugar).
Las proposiciones A', B', a') y b') y I, II constituyen el punto de partida mate-
mático de nuestro análisis.
Sea j1, j2, … un sistema ortonormal completo, y, en vez de cada operador R,
consideremos la matriz asociada amn = (Rjn, jm). Formemos, además, los operado-
res hermíticos definidos por las matrices
mn =
e(n) {
1, para m = n = n ,
0, en caso contrario ∣
1, para m = m, n = n -i, para m = m, n = n
(mn)
emn
{0, en caso contrario
∣
= 1, para m = n, n = m , gmn
(mn)
{
= -i, para m = n, n = m ;
∣
estos operadores son precisamente, dicho sea de paso,
317
Fund_MAT_04.indd 317 9/5/18 10:17

P[ϕn], P ⎡ϕm +ϕn ⎤ − P ⎡ϕm −ϕn ⎤ y P ⎡ϕm +iϕn ⎤ − P ⎡ϕm −iϕn ⎤.

⎢⎣ 2 ⎥⎦ ⎢⎣ 2 ⎥⎦ ⎢⎣ 2 ⎥⎦ ⎢⎣ 2 ⎥⎦
Sean U(n), V(mn), W(mn) las correspondientes magnitudes. Es evidente que
aµν = ∑ anneµν
(n)
+ ∑ Re amn f µν(mn) + ∑ Im amn g µν(mn),
n m <n m <n
pues anm = amn. Luego
R = ∑ annU(n) + ∑ Re amn V(mn) + ∑ Im amn W(mn),

n m <n m <n
y a causa de II y B':
Vm(R) = ∑ annVm(U(n)) + ∑ Re amnVm(V(mn))

n m <n
+ ∑ Im amnVm(W(mn)).
m <n
Por lo tanto, si hacemos
}
unn = Vm(U(n)),
1 i
umn = Vm(V(mn)) + Vm(W(mn)), (m < n)
2 2
1 i
unm = Vm(V(mn)) - Vm(W(mn)),
2 2
resultará
Vm(R) = ∑ unm amn.

m, n
Ahora bien, puesto que unm = u–mn, podemos definir un operador hermítico U
mediante las relaciones umn = (Ujn, jn),166 merced a lo cual el segundo miembro
de la ecuación que precede coincide con traza (UR) (cf. II.11). La fórmula defini-
tiva es, pues,
(R) = traza (UR),

(Tr.) Vm
donde U es un operador hermítico independiente de R,167 determinado, por ende,

tan sólo por la colectividad.
318
Fund_MAT_04.indd 318 9/5/18 10:17

Cualquiera que sea el U que se haya elegido, Tr. satisface B' a causa de II. De
esto resulta que sólo queda aun por fijar qué limitación impone A' a U.
Si es ∙j ∙ = 1 (por lo demás, j es arbitrario) y llamamos P la magnitud aso-
ciada al operador P[j], a causa de ser P [2j] = P[j] y de I se tiene P2 = P y, por lo
tanto, en virtud de A', Vm(P) ≥ 0. Luego traza (UP[j]) = (Uj, j) ≥ 0. Si f es cual-
1 1
quiera, para f ≠ 0 podemos elegir j = f, con lo que (Uj, j) = (Uf, f ), y
∙ f ∙ ∙ f ∙2
de nuevo se obtiene (Uf, f ) > 0; para f = 0 es (Uf, f ) = 0. Resumiendo, U es de-
finido. Pero hay más: que U sea definido no es sólo una condición necesaria para
la validez de A', sino también suficiente.
En efecto: A' nos dice que cada Vm (S2) debe ser ≥ 0, y nada más; puesto que,
si R sólo puede tomar valores no negativos, para f (x) = ∣x∣ es f (R) = R, y dado que
para g(x) = √∣x∣ es idénticamente ( g (x))2 = f (x), tendremos (g (R))2 = f (R) y, por
ende, R = S2, si S = g (R).168 En consecuencia, si S es el operador de S, traza (US 2)
ha de ser ≥ 0. Pero S2 es definido: (S 2f , f ) = (Sf , Sf ) ≥ 0; luego, en último término
de lo que se trata es de demostrar que traza (US 2) ≥ 0), cuando U y S 2 son her-
míticos y definidos, propiedad ésta que fue ya demostrada169 en II.11 mediante la
aplicación de un teorema general relativo a los operadores definidos (cf. Nota 114).
Con esto hemos precisado por completo las características de las funciones
Vm (R): son funciones que corresponden a los operadores hermíticos definidos U,
y la interdependencia de unas y otros está expresada por Tr. Llamaremos a U el
operador estadístico de la correspondiente colectividad.
Es fácil ahora discutir las observaciones 1, 2, 3, de IV.1. Resulta, respectiva-
mente:
1. Desde el punto de vista de las probabilidades y valores medios relativos,

U y cU no son esencialmente distintos entre sí (c es una constante > 0).
2. U = 0 no proporciona enunciados de ningún género y, por lo tanto, debe
excluirse.
3. Se obtienen probabilidades y valores medios absolutos (es decir, correcta-
mente normalizados) cuando traza U = 1. En tanto traza U sea finita, podemos
1
normalizarla multiplicando por c = de acuerdo con 1. (A causa de ser U
traza U
definido, traza U es ≥ 0; es más, traza U es > 0, porque, como se demostró al final
de IV.1 en general —y en nuestro caso resulta también de II.11—, la condición
traza U = 0 trae consigo que U = 0, es decir, el caso excluido por lo dicho en 2.)
Solamente cuando traza U = ∞ nos encontramos ante probabilidades y valores
medios esencialmente relativos.
Finalmente es menester examinar las proposiciones a), b) de IV.1, esto es,
determinar entre los U aquellos que estén libres de dispersión y los homogéneos.
Consideremos primero los sin dispersión. En este caso hemos de suponer U
correctamente normalizado (cf. IV.1) y U debe ser tal que siempre Vm (R2) =
= [Vm (R)]2, es decir, traza (UR)2 = [traza (UR)]2. Para R = P[j] se tiene R 2 = R
= P[j], traza (UP[j]) = (Uj , j), de modo que ha de ser (Uj , j) = (Uj , j)2, esto
319
Fund_MAT_04.indd 319 9/5/18 10:17

es, (Uj , j) = 0 ó (Uj, j) = 1. Si ∙j' ∙ = 1 y ∙j'' ∙ = 1, podemos hacer variar j de

modo continuo, de manera que inicialmente coincida con j' y al final con j'',
manteniéndose constantemente ∙j ∙ = 1.170 En estas condiciones, (Uj , j) varía
también con continuidad, y como sólo puede ser o igual a 0 o igual a 1, (Uj, j)
es constante; luego (Uj', j') = (Uj'', j''). En consecuencia, (Uj , j) es siempre
= 0 o siempre = 1, de lo que se sigue desde luego U = 0 o U = 1. A causa de 2
no cabe considerar el caso U = 0; U = 1 no es normalizable (traza U = número de
dimensiones del espacio = ∞), y, como es fácil ver también directamente, no está
libre de dispersión. Luego no existe ninguna colectividad libre de dispersión.
Pasemos ahora a los U homogéneos. Con arreglo a b ) y S, U es homogéneo
cuando de
U=V+W
(V y W, como U, son definidos y hermíticos) se sigue V = c' U; W = c''U.171 Esta

propiedad corresponde a los U = P[j] (∙j ∙ = 1) y sólo a ellos.
En efecto: Supongamos que U posee dicha propiedad. Por ser U ≠ 0, existe
un f0 tal que Uf0 ≠ 0, de donde f0 ≠ 0 y, por lo tanto, (Uf0, f0) > 0 (cf. II.5, teore-
ma 19). Formemos los dos operadores hermíticos
(f, Uf0) (f, Uf0)

Vf = ⋅ Uf0, Wf = Uf - ⋅ Uf0;
(Uf0, f0) (Uf0, f0)
se tiene entonces
∙(f, Uf0)∙2 (Uf, f ) (Uf0, f0) - ∙(f, Uf0)∙2

(Vf, f ) = ≥ 0; (Wf, f ) = ≥ 0,
(Uf0, f0) (Uf0, f0)
(cf. II.5 teorema 19), es decir, V y W son definidos y, además, evidentemente es U
= V + W. Por consiguiente, V = c'U, y dado que Vf0 = Uf0 ≠ 0, ha de ser c' = 1,
1 ∙Uf0∙2
esto es, U = V. Hagamos ahora j = ⋅ Uf0, (∙j ∙ = 1), y c = , (c > 0;
∙Uf0∙ (Uf0, f0)
entonces es Uf = Vf = c(f, j) j = cP[j] f, o sea U = cP[j], es decir, U coincide en
esencia con P[j], en virtud de 1.
Recíprocamente, sea U = P[j](∙j ∙ = 1). Si U = V + W, donde V y W son de-
finidos, razonaremos del siguiente modo: De Uf = 0 se deduce que
0 ≤ (Vf, f ) ≤ (Vf, f ) + (Wf, f ) = (Uf, f ) = 0, (Vf, f ) = 0;
luego Vf = 0. Pero de (f, j) = 0 se sigue que Uf = P[j] f = 0, es decir, Vf = 0; luego

para todo g es (f, Vg) = (Vf, g) = 0. Por consiguiente, todo f ortogonal a j es asimis
mo ortogonal a Vg, cualquiera que sea g; por ende, Vg = cg.j (cg es un número que
depende de g). En particular, para g = j resulta Vj = c'j. Ahora bien, sea f un
320
Fund_MAT_04.indd 320 9/5/18 10:17

vector cualquiera; siempre podemos considerarlo dado en la forma ( f, j) · j + f',

donde f' es ortogonal a j. En estas condiciones
Vf = (f, j)Vj + Vf' = ( f, j)c' j = c'P[j] f = c'Uf ;
luego V = c'U, W = U - V = (1 - c' ) U, como queríamos demostrar.

Así, pues, las colectividades homogéneas corresponden a los U = P[j], ∙j ∙ = 1,
y en tal caso Tr. pasa a ser la fórmula V2 de III.1:
(V2) Vm (R) = traza (P[j]R) = (Rj, j).
Nótese que Vm(1) = traza (P[j]) = 1 (o porque P[j] está vinculado a la variedad
unidimensional [j], o en virtud de V2), es decir, la presente forma de U está co-
rrectamente normalizada. Determinemos, finalmente, cuándo P[j] y P[Ψ] tienen la
misma estadística, o lo que es lo mismo, cuándo P[j] = cP[Ψ] (c constante y > 0;
cf. 1). A causa de traza (P[j]) = traza (P[Ψ]) = 1, es entonces c = 1, v, por lo tanto,
P[j] = P[Ψ], es decir, j = aΨ; y como ∙j ∙ = ∙Ψ ∙ = 1, de esto se sigue que ∙a∙ = 1.
Es claro que esta condición es también suficiente.
En consecuencia podemos decir, resumiendo, que: no existen colectividades
sin dispersión; existen colectividades homogéneas, las cuales corresponden a los
U = P[j], ∙j ∙ = 1, y sólo a ellos. Para estos U, Tr. se convierte en V2, la normali-
zación es correcta y U no cambia cuando j se sustituye, por un aj (a constante,
∙a∙ = 1), pero cualquier otro cambio de j altera esencialmente U (cf. 1). Las co-
lectividades homogéneas corresponden, por lo tanto, a los estados de que se trata
en Mecánica cuántica tal cual antes fueron caracterizados: por un j del espacio de
Hilbert y de módulo unidad, en el que un factor constante de valor absoluto ca-
rece de significación (cf. por ejemplo, III.2), y los enunciados estadísticos resultan
de E2.172
Todo eso se ha deducido de las condiciones meramente cualitativas A', B', a')
y b'), I y II.
Así, y dentro del marco de las condiciones indicadas, ha quedado decidida la
alternativa a que aludíamos en el párrafo anterior, y el fallo es opuesto a la causa-
lidad: todas las colectividades están afectadas de dispersión, incluso las homo
géneas.
Debiérase discutir aún la cuestión planteada en III.2 acerca de los parámetros
ocultos, es decir, la cuestión de si las dispersiones de las colectividades homogéneas
caracterizadas por las funciones de onda j (o sea, por V2) no serían acaso debidas
a que ésas no son los verdaderos estados, sino solamente mezclas de varios, mien-
tras que para la caracterización del estado real, junto a la indicación de la función
de onda 9, quizás fuesen menester otros datos (los «parámetros ocultos»), de modo
que aquélla juntamente con éstos todo lo determinen causalmente, esto es, con-
duzcan a colectividades sin dispersión. La estadística de la colectividad homogénea
(U = P[j], ∙j ∙ = 1) resultaría entonces promediando sobre todos los estados reales
de que se compone; o en otros términos, promediando sobre aquel dominio de
321
Fund_MAT_04.indd 321 9/5/18 10:17

los valores de los «parámetros ocultos» que se realiza en dichos estados. Pero eso
es imposible por dos motivos: Primero, porque en tal caso la correspondiente co-
lectividad homogénea podría ser concebida como mezcla de dos colectividades
diferentes,173 contra la definición de colectividad homogénea. Segundo, porque las
colectividades sin dispersión, que debieran corresponder a los estados «reales» (es
decir, las constituidas por simples sistemas en el mismo estado «real»), no existen.
Obsérvese que no ha sido necesario entrar en los pormenores del mecanismo de
los «parámetros ocultos»: los resultados de la Mecánica cuántica que se encuentran
fuera de duda no pueden obtenerse de nuevo en ningún caso acudiendo a tales
parámetros. Es más, incluso está excluido que existan las mismas propiedades fí-
sicas con los mismos vínculos (esto es, que valgan I y II) cuando a la función de
onda acompañan otros elementos determinantes («parámetros ocultos»).
Tampoco bastaría la existencia de otras magnitudes físicas aún no descubiertas,
además de las hoy conocidas y representadas en Mecánica cuántica por operadores.
Pues ya respecto de éstas dejarían de cumplirse las relaciones que postula dicha
teoría (es decir, I y II). No se trata, por lo tanto, en modo alguno, de una cuestión
de interpretación de la nueva Mecánica, como se ha supuesto en más de una oca-
sión; más bien debiera ser ésa esencialmente falsa para que fuese posible un com-
portamiento en los procesos elementales distinto del estadístico.
Otra circunstancia hay digna de mención: A primera vista las relaciones de
indeterminación muestran un cierto parecido con los postulados fundamentales
de la teoría de la Relatividad. Se afirma en ésta que es fundamentalmente impo-
sible determinar la simultaneidad de dos sucesos que ocurren en dos puntos sepa-
rados entre sí por la distancia r, con una precisión mayor que el intervalo tempo-
r
ral (c = velocidad de la luz). Las relaciones de indeterminación, por su parte,
c
nos dicen que es fundamentalmente imposible determinar la posición de un pun-
to material en el espacio de las fases con una precisión mayor que un dominio de
3
⎛ h ⎞
volumen ⎜ ⎟ .174 Sin embargo, existe entre ambos casos una diferencia funda-
⎝ 4π ⎠
mental. La teoría de la Relatividad niega ciertamente la posibilidad de una medi-
ción de simultaneidad exacta, objetiva; pero, con todo, es posible, introduciendo
un sistema de ejes de Galileo, establecer en el Universo un sistema de coordenadas
que permita una definición de la simultaneidad que coincide suficientemente con
nuestros conceptos normales que a ella se refieren. No se concede un sentido ob-
jetivo a esta definición de simultaneidad, porque este sistema de coordenadas
puede elegirse de infinidad de maneras distintas, de lo que resultan infinidad de
definiciones de simultaneidad distintas, todas ellas igualmente lícitas. O sea: tras
la imposibilidad de la medición, reside una ambigüedad infinita tocante a las po-
sibles definiciones teóricas. Otra es la cosa en Mecánica cuántica: en ella es com-
pletamente imposible describir un sistema al que va asociada la función de onda
j mediante puntos del espacio de las fases, incluso ni acudiendo a nuevas coorde-
nadas (hipotéticas, inobservadas), a los «parámetros ocultos», pues esto conduciría
a colectividades sin dispersión. O sea: no sólo es imposible la medición, sino in-
322
Fund_MAT_04.indd 322 9/5/18 10:17

cluso toda definición teórica racional (es decir, aunque indemostrable empírica-
mente, como en teoría de la Relatividad, por lo menos también empíricamente
irrefutable). La imposibilidad fundamental de la medición descansa, por ende, en
que, en un caso, existen infinitas definiciones del concepto en cuestión que no
contradicen la experiencia inmediata, mientras en el otro no existe ninguna que
no contradiga las hipótesis fundamentales generales de la teoría.
En resumen, podemos caracterizar la posición de la causalidad en la Física de
hoy del siguiente modo: En el dominio de lo macroscópico no cabe experiencia
alguna que la apoye, ni puede haberla, pues la aparente ordenación causal del
Universo en grande (es decir, el de los objetos perceptibles a simple vista) no tie-
ne con seguridad otra causa que la «ley de los grandes números», independiente-
mente de si las leyes naturales que regulan los procesos elementales (las auténticas
leyes reales) son o no de carácter causal.175 Poco tiene que ver con la causalidad el
que objetos macroscópicamente iguales se comporten macroscópicamente de la
misma manera: iguales realmente no lo son, pues las coordenadas que determinan
los estados de sus átomos casi nunca coinciden y el punto de vista macroscópico
se alcanza al promediar sobre éstas (parámetros ocultos). Con todo, el número de
tales coordenadas es muy grande (para 1 gr. de materia, cerca de 1025), y el efectuar
el promedio trae consigo, en virtud de conocidas leyes del cálculo de probabili-
dades, una considerable disminución de todas las dispersiones. (Naturalmente,
esto en general. En algunos casos particulares —movimiento browniano, estados
inestables, etc.— falla esta aparente causalidad macroscópica.) Tan sólo en lo ató-
mico, en los mismos procesos elementales, pudiera realmente comprobarse la
cuestión de la causalidad; pero aquí, y en el estado actual de nuestros conocimien-
tos, todo habla en su contra: la única teoría formal hoy existente que ordena y
compendia nuestras experiencias en forma casi satisfactoria, esto es, la Mecánica
cuántica, se encuentra respecto de ella en irreductible contradicción lógica. Sin
duda, sería una exageración el afirmar que con esto ha quedado suprimida la cau-
salidad: en su forma actual, la Mecánica cuántica es ciertamente incompleta e
incluso puede suceder que sea falsa, si bien esto último es muy improbable en
vista de la asombrosa eficacia que manifiesta para la comprensión de los problemas
generales y el cálculo de los particulares. A pesar de que la nueva Mecánica coin-
cide brillantemente con la experiencia, y nos ha mostrado toda una faz del Uni-
verso cualitativamente nueva, nunca puede decirse de una teoría que está demos-
trada por la experiencia, sino tan sólo, que es el más completo resumen conocido
de la misma. Sin embargo, y con todas estas reservas, podemos afirmar que no
hay actualmente ni excusa ni motivo alguno para hablar de causalidad en la Na-
turaleza, ya que ninguna experiencia apoya su intervención: las experiencias ma-
croscópicas son para ello esencialmente inadecuadas, y la única teoría conocida
compatible con las relativas a los procesos elementales, la Mecánica cuántica, la
contradice.
Se trata, eso sí, de un ancestral modo de ver arraigado en todos los hombres,
pero en modo alguno de una necesidad lógica (como lo prueba el que se haya
podido sentar la teoría estadística), y quien se dirige al objeto, sin prejuicios no
323
Fund_MAT_04.indd 323 9/5/18 10:17

tiene ningún fundamento para aferrarse a ella. ¿Está justificado, en estas condicio-
nes, sacrificarle una teoría física racional?
3. Consecuencias de la experimentación
El último párrafo nos ha enseñado que la más general colectividad estadística
compatible con nuestras hipótesis cualitativas está caracterizada, según la ley Tr.,
por un operador definido U. Aquellas colectividades particulares que calificábamos
de homogéneas, lo están por operadores U = P[j], (∙j ∙ = 1). Dado que éstas son
los auténticos estados del sistema S (no son susceptibles de ulterior descomposi-
ción), las llamaremos también estados (estados j la caracterizada por U = P[j]).
Si U posee un espectro discreto puro, por ejemplo con los valores propios w1,
w2, … y las funciones propias j1, j2, … (que constituyen un sistema ortonormal
completo), se tiene (cf. II.8).
U = ∑ wn P[ϕn ],
donde por ser U definido, todos los wn son ≥ 0 [en efecto: Ujn = wnjn y, por lo
tanto, 0 ≤ (Ujn, jn) = wn]; además, ∑ wn = ∑ (U ϕn ,ϕn ) = traza U (cf. también el
n n
comienzo de IV.1), es decir, ∑ wn = 1 si U está correctamente normalizado. Por
n
consiguiente, y en virtud de lo dicho al principio de IV.1, U puede considerarse
como mezcla de los estados j1, j2, … afectados de los pesos relativos w1, w2, …,
pesos que son absolutos si U está normalizado correctamente.
Ahora bien, un U correctamente normalizado, es decir, tal que traza U = 1, es
completamente continuo en virtud de II.11 (cf. en particular Nota 115) y posee,
por ende, un espectro discreto puro. Lo mismo vale cuando traza U es finita. (Una
traza U infinita podemos considerarla como un caso límite, sobre el que aquí no
entraremos en pormenores.) En consecuencia, en el caso verdaderamente intere-
sante cabe representar la colectividad que consideramos como mezcla de estados
que, por otra parte, hemos elegido ortogonales dos a dos. Por tal razón, llamaremos
mezclas a las colectividades generales, en oposición a las homogéneas, los estados.
Cuando todos los valores propios de U son simples, esto es, cuando los w1, w2,
… son diferentes entre sí, las funciones propias j1, j2, … están unívocamente
determinadas, como sabemos, salvo un factor constante de valor absoluto igual a
1; los correspondientes estados y los operadores P[j ], P[j ], … quedan, por lo tan-
1 2
to, completamente fijados. En las mismas condiciones se hallan los pesos w1, w2,
…, aunque, claro está, unívocamente determinados lo están salvo en el orden de
sucesión. En este caso, por lo tanto, se puede indicar de modo unívoco qué estados
(dos a dos ortogonales) integran la mezcla U. Muy otras son las circunstancias
cuando U posee asimismo valores propios múltiples («degeneraciones»). En II.8
discutióse detenidamente cómo cabe elegir las j1, j2, …: la elección puede llevarse
a cabo de infinitas maneras, todas esencialmente distintas, mientras los w1, w2, …,
324
Fund_MAT_04.indd 324 9/5/18 10:17

aun en este caso, están determinados unívocamente. Sean w', w'', … aquellos de
entre los w1, w2, …, que son diferentes entre sí y determinemos para cada uno las
variedades lineales cerradas constituida por las funciones propias asociadas (es de-
cir, las soluciones de Uf = wf ); sean ésas Mw', Mw'', … Llegados a este punto, eli-
jamos al arbitrio en cada variedad; Mw', Mw''; … un sistema ortonormal c'1, c'2 …;
c'' 1, c'' 2, …; cuya extensión lineal cerrada coincida con ella. Entonces c'1, c'2, …;
c'' 1, c'' 2, …, son las j1, j2, … y los correspondientes w', w', …, w'', w'', …, son los
w1, w2, … En cuanto un Mw tenga más de una dimensión, es decir, apenas exista un
valor propio múltiple, las correspondientes c1, c2, … no están ya determinadas salvo
un factor constante de valor absoluto igual a 1 (así, por ejemplo, c1 puede ser cual-
quier elemento normalizado de Mw) es decir, ¡incluso en los estados existe ambigüedad!
Este aspecto se puede expresar también del siguiente modo: si los estados c1,
c2, … son ortogonales dos a dos (es decir, c1, c2, … forman un sistema ortonor-
mal, que lo mismo puede ser finito que infinito) y los mezclamos de manera que
a todos les corresponda el mismo peso (por ejemplo, los pesos relativos 1 : 1 : …),
la mezcla que así resulta depende únicamente de la variedad lineal cerrada defini-
da por c1, c2, … y puesto que
U = P[c ] + P[c ] + … = PM.

1 2
Si el número de los ci es finito, por ejemplo s: c1, …, cs, la U en cuestión

puede concebirse también como mezcla de todos los elementos normalizados de
M, esto es, de todos los estados de M, elementos cuya expresión general es:
c = x1c1 + … + xscs, ∙x1∙2 + … + ∙xs∙2 = 1.
En efecto: supongamos x1 = u1 + iv1, …, xs = us = + ivs, llamemos K la super-

ficie esférica de 2s - 1 dimensiones y radio unidad
u12 + v12 + … us2 + vs2 = 1,
la cual corresponde a las xi tales que ∙x1∙2 + … + ∙xs∙2 = 1, y ds el elemento super-

ficial de K. El operador
U' = … ∫ ∫ K
P[ χ ]dσ
es tal que
∫ ∫
(U'f , g ) = …
K
(P[ χ ] f , g)dσ = … ∫ ∫ K
( f , χ )(g, χ )dσ
⎛ s
⎞⎛ s
⎞
= … ∫ ∫ K
⎜f,
⎝
∑
µ =1
(uµ + ivµ )χ µ ⎟ ⎜ g,
⎠⎝
∑ (u
µ =1
µ + ivµ )χ µ ⎟ dσ
⎠
s
= … ∫ ∫ ∑ ( f , χ )(g, χ )(u
K
µ ,ν =1
µ ν µ − ivµ )(uν + ivν )dσ
325
s
= ∑ ( f , χ )(g, χ )∫ …∫ [(u u + v v ) + i(u v − u v )]dσ ,

µ ,ν =1
µ ν
K
µ ν µ ν µ ν ν µ
Fund_MAT_04.indd 325 9/5/18 10:17

∫ ∫
(U'f , g ) = …
K
(P[ χ ] f , g)dσ = … ∫ ∫ K
( f , χ )(g, χ )dσ
Fundamentos matemáticos ⎛de la mecánica cuántica

⎞⎛ ⎞
s s
= … ∫ ∫ K
⎜f,
⎝
∑
µ =1
(uµ + ivµ )χ µ ⎟ ⎜ g,
⎠⎝
∑ (u
µ =1
µ + ivµ )χ µ ⎟ dσ
⎠
s
= … ∫ ∫ ∑ ( f , χ )(g, χ )(u
K
µ ,ν =1
µ ν µ − ivµ )(uν + ivν )dσ
= ∑ ( f , χ )(g, χ )∫ …∫ [(u u + v v ) + i(u v − u v )]dσ ,

µ ,ν =1
µ ν
K
µ ν µ ν µ ν ν µ
y dado que todas las integrales de um vn, un vm son nulas, por razón de simetría,176
lo mismo que las de um un, vm vn, para m ≠ n, y pues para m = n estas últimas valen
C
(C > 0),176 obtenemos en definitiva
2s
s s
C C
(U'f , g) =
s
∑ ( f , χ µ )(g, χ µ ) = s ∑ (P[χ ] f , g) µ
µ =1 µ =1
⎛ ⎧C s
⎫ ⎞
= ⎜⎨ ∑ P[χ ] ⎬ f , g ⎟ .
⎝⎩ s
µ
µ =1 ⎭ ⎠
Luego
s
C C
U' =
s
∑ P[χ ] = µ
s
U,
µ =1
es decir, U' y U no son esencialmente distintos.

Todo eso es de gran importancia para el carácter de la estadística cuántica, por
lo que conviene recapitularlo:
1. Cuando una mezcla se compone de estados ortogonales entre sí, exacta-
mente con los mismos pesos, no es ya posible fijar cuáles eran aquéllos; o de otro
modo: mezclando en proporciones exactamente iguales, es posible obtener la mis-
ma mezcla con diferentes componentes ortogonales entre sí.
2. La mezcla que así resulta, supuesto que se trate de un número finito de
componentes, es idéntica a la mezcla de todos los estados que son combinaciones
lineales de dichas componentes.
El ejemplo más sencillo lo ofrece la mezcla 1 : 1 de j y Ψ (¡ortogonales!): el
ϕ+Ψ ϕ−Ψ
resultado es el mismo que si se mezcla 1 : 1, por ejemplo, , o también
2 2
todos los xj + yΨ(∙x∙2 + ∙ y ∙2 = 1). Si se mezclan dos j, Ψ no ortogonales (la
proporción puede no ser la 1 : 1), es aún mucho menos lo que cabe reconocer
en la mezcla acabada; pues, con seguridad, podemos concebir ésta asimismo como
mezcla de estados ortogonales. Diferimos el tratar más ampliamente de la natu-
raleza de las mezclas hasta que lleguemos a las consideraciones termodinámi-
cas (V.2).
326
Fund_MAT_04.indd 326 9/5/18 10:17

La fórmula Tr. de IV.2 indica cómo hay que calcular el valor medio de una
magnitud R asociada al operador R en una mezcla cuyo operador estadístico es el
U: dicho valor medio es traza (UR). La probabilidad de que el valor a de R se
encuentre en el intervalo a' < a ≤ a'' (a', a'' dados, a' ≤ a'' ) se determina al igual
que en III.1, III.5: fórmese primero la función F (x) = 1, para a' < x ≤ a'' ,
{ ∣
el valor medio de la magnitud F(R) es la probabilidad pedida. Ahora bien: el ope-
rador asociado a F(R) es el F(R) (según I, en IV.2), y si E(l) es la descomposición
de la unidad correspondiente a R, se tiene, cual hemos calculado en más de una
ocasión, F(R) = E(a'' ) - E(a' ). La probabilidad buscada es, pues, w (a', a'' ) = tra-
za U [E(a'' ) - E(a' )] y la función de probabilidad que describe la estadística de R,
w(a) = traza UE (a), [Cf. IV.1, Nota 175; para los estados, es decir, U = P[j] es de
nuevo w(a) = traza P[j] E(a) = (E(a)j, j)]. Naturalmente, estas probabilidades son
sólo relativas si U no está correctamente normalizado.
La cuestión de cuándo la magnitud R de operador R toma con certeza el valor
l* en la mezcla caracterizada por el operador estadístico U, se contesta desde lue-
go merced a w(a): para a < l* debe ser w(a) = 0, y para a > l*, w(a) = 1 o bien
= Vm (1) = traza U, si U no está correctamente normalizado. O sea, para a < l*,
traza UE(a) = 0 y para a > l*, traza U. (1 - E(a)) = 0.177 Esto sentado, recordemos
que cuando A, B son operadores definidos, traza (AB) = 0 trae consigo AB = 0
(cf. II.11); luego, para a < l* es UE(a) = 0 y para a > l* es UE(a) = U, o lo que
es lo mismo, E(a)U = 0 o = U, respectivamente, puesto que los factores deben ser
permutables a causa del carácter hermítico del producto. Así, pues, si hacemos
f = Ug (g cualquiera), resulta:
E(a)f = f, para a ≥ l* ,
{ ∣
0, para a < l*
y esto significa justamente, a causa de lo demostrado en II.8, que Rf = l*f, es de-

cir, RUg = l*Ug cualquiera que sea g. La condición definitiva es, por ende,
RU = l*U. O también, usando del signo M para representar la variedad lineal
cerrada constituida por todas las soluciones h de Rh = l*h: Uf ha de pertenecer
a M cualquiera que sea f.
Al mismo resultado hubiéramos llegado, por lo demás, partiendo de la anu
lación de la dispersión, es decir, del valor medio (eventualmente relativo) de
(R - l*)2.
En III.3 hemos contestado a las siguientes preguntas (R, S, … son magnitudes
físicas, R, S, … sus respectivos operadores).
1. ¿Cuándo es mensurable R con precisión absoluta? Respuesta: Cuando R

posee un espectro discreto puro.
2. ¿Cuándo son mensurables R, S simultáneamente con precisión absoluta?
Respuesta: Cuando R, S, tienen espectros discretos puros y son permutables en-
tre sí.
327
Fund_MAT_04.indd 327 9/5/18 10:17

3. ¿Cuándo son medibles varias magnitudes R, S, … simultáneamente con

precisión absoluta? Respuesta: Cuando R, S, … tienen espectros discretos puros y
son todos permutables entre sí.
4. ¿Cuándo son medibles varias magnitudes R, S, … simultáneamente con
precisión arbitraria? Respuesta: Cuando R, S, … son todos permutables entre sí.
Para ello utilizamos el siguiente principio abstraído del resultado del experi-
mento de Compton-Simons:
(M) Cuando se mide en un sistema S la magnitud física R dos veces consecu-

tivas, ambas veces se obtiene el mismo valor. Ello es así, aunque R presente dis-
persión en el primitivo estado y la medición de R pueda, además, alterar el estado
de S.
El significado físico de esta proposición se discutió con todo pormenor en
III.3. Otras hipótesis que se utilizaron para llegar a las respuestas 1-4 fueron: la
fórmula estadística V2 de III.1 relativa a los estados; las hipótesis F de III.2, según
la cual el operador F(R) es el F(R), cuando R tiene el operador R; la hipótesis se-
gún la cual el operador de R + S es el R + S, cuando a las magnitudes (simultá-
neamente medibles) R, S corresponden los operadores R, S.
Dado que nuevamente podemos disponer de esos tres supuestos (el primero
se deduce de la fórmula Tr. en IV.2; los otros dos se corresponden con I, II en IV.2)
y es menester seguir considerando justa la proposición M —porque la hemos re-
conocido como indispensable para la construcción sintética de la Mecánica cuán-
tica—, las demostraciones dadas en III.3 de 1-4 conservan aquí su validez y, por
ende, también la conservan las indicadas respuestas.
En III.5 estudiamos aquellas magnitudes físicas que sólo pueden tomar dos
valores: 0 y 1. Tales magnitudes estaban en correspondencia biunívoca con las
propiedades E, pues dado E la magnitud podría definirse así: para medir la mag-
nitud asociada E se decide acerca del darse o no darse la propiedad; en el primer
caso el valor de la magnitud es 1, en el segundo 0. Recíprocamente, dada la
magnitud, la propiedad E es la siguiente: la magnitud en cuestión tiene el valor
1 (es decir, no el 0). De la proposición F (es decir, la I de IV.2) se seguía que los
operadores correspondientes a dichas magnitudes son justamente los operadores
de proyección E y sólo éstos. La probabilidad de que se dé E era igual al valor
medio de la magnitud asociada antes definida. En III.5 se calculó esta probabi-
lidad únicamente para estados j (esto es, U = P[j], ∙j ∙ = 1), pero ahora podemos
ya determinarla en general a partir de Tr.: su valor es traza (UE ) (¡probabilidad
relativa!; absoluta lo es sólo si U está correctamente normalizado, es decir, si tra-
za U = 1).
Asegurada ya la validez de 1-4, con esto quedan al mismo tiempo justificadas
las proposiciones a)-z) que de aquéllas se deducen (cf. III.5). Cierto es que a)
aparecía como sólo aplicable a los estados; pero, como acabamos de ver, su apli-
cabilidad se ha hecho extensiva a las mezclas:
328
Fund_MAT_04.indd 328 9/5/18 10:17

a') La probabilidad de que en la mezcla caracterizada por el operador esta-

dístico U se dé la propiedad E vale:
traza (UE )
y la de que no se dé:
traza [U(1 - E )]
(estas probabilidades en general son relativas; son absolutas sólo si traza U = 1).
Supongamos ahora que se trata de investigar varias magnitudes R1, …, Ri a las
que corresponden los operadores R1, …, Ri y cuyas descomposiciones de la unidad
son E1(l), …, Ei(l). Si I1 …, Ii son los intervalos l'1 < l < l''1, y hacemos
E1(I1) = E1(l''1) - E1(l'1), …, Ei(Ii) = Ei(l''i) - Ei(l'i),
los operadores de proyección pertenecientes a las propiedades «R1 está en I1», …,

«Ri está en Ii» son, respectivamente, E1(I1), …, Ei(Ii) (cf. z ). Para la demostrabi-
lidad simultánea de estas propiedades, es necesaria y basta la permutabilidad de
E1(I1), … Ei(Ii) (cf. g ), y el operador de proyección que corresponde a la propiedad
de darse simultáneamente todas ellas es E = E1(I1), …, Ei(Ii) (cf. e). La probabili-
dad de esta última es, por lo tanto, traza (UE) (cf. a' ).
Tomemos ahora el camino en sentido opuesto: supongamos que no conoce-
mos el estado de un sistema S, pero que hemos efectuado en él ciertas medicio-
nes y sabemos sus resultados. En realidad, es éste el proceso que se sigue siempre,
pues sólo a partir de medidas podemos llegar a saber algo acerca del estado de S.
Los estados, en rigor, son únicamente una construcción teorética; lo que efecti-
vamente existe son las medidas, y lo que constituye el objeto de la Física es el
descubrir relaciones entre los resultados de mediciones ya efectuadas y los de
futuras mediciones. Verdad es que esto siempre se lleva a cabo mediante la intro-
ducción del concepto auxiliar de estado; pero la teoría física debe enseñarnos
entonces, de una parte, cómo se deduce el estado actual de las medidas realizadas,
y de otra, cómo del presente estado se siguen los futuros resultados de medición.
Hasta aquí nos hemos ocupado de la segunda cuestión. Ahora es necesario dedi-
carnos a la primera.
Cuando las mediciones efectuadas no bastan para fijar unívocamente el estado
presente, de ellas se puede inferir eventualmente con qué probabilidades aparecen
cada uno de los estados, y esto vale lo mismo en las teorías causales, por ejemplo
en la Mecánica clásica, que en la Mecánica cuántica. Propiamente este es, pues, el
problema: dadas unas medidas hallar una mezcla suya característica sea la misma
que la que cabe esperar para un sistema S del que sólo se sabe que en él se han
efectuado mediciones y que de éstas han resultado aquellas medidas. Naturalmen-
te, es necesario que precisemos un poco más qué queremos significar cuando de-
cimos que tocante a S sólo conocemos aquellas mediciones y medidas y nada más,
329
Fund_MAT_04.indd 329 9/5/18 10:17

como también hay que indicar de qué manera puede conducir este conocimiento
a una estadística.
Sea como fuere, la relación con ésta no puede ser otra que la siguiente: si esas
mediciones diesen en varios sistemas S'1, …, S'M (¡simples ejemplares de S !) dichos
resultados, la colectividad [S'1, …, S'M] coincidiría en todas sus propiedades esta-
dísticas con la mezcla que hemos coordinado a las medidas obtenidas. En virtud
de M, podemos imaginar que la causa de que éstas resulten igualmente en todos
los S'1, …, S'M reside en que originariamente se nos dio una gran colectividad [S1,
…, SN] en la que se llevaron a término aquellas mediciones, y que los elementos
en los cuales aparecieron los resultados pedidos se han reunido en una nueva co-
lectividad: esta es precisamente [S'1, …, S'M]. Se comprende que en estas condi-
ciones todo depende de cómo se elija [S1, …, SN]. Esta colectividad inicial da,
por decirlo así, las probabilidades a priori de cada uno de los estados del sistema
S. Todo ese estado de cosas es perfectamente conocido por la teoría general de las
probabilidades: para poder inferir de las medidas los estados, es decir, de las con-
secuencias las causas, o sea, para poder calcular probabilidades a posteriori, hay que
conocer las probabilidades a priori. Podemos elegir éstas, en general, de muchas
maneras diferentes, por lo que la solución a nuestro problema no será única; sin
embargo, veremos que, dadas las circunstancias particulares de la Mecánica cuán-
tica, es sobre todas notable una cierta determinación de la colectividad de partida
[S1, …, SN] (es decir, de las probabilidades a priori).
Muy de otro modo se plantea la cuestión cuando disponemos de medidas en
número suficiente para determinar completamente el estado de S: la respuesta
debe ser entonces única. Al punto veremos cómo se impone esta circunstancia a
las demás.
Finalmente haremos notar que, en vez de decir que se conocen varias medidas
relativas a S, podemos también decir que se ha examinado S respecto de una
cierta propiedad E y comprobado su existencia. En virtud de a)-z) sabemos, en
efecto, cómo están relacionadas entre sí aquéllas y ésta: dadas las medidas simul-
táneamente determinables, según las cuales los valores de las magnitudes R1 …, Ri
están en los intervalos I1, …, Ii, respectivamente, el operador de proyección que
corresponde a E es, usando de los símbolos antes introducidos,
E = E1(I1) … Ei(Ii).
En consecuencia, nuestros conocimientos acerca de S equivalen siempre a la

comprobación de la existencia de una cierta propiedad E, propiedad que está ca-
racterizada formalmente por el operador de proyección E. Se trata de hallar el
operador estadístico U de la colectividad equivalente [S'1, …, S'M], como también
el U0 de la colectividad general de partida [S1, …, SN]. ¿Cuáles son las relaciones
matemáticas existentes entre E, U, U0?
A causa de M, la propiedad E existe con toda seguridad en [S'1, …, S'M], es
decir, la magnitud que a ella corresponde tiene el valor 1. Esto significa, conforme
vimos al principio de este párrafo, que EU = U, esto es, Uf pertenece a M, don-
330
Fund_MAT_04.indd 330 9/5/18 10:17

de M es el conjunto de todos los f tales que Ef = f, la variedad lineal cerrada aso-
ciada al operador de proyección E.
En vez de EU = U, da lo mismo escribir UE = U, U (1 - E ) = 0, es decir,
Ug = 0 para todo g = (1 - E )f ; en otros términos, podemos decir que Ug = 0 para
todo g de la variedad lineal cerrada correspondiente a 1 - E, o sea para todo g de
E - M. Nada más cabe afirmar de U siguiendo este camino.
Cuando las dimensiones de M son 0 ó 1, y sólo entonces, queda determinado
U en lo esencial, o sea, salvo un factor constante, por las condiciones que preceden.
En efecto: para M = [0] resulta de ellas que U = 0, lo que es imposible según III.2,
observación 1; para M = [j] (j ≠ 0 de modo que podemos suponer ∙j ∙ = 1) se
tiene Uj = cj, de suerte que para todo f de M (que es de la forma aj) es Uf = cf
y, en general, Uf = UEf = cEf, U = cE = cP[j]. Ahora bien, c > 0, pues U es defi-
nido y ≠ 0; luego U coincide, en esencia, con E = P[j]. Si el número de dimensio-
nes de M es ≥ 2, podemos elegir dos elementos j, ψ de esta variedad ortogonales
entre sí y normalizados y los operadores P[j], P[ψ], son entonces dos U diferen-
tes que satisfacen nuestras condiciones. Resumiendo: E = 0 es imposible; para
E = P[j](∙j ∙ = 1), U = E = P[j]; en los demás casos U es indeterminado.
Que para E = 0 no quepa hallar ningún V fuera extraordinariamente enojoso
si existiese un S que pudiera poseer la correspondiente propiedad E. Afortunada-
mente este caso está excluido por h): nunca se da E, su probabilidad es siempre
nula. Si M es unidimensional, es decir, si E = P[j](∙j ∙ = 1), U queda fijado uní-
vocamente, precisamente como estado j. Esta es, por ende, aquella medida que
determina por completo el estado de S cuando da resultado positivo; ése es en-
tonces el estado j.178 Todas las otras mediciones, en cambio, son incompletas, no
bastan para la determinación del estado.
En el caso general procederemos del siguiente modo: llamemos también E la
magnitud asociada a la propiedad E. El operador U resulta de medir E en la co-
lectividad [S1, …, SN] correspondiente a U0 y reunir en una sola colectividad, la
[S'1, …, S'N], aquellos elementos en los que se obtiene el valor 1. Esta última es
la colectividad asociada a U. La medición de E cabe efectuarla de muchas maneras,
por ejemplo midiendo otra magnitud R, de la que E es una función conocida: E
= F(R). Así, ponemos por caso, cuando j1, j2, … es un sistema ortonormal cuya
extensión lineal cerrada es precisamente M, y ψ1, ψ2, … es otro sistema en las
mismas condiciones respecto de E - M, la variedad lineal cerrada definida por j1,
j2, …, ψ1, ψ2, … es la M + (E - M) = E, es decir, este sistema es completo. Sean
l1, l2, …, m1, m2, … números reales diferentes entre sí y R el operador definido
por
R
(∑ x ϕ + ∑ y ϕ ) = ∑ λ x ϕ + ∑ µ y ψ .
n
n n
n
n n
n
n n n
n
n n n
Evidentemente, el operador R posee un espectro discreto puro, el l1, l2,

…, m1, m2, …, con las correspondientes funciones propias j1, j2, …, y1, y2,
331
Fund_MAT_04.indd 331 9/5/18 10:17

…, y todos los valores propios son simples. Si F(x) es una función cualquiera
tal que
F(ln) = 1, F(mn) = 0,
F(R) tiene la unidad como valor propio para j1, j2, …, por manera que lo mismo
ocurrirá para todo f de M, y el valor propio 0 para y1, y2 …, es decir, en último
término, para todo f de E - M; luego, E = F(R). Si es R la magnitud a la que
pertenece R, según esto se tendrá E = F(R). Por consiguiente, la medición de R
puede interpretarse como medición de E.
Podemos calcular en este caso cómo están relacionados U0 y U. Tras una me-
dición de R, cada sistema se encuentra en uno de los estados j1, j2, …, y1, y2,
…, según sea l1, l2, …, m1, m2, …, el resultado hallado, respectivamente. Las
correspondientes probabilidades son
traza (U0P[j ]) = (U0j1, j1), traza (U0P[j ]) = (U0j2, j2), …,

1 2
traza (U0P[y ]) = (U0y1, y1), traza (U0P[y ]) = (U0y2, y2), …,

1 2
(cf. las consideraciones hechas en III.3, cuya validez ha sido ya establecida). Dicho
con otras palabras: éstas son las fracciones de la colectividad ligada a U0 que se
integran en las colectividades asociadas a P[j ], P[j ], …, P[y ], P[y ] … Dado que
1 2 1 2
E = 1 corresponde a R = l1, l2, …, la colectividad U nace de la reunión de las

que forman parte del primer grupo. Por lo tanto,
U = ∑ (U 0ϕn, ϕn )P[ϕn ] .
n
Ahora bien, cada P[j ] es permutable con R ;179 luego también debe serlo U, de
1
lo que se sigue que cuando U no es permutable con todos los R que se pueden
obtener del modo indicado, existen ciertos procesos de medición (los que estriban
en las correspondientes R) que no cabe tener en cuenta para la formación de U a
partir de U0. De U sabemos entonces algo más que su haber resultado de una
medición de E. Pero es el caso que U debe representar justamente este estado de
nuestro conocimiento; de ahí que convenga intentar ceñirnos estrictamente a esta
condición: cuando exista un U tal que no sea necesario excluir a causa de él ningún
proceso de medición de E, a este U debemos darle la preferencia. Veamos, por
consiguiente, si tales U existen y cuáles son.
Sabemos ya que U debería ser permutable con los R construidos cual se ha
indicado. De esto se deduce que RUj = URj = U(lnjn) = lnUjn, es decir, Ujn
n n
es función propia de R correspondiente al valor propio ln; luego Ujn = anjn y, en

particular, Uj1 = a1j1. Dado un j cualquiera, elemento de M, de módulo unidad,
podemos elegir j1, j2, …, y1, y2, …, de modo que j1 = j; luego todo j que se
encuentre en estas condiciones serán función propia de U. Pero hay más; todos
332
Fund_MAT_04.indd 332 9/5/18 10:17

estos j pertenecen al mismo valor propio. Pues si j y y perteneciesen a valores

ϕ +ψ
propios distintos, debieran ser ortogonales y, por lo tanto, también sería
ϕ +ψ 2
función propia; y dado que no es ortogonal ni a j ni a y, por ser
2
⎛ ϕ + ψ , ϕ ⎞ = (ϕ, ϕ) = 1 , ⎛ ϕ + ψ , ψ ⎞ = (ψ , ψ ) = 1 ,
⎜⎝ ⎟⎠ ⎜ ⎟⎠
2 2 2 ⎝ 2 2 2
ϕ +ψ
correspondería al mismo valor propio que j y y, resultado que contradice
2
la hipótesis de que hemos partido. Luego Uj = aj donde a es una constante.
Podemos, además, prescindir de la condición ∙j ∙ = 1, con lo que resulta en defi-
nitiva Uf = af, cualquiera que sea el elemento f de M. En consecuencia, para todo
g es UEg = aEg, de donde UE = aE ; y como U = UE, queda en definitiva U = aE.
A causa de ser U, E ambos definidos y ≠0, la constante a es > 0, de manera que
podemos hacer U = E sin alterar esencialmente U.
Pues bien, este U resuelve efectivamente el problema planteado para cada R,
es decir, para cada sistema j1, j2, …, y1, y2, …, supuesto convenientemente
elegido U0. Para U0 = 1 se tiene, en efecto,
∑ (U 0ϕn, ϕn )P[ϕ ] = ∑ (ϕn, ϕn ) P[ϕ ] = ∑ (P[ϕ ] = PM = E = U ).

n n n
n n n
Con esto queda establecida la relación U = E, de acuerdo con el programa

antes bosquejado. También U0 puede determinarse, con tal que lo supongamos
universal, es decir, independiente de E y R: el operador U0 = 1 y sólo él cumple
estas condiciones. Se tiene, en efecto,
(U ϕm, ϕm ) = (E ϕm, ϕm ) = (ϕm ,ϕm ) = 1,

(U ϕm, ϕm ) = ∑ (U 0ϕn, ϕn )(P[ϕn ]ϕm, ϕm ) = ∑ (U 0ϕn, ϕn ) (ϕn, ϕm ) = (U 0ϕm, ϕm ),
2
n n
es decir, (U0jm, jm) = 1. Todo j elemento de M y de módulo unidad puede ele-

girse como j1, de suerte que (U0j, j) = 1, de donde se sigue que, cualquiera que
sea f en M, (U0f , f ) = ( f , f ). Pero M es arbitrario; luego la última igualdad vale
para todo f, y por ende U0 = 1.
Dadas dos propiedades E y F, no necesariamente demostrables a la vez, la pro-
babilidad de que un sistema S en el que se ha determinado la existencia de E
posea también la propiedad F al efectuar inmediatamente después una nueva prue-
ba, es traza (EF ) = ∑ (EF ) (E, F son los operadores de E, F; la primera fórmula
vale porque U = E, la segunda a causa de E 2 = E, F 2 = F y según II.11). Debemos
advertir que estas probabilidades son relativas, por lo cual hay que considerar E
333
Fund_MAT_04.indd 333 9/5/18 10:17

fija y F variable. Cuando traza (E ) = ∑(E ) = número de dimensiones de M es

finita, basta dividir por este número para normalizarlas.
En vez de las propiedades E, F podemos también considerar magnitudes físicas:
sean R1, …, Rj magnitudes mensurables simultáneamente e igualmente S1, …, Sl ,
sean R1, …, Rj, S1, …, Si los correspondientes operadores y E1(l), …, Ej(l), F1(l),
…, Fl (l) las descomposiciones de la unidad asociadas; sean, finalmente, I1, …, Ij,
J1, …, Jl los intervalos l'1 < l ≤ l''1, …, l'j < l ≤ l''j, m'1 < l ≤ m''1, …, m'i < l ≤ ml''
y E1(I1) = E1(l''1) - E1(l'1), …, Ej(Ij) = Ej(l''j) - Ej(l'j), F1( J1) = F1(m''1) - F1(m'1),
…, Fl ( Jl ) = Fl (m''l ) - Fl (m'l ). El problema es éste: se midieron en S R1, …, Rj y se
encontraron sus valores en I1, …, Ij, respectivamente; ¿cuál es la probabilidad de
que en una medición efectuada inmediatamente después los valores de S1, …, Sl ,
¿resulten estar en los intervalos J1, …, Jl ? Evidentemente hay que tomar E = E1 (I1)
… Ej(Ij), F = F1( J1) … Fl ( Jl ) (cf. e), z )) y la probabilidad en cuestión es entonces
traza [E1(I1) … Ej(Ij) · F1( J1) … Fl ( Jl )] = ∑[E1(I1) … Ej(Ij) · F1( J1) … Fl ( Jl )].
Para terminar, insistiremos una vez más acerca de la significación física de la

colectividad general de partida U0 = 1. La colectividad U se obtenía a partir de
ella descomponiendo U0 en dos mediante una medición de R; si no hubiéramos
llevado a término la descomposición, es decir, si hubiésemos medido R en cada
uno de los elementos de U0 y reunido después todos en una sola colectividad, ésta
hubiera resultado ser de nuevo la U0 = 1. El cálculo permite reconocer este hecho
con facilidad directamente; pero cabe también demostrarlo eligiendo E = 1; des-
aparecen entonces m1, m2, …, y y1, y2, …, y los l1, l2, … y j1, j2, … constitu-
yen un sistema completo. Por lo tanto, aunque la medición de R altera eventual-
mente cada uno de los elementos de la colectividad, todas estas alteraciones deben
compensarse exactamente, pues la colectividad total se conserva invariable. Esta
propiedad, además, es suficiente para que sea U0 = 1. En efecto, si para todo sis-
tema ortonormal completo j1, j2, … se tiene
∞
U 0 = ∑ (U 0ϕn, ϕn )P[ϕn ],
n =1
U0 es necesariamente permutable con P[j ], dado que lo son todos los P[j ];
1 n
luego U0 es permutable con cada P[j](∙j ∙ = 1) y, por ende,
U0j = U0P[j]j = P[j]U0j = (U0j, j)j,
es decir, es función propia de U0. De ahí se deduce que U0 = 1 del mismo modo
como antes dedujimos que U = E de la correspondiente relación (con M, E, en
vez de E y 1).
En consecuencia podemos afirmar que en la colectividad U0 = 1 todos los es-
tados posibles se encuentran en el más alto grado dable de equilibrio: nunca lo-
334
Fund_MAT_04.indd 334 9/5/18 10:17

grará alterarlo la perturbación que acompaña a la medición. Para cada sistema

ortonormal completo j1, j2, …, es
∞
U 0 = 1 = ∑ P[ϕn ],
n =1
o sea, la mezcla 1 : 1 : … de todos los estados j1, j2, … Se reconoce en esto la

correspondencia de U0 = 1 con la hipótesis termodinámica de la equiprobabili-
dad a priori de todas las órbitas cuánticas simples, hipótesis que se encuentra en
la antigua teoría de los quanta. También en nuestras consideraciones acerca de la
Termodinámica, a las que dedicaremos los próximos párrafos, representará el caso
U0 = 1 un importante papel.
335
Fund_MAT_04.indd 335 9/5/18 10:17

Fund_MAT_04.indd 336 9/5/18 10:17
V
Consideraciones generales
1. Medición y reversibilidad
Es posible predecir lo que ocurrirá en una mezcla cuando en ella se mida una
magnitud R esto es, cuando se efectúe la medición en cada elemento de la colec
tividad y luego se reúnan nuevamente en una sola todos los sistemas, no bien han
sido sometidos a medida —hasta tanto permite esta cuestión una respuesta uní
voca.
Supongamos primero que R presenta un espectro discreto puro y además sim
ple; sean j1, j2, … el sistema ortonormal completo constituido por sus funciones
propias y l1, l2, … los correspondientes valores propios, todos ellos distintos
entre sí por hipótesis. Después de la medición, la situación es la siguiente: en la
parte (Ujn, jn) de la colectividad inicial, R tiene el valor ln (n = 1, 2, …); esta
fracción, por lo tanto, es a su vez una colectividad en la que R posee con certeza
el valor ln (cf. M en IV.3), es decir, es el estado jn con el operador estadístico
(¡correctamente normalizado!) P[j ]. Por reunión de estas colectividades resulta, por
n
ende, una mezcla con el operador estadístico
∞
U' = ∑ (U ϕn, ϕn )P[ϕn].
n =1
Admitamos ahora que R tiene un espectro discreto puro (por lo que atribui
remos a j1, j2, …, l1, l2, … el mismo significado que en el caso anterior), pero
no simple, es decir, entre los ln los hay iguales entre sí. En estas condiciones, el
proceso a seguir para la medición de R no está unívocamente definido (lo mismo
ocurría en IV.3 con el de E). En efecto: sean m1, m2, … simples números reales
diferentes entre sí, S el operador que corresponde a j1, j2, …, m1, m2, … y S la
magnitud asociada a S. Si F(x) es una unción tal que
F(mn) = ln (n = 1, 2, …)
se tendrá F(S) = R, de donde F(S) = R; luego la medición de S se puede conside

rar también como medición de R. La primera cambia U en el U' arriba indicado,
el cual es independiente de m1, m2, … (completamente arbitrarios), pero no de las
funciones propias j1, j2, … —aunque éstas, a causa de la multiplicidad de los
valores propios de R, no están unívocamente determinadas. Vimos, en efecto (cf.
II.8, IV.2), que si l', l'', … son los ln distintos entre sí y Ml' , Ml'' … los conjun
tos de funciones f tales que Rf = l'f, Rf = l''f, …, respectivamente, el sistema j1,
j2, … más general se obtiene por reunión de sistemas ortonormales arbitrarios
337
Fund_MAT_05.indd 337 7/5/18 18:20

c'1, c'2, …, c''1, c''2, …, cuyas extensiones lineales cerradas son, respectivamente,

Ml' , Ml'' ,… Por lo tanto, el U' en cuestión puede ser cualquier
U' = ∑ (U χ'n, χ'n )P[χ'n] + ∑ (U χ''n, χ''n )P[χ''n] + …,

n n
y aquél será según sea la magnitud S elegida, es decir, según sea el efectivo dispo
sitivo de medida. Es claro que únicamente en ciertos casos particulares será único
el resultado U'.
Para llegar a su determinación, observemos que la unicidad de U' requiere la
de cada uno de los sumandos; es decir, para cada valor propio ∑ (U χn, χn )P[χn]
n
debe ser el mismo cualquiera que sea el sistema ortonormal que se tome para de
finir Ml, siendo Ml el conjunto de todos los f soluciones de Rf = lf. Llamemos
V a ese operador suma; basta repetir literalmente lo dicho en IV.3 (sustitúyase U0,
U, M por U, V, Ml) para llegar a la conclusión de que necesariamente es
V = clPM (cl constante y > 0), lo que equivale a la validez de (Uf, f ) = cl (f, f )
l
para todo f de Ml. Ahora bien, estas f son las mismas que las funciones PM g, en l
las que g es cualquiera; luego es menester imponer la condición
(UPM g, PM g) = cl(PM g, PM g),

l l l l
esto es,
(PM UPM g, g) = cl(PM g, g),

l l l
o sea
PM UPM = clPM
l l l'
para todo valor propio l de R. Pero si esta condición impuesta a U, evidentemen

te muy restrictiva, no queda satisfecha, cabe encontrar procesos de medición de R
que cambien efectivamente U en diferentes U'. (Con todo, en V.4 podremos aña
dir algo más acerca del resultado de la medición de R en general basándonos en
fundamentos termodinámicos.)
En tercer lugar, supongamos que R no posee espectro discreto puro. En tal
caso y en virtud de III.3 (o IV.3, criterio 1) la magnitud R no es medible con
precisión absoluta y las mediciones de R de precisión acotada son siempre equi
valentes a las de magnitudes cuyos operadores poseen espectro discreto puro (cf.
loc. cit.).
Otra manera de aprehender el comportamiento de un sistema material, con
trapuesta a la que acude a las acciones discontinuas, no causales e instantáneas
provocadas por los experimentos o las mediciones, es la que traduce la ecuación
temporal de Schrödinger: ésta permite reconocer cómo evoluciona el sistema en
338
Fund_MAT_05.indd 338 7/5/18 18:20

el transcurso del tiempo de modo continuo y causal cuando de él se conoce su

energía total. Para estados j, dicha ecuación es
∂ 2pi
(T1.) j = - Hjt,
∂t t h
donde H es el operador de la energía. De ella se sigue que también el operador
estadístico Ut = P[j ], del estado jt depende del tiempo:
t
⎛∂ ⎞ ∂ ∂ ⎛ ∂ ⎞ ∂
⎜⎝ U t ⎟⎠ f = (U t f ) = [( f , ϕt ) ⋅ ϕt ] = ⎜⎝ f , ϕt ⎟⎠ ⋅ ϕt + ( f , ϕt ) ⋅ ϕt
∂t ∂t ∂t ∂t ∂t
2π i 2π i
= −⎛ f , Hϕt ⎞ ⋅ ϕt − ( f , ϕt ) Hϕt
⎝ h ⎠ h
2π i 2π i
= [(Hf , ϕt ) ⋅ ϕt − ( f , ϕt )Hϕt ] = (U t H − HU t )f ,
h h
de donde
∂ 2π i
(T2.) Ut = (U t H − HU t ).
∂t h
Si Ut es el operador estadístico, no de un estado, sino de una mezcla de varios,

por ejemplo una mezcla de P[j (1)], P[j (2)], … con los pesos w1, w2, …, Ut debe
t t
cambiar conforme resulte de las evoluciones de P[j (1)], P[j (2)], …: basta sumar las
t t
correspondientes ecuaciones T2 para llegar a la conclusión de que T2 vale asimismo

para Ut. Ahora bien, todos los U son mezclas de esta naturaleza o límites de tales
mezclas (p. e., cada U cuya traza sea finita es una mezcla de este tipo); luego siem
pre podremos recurrir a la validez general de T2.
En ella, como también en la ecuación de Schrodinger T1, el operador hamil
toniano H puede depender de t; pero caso que no dependa, es posible obtener la
solución explícita. Se tiene así para T1, conforme ya sabemos,
2πi t ⋅ H
(T'1.) jt = e - h j, 0
y para T2
2πi t ⋅ H 2πi t ⋅

(T'2.) Ut = e - h U0 e h .
H
(Es fácil verificar que estas expresiones son soluciones de T1, T2, como también
que una se deduce de otra. Es claro además que, para valores iniciales dados j0, U0
339
Fund_MAT_05.indd 339 7/5/18 18:20

la solución es única: las ecuaciones diferenciales T1 y T2 son, en efecto, de primer

orden en t.)
Tenemos, pues, dos tipos de intervención exterior fundamentalmente distintos
que pueden modificar un sistema S o una colectividad [S1, …, SN]. Primero, los
cambios arbitrarios provocados por mediciones que traduce la fórmula
∞
(1.) U →U' = ∑ (U ϕn, ϕn ) ⋅ P[ϕn]
n =1

(j1, j2, … es un sistema orto normal completo, cf. supra). Segundo, los cambios
automáticos que resultan del decurso del tiempo y traduce la fórmula
2πi t ⋅ H 2πi t ⋅ H
(2.) U → Ut = e - h Ue h
donde H es el operador de la energía, t el tiempo y H es independiente de t. Cuan

do H es función de t, se divide el intervalo temporal de que se trate en pequeños
intervalos de tiempo en los que H no cambie, o sólo en muy poco; se aplica en
tonces 2 a cada uno de éstos y la superposición conduce al resultado final.
Es menester ahora que analicemos estos dos tipos de intervención, su natura
leza y relación mutua.
En primer lugar, no deja de ser raro que en 2 se admita una posible depen
dencia temporal de H (del tipo antes indicado), así que, a decir verdad, cabría
pensar que 2 basta ya para describir la perturbación provocada por una medición:
una intervención física no puede ser sino la inserción durante un cierto lapso de
tiempo de un cierto acoplamiento energético con el sistema que se considera, esto
es, la introducción de una adecuada dependencia temporal de H impuesta por el
observador. ¿Por qué, entonces, nos servimos del particular proceso 1 cuando se
trata de una medición? He aquí el motivo: En la medición no podemos considerar
el sistema S en sí mismo, antes bien es necesario investigar el sistema S + M para
que sea posible evaluar numéricamente la interacción de S y el dispositivo de me
dición M. Cierto es que la teoría de la medición se refiere al sistema S + M, pero
lo que debe indicarnos es cómo está vinculado el estado de S con ciertas propie
dades del estado de M (a saber, las posiciones de ciertos índices, dado que son
éstas lo que el observador lee). Además, es bastante arbitrario el que en los cálcu
los no se añada a M también el observador y que en vez de la conexión entre el
estado de S de una parte y las posiciones de los índices en M de otra, no se esta
blezca la que lo liga con los cambios químicos que se producen en la retina de
aquél o incluso en su cerebro (es decir, con lo que el observador «ha visto» o
«percibido»). Más adelante, en VI.1, examinaremos más detenidamente esta cues
tión. Sea como fuere, se considera aquí la aplicación de 2 sólo a S + M; hay que
demostrar, ciertamente, que ésta, por lo que a S se refiere, conduce al mismo re
sultado que la directa aplicación de 1 a S. En cuanto lo consigamos, habremos
logrado una coherente concepción del mundo físico que reconoce su fundamento
ideal en la teoría cuántica. Aplazamos la discusión de este problema hasta VI.3.
340
Fund_MAT_05.indd 340 7/5/18 18:20

En segundo lugar, acerca de 1 hay que advertir cuán repetidamente hemos

llamado la atención sobre el carácter instantáneo que presenta una medición en el
sentido de 1: ésta debe llevarse a cabo en un lapso tan corto, que no sea apreciable
el cambio en U que requiere 2. (Si se pretendiera ajustar este resultado calculando
de acuerdo con 2 el nuevo Ut, nada habría de conseguirse con ello; porque para
aplicar un Ut, cualquiera que sea, hay que conocer exactamente el instante t de la
medición, es decir, en todo caso debe ser corto el tiempo en ella empleado.) Aho
ra bien, este hecho es fundamentalmente delicado, pues es harto sabido que exis
te una magnitud que, en la Mecánica clásica, guarda con la variable tiempo la
relación de variable canónica conjugada: la energía.180 En consecuencia, cabe es
perar que para el par canónico-conjugado energía-tiempo deben valer ciertas rela
ciones de indeterminación semejantes a las que se dan entre los elementos del par
coordenada cartesiana-impulso.181 También la teoría de la relatividad espacial
muestra que debe existir una amplia analogía entre ambos pares: las tres coorde
nadas espaciales junto con el tiempo constituyen un vector de cuatro componen
tes, al igual que los tres impulsos junto con la energía. De existir una tal relación
de indeterminación, ello significaría que no es posible conseguir llevar a cabo una
muy precisa medición de la energía en un tiempo muy corto y cabría esperar una
relación, precisamente de la forma
et  h,
entre el error e de la medida y la duración t de la medición. Una discusión de

carácter físico, semejante a la realizada en III.4 para el par p - q, conduce, en
efecto, a este resultado181. Sin entrar en los pormenores, mencionaremos aquí so
lamente el caso de un quantum luminoso: la indeterminación e en el valor de la
energía es igual al producto por h de la indeterminación ∆n en el de la frecuencia,
a causa de la relación energía-frecuencia de Bohr (e = h∆n); pero ∆n, conforme
vimos en la Nota 137, en el caso más favorable es igual a la inversa del intervalo t ;
h
luego e ≳ y la medición debe extenderse sobre todo este intervalo temporal para
t
fijar el carácter monocromático del quantum de luz durante el mismo. El caso de
un quantum luminoso, empero, es característico en este orden de ideas, dado que
los niveles de energía atómicos, por regla general, se determinan a partir de la
frecuencia de las correspondientes rayas espectrales. Ahora bien, este comporta
miento de la energía muestra la posibilidad de que también en los casos de otras
magnitudes exista un nexo entre la exactitud y la duración de la medición. ¿Cómo
justificar en estas condiciones nuestro supuesto de mediciones instantáneas?
Hay que añadir ante todo que esta objeción hiere a la Mecánica cuántica en
un punto débil, en su punto más vulnerable: la hiere en su carácter no-relativista,
que distingue el tiempo t frente a las tres coordenadas espaciales y presupone un
concepto objetivo de simultaneidad. En efecto: mientras todas las restantes mag
nitudes (en particular las coordenadas x, y, z, esencialmente ligadas con t por la
transformación de Lorentz) están representadas por operadores, al tiempo le co
341
Fund_MAT_05.indd 341 7/5/18 18:20

rresponde, cual en la Mecánica clásica, un ordinario parámetro numérico t. O

también: un sistema constituido por dos partículas posee una función de onda que
depende de sus 2 × 3 = 6 coordenadas espaciales y solamente de un tiempo t,
aunque, en virtud de la transformación de Lorentz, convendrían dos tiempos. Pues
bien, tal vez ese nuestro poder ignorar la duración mínima natural de una me
dición esté relacionado con el carácter no relativístico de la Mecánica cuántica.*
Sin duda esto constituye una explicación, ¡pero tan poco alentadora!
Con todo, al tratar el problema con algo más de rigor se echa de ver que la
situación no es tan grave como parece, pues lo que en verdad necesitamos es no
que t sea pequeño, sino que no afecte mucho a la evaluación de las probabilida
∞
des (Ujn, jn) y, por lo tanto, a la formación de U' = ∑ (U ϕn, ϕn )P[ϕn] tanto si
n =1
2πi t ⋅ H 2πi t ⋅ H
hemos partido del propio U o de un Ut = e - h Ue h . Esto se puede conse
guir, por
2πi t ⋅ H 2πi t ⋅ H 2πi t ⋅ H 2πi t ⋅ H

(Utjn, jn) = (e - h Ue h jn, jn) = (Ue h jn, e h jn),
alterando H mediante una adecuada energía de perturbación de modo tal que

2πi
e h t ⋅ Hjn difiera de jn en un factor constante de valor absoluto igual a la unidad.
Es decir, el estado debe permanecer inalterado bajo la acción de 2; esto es, jn ha
de ser un estado estacionario; o en otros términos: H jn debe ser igual al produc
to de jn por una constante real, o sea, jn tiene que ser función propia de H. A
primera vista acaso parezca nada plausible esta alteración del operador de energía
H que transforma en estacionarias las funciones propias de R, es decir, en funcio
nes propias del operador H (que hace permutables H y R, si se quiere). Y en rea
lidad, el caso es que los dispositivos de medición típicos persiguen todos justamen
te esta acción sobre él.
En efecto, toda medición acaba en el movimiento libre de un quantum de luz
o de un punto material con una cierta energía y en una cierta dirección, y son
estas sus características, es decir, sus impulsos, mediante lo que indican el resulta
do de aquélla; o acaso termina en el reposo de un punto material (p. e., un índice
sobre una escala), cuyas coordenadas cartesianas indican dicho resultado. Usando
de la terminología introducida en III.6, podemos decir que, en el caso del quantum
luminoso, la indicación del Mn que es = 1 (los restantes son = 0), es decir, la de
todos los valores M1, M2, … equivale a la magnitud a medir; en el caso del punto
material en movimiento, a esta equivale la indicación de las tres componentes del
impulso P x, P y, P z; finalmente, en el del punto material en reposo, es la indicación
de las tres coordenadas cartesianas x, y, s, o de sus operadores Q x, Q y, Q z, lo que
de tal modo se comporta. Ahora bien, la medición está realmente efectuada sólo
cuando el movimiento del quantum de luz o del punto material es realmente libre,
* Cf. W. Pauli, «Die Allgemeinen Prinzipien der Wellenmechanik». (Handb der Physik, Bd.
XXIV, Erster Teil, p. 113). (N. del T.)
342
Fund_MAT_05.indd 342 7/5/18 18:20

es decir, cuando ni el quantum luminoso está expuesto a ser absorbido ni el pun

to material lo está a ser desviado por energías de tipo potencial; y en el caso del
punto material en reposo, para que así sea es menester que el punto se encuentre
efectivamente en reposo, lo que requiere una masa considerable.182 (Esto último a
causa de la relación de indeterminación; pues, de una parte, la velocidad debe ser
próxima a cero, es decir, pequeña su dispersión y, de otra, su producto por la masa,
esto es, el impulso, ha de presentarla y muy notable a causa de lo pequeña que es
la dispersión de las coordenadas. De hecho, los índices son objetos macroscópicos,
es decir, enormes.) Pero la parte del operador de la energía H que afecta al quan
tum luminoso es, según III.6,
∞
h ρ
n =1
⋅ M +
∞ ∞
⎡
j =1 n =1
k→ j
( k→ j
) ⎤
∑ n n ∑ ∑ wkjn ⎣⎢ Mn + 1 ⋅ M n → Mn + 1 + Mn M n → Mn − 1 ⎦⎥, ( )
y el operador H que corresponde al ejemplo de los dos puntos materiales
(P x)2 + (P y)2 + (P z)2

+ V (Qx, Qy, Qz)
2m
(m es la masa, V la energía potencial); luego, nuestros criterios equivalen a la
condición de ser nulos los wnkj en el primer caso, a la de constancia de V en el se
gundo y a la de ser m, muy grande en el terrero. Y esto determina justamente la
permutabilidad de Mn, de P x, P y, P z y de Q x, Q y, Q z, respectivamente, con el
operador H.
Para terminar esta discusión, recordaremos que ese comunicar un carácter es
tacionario a los estados que propiamente interesan (aquí, a los j1, j2, …), es algo
que también en otras ocasiones representa un importante papel en la Física teóri
ca. La hipótesis acerca de la posibilidad de interrumpir las reacciones químicas (del
«envenenamiento»), tan a menudo inevitable en los experimentos ideales físico-
químicos, es precisamente de esa naturaleza.183
Los dos tipos de influencia 1 y 2, son fundamentalmente diferentes entre sí.
Carece de importancia el que ambos, con arreglo a su forma, sean unívocos, es
decir, causales; pues dado que consideramos las propiedades estadísticas de mezclas,
nada tiene de sorprendente que todo cambio, aun cuando sea estadístico, dé lugar
a un cambio causal en las probabilidades y los valores medios. ¡Por este motivo se
introducen las colectividades estadísticas y las probabilidades! En cambio, sí la
tiene el que 2 no aumenta la indeterminación estadística existente en U, mientras
con 1 ocurre lo contrario: 2, en efecto, transforma estados en estados,
2 πi
P[ϕ] en P[e − h t ·Hϕ] ;
1, en cambio, puede muy bien transformar estados en mezclas. En este sentido,

la evolución de un estado regida por 1 es estadística, y causal si lo es por 2.
343
Fund_MAT_05.indd 343 7/5/18 18:20

Además, para H y t fijos, 2 es simplemente una transformación unitaria de

2πi
todos los U : Ut = AUA-1, donde A = e - h t ⋅ H es unitario; es decir, Uf = g equiva
le a Ut(Af ) = Ag, de manera que Ut resulta de U mediante la transformación uni
taria A del espacio hilbertiano, o sea, por medio de un isomorfismo que deja in
tactos nuestros conceptos geométricos fundamentales. (Cf. los principios
analizados en I.4.) Luego 2 es reversible: basta sustituir A por A-1, y esto es posible
porque A y A-1 pueden concebirse como operadores unitarios cualesquiera, dada
la amplia arbitrariedad en la elección de H y t. Al igual que la Mecánica clásica,
tampoco 2 logra reproducir una de las más esenciales y singulares propiedades del
mundo real, a saber, su irreversibilidad, la fundamental diferencia entre los dos
sentidos del tiempo, futuro y pasado.
Muy otro es el comportamiento de 1: la transición
∞
U →U' = ∑ (U ϕn, ϕn )P[ϕn]
n =1
no se puede invertir sin más. Pronto hemos de ver que dicha transición es en
esencia irreversible, en el sentido de que en general ni una sola vez se consigue
volver de U' al U de que procede acudiendo a la aplicación reiterada de procesos
cualesquiera 1, 2.
Con esto hemos alcanzado un punto en que hay motivos para acudir al modo
de razonar termodinámico, pues sólo éste posibilita la correcta comprensión de la
diferencia entre 1 y 2, diferencia que evidentemente interviene en las cuestiones
de reversibilidad.
2. Consideraciones termodinámicas
Examinaremos la Termodinámica de las colectividades mecánico-cuánticas des
de dos puntos de vista distintos. Primero supondremos la validez de los dos prin
cipios termodinámicos fundamentales, es decir, la imposibilidad del perpetuum
mobile de primera y segunda especie (principio de la energía y principio de la
entropía),184 y a partir de ellos evaluaremos la entropía para cada colectividad. En
esta deducción usaremos de los medios normalmente utilizados en la Termodiná
mica fenomenológica, mientras la Mecánica cuántica interviene tan sólo por cuan
to nuestras consideraciones termodinámicas se refieren a objetos (nuestras colec
tividades, al igual que sus operadores estadísticos U ) cuyo comportamiento está
regido por sus leyes. En este primer estadio, repetimos, se presupone la verdad de
ambas proposiciones fundamentales, no se demuestra. Una vez desarrollado ese
primer punto de vista, demostraremos la validez de las proposiciones termodiná
micas fundamentales en la Mecánica cuántica, si bien, dado que la relativa a la
energía vale en todo caso, sólo se tratará de la que se refiere a la entropía. En otros
términos, demostraremos que las modificaciones traducidas por 1, 2 nunca dismi
344
Fund_MAT_05.indd 344 7/5/18 18:20

nuyen la entropía calculada siguiendo el primer método. Acaso parezca este orden
poco natural, pero reconoce su fundamento en que, mediante la discusión termo
dinámica fenomenológica, conseguiremos aquella visión de conjunto del problema
que es indispensable para los razonamientos de la segunda fase.
Comenzamos, pues, con la consideración fenomenológica que, por otra parte,
nos permitirá resolver una conocida paradoja de la Termodinámica clásica. Ante
todo hemos de llamar la atención sobre el hecho de que el carácter fantástico de
nuestros experimentos ideales, es decir, su calidad de irrealizables prácticamente, no
afecta en nada a su poder de demostración: en el sentido de la Termodinámica
fenomenológica, todo proceso imaginable es concluyente cuando no vulnera las
proposiciones fundamentales.
Nuestra finalidad es la determinación de la entropía de una colectividad [S1,
…, SN] caracterizada por el operador estadístico U, que supondremos correcta
mente normalizado (traza U = 1). Usando de la terminología propia de la Mecá
nica estadística clásica, podemos decir que nos encontramos aquí ante una colec
tividad de Gibbs: la Estadística y la Termodinámica se refieren, no a las partes en
interacción integrantes de un sistema mecánico único, muy complicado, con mu
chos grados de libertad185 (sólo en parte conocidos), sino a una colectividad de
gran número de sistemas mecánicos, cada una de los cuales ya de por sí puede
tener (aunque acaso no los tenga) un número extraordinariamente grande de gra
dos de libertad, sistemas que debemos pensar completamente separados unos de
otros y sin interacción.186 Por razón de la separación completa de los sistemas S1,
…, SN y del hecho de pretender aplicarles en lo que sigue los métodos puramen
te de cómputo del cálculo de probabilidades, es indudable que se puede usar del
cálculo de probabilidades ordinario y que no entran aquí en juego las modalidades
propuestas por Bose-Einstein y Fermi-Dirac, las cuales encuentran lugar ade
cuado en ciertas colectividades de individuos indiscernibles y en interacción (a
saber, los quanta de luz y los electrones y protones, respectivamente. Cf. III.6, en
particular Nota 147).*
El método introducido por Einstein para el tratamiento termodinámico de
las colectividades en cuestión [S1, …, SN] es el siguiente:187 Se encierran los siste
mas S1, …, SN en sendas cajas K1, …, KN cuyas paredes son impenetrables a toda
transferencia de acción, lo que es lícito en virtud de la falta de interacción en estos
sistemas. Además, cada una de las cajas ha de tener una masa muy grande para
que los eventuales cambios de estado (y de energía, por lo tanto de masa) de S1,
…, SN sólo en muy poco alteren las masas de aquéllas. Finalmente, en los experi
mentos ideales que hay que efectuar, las velocidades de dichas cajas serán tan pe
queñas, que podremos llevar a cabo los cálculos no-relativísticamente. – Esto senta
do, coloquemos las cajas K1, …, KN a su vez en una caja K de grandes
dimensiones, es decir, en una caja de volumen U mucho mayor que la suma de
* Recuérdense que es regla general, por hoy admitida, que todas las partículas de spin entero
siguen la estadística de Bose-Einstein (fotón, mesón, deutón (21D), helión (42He), …) y las de spin
semientero la de Fermi-Dirac (neutrino, electrón ±, protón (11H), neutrón, …). (N. del T.)
345
Fund_MAT_05.indd 345 7/5/18 18:20

–
los volúmenes de K1, …, KN, y supongamos, – para simplificar, que en K no reina
campo de fuerzas alguno (en particular, K debe estar alejado, por consiguiente, de
todo campo de gravitación y ha de ser tan grande que no den lugar a acción nin
guna las masas de K1, …, KN). En consecuencia, cabe considerar K1, …, KN (que
contienen, respectivamente,
– S1, …, SN) como moléculas de un gas encerrado en
la gran caja K. Si ahora ponemos en contacto ésta – con un termostato, a la tempe
ratura T, de gran capacidad, las paredes de K tomarán esta temperatura y sus
moléculas reales adquirirán el correspondiente movimiento browniano. Estas, por
lo tanto, transmitirán impulso a las cajas K1, …, KN inmediatas, por lo que éstas
entrarán en movimiento y a su vez comunicarán impulso a las restantes K1, …,
KN. Pronto estarán en movimiento todas– las K1, …, K–N e intercambiarán impulso
con las moléculas de las paredes
– de K , en la pared de K, y entre sí, al chocar unas
con otras, en el interior de K. Este movimiento alcanzará el estado de equilibrio
estacionario justamente cuando las K1, …, KN hayan adoptado la distribución de
velocidades que corresponde al equilibrio con el movimiento browniano de las
moléculas de las paredes (a la temperatura T), es decir, cuando hayan adoptado la
distribución de velocidades que la ley de Maxwell atribuye a un gas a la tempe
ratura T cuyas «moléculas» serían K1, …, KN .188 Podemos decir, pues, que el gas
[K1, …, KN] ha tomado la temperatura T. Para abreviar, convendremos en llamar
en lo que sigue colectividad-U a la colectividad [S1, …, SN], cuyo operador esta
dístico es el U, y gas-U al gas [K1, …, KN].
La razón que nos conduce a ocuparnos de un tal gas es que, por definición, la
diferencia de entropías entre la colectividad-U y la colectividad-V (U y V son ope
radores definidos, con traza 1, cuyas colectividades asociadas llamaremos [S1, …,
SN], [S'1, …, S'N]), debe determinarse transformando reversiblemente la primera
en la última,189 y la mejor manera de conseguirlo es pasando por el gas-U y el
gas‑V. Y ello es así, porque la diferencia de entropías de las colectividades U y V
es exactamente la misma que entre las de los gases U y V cuando ambos se consi
deran a la misma temperatura T, que, por lo demás, puede ser cualquiera. Que las
cosas ocurren de este modo con exactitud tan grande cuanto se quiera, es eviden
te cuando la temperatura T es muy próxima a 0, pues la diferencia entre la colec
tividad-U y el gas-U a la temperatura 0 se anula porque las K1, …, KN del último
– de todo movimiento propio y la presencia de las cajas en reposo K1, …,
carecen
KN, K no tiene importancia alguna desde el punto de vista termodinámico (lo
mismo cabe decir de V ). Por lo tanto, habremos conseguido nuestro propósito tan
pronto se demuestre que son iguales las variaciones de entropía del gas-U y del
gas-V correspondientes a una misma variación de la temperatura T. Ahora bien, la
variación de la entropía de un gas cuando se calienta de T1 a T2 depende sólo de
su ecuación de estado calorífica, más exactamente, de su calor específico.190 Claro
está, que no cabe suponer perfecto el gas cuando, como en nuestro caso, ha de
elegirse T1 próximo a 0.191 Pero, en cambio, lo que sí es seguro es que ambos gases,
el U y el V, poseen la misma ecuación de estado y el mismo calor específico, por
cuanto las cajas K1, …, KN prevalecen desde el punto de vista cinético y encubren
por completo los sistemas S1, …, SN o S'1, …, S'N encerrados en ellas. En ese
346
Fund_MAT_05.indd 346 7/5/18 18:20

proceso de calentamiento, por ende, no es perceptible la diferencia entre U y V y

los dos incrementos de entropía coinciden, c · q · d. Por este motivo, en lo que
sigue compararemos entre sí únicamente el gas-U y el gas-V y elegiremos la tem
peratura T tan elevada que ambos puedan ser considerados como gases perfectos.192
Con esto dominamos por completo el comportamiento cinético de uno y otro gas
y podemos aplicarnos a lo que propiamente es nuestro problema: la transformación
reversible del gas U en el gas V. Para ello deberemos actuar sobre los sistemas S1,
…, SN que se encuentran en el interior de K1, …, KN, en oposición a los procesos
aplicados hasta aquí; con otras palabras, deberemos «abrir» las cajas K1, …, KN.
Demostraremos primero que todos los estados U = P[j] tienen la misma en
tropía, es decir, que la transformación reversible de la colectividad P[j] en la colec
tividad P[y] se consigue sin consumo ni desarrollo de energía calorífica (energía
mecánica sí deberá consumirse o desarrollarse cuando el valor medio de la energía
en P[j] sea otro que en P[y], cf. Nota 185. No será necesario para ello recurrir ni una
sola vez a los gases antes considerados: esa transformación se logra incluso a la
temperatura 0, es decir, con las propias colectividades. Por otra parte, tan luego
como quede demostrado, podremos normalizar las entropías de las colectivida
des‑U, y así lo haremos, de modo que todos los estados tengan la entropía 0.
Hay que advertir que la transformación de P[j] en P[y] a que arriba nos refe
ríamos no tiene por qué ser necesariamente reversible, pues, cuando no lo es, la
diferencia de entropías ha de ser ≥ que la expresión indicada en la Nota 185 (cf. loc.
cit. Nota 185), por lo tanto ≥ 0; la permutación de P[j], P[y] conduce igualmente a
que ha de ser ≤ 0; luego es = 0.*
El procedimiento más fácil sería valernos de la ecuación temporal de Schro
dinger, es decir, del proceso 2, para lo cual deberían hallarse un operador de la
2πi
energía H y un valor del tiempo t tales que el operador unitario e - h t ⋅ H transfor
mase j en y. En estas condiciones, en el decurso de t segundos P[j] se transfor
maría espontáneamente en P[y], el proceso es incluso reversible y para nada se
habla de calor (cf. V.1). Sin embargo, preferimos evitar el hacer hipótesis acerca
de las posibles formas del operador de la energía H y aplicar tan sólo el proceso 1,
es decir, operaciones del tipo medición. Lo más simple en que cabe pensar es en
medir en la colectividad P[j] una magnitud R cuyo operador R presente un espec
tro discreto puro con sólo valores propios simples l1, l2, … y que sea tal, además,
que y figure entre las funciones propias y1, y2, …, por ejemplo, y = y1; porque,
en este supuesto, dado que la medición de R transforma j en una mezcla de los
estados y1, y2, …, entre éstos aparecerá el y. No obstante, esto resulta poco con
veniente, por cuanto a y1 = y le corresponde sólo la probabilidad ∙(j, y)∙2, mien
* Es decir, si conseguimos demostrar la existencia de un proceso, reversible o irreversible, que

no requiera energía calorífica exterior y conduzca de P[j] a P[y] podremos afirmar que SP[y] - SP[j] ≥ 0;
si, además, encontramos un proceso que tampoco ponga en juego energía calorífica exterior y lleve
de P[y] a P[j], de ello se seguirá que SP[y] - SP[j] ≤ 0. Luego, de la existencia de ambos procesos se
deducirá que SP[j] = SP[y]. Todo descansa, pues, en la demostración de la existencia de dos procesos
de esta índole, o de uno reversible (N. del T.)
347
Fund_MAT_05.indd 347 7/5/18 18:20

tras que la parte 1-∙(j, y)∙2 pasa a otros estados, y ésta es incluso toda la colecti
vidad cuando j y y, son ortogonales. A pesar de todo, un proceso similar
conduce al fin perseguido: mediante la realización sucesiva de mediciones de un
gran numero de magnitudes diferentes transformaremos P[j] en una colectividad
que difiera de la P[y] en tan poco cuanto se quiera. Como vimos más arriba, no
tiene importancia alguna el que estas operaciones sean irreversibles (o lo puedan
ser, por lo menos).
Supondremos en lo que sigue que j y y son ortogonales entre sí, pues, de no
serlo, bastaría elegir un c (∙c∙ = 1) ortogonal a ambos y transformar entonces j
en c y luego c en y. Sea k = 1, 2, … un número —que no fijamos por ahora a
pn pn
fin de poder disponer de él— y y (n) = cos ⋅ j + sen ⋅ y (n = 0, 1, …, k);
2k 2k
evidentemente y (0) = j, y (k) = y, y constantemente ∙y (n)∙ = 1. A partir de cada
y (n) (n = 1 …, k) construyamos un sistema ortonormal completo y 1(n), y 2(n), …,
tal que y 1(n) = y (n) y sea R(n) un operador dotado de espectro discreto puro y sólo
valores propios simples l 1(n), l 2(n), cuyas funciones propias son las y 1(n), y 2(n), …,
y cuya magnitud asociada llamaremos R(n). Observemos además que
π (ν − 1) πν π (ν − 1) πν
(ψ (ν −1), ψ (ν)) = cos cos + sen sen
2k 2k 2k 2k
πν π (ν − 1)⎞ π
= cos ⎛ − = cos .
⎝ 2k 2k ⎠ 2k
Esto sentado, midamos ahora en la colectividad caracterizada por U (0) = P[j(0)] =

= P[j] la magnitud R(1) y sea U (1), por ejemplo, la colectividad resultante; midamos
entonces R(2) en U (1) con lo que resultará, por ejemplo, U (2); …; finalmente, en
U (k - 1) midamos la magnitud R(k) y llamemos U (k) la colectividad que así resulta.*
Una justificación de carácter intuitivo de que U (k) difiere poco de P[y(k)] = P[y] si
U (k) es suficientemente grande, puede serlo la que sigue: cuando medimos R(n) en
2
2 ⎛ π⎞
y (n - 1), la fracción (ψ (ν −1), ψ (ν)) = cos se transforma en y (n); luego, en las
⎝ 2k ⎠
* U (n) resulta de medir R(n) en U (n - 1) Inmediatamente después de efectuada la medición, cada
uno de los sistemas está en uno de los estados yn (n) con la frecuencia
[U (n - 1) yn (n), yn (n)],

es decir, la fracción (U (n - 1) yn (n), yn (n)), de la colectividad U (n - 1) constituye la colectividad P[y (n)]. De
la reunión de todas éstas resulta la U (n) definida por
U (ν) = ∑ [U (ν −1)ψ n(ν ),ψ n(ν) ]P[ψ n(ν) ]

n
(N. del T.)
348
Fund_MAT_05.indd 348 7/5/18 18:20

2k
⎛ π⎞
sucesivas mediciones de R , R , …, R por lo menos la fracción cos
(1) (2) (k)
se
⎝ 2k ⎠
convertirá en y = y (k) partiendo de y (0) = j y pasando por y (1), y (2), …, y (k - 1).
La demostración exacta discurre así: puesto que el proceso 1 no altera la traza, a
causa de traza U (0) = traza P[j] = 1 será traza U (1) = traza U (2) = … = traza U (k) = 1.
Por otra parte
(U (ν) f , f ) = ∑ (U (ν −1)ψ n(ν), ψ n(ν))(P[ψ n(ν )] f , f )

n
= ∑ (U
2
ψ n(ν), ψ n(ν))(ψ n(ν), f ) ,
(ν −1)
de donde se sigue, para n = 1, …, k - 1 y f = y1(n + 1) = y (n + 1) y para n = k,

f = y1(k) = y (k) = y, que
2
(U (k)ψ (ν +1) ⋅ ψ (ν +1)) ≥ (U (ν +1)ψ (ν) ⋅ ψ (ν)) ⋅ ψ (ν) ,ψ (ν +1)
2
⎛ π⎞
= ⎜ cos ⎟ ⋅ (U (ν −1)ψ (ν), ψ (ν)),
⎝ 2k ⎠
(U (k)ψ (k), ψ (k)) = (U (k −1)ψ (k), ψ (k)).
Este resultado junto con

2
π
(U (0)y (1), y (1)) = (P[j(0)]y (1), y (1)) = ∙y (0), y (1) ∙2 = ⎛ cos ⎞
⎝ 2k ⎠
nos permite afirmar que
2k
π
(U (k)ψ , ψ ) ≥ ⎛ cos ⎞ .
⎝ 2k ⎠
2k
⎛ π⎞
Ahora bien, dado que traza U (k) = 1 y cos → 1 cuando k → ∞, pode
⎝ 2k ⎠
mos aplicar el resultado obtenido en II.11; luego U (k) converge hacia P[j], como
queríamos demostrar.
La cuestión que debemos discutir en segundo lugar trata de hasta qué punto
podemos servirnos para el estudio de los sistemas de la Mecánica cuántica de uno
de los recursos capitales a que se acude en los «experimentos ideales» de la Termo
dinámica fenomenológica: los llamados tabiques semipermeables.
En la Termodinámica fenomenológica vale el siguiente teorema: si I y II son
dos estados distintos del mismo sistema S, es lícito admitir la existencia de un
349
Fund_MAT_05.indd 349 7/5/18 18:20

tabique completamente permeable a I e impermeable en absoluto a II.193 (Es esto

lo que constituye, por decirlo así, la definición termodinámica de la diversidad de
dos estados, por ende también de su igualdad.) ¿Hasta qué punto es lícita esta
hipótesis en Mecánica cuántica?
Vamos a demostrar primero que si j1, j2, …, y1, y2, … es un sistema orto
normal, existe una pared semipermeable que deja pasar libremente los sistemas S
que se hallan en uno cualquiera de los estados j1, j2, … y refleja, sin alterarlos,
aquellos que se encuentran en cada uno de los estados y1, y2, … Los sistemas que
estén en otros estados, en cambio, pueden incluso verse alterados al entrar en co
lisión con la pared.
Siempre podemos suponer que el sistema j1, j2, …, y1, y2, … es completo;
pues, en caso contrario, podemos completarlo con c1, c2, … hasta conseguir que
lo sea y agregar estas ci a las j1, j2, …, por ejemplo. Elijamos ahora un operador
R dotado de un espectro discreto puro y de valores propios l1, l2, …, m1, m2, …,
todos ellos simples, cuyas funciones propias asociadas sean j1, j2, …, y1, y2, …,
respectivamente; además, supondremos ln < 0 y mn > 0 para n = 1, 2, … Sea R la
magnitud que corresponde a R. Abramos en la pared gran número de ventanas de
manera que cada una de ellas quede dispuesta del siguiente modo: cada molécula
K1, …, KN de nuestro gas (de nuevo consideramos gases-U a la temperatura T > 0)
es detenida allí, es abierta y en el sistema S1, …, SN que en ella esté contenido se
mide la- magnitud R; se cierra acto seguido la caja y según que el valor medido
de R sea < 0 ó > 0, así se la deja pasar junto con su contenido y con el mismo
impulso o se la refleja en estas mismas condiciones, respectivamente .Es claro que
este dispositivo cumple nuestro propósito y sólo resta discutir qué cambios resul
tan en él después de tales colisiones y hasta qué punto está ligado o no con el
«demonio de Maxwell» de la Termodinámica.194
Observemos, en primer lugar, que pues la medición de R modifica eventual
mente el estado de S y, por lo tanto, su valor medio de la energía, esta diferencia
de energía mecánica, en virtud del primer principio, debe ser proporcionada o
recibida por el aparato de medición (por ejemplo, porque hay un muelle que se
afloja o tiende, o por algo parecido). Dado que se trata de un mecanismo de me
dición cuyo funcionamiento es puramente automático y sólo se intercambia ener
gía mecánica (¡no calorífica!), no se presentan aquí, evidentemente, variaciones de
entropía y para nosotros es esto lo único que importa ahora. (Si S se encuentra
en uno de los estados j1, j2, …, y1, y2, …, la medición de R no altera en abso
luto el sistema S, de suerte que no se produce en el aparato de medición ningún
cambio como compensación.)
El segundo punto es más delicado: nuestro dispositivo muestra una cierta se
mejanza con el «demonio de Maxwell», es decir, con una pared semipermeable que
deja pasar las moléculas que proceden de la derecha y refleja las que vienen de la
izquierda. Sí se coloca un tal tabique en medio del recinto que contiene gas, pron
to se encontrará éste todo él a la izquierda del tabique; es decir, el volumen ocu
pado por el gas se reduce a la mitad sin gasto de entropía. Esto significa una dis
minución no compensada de entropía del gas; luego no puede existir un tabique
350
Fund_MAT_05.indd 350 7/5/18 18:20

de esas características, en virtud del segundo principio. De todos modos, nuestra

pared semipermeable se diferencia esencialmente de la que acabamos de considerar,
termodinámicamente inadmisible, porque en su mecanismo se atiende a propie
dades internas de las «moléculas» K1, … KN (esto es, al estado del sistema en cada
una encerrado, el S1, o el S2, … o el SN) y no a propiedades externas (si viene de
la derecha o de la izquierda). Y ahí está la clave precisamente. Partiendo de las
investigaciones de L. Szilárd, que han puesto en claro la naturaleza de las pare
des semipermeables, del «demonio de Maxwell» y, en general, el papel de la «in
tervención de entes dotados de inteligencia en los sistemas termodinámicos», es
posible llevar a cabo un análisis detenido de la cuestión. Pero no podemos noso
tros entrar aquí en pormenores acerca de todas esas cosas, tanto más cuanto que
el lector encontrará en otro lugar (loc. cit. Nota194) una amplia exposición de los
mismos.
El estudio que precede muestra en particular que dos estados j, y, del sistema
S pueden separarse con seguridad, mediante paredes semipermeables, cuando son
ortogonales. Se trata ahora de demostrar el recíproco: si j, y no son ortogonales,
suponer la existencia de una tal pared semipermeable contradice el segundo prin
cipio. En otros términos: la condición necesaria y suficiente para que dos estados
j, y sean separables mediante una pared semipermeable es que (j, y ) = 0 y no,
como en la teoría clásica, j ≠ y (escribimos j, y en lugar de los símbolos I, II
antes utilizados). Con esto se explica una vieja paradoja de la forma clásica de la
Termodinámica, a saber, la inevitable discontinuidad que se presenta al operar con
paredes semipermeables: ¡por poco que se diferencien dos estados son separables
100%; pero si son iguales en absoluto, es totalmente imposible la separación!
Ahora, en cambio, tenemos una transición continua: la separabilidad 100% se
presenta sólo si (j, y ) = 0 y a medida que ∙(j, y )∙ crece es cada vez más y más
incompleta. Pero justamente cuando ∙(j, y )∙ es máximo, esto es ∙(j, y )∙ =1, los
dos estados j, y son idénticos (de ∙∙j ∙∙ = ∙∙y ∙∙ = y ∙j, y)∙ = 1 se sigue j = cy,
donde c es una constante y ∙c ∙ = 1), es decir, la separación es del todo impo
sible.
Para llevar a término la anunciada demostración del teorema recíproco hemos
de anticipar el resultado final de este párrafo, el valor de la entropía de la colecti
vidad U. Naturalmente, en la deducción de éste no podremos aplicar el resultado
de la demostración que sigue.
4a b 3
1a b 2
Figura 3
351
Fund_MAT_05.indd 351 7/5/18 18:20

Supongamos, pues, que existe un tabique semipermeable susceptible de separar

1
j y y De ello hay que deducir que (j, y) = 0. Consideremos un gas (P[j] + P[y])
N N 2
(es decir, el correspondiente a sistemas en el estado j y sistemas en el esta
2 2
–
do y; la traza de este operador es 1), y elijamos
– B (es decir, K ) y T tales que el gas
sea perfecto. La sección longitudinal de K sea la 12341 indicada en la figura 3.
Introduzcamos en un extremo, aa, dicho tabique semipermeable y corrámoslo
hasta la mitad bb. Durante este proceso, debe mantenerse – constante la tempera
tura del gas merced al contacto del otro extremo de K, 23, con un termostato W
a la temperatura T. El resultado del mismo, por lo que a las moléculas j atañe, es
nulo; en cambio, las moléculas y son separadas del resto y confinadas en la mitad
– 1
derecha de K (entre bb y 23). Es decir, el gas (P[j] + P[y]) es una mezcla 1:1 de
un gas -P[j] y un gas -P[y]; al primero nada le 2ocurre, pero el segundo es compri
mido isotérmicamente hasta ocupar un volumen mitad del primitivo. De la ecua
ción de estado de los gases perfectos se sigue que en este proceso las fuerzas exte
N N
riores realizan el trabajo mecánico χ T ln 2
2 2 (es el número de moléculas del
gas -P[j], χ = constante de Boltzmann), y pues la energía del gas no ha cambia
195
do196 (a causa de la isotermía), esta energía es recibida por el termostato W. El

Q 1
aumento de la entropía de éste es, por ser igual a , Nχ. ln 2 (cf. Nota 186).
T 2
En consecuencia, a la izquierda de bb tenemos finalmente la mitad de las mo
N
léculas del gas -P[j], es decir, moléculas; a la derecha de bb, en cambio, hay la
4
N N
otra mitad del -P[j], o sea moléculas, y la totalidad del gas -P[j], es decir,
4 2
3N
moléculas; en total, por lo tanto, a la derecha de bb existen moléculas de un
4
1 2 B
gas P[j] + P[y]. Comprimamos el primer gas, el P[j], hasta el volumen y
3 3 4
1 2 3B
expandamos el segundo, el P[j] + P[y] hasta el volumen . El trabajo reali
3 3 4
N 3N 2
zado es χ T ln 2 en el primer caso y χ T ln en el segundo. Ambas energías
4 4 3
pasan al termostato W (cf. Nota 196) y, por lo tanto, la entropía de éste experimen
1 3 3
ta un nuevo incremento Nχ ⋅ ln 2, - N χ ⋅ ln , respectivamente. El aumen
4 4 2
to total de la entropía de W es, por consiguiente,
1 1 3 3 3 4
Nχ ( 2 ln 2 + 4 ln 2 - 4 ln 2 ) = Nχ ⋅ 4 ln 3 .
1 1
Resumiendo: En el estado inicial se tenía un gas P[j] + P[y] constituido
2 2
1 1
por N moléculas en el volumen B o, si se quiere, dos gases P[j] + P[y], uno con
2 2
352
Fund_MAT_05.indd 352 7/5/18 18:20

N B 3N 3B
moléculas en el volumen y el otro con moléculas en el volumen . En
4 4 4 4
N B
el estado final se tienen moléculas de un gas P[j] en el volumen
4 4
3N 1 2 3B
y moléculas de un gas P[j] + P[y] en el volumen . Los cambios provoca
4 3 3 4
N
dos por la totalidad del proceso son, pues, los siguientes: 1) moléculas en el
4
B 1 1 3N
volumen se transformaron de gas P[j] + P[y] en gas, -P[j]; 2) moléculas
4 2 2 4
3B 1 1 1 2
en el volumen se transformaron de gas P[j] + P[y] en gas P[j] + P[y];
4 2 2 3 3
3 4
3) la entropía de W aumentó en Nχ . ln . Dado que el proceso fue reversible,
el incremento de la entropía total debe4ser 0,3 es decir, los cambios en las entropías
de los dos gases han de compensar exactamente el aumento de entropía de W. Es
menester, por lo tanto, que conozcamos aquéllos.
Conforme veremos, un gas -U constituido por M moléculas tiene una entropía
-Mc · traza (U · ln U), cuando la de un gas -P[j] de igual volumen y a la mis
ma temperatura se considera igual a 0 (cf. supra). Por consiguiente, si U presenta
un espectro discreto puro, con los valores propios w1, w2, …, la entropía de dicho
∞
gas - U será −M χ ⋅ ∑ wn ln wn, donde hay que suponer iguales a cero los términos
n =1
de la forma x ln x si es x = 0. Ahora bien, los valores propios de los operadores
1 1 1 2 1+ α 1− α 3 + 1 + 8α 2 3 − 1
P[j], P[j] + P[y], P[j] + P[y] son, como es fácil calcular, 1,0; , , 0; ,
2 2 3 3 2 2 6 6
1+ α 1− α 3 + 1 + 8α 2 3 − 1 + 8α 2
, , 0; , 0, respectivamente (a = ∙(j, y)∙, es decir, 0 ≤ a ≤ 1.
, 0,
2 2 6 6
De entre estos valores propios, el 0 es múltiple de orden infinito en los tres casos;
todos los demás son simples.197 Luego, la entropía de los gases ha aumentado en
N 3N ⎛ 3 + 1 + 8α 2 3 + 1 + 8α 2 3 − 1 + 8α 2 3 − 1 + 8α 2 ⎞
− χ ⋅0 − χ ⋅⎜ ln + ln ⎟⎠
4 4 ⎝ 6 6 6 6
1+ α 1+ α 1− α 1− α ⎞
+ Nχ ⋅⎛ ln + ln .
⎝ 2 2 2 2 ⎠
3 4
Esto, aumentado en el incremento N χ ⋅ ln y de la entropía de W, debe
4 3
Nχ
dar como resultado 0. Si, además, dividimos por , queda en definitiva
4
3 + 1 + 8α 2 3 + 1 + 8α 2 3 − 1 − 8α 2 3 − 1 + 8α 2
− ln − ln
2 6 2 6
1+ α 1− α 4
+ 2 (1 + α ) ln + 2 (1 − α ) ln + 3ln = 0,
2 2 3
353
Fund_MAT_05.indd 353 7/5/18 18:20

donde 0 ≤ a ≤ 1.
Se reconoce fácilmente que el primer miembro aumenta constantemente de 0
4
a 3 ln cuando a crece de 0 a 1;198 luego debe ser a = 0, es decir, (j, y) = 0
3
c.q.d. (Para a = 0, el proceso inverso del que acabamos de describir disminuiría
la entropía, en contra del segundo principio.)
Tras estos preliminares, pasemos a la determinación de la entropía de un
gas - U constituido por N moléculas en el volumen B y a la temperatura T; o
dicho más exactamente, pasemos a la determinación del exceso de su entropía
respecto de la de un gas - P[j] sometido a las mismas condiciones. De acuerdo con
las observaciones que hicimos anteriormente y en virtud de la normalización arri
ba indicada, es entonces este exceso lo que debe entenderse por entropía de la
colectividad - U formada por N sistemas sin interacción, ejemplares de un mismo
tipo*. Supondremos, además, traza U igual a la unidad, de conformidad con lo
antes dicho.
Sabemos ya que, en estas condiciones, U tiene un espectro discreto puro w1,
w2, …, siendo w1 ≥ 0. w2 ≥ 0, …, y w1 + w2 + … = 1; sean j1, j2, … sus fun
∞
ciones propias: entonces es U = ∑ wn P[ϕn ] (cf. IV.3). El gas — U aparece así como
n =1
una mezcla de gases P[j ], P[j ], … compuestos de w1N, w2N, … moléculas, res
1 2
pectivamente, todos ellos en el mismo volumen B. T y B sean tales que todos estos
gases se comporten
– como gases perfectos y, además, supongamos rectangular la
sección de K. Para separar unas de otras las diferentes especies de moléculas j1,
j2, … efectuaremos las siguientes operaciones reversibles (cf. fig. 4). Construyamos
al lado de K (23452) una segunda caja rectangular K' (12561) de iguales dimen
siones y sustituyamos la pared común 25 por dos tabiques muy próximos, uno de
los cuales, el (25), sea fijo, semipermeable, deje pasar j1 y refleje j2, j3, …, y el
otro, el (bb), móvil, y por lo demás un tabique ordinario absolutamente imper
meable. Introduzcamos, finalmente, en dd, tocando a 34, otro tabique semiper
meable que se deje atravesar por j2, j3, … y refleje j1. Corramos entonces bb y
dd, manteniendo fija su distancia mutua, hasta bb, dd, respectivamente (es decir,
hasta 16 y 25). La influencia de este proceso sobre las moléculas j2, j3, … es nula;
las moléculas j1 en cambio, se ven constreñidas a mantenerse constantemente
entre los tabiques móviles bb, dd. Dado que la distancia mutua de éstos es cons
tante, no hemos de realizar para ello trabajo alguno contra la presión del gas; por
otra parte, tampoco tiene lugar ningún desarrollo de calor. Sustituyamos, en fin,
los tabiques 25 y cc por una pared fija –absolutamente
– impermeable 25 y alejemos
aa, con lo cual quedan – reconstruidas K y K ', sólo que ahora todas las moléculas
j1 se encuentran en K'. Por lo tanto, hemos «transvasado» dichas moléculas de
* Téngase muy presente la definición de esas colectividades dada en la página 345 y cuídese de
no confundirlas con los sistemas de partículas (o de sistemas) indiscernibles, los cuales obedecen a
otra estadística muy distinta. (N. del T.)
354
Fund_MAT_05.indd 354 7/5/18 18:20

– –
K a K' por vía reversible, sin gasto de trabajo, ni desarrollo de calor ni cambio de
temperatura.199
1 2 3
a b c d
a b c d
6 5 4
Figura 4
– «Transvasemos»
– de la misma manera las moléculas j2, j3, … a cajas iguales
K'', K''', … Tendremos, así, finalmente, gases P[j ], P[j ], … constituidos por w1N,
1 2
w2N, … moléculas, respectivamente cada uno en el volumen B. Comprimámoslos

ahora isotérmicamente hasta que ocupen los volúmenes w1B, w2B …, respectiva
mente, para lo cual, y en compensación, habrá que tomar de un termostato de
gran capacidad (a la temperatura T, a fin de que el proceso sea reversible) las can
tidades de calor w1Nχ · T ln w1, w2 T · ln w2, … (¡estas cantidades de calor son
todas < 0!), ya que los trabajos de compresión gastados en cada uno de los gases
son iguales y de signo contrario a estas cantidades (cf. Nota 196). El aumento de
∞
entropía en estos procesos importa», pues, ∑ wn N χ · ln wn . Por último» transfor

n =1
memos todos los gases P[j ], P[j ], …, en un gas P[j] (j es un estado arbitrariamen
1 2
te elegido). De esta manera tenemos ahora sólo gases P[j] formados por w1N, w2N,
… moléculas en los volúmenes w1B, w2B, …» respectivamente. Dado que todos
son idénticos y de igual densidad (N : B), podemos mezclarlos y también esta
operación es reversible: el resultado de la mezcla es un gas P[j] integrado por N
⎛ ∞
⎞
moléculas en el volumen B ⎜ ya que ∑ wn = 1⎟ .
⎝ n =1 ⎠
Hemos llevado así a término la transición reversible que perseguíamos. En su
∞
curso la entropía aumentó en N χ ∑ wn ln wn y pues en el estado final (de acuerdo
∞
n =1
con nuestra normalización) es cero, en el estado inicial era −N χ ∑ wn ln wn .
n =1
Recordemos que U tiene como funciones propias j1, j2, … y como valores
propios wi, w2, …; luego U ln U posee las mismas funciones propias» pero sus
∞
valores propios son w1 ln w1, w2 ln w2, … y, por ende, traza (U ln U ) = ∑ wn ln wn .
n =1
Nótese que 0 ≤ wn ≤ 1 por lo tanto wn ln wn < 0, y sólo igual a cero para wn = 0
ó 1. Que para wn haya que tomar wn ln wn = 0 se sigue de que en nuestras consi
355
Fund_MAT_05.indd 355 7/5/18 18:20

deraciones no cabe tener en cuenta las wn nulas; por lo demás, al mismo resultado
se llega si atendemos a la continuidad de wn ln wn.
Hemos determinado de esa manera la entropía de una colectividad —U cons
tituida por N sistemas iguales y aislados entre sí: su valor es— Nc traza (U ln U ).
Lo dicho antes acerca de wn ln wn indica que esta entropía es siempre ≥ 0 y para
que sea = 0 todos los wn deben ser iguales a 0 ó 1. En tal caso, y a causa de ser tra
za U = 1, hay precisamente un wn = 1, todos los demás son nulos; luego U = P[j ], n
es decir» los U = P[j], los estados, tienen una entropía nula mientras que la entro
pía de las mezclas es > 0.
3. Problemas de reversibilidad y equilibrio
Podemos ahora ya demostrar la irreversibilidad del proceso de medición que

afirmábamos en V. 1. Cuando, por ejemplo, U es un estado, U = P[j], la medición
de una magnitud R cuyo operador R tiene como funciones propias a j1, j2, …,
transforma U en la colectividad
∞ ∞
U' = ∑ (P[ϕ]ϕn, ϕn ) ⋅ P[ϕn] = ∑ (ϕ, ϕn ) P[ϕn],
2
n =1 n =1
y a menos de ser también U' un estado habrá tenido lugar un aumento de entro
pía (la entropía de U era 0, la de U' es > 0), de suerte que el proceso es irreversi
ble. Ahora bien, para que U’ sea un estado, un P[j] por consiguiente —pues las jn
son las funciones propias de U'—, todos los ∙(j, jn)∙2 deben ser nulos salvo uno,
que es entonces = 1, es decir, j ha de ser ortogonal a todos los jn tales que n ≠ n–;
pero en tal caso se tiene j = cj n, donde ∙c∙ = 1, y por lo tanto P[j] = P[j ], U = U'.
n
En consecuencia: toda medición en un estado «s irreversible, excepto cuando

éste es función propia de la magnitud medida, es decir, cuando esta magnitud
en el estado dado tiene un valor preciso, en cuyo caso la medición no altera el
estado en absoluto. Vemos, pues, que también el comportamiento no causal está
vinculado de modo unívoco con ciertos fenómenos termodinámicos concomi
tantes.
Esto sentado, hay que discutir ampliamente y en toda su generalidad cuándo
∞
el proceso 1., U →U' = ∑ (U ϕn, ϕn ) ⋅ P[ϕn], aumenta la entropía.
n =1
Sean w1, w2, … los valores propios del operador U y y1, y2, … las correspon
dientes funciones propias. En este supuesto, la entropía de U, - Nχ traza (U ln U ),
es igual a
∞ ∞
−N χ ∑ wn ln wn = −N χ ∑ (Uψ n, ψ n ) ln (Uψ n, ψ n ).
n =1 n =1
356
Fund_MAT_05.indd 356 7/5/18 18:20

Los valores propios del operador U' son (U j1, j1), (U j2, j2), …; luego su
∞
entropía es −N χ ∑ (U ϕn, ϕn ) ln (U ϕn, ϕn ). Por lo tanto, la entropía de U será ⪌
n =1
que la de U' según sea
∞ ∞
*
∑ (Uψ n, ψ n ) ln (Uψ n, ψ n ) ≤≥ ∑ (Uϕn, ϕn ) ln (Uϕn, ϕn ).
n =1 n =1

Demostremos primero que en * vale siempre la relación ≧, es decir, que el
proceso U → U' en ningún caso origina una disminución de entropía. Cierto es
que el que así sea está claro desde el punto de vista termodinámico; sin embargo,
importa para nuestros ulteriores fines dar de ello una demostración puramente
matemática.
Mantengamos fijo el operador U, y con él y1, y2, …, y hagamos describir a
j1, j2, … el conjunto de todos los sistemas ortonormales completos. En primer
lugar, por motivos de continuidad podemos limitarnos a aquellos sistemas j1, j2,
… entre cuyos elementos sólo hay un número finito que sean distintos de los co
rrespondientes yn. Supongamos, en consecuencia, que, por ejemplo, para n > M
es siempre jn = yn. En estas condiciones, los jn tales que n ≤ M son combinacio
nes lineales de los M primeros yn(n ≤ M) y recíprocamente; luego
M
ϕm = ∑ xmnψ n (m = 1, …, M)
n =1
y la matriz M-dimensional {xmn} es evidentemente unitaria. Ahora bien, dado que

M
(U ym, ym) = wm y, como se calcula fácilmente, (U ϕm, ϕm ) = ∑ xmn wn lo que se
2
trata de demostrar es que m =1
M M
⎛M ⎞ ⎛M ⎞
∑ wn lnwn ≥ ∑ ⎜ ∑ xmn wn ⎟ ln ⎜ ∑ xmn wn ⎟ .
2 2
n =1 m =1 ⎝ n =1 ⎠ ⎝ n =1 ⎠
El segundo miembro es un función continua de las M 2 variables acotadas xmn

(¡{xmn} es unitaria!); luego posee un máximo accesible. El primer miembro es el
valor de esta función para xmn = 1 para m = n ; luego lo que hay que demostrar
{ ∣
0 para m ≠ n
es que dicho máximo lo toma en este conjunto de valores de las xmn.
o
Sea, pues, xmn (m, n = 1, …, M ) un sistema de valores en el que el máximo es
accesible. Multipliquemos a la izquierda la matriz {xmn
o
} por la matriz unitaria
⎛ α β 0…0 ⎞
⎜ – β α 0…0 ⎟ 2 2
⎜ ⎟ , α + β = 1;
⎜ 0 0 1…0 ⎟
⎝ 0 0 0…1 ⎠
357
Fund_MAT_05.indd 357 7/5/18 18:20

la matriz producto {x'mn} es asimismo unitaria y, por ende, sus elementos constitu
yen un sistema de xmn adecuado. Tomemos α = 1 − ε 2 b = qe (e real, ∙q∙ = 1) y
supongamos e pequeño, lo que nos permitirá efectuar los cálculos atendiendo sólo
a los términos en 1, e, e 2 y prescindir de los que contengan e3, e4, … Se tiene
1
entonces a ≃ 1 - e2, y en la nueva matriz {x'mn}
2
⎛ 1 ⎞
x'1n  ⎜1 − ε 2 ⎟ x1no + θε x2no
,
⎝ 2 ⎠
⎛ 1 ⎞ o
x' 2n  − θε x1no + ⎜1 − ε 2 ⎟ x2n ,
⎝ 2 ⎠
x'mn = xmn o
, (m ≥ 3) ;
luego
M M M
∑ wn x'1n ! ∑ wn x1no + ε ∑ 2wn Re(θ x1no x2n
2 2 o
)
n =1 n =1 n =1
M
+ ε 2 ∑ wn (− x1no + x2n
2 2
o
),
n =1
M M M
∑ wn x'2n ! ∑ wn x2no − ε ∑ 2wn Re(θ x1no x2n
2 2 o
)
n =1 n =1 n =1
M
− ε 2 ∑ wn (− x1no + x2n
2 2
o
),
n =1
M M
∑ wn x'mn = ∑ wn xmno
2
2
, (m ≥ 3)
n =1 n =1
Sustituyamos estas expresiones en f (x) = x ln x, teniendo en cuenta que
1
f'(x) = lnx + 1, f''(x) =
x
y sumemos los resultados obtenidos; la suma es
M
⎛M ⎞ ⎛M 2⎞
M
⎛M o 2⎞ ⎛M o 2⎞
∑ ⎜ ∑ wn x'mn ⎟⎠ ⎜⎝ n =1 n mn ⎟⎠ m =1 ⎜⎝ n =1 n mn ⎟⎠ ⎜⎝ ∑
∑ ∑ ∑
2
ln w x' ! w x ln wn xmn ⎟⎠
m =1 ⎝ n =1 n =1
⎡ ⎛M 2⎞ ⎛M o 2⎞
⎤ M
+ ε ⎢ln ⎜ ∑ wn x1no ⎟ − ln ⎜ ∑ wn x2n ⎥ ⋅ ∑ 2wn Re (θ x1n x2n )
o o
⎟
⎣ ⎝ n =1 ⎠ ⎝ n =1 ⎠ ⎦ n =1
⎡ ⎛ ⎛M 2⎞ ⎛M ⎞ M
o 2⎞ ⎛
M
o 2⎞
+ ε 2 ⎢− ⎜ ln ⎜ ∑ wn x1no ⎟ − ln ⎜ ∑ wn x2n ⎟ ⎟ ⎜ ∑ wn x o 2
1n − ∑ wn x2n ⎟⎠
358 ⎢⎣ ⎝ ⎝ n =1 ⎠ ⎝ n =1 ⎠ ⎠ ⎝ n =1 n =1
1 1 1 ⎞ ⎛ 2w
M
o o ⎞
2
⎤
+ ⎛M + ⎜ ∑ n Re (θ x1n x2n )⎟ ⎥.
2⎜ 2⎟
M
⎜ ∑ n 1n
w x o 2
∑ wn x2no ⎟ ⎝ n =1 ⎠ ⎥
⎥⎦
⎝ n =1 n =1 ⎠
Fund_MAT_05.indd 358 7/5/18 18:20
M
⎛M ⎞ ⎛M 2⎞
M
⎛M o 2⎞ ⎛M o 2⎞
∑ ⎜ ∑ wn x'mn ∑ ∑ ∑ ⎟⎠ ⎜⎝ ∑
2
ln
⎟⎠ ⎜⎝ n =1 wn x' mn !
⎟⎠ m =1 ⎜⎝ n =1 wn x mn ln wn xmn ⎟⎠
m =1 ⎝ n =1 n =1
⎡ ⎛M 2⎞ ⎛M o 2⎞
⎤ M Consideraciones generales
+ ε ⎢ln ⎜ ∑ wn x1no ⎟ − ln ⎜ ∑ wn x2n ⎥ ⋅ ∑ 2wn Re (θ x1n x2n )
o o
⎟
⎣ ⎝ n =1 ⎠ ⎝ n =1 ⎠ ⎦ n =1
⎡ ⎛ ⎛M 2⎞ ⎛M ⎞ M
o 2⎞ ⎛
M
2⎞
+ ε 2 ⎢− ⎜ ln ⎜ ∑ wn x1no ⎟ − ln ⎜ ∑ wn x2n ⎟ ⎟ ⎜ ∑ n 1n ∑ wn x2no ⎟
w x o 2
−
⎢⎣ ⎝ ⎝ n =1 ⎠ ⎝ n =1 ⎠ ⎠ ⎝ n =1 n =1 ⎠
1 1 1 ⎞ ⎛ 2w
M
⎞
2
⎤
+ ⎛M + ⎜ ∑ n Re (θ x1no x2no )⎟ ⎥.
2⎜ M
⎟
⎜ ∑ wn x1n
o 2
∑ wn x2no ⎟ ⎝ n =1 ⎠
2
⎥
⎝ n =1 n =1 ⎠ ⎥⎦
Para que el primer término del secundo miembro sea el valor máximo en cues
tión, el coeficiente de e debe ser nulo y el de e2 ha de ser ≤ 0. El primero de estos
coeficientes es producto de dos factores,
⎛M 2⎞ ⎛M o 2⎞
M
ln ⎜ ∑ wn x1no ⎟ − ln ⎜ ∑ wn x2n ⎟⎠ y ∑ 2wn Re(θ x1no x2no );
⎝ n =1 ⎠ ⎝ n =1 n =1
si es el primero el que es cero, también es cero el primer término del coeficiente

de e2 (término que es siempre ≤ 0), de manera que el segundo término, que evi
dentemente es siempre ≥ 0, ha de anularse, para que todo el coeficiente sea ≤ 0.
Esto significa que
M
∑ 2wn Re(θ x1no x2no ) = 0
n =1
Luego, de todos modos, el segundo factor del coeficiente de e es nulo, condi

⎛ M o ⎞
ción ésta que también puede escribirse 2 Re ⎜θ ∑ wn x1no x2n ⎟⎠ = 0.
⎝ n =1
Eligiendo convenientemente θ, esta expresión se transforma en el valor abso
M
luto de la ∑ ; por lo tanto, necesariamente es
n =1
M
∑ wn x1no x2no = 0
n =1
Puesto que en lugar de 1,2 cabe poner dos números distintos cualesquiera k,
j = 1, …, M. resulta en definitiva que
M
∑ wn xkno x jno = 0 para k ≠ j.
n =1
Es decir, el cambio de coordenadas unitario caracterizado por la matriz lleva

la matriz diagonal de elementos diagonales w1, …, wM nuevamente a la forma
359
Fund_MAT_05.indd 359 7/5/18 18:20

diagonal. Pero como los elementos diagonales son los multiplicadores (o valo
res propios) de la matriz, estos elementos no cambian al efectuar una transfor
mación de coordenadas, a lo sumo pueden aparecer permutados entre sí. Ahora
bien, antes de la transformación dichos elementos eran los wm (m = 1, …,
M
∑ wn xmno
2
M); después de ésta son los (m = 1, …, M); luego las sumas
n =1
M M
⎛M ⎞ ⎛M o 2⎞
∑ wn lnwn, ∑ ⎜ ∑ wn xmno ⎟⎠ ln ⎜⎝ ∑
2
n =1 m =1 ⎝ n =1 n =1
wn xmn ⎟⎠ tienen el mismo valor, es decir, tam
{ }
bién las xmn = 1, para m = n dan lugar a un máximo, conforme afirmábamos.
0, para m ≠ n
Determinemos ahora cuándo en * vale el signo =. Cuando así ocurre, la ex
presión
∞
∑ (U χn, χn ) ln (U χn, χn )
n =1
toma su valor máximo, no sólo para cn = yn (n = 1, 2, …), sino también para

cn = jn (n = 1, 2, …). (c1, c2, … recorre el conjunto de todos los sistemas orto
normales completos.) Esto último vale, en particular, cuando sólo se someten a
transformaciones unitarias las M primeras jn (esto es, cn = jn para n > M). Escri
bamos umn = (Ujm, jn) (m, n = 1, …, M ) y sean u1, …, vM los valores propios de
la matriz finita {umn} (asimismo hermítica y definida) y {amn} (m, n = 1, …, M) la
matriz que reduce {umn} a la forma diagonal. Sean w1, …, wM los transformados de
j1, …, jM por la matriz {amn},
M
ϕm = ∑ amnwn ;
n =1
se tiene entonces
Uwm = umwm, de donde (Uwm, wn) = un, para m = n { ∣
0, para m ≠ n
M
Por consiguiente, para ξm = ∑ xmnwn (m = 1, …, M, {xmn} unitaria), resulta
M n =1
(U ξk , ξ j ) = ∑ υn xkn x jn. A causa de la hipótesis hecha acerca de las j1, …, jM, la
n =1
expresión
M
⎛M ⎞ ⎛M 2⎞
∑ ⎜ ∑ υn xmn ⎟⎠ ln ⎜⎝ ∑
2
υn xmn ⎟
m =1 ⎝ n =1 n =1 ⎠
360
Fund_MAT_05.indd 360 7/5/18 18:20

toma su valor máximo para xmn = amn. De aquí se sigue, según hemos demostrado,
M
que ∑ υnα knα jn = 0 para k ≠ j, es decir, (Ujk, jj) = 0 para k ≠ j, k, j = 1, …, M.
n =1
Estas relaciones deben valer para todo M; luego Ujk ha de ser ortogonal a
todas las jj, j ≠ k, e igual, por lo tanto, a w'kjk, donde w'k es una constante. En
resumen, las funciones j1, j2, … son funciones propias del operador U y los co
rrespondientes valores propios son w1, w2, …, los cuales, por ende, constituyen
una permutación de w1, w2, … Pero en estas condiciones,
∞ ∞
U' = ∑ (U ϕn, ϕn )P[ϕn] = ∑ w'n ⋅ P[ϕn] = U.
n =1 n =1
Hemos llegado, pues, al siguiente resultado:

∞
El proceso 1, U →U' = ∑ (U ϕn, ϕn ).· P[j ] (j1, j2, … son las funciones propias
n
n =1
del operador R asociado a la magnitud medida R), nunca disminuye la entropía;
más exactamente, la aumenta siempre, excepto cuando todas las j1, j2, … son
funciones propias de U, y entonces es U' = U. En este caso, por otra parte, U es
permutable con R y esta condición es además suficiente para que tal caso se dé; la
permutabilidad de U y R en efecto, equivale a la existencia del sistema de funcio
nes propias j1, j2, … comunes a uno y otro (cf. II.10).
Por consiguiente, el proceso 1 es irreversible en todos aquellos casos en los que
provoca una alteración efectiva.
Con arreglo a lo enunciado en V.2 como segundo punto del programa, hemos
de tratar ahora la cuestión de la reversibilidad en los procesos 1 y 2 independien
temente de la Termodinámica fenomenológica. Conocemos ya el método mate
mático merced al cual esto se puede lograr: supuesta la validez del segundo prin
cipio, la entropía ha de ser igual a -Nc. traza (U ln U ) y no puede disminuir en
ningún proceso 1, 2: luego lo que ahora debemos hacer es tratar -Nc. traza (U
ln U ) como simple magnitud numérica, independientemente de su interpretación
como entropía, y determinar qué ocurre con ella en dichos procesos.
2πi 2πi
El 2 transforma U en Ut = e - h t H Ue h t H, es decir, si designamos con A el
2πi
operador unitario e - h t H, el efecto de este proceso es la transición U → Ut = AUA-1.
A causa del carácter unitario de A, la correspondencia f → Af es una representación
isomorfa del espacio hilbertiano sobre sí mismo, representación que transforma
cada operador P en APA-1; luego en general es F(APA-1) = A. F(P). A-1 y de don
de se sigue Ut ln Ut = A. U ln U . A-1 y, por consiguiente, traza (Ut ln Ut) = traza
(U ln U ), de suerte que la magnitud -Nχ traza (U ln U ) se conserva en todo
proceso del tipo 2. Lo que le sucede en un proceso de la clase 1, lo hemos averi
guado poco ha, y justamente sin tener que acudir para ello al segundo principio:
cuando en él cambia U (es decir, U' ≠ U ), dicha magnitud aumenta; si U resulta
361
Fund_MAT_05.indd 361 7/5/18 18:20

inalterado (es decir, si U' = U, o lo que es equivalente, si j1, j2, … son funciones
propias de U, o sea, si U y R son permutables), también ella, claro está, conserva
su valor. Por lo tanto, en una operación compuesta de procesos 1, 2, en número
y orden de sucesión cualesquiera, la magnitud -Nc traza (U ln U ) se conserva
cuando cada proceso 1 es inactivo (no origina cambio alguno); en todos los demás
casos, dicha magnitud aumenta. Luego, cuando sólo se consideran operaciones 1,
2, cada proceso 1 que origine un cambio efectivo es irreversible.
Por otra parte, hay también expresiones más sencillas que traza (U ln U ) que
no crecen en 1 y son constante en 2, por ejemplo el mayor valor propio de U. En
efecto: frente a una transformación 2 es invariable, como todos los valores propios
de U; en un proceso 1, los valores propios de U, w1, w2, …, se transforman en los
∞ ∞
valores propios de U', ∑ wn x1n , ∑ wn x2n
2 2
, … (cf. supra, en este mismo párra
n =1 n =1
fo), y puesto que a causa del carácter unitario de la matriz {xmn} se tiene
∞ ∞
∑ x1n = 1, ∑ x2n = 1, …, todos estos números son ≤ que el mayor de los wn
2 2
n =1 n =1 ∞
(máximo de los wn que existe, porque todo wn ≥ 0 y ∑ wn = 1 implica wn → 0).
n =1
Ahora bien, dado que es posible sin más cambiar U de modo tal que -traza
∞
(U lnU ) = − ∑ wn ln wn no varíe y a la vez aumente el mayor de los wn se echa
n =1
de ver que existen transiciones posibles desde el punto de vista de la Termodiná
mica fenomenológica —las cuales, por consiguiente, son efectivamente realizables
con nuestros gases— que nunca podrán ser llevadas a término por aplicación su
cesiva de 1, 2. Esto indica que la introducción del método de los gases es inevi
table.
En lugar de -traza (U ln U ) cabe también considerar la traza (F(U )) para
funciones F(x) convenientemente elegidas. Puede demostrarse que este valor au
menta en el proceso 1 para U ≠ U (para U = U' y también en 2 es, claro está,
invariante) de la misma manera que se hizo en el caso particular F(x) = x ln x,
supuesto que las únicas propiedades del segundo miembro que se utilizaron más
arriba se den asimismo en F(x). Estas propiedades son: F''(x) < 0, F'(x) monótona
decreciente; pero la última se deduce de la primera. En consecuencia: en lo que
atañe a las cuestiones de irreversibilidad independientes de la Termodinámica,
podemos aplicar toda traza (F(U )) cuando F(x) es una función convexa respecto
del eje OY +, es decir, cuando F''(x) < 0 en el intervalo 0 ≤ x ≤ 1, que es el que
contiene los valores propios de U.
Habría que demostrar, finalmente, que tampoco la mezcla de dos colectivida
des U, V (por ejemplo en la proporción a : b, donde a > 0, b > 0 y a + b = 1)
disminuye la entropía, o sea
- traza [(aU + bV ) ln (aU + bV )]

≥ - a traza (U ln U ) - b traza (V ln V ).
362
Fund_MAT_05.indd 362 7/5/18 18:20

También este resultado vale incluso para toda función convexa F(x) en vez de
-x ln x. Dejamos la demostración a cargo del lector.
El problema que nos proponemos resolver a continuación es el de hallar la
mezcla de equilibrio estacionaria, esto es, la mezcla de entropía máxima, cuando
se da el valor de la energía. Esto último hay que entenderlo, naturalmente, en el
sentido de que lo prefijado es el valor medio de la energía, porque, en fuerza del
método para la investigación termodinámica de las colectividades estadísticas ci
tado en la Nota 184, sólo dicho valor medio entra en consideración. De acuerdo con
esto, son admisibles solamente aquellas mezclas para cuyos operadores estadísticos
U sea traza U = 1 y traza (U H) = E, igualdad esta última en la que H es el ope
rador de la energía y E el prefijado valor medio de la misma. Bajo estas condicio
nes, hay que hacer máximo -Nχ traza (U ln U ). Para simplificar, supondremos
además que H posee un espectro discreto puro; sean W1, W2, … sus valores propios
(entre los que puede haberlos múltiples) y j1, j2, … sus funciones propias.
Sea R una magnitud cuyo operador R tiene a j1, j2, … como funciones pro
pias, pero con valores propios todos simples. La medición R transforma U, según
∞
1, en U' = ∑ (U ϕn, ϕn )P[ϕn] y en este proceso -Nc traza (U ln U ) aumenta (si no
n =1
es U = U' ) y traza (U) traza (U H ) no varían. La verdad de esto último resulta de
ser las jn funciones propias de H, por lo que (H jm, jn) = 0 para m ≠ n:
∞ ∞
traza (U'H) = ∑ (U ϕn, ϕn ) traza (P[ϕn]H) = ∑ (U ϕn, ϕn )(Hϕn, ϕn )
n =1 n =1
∞
= ∑ (U ϕm, ϕn )(Hϕn, ϕm ) = traza (UH);
m,n =1
que así debe ser, se sigue también de la permutabilidad de R y H (es decir, de la

mensurabilidad simultánea de R y la energía).
En consecuencia, el máximo buscado es el mismo cuando nos limitamos a
colectividades caracterizadas por operadores del tipo U', o sea, a operadores esta
dísticos con las funciones propias j1, j2, …, y solamente se da entre éstas.
∞
Tomemos, pues, U = ∑ wn P[ϕn]. Dado que U, U H, U ln U tienen todos las
n =1
mismas funciones propias j1, pero los valores propios wn, Wnwn, wn ln wn, respecti
∞
vamente, de lo que se trata es de hacer máxima la función −N χ ∑ wn ln wn, cuyas
n =1
∞ ∞
variables wn están sujetas a las ecuaciones de condición ∑ wn = 1, ∑Wnwn = E. Pero
n =1 n =1
este problema es exactamente el mismo que se presenta en la ordinaria teoría ci
nética de los gases al estudiar el correspondiente problema del equilibrio,201 y se
resuelve, por lo tanto, de la misma manera. Según la conocida regla para el cálcu
363
Fund_MAT_05.indd 363 7/5/18 18:20

lo de extremos, para el sistema de valores w1, w2, … que corresponde al máximo

debe tenerse
∂ ⎛ ∞ ⎞ ∂ ⎛ ∞ ⎞ ∂ ⎛ ∞ ⎞
⎜ ∑
∂wn ⎝ m =1
wm lnwm ⎟ + α ⎜ ∑ wm
∂wn ⎝ m =1 ⎠ ⎟ + β ⎜ ∑
∂wn ⎝ m =1
Wmwm ⎟ = 0,
⎠ ⎠
donde a, b son ciertas constantes apropiadas y n = 1, 2, … Es decir,
(ln wn + 1) + a + bWn = 0, wn = e - 1 - a - bWn = ae- bWn,

∞
donde hemos introducido la constante a = e-1 - a en vez de a. De ∑ wn = 1 se
1 n =1
deduce a = ∞ ; luego
∑e −βWn
n =1 e −βWn
wn = ∞ ,
∑ e −βWm
m =1
∞
y en virtud de ∑Wnwn = E ha de ser
n =1
∞
∑Wne − βW n
n =1
∞ = E,
∑e − βWn
n =1
condición ésta que fija b. Introduzcamos, como es costumbre, la «suma de estados»

∞
Z (β ) = ∑ e − βWn = traza(e −βH )
n =1
(cf. para esto y para lo que sigue Nota 197); se tiene entonces

∞
Z' (β ) = −∑Wne −βWn = −traza(He −β H),
n =1
y la condición que determina b reza
Z' (β )
− = E.
Z (β )
364
Fund_MAT_05.indd 364 7/5/18 18:20

∞ ∞
(Haremos, además, la hipótesis de que ∑ e −βW y ∑Wne −βW
n n
convergen para todo
n =1 n =1
b > 0, es decir, que Wn → ∞ con suficiente rapidez para n → ∞. Por ejemplo,
W
basta que n → ∞.) De esta manera resulta para el propio U la expresión siguiente:
lnn
∞
e −βH e −βH
U = ∑ ae −βWn P[ϕn] = ae − βH = = .
n =1 traza (e −βH) Z (β )
Los métodos ordinarios de la teoría cinética de los gases permiten ahora deter
minar las propiedades de la colectividad de equilibrio U, la cual queda fijada una
vez dado el valor de E o de b, colectividad que, por lo tanto, depende de un pa
rámetro, como debía suceder.
Su entropía es
⎛ e − βH e − βH ⎞
S = −N χ traza (U lnU ) = −N χ traza ⎜ ⋅ ln
⎝ Z (β ) Z (β )⎟⎠
Nχ
=− traza [e −βH (−β H − ln Z(β ))]
Z (β )
βN χ N χ ln Z(β )
= traza (He −βH) + traza (e −β H)
Z (β ) Z (β )
⎡ β Z' (β ) ⎤
= N χ ⎢− + ln Z (β )⎥ ,
⎣ Z (β ) ⎦
y su energía total
Z'(b)
N E = -N .
Z(b)
(El paralelo debe establecerse entre ésta y S, no entre E y S.) Con esto hemos
determinado U, S y N E como funciones de b. En vez de pretender expresar sim
plemente b en función de E, es más práctico determinar la temperatura T de la
mezcla de equilibrio y reducirlo a ésa, lo que se consigue de la siguiente manera:
pongamos en contacto nuestra colectividad de equilibrio con un termostato de
temperatura T' y tomemos de él la energía Nd E —con ello, en virtud de los dos
principios fundamentales, la energía total debe permanecer inalterada y la entropía
no decrecer. En consecuencia, el termostato pierde la energía Nd E, de suerte que
Nd E
su aumento de entropía es - , y al mismo tiempo ha de ser
T'
Nd E ⎛ d S 1⎞
dS− =⎜ − ⎟ Nd E ≥ 0.
T' ⎝ Nd E T' ⎠
365
Fund_MAT_05.indd 365 7/5/18 18:20

Por otra parte, evidentemente es Nd E ⋛ 0 según sea T' ⋛ T, porque el cuer
d S
po más frío toma energía del más caliente. Por lo tanto, T' ⋛ T significa que
dE Nd E
1 Nd E dβ
- ⋛ 0, esto es T' ⋛ =N ; luego
T' dS dS
dβ
dE ⎛ Z' (β )⎞ ⎛ Z' (β )⎞'

N ⎜⎝ Z (β ) ⎟⎠
dβ 1 1 ⎜⎝ Z (β ) ⎟⎠ 1
T= =− =− = ,
dS χ ⎛ Z' (β )⎞ χ ⎛ Z' (β )⎞ x β
'
⎜⎝ ln Z (β ) − β −β ⎜⎝ Z (β ) ⎟⎠
dβ Z (β ) ⎟⎠
es decir,
1
b= ,
χT
relación ésta que permite representar U, S, N E como funciones de la temperatura.
Es sorprendente la analogía de las expresiones que acabamos de obtener para
la entropía, la colectividad de equilibrio, etc., con los correspondientes resultados
de la teoría termodinámica basada en la Mecánica clásica. Consideremos primero
la entropía -Nχ traza (U In U ).
∞
Sea U = ∑ wn P[ϕn] una mezcla de las colectividades P[j ], P[j ], … en las propor
1 2
n =1
ciones w1, w2: …, es decir, Nw1 sistemas j1, Nw2 sistemas j2, … La entropía de
Boltzmann de esta colectividad se obtiene con ayuda del «número de complexio
N!
nes» : es igual al producto del logaritmo de este número por χ201.
(Nw1)! (Nw2)! …
Dado que N es grande, podemos aproximar las factoriales mediante la fórmula de
N!
Stirling x ! ≈ 2π xe − x x x , merced a lo cual χ ln se transforma
∞
(Nw 1 )! (Nw2)! …
en −N χ ∑ wn ln wn,que es justamente -traza (U ln U ).

n =1 H
Teníamos, además, la colectividad de equilibrio U = e - χT (hemos prescindido
del factor de normalización
1
Z(b) )
que es igual a
∞ Wn
∑ e − xT P[ϕ ] ,
n
n =1
una mezcla, por ende, de los estados P[j ], P[j ], … (es decir, de los estados estacio
1 2
W1 W2
narios de energías W1, W2, …), afectados de los pesos (relativos) e - χT : e - χT : … Si
366
Fund_MAT_05.indd 366 7/5/18 18:20

un valor propio de la energía es múltiple, por ejemplo Wn = …= Wn = W, P[j ],

1 n n1
W
+ … + P[j ], aparece en la mezcla con el peso e - xT , es decir, la colectividad co
nn
1
rrectamente normalizada (P[j ] + … + P[j ]), (cf. el principio de IV.3) lo hace
W n n1 nn
con el peso ne - xT . Pero precisamente así se define la colectividad «canónica» clá
1
sica (prescindiendo de la expresión (P[j ] + … + P[j ]) que es específica de la
n n1 nn
Mecánica cuántica) según el llamado teorema de Boltzmann201.

Vale la pena averiguar qué podemos decir acerca de la colectividad de equilibrio
U de energía dada que no se base en la Termodinámica, esto es, fundándonos tan
sólo en el hecho de que U es estacionario [no cambia en el correr del tiempo (pro
ceso 2)] y que en todas las mediciones que no influyen en la energía [es decir, en
las mediciones de magnitudes simultáneamente mensurables con ella (proceso 1
en el que R, H son permutables, o sea, j1, j2, … funciones propias de H)] per
manece inalterado.
∂ 2pi
En virtud de la ecuación diferencial U= (U H - HU ) lo primero sig
∂t h
nifica simplemente que H y U son permutables. En cuanto a lo segundo, ello nos
dice que si j1, j2, … se puede utilizar como sistema completo de funciones pro
pias de H, será U = U', es decir, j1, j2, … son también funciones propias de U.
Sean W1, W2, … valores propios que corresponden a las jn consideradas como
funciones propias de H y w1, w2, … los valores propios de U en este mismo su
puesto. Si Wj = Wk, podemos sustituir en H jj, jk por
ϕ j + ϕk ϕ j − ϕk
, ,
2 2
de manera que éstas son asimismo funciones propias de U, y por lo tanto, wj = wk.
En consecuencia, cabe construir una función F (x) tal que F (Wn) = wn (n = 1, 2, …)
y se tendrá F (H) = U. Es claro que esta condición es también suficiente e igual
mente lo es que implica la permutabilidad de H y U.
Por este camino, pues, resulta que U = F (H). pero no se consigue determinar
la forma de F (x) (conforme sabemos, es F (x) =
e-bx
Z(b)
,b=
1
cT )
De traza (U ) = 1 y traza (U H) = E se deduce aún que
∞ ∞
∑ F(Wn ) = 1, ∑Wn F(Wn ) = E,
n =1 n =1
pero con esto se agota lo que el método da de sí.
4. La medición macroscópica
Aunque nuestra expresión de la entropía es, como vimos, una forma del todo
análoga a la entropía clásica, no puede dejar de sorprender el que se conserve du
367
Fund_MAT_05.indd 367 7/5/18 18:20

rante la evolución temporal del sistema (proceso 2) y aumente sólo como conse
cuencia de una medición (proceso 1). En la Mecánica clásica, en la que las medi
ciones no representaban ningún papel, la entropía aumentaba, por regla general
incluso en la evolución temporal mecánica ordinaria del sistema. Por esto es ne
cesario poner en claro aquel comportamiento en apariencia paradójico.
El razonamiento normal propio de la Termodinámica clásica discurre así: To
memos un recipiente cerrado de volumen B en cuya mitad derecha, de volumen,
B
separada de la otra mitad por un tabique, se encuentran M moléculas de un
2
gas (que para simplificar supondremos perfecto) a la temperatura T. Si expansio
násemos este gas isotérmica y reversiblemente hasta el volumen B (haciendo retro
ceder el tabique a favor de la presión del gas, gastando el trabajo mecánico así
obtenido y manteniendo constante la temperatura por medio de un termostato de
temperatura T), la entropía del sistema exterior (el termostato) disminuiría en Mc
ln 2 y, por consiguiente, en otro tanto aumentaría la del gas. Por el contrario, si
simplemente quitamos el tabique, el gas se difunde en la mitad libre izquierda y
el volumen crece hasta el valor B, es decir, la entropía aumenta en Mc ln 2 sin
que se produzca compensación ninguna. El proceso es, por lo tanto, irreversible,
la entropía ha aumentado en el curso de la evolución temporal simplemente me
cánica del sistema (a saber, en la difusión). ¿Por qué no resulta de nuestra teoría
nada semejante?
Como más claramente se patentizan las circunstancias es haciendo M = 1. Para
un tal gas monomolecular sigue siendo válida la Termodinámica y es correcto de
cir que su entropía aumenta en c ln 2 cuando se duplica el volumen que se le
ofrece. Sin embargo, esta diferencia c ln 2 existe realmente sólo en tanto lo único
B
que verdaderamente se sepa de la molécula es que se encuentra en el volumen
2
o en el B respectivamente. Cuando, por ejemplo, la molécula está en el volumen
B pero además se sabe si se encuentra en la mitad derecha o izquierda del recipien
te, basta introducir en medio de éste un tabique y dejar que la molécula empuje
hasta la pared terminal izquierda o derecha, respectivamente. Con esto se realiza
el trabajo mecánico χT ln 2, es decir, se toma esta energía del termostato. Al final,
pues, la molécula se encuentra de nuevo en el volumen B; sin embargo, ya no
sabemos si se halla en la mitad derecha o izquierda del recipiente, pero en com
pensación existe en el termostato una disminución de entropía χ ln 2. En otros
términos, hemos trocado nuestro conocimiento por la disminución de entropía
χ ln 2.202 O también: la entropía en el volumen B es la misma que en el volumen
B
si se sabe en qué mitad del recipiente se halla la molécula. Por consiguiente, si
2
se conoce exactamente la molécula antes de la difusión (es decir, si se conocen su
posición y su impulso), se puede calcular en cada momento, después de ésta, si se
encuentra en la mitad derecha o izquierda, esto es, la entropía no habrá aumenta
B
do. Tan sólo cuando únicamente disponemos del dato macroscópico de ser el
volumen inicial, aumenta realmente la entropía en la difusión. 2
368
Fund_MAT_05.indd 368 7/5/18 18:20

Para un observador clásico, que conoce todas las coordenadas y los impulsos,
la entropía es, por ende, constante y precisamente igual a 0, pues el «número de
complexiones» de Boltzmann es 1 (cf. loc. cit. Nota 201). Igual ocurre en nuestra
teoría con los estados U = P[j], los cuales también aquí corresponden al más alto
nivel de conocimiento del observador acerca del sistema.
En consecuencia, las variaciones temporales de entropía son debidas, en un
caso, a que el observador no lo conoce todo, en el otro, a que no ha determinado
(medido) todo lo por principio medible: sus sentidos sólo le permiten percibir
justamente las llamadas magnitudes macroscópicas. Esta explicación de la aparen
te contradicción de que hablábamos al empezar, nos impone, empero, el deber de
buscar algo que se comporte respecto de las colectividades de la Mecánica cuánti
ca como la entropía macroscópica clásica, es decir, el de estudiar la entropía desde
el punto de vista de un observador que no puede medir todas las magnitudes, sino
solamente algunas privilegiadas, a saber, las magnitudes macroscópicas, y aun éstas,
eventualmente, sólo con una precisión limitada.
Vimos en III.3 que todas las mediciones de precisión acotada se pueden sus
tituir por mediciones absolutamente precisas de otras magnitudes que son funcio
nes de aquéllas y poseen un espectro discreto puro. Sea R una de esas magnitudes,
R su operador y l(1), l(2)… aquellos de entre sus valores propios que son distintos
entre sí. En estas condiciones, la medición de R equivale a contestar a las siguien
tes preguntas: «¿Es R = l(1)?, ¿es R = l(2)?», … Sin duda, cabe asimismo decir di
rectamente: hay que medir la magnitud S cuyo operador es el S, con una precisión
limitada; por ejemplo, hay que decidir en qué intervalo cn - 1 < l ≤ cn se encuen
tra (… < c-2 < c-1 < c0 < c1< c2 ≤ …; cn → ∞ o - ∞ para n → ∞ o - ∞, respec
tivamente); así, de lo que se trata es de contestar a todas las preguntas «¿está en
cn - 1 < l ≤ cn?» (n = 0, ±1, ±2, …).
Según III.5, a tales preguntas corresponden operadores de proyección E cuyas
magnitudes E son, en el fondo, lo que hay que medir. En nuestro primer ejemplo
las E son las funciones Fn(R), n = 1, 2, …, donde Fn(l) = 1, para l = l(n) y el
{ ∣
(n)
0, para l ≠ l
operador E, el Fn(R); en el segundo, lo son las funciones Gn(S), n = 0, ±1, ±2, …,
donde
Gn(l) = 1, para cn - 1 < l ≤ cn ,

{ ∣
y el operador E, el Gn(S). Por consiguiente, en vez de indicar las magnitudes ma

croscópicamente medibles S con inclusión de la exactitud que se puede conseguir,
cabe indicar las cuestiones E resolubles por medio de mediciones macroscópicas o
sus operadores de proyección E (cf. III.5). Es esto lo que verdaderamente caracte
riza a un observador macroscópico: la especificación de sus E. (Desde el punto de
vista clásico lo caracterizaríamos indicando, por ejemplo, que es capaz de medir la
presión y la temperatura en cada cm3 del volumen del gas —quizá con ciertos lí
mites en la precisión—, pero no otra cosa).203
369
Fund_MAT_05.indd 369 7/5/18 18:20

Ahora bien, pertenece a la esencia del medir macroscópico que todo lo que es
macroscópicamente medible lo es también simultáneamente. Es decir, a todas las
preguntas E a las que se puede responder macroscópicamente, cabe responder si
multáneamente; o sea, todos los E son entre sí permutables. Justamente por esto
la no simultánea mensurabilidad de las magnitudes de la Mecánica cuántica ha
causado al principio la impresión de algo paradójico: dicho concepto es extraño
al modo de ver macroscópico. Dada la gran importancia fundamental de este
punto, es conveniente discutirlo algo más detalladamente.
Recordemos el método merced al cual se pueden medir a la vez con una pre
cisión acotada dos magnitudes notoriamente no mensurables simultáneamente,
por ejemplo, la coordenada q y el impulso p (cf. III.4). Sean e, h, respectivamen
te, los errores medios cuadráticos de las dos medidas (según las relaciones de in
determinación, eh ∼ h). La discusión llevada a cabo en III.4 muestra que, si no se
pide más exactitud que ésta, la medición simultánea es efectivamente posible: la
medición de q (de la posición) se efectúa con luz de longitud de onda no dema
siado corta; la medición de p (del impulso), con trenes de ondas luminosas no
excesivamente largos. Cuando todo ha quedado así dispuesto, lo que propiamen
te constituye la medición consiste en poner de manifiesto como sea los dos quan
ta de luz, por ejemplo, fotografiándolos: uno es el desviado por efecto Compton
en la medición de q; el otro es el que en la medición de p se refleja afectado por
el efecto Doppler, viendo así alterada su frecuencia, y que luego es desviado por
un instrumento óptico (prisma, reja de difracción) al determinarla. Al final del
experimento nos encontramos, pues, ante dos quanta luminosos o tal vez dos pla
cas fotográficas, y hay que calcular q y p a partir de las direcciones de aquéllos o
de las posiciones de ennegrecimiento que resultan en éstas. Tocante a esto hay que
destacar que nada nos impide determinar con cuanta exactitud queramos dichas
dos direcciones o dichas dos posiciones, pues tanto las unas como las otras son
magnitudes simultáneamente mensurables, evidentemente (en un caso son impul
sos y en el otro coordenadas de dos objetos diferentes); pero ello de poco serviría
para la medición de q y de p. En efecto, conforme se demostró en III.4, la conexión
de estas magnitudes con q y p es tal que siempre subsisten para éstas las indeter
minaciones e, h (incluso cuando se conocen exactamente las primeras) y que no
cabe disponer las cosas de modo que eh << h.
Introduzcamos, en consecuencia, dichas dos direcciones o posiciones de enne
grecimiento como magnitudes físicas y sean Q', P' sus operadores: Q' y P' son, en
verdad, exactamente permutables, pero los operadores Q, P que corresponden a q,
p no pueden expresarse en función de ellos con una precisión superior a e, h,
respectivamente. Sean q', p' las magnitudes correspondientes a Q, P'; la interpre
tación según la cual las verdaderas magnitudes medibles macroscópicamente son,
no q y p, sino q' y p' es muy natural (¡de hecho lo que realmente se mide es q' y
p' !) y está de acuerdo con nuestro postulado de la mensurabilidad simultánea de
todas las magnitudes físicas.
Es conveniente interpretar el resultado que acabamos de establecer, generali
zándolo, como una característica del punto de vista macroscópico. Según esto, el
370
Fund_MAT_05.indd 370 7/5/18 18:20

modo de ver macroscópico consiste en sustituir todos los operadores posibles A,

B, C, …, que de ordinario no son permutables entre sí, por otros operadores A',
B', C', … de los que aquéllos son funciones aproximadamente. Llamando igual
mente A', B', C', … a estas funciones de A', B', C', …, podemos decir: A', B', C',
… son aproximaciones de A, B, C, …, pero exactamente permutables entre sí. Si
los números eA, eB, eC, … dan una medida del orden de magnitud de los opera
dores A' - A, B' - B, C' - C, …, es fácil ver que eA, eB, será del orden de AB - BA
(que en general es ≠ 0) etc., lo que da los límites de las aproximaciones que po
demos conseguir. Naturalmente, es muy razonable limitarse en la formación de
los operadores A, B, C, … a aquellos operadores cuyas magnitudes físicas se pue
den concebir macroscópicamente por lo menos con una aproximación aceptable.
Estos argumentos totalmente cualitativos siguen siendo un mero programa en
tanto no podamos demostrar que postulan algo matemáticamente realizable. Es
éste el motivo por el que, a continuación, discutiremos de un modo puramente
matemático y limitándonos al caso característico de los operadores Q y P, la cues
tión de la existencia de los operadores Q' y P' arriba definidos. Sean, pues, e, h
h
dos números dados que cumplen la condición eh = ; se trata de hallar dos
4p
operadores permutables Q', P' tales que Q' - Q, P - P' sean del orden de e, h,
respectivamente (en un cierto sentido que hemos de definir aún con exactitud).
Operaremos con magnitudes q', p' medibles con una completa precisión, es
decir, Q' y P' han de poseer un espectro discreto puro. como además son permu
tables, existe un sistema ortonormal completo j1, j2, … constituido por funciones
propias comunes a uno y otro (cf. II.10). Sean a1, a2, … los valores propios de Q',
b1, b2, … los de P'; se tendrá
∞ ∞
Q' = ∑ an P[ϕn], P' = ∑ bn P[ϕn].
n =1 n =1
Siempre podemos efectuar la medición de q', p' de manera que, inmediata

mente después, el estado sea uno de los j1, j2, …; por ejemplo, basta medir una
magnitud R cuyo operador R tenga por funciones propias a j1, j2, … y los valo
res propios del cual, c1, c2, …, sean todos diferentes; entonces Q' y P' son funcio
nes de R. Que dicha medición incluya de modo aproximado una medición de Q,
P significa, evidentemente, que, en el estado jn, Q y P están expresados aproxi
madamente por los respectivos valores de Q' y P', es decir, por an y bn. En otros
términos: las dispersiones, en el estado jn, respecto de estos valores, son pequeñas.
Estas son, por definición, los valores medios de las magnitudes (q - an)2, (p - bn)2,
es decir:
[(Q - an ⋅ 1)2jn, jn] = ∙(Q - an ⋅ 1) jn ∙2 = ∙Qjn - anjn ∙2,
[(P - bn ⋅ 1)2jn, jn] = ∙(P - bn ⋅ 1) jn ∙2 = ∙Pjn - bnjn ∙2,
371
Fund_MAT_05.indd 371 7/5/18 18:20

y constituyen las medidas de los cuadrados de las diferencias entre Q' y Q y entre
P' y P respectivamente, de suerte que deben ser iguales, aproximadamente, a e2 en
el primer caso y a h2 en el segundo. Por tal razón imponemos las condiciones
∙Qjn - anjn ∙ ≲ e, ∙Pjn - bnjn ∙ ≲ h.
Y he aquí por qué es más conveniente, en vez de hablar de Q' y P\ buscar sim
plemente un sistema ortogonal completo j1, j2, … para el cual valgan las anterio
res desigualdades, si se eligen adecuadamente a1, a2, … y b1, b2, …
En III.4 encontramos ya una j (∙j ∙ = 1) que satisface las igualdades
∙Qj - aj ∙ = e, ∙Pj - bj ∙ = h,
supuestas elegidas a y b convenientemente; esta función es

1
2γ 4 − πγ (q − σ )2 + 2πρ iq
ϕ ρ, σ , γ = ϕ ρ, σ , γ (q) ≡ ⎛ ⎞ ⋅ e h h ,
⎝ h⎠
h hγ h ⎛ ε⎞
donde, en virtud de ser eh = , de nuevo hemos puesto ε = ,η= es decir, γ = ⎟
4p 4π 4πγ ⎜⎝ η⎠
h ⎛ ε⎞
η= ⎜ es decir, γ = ⎟ y donde hay que tomar a = s y b = r. Pero ahora de lo que se
4πγ ⎝ η⎠
trata es de formar un sistema ortonormal completo a partir de esas jr, s, g . Obser
vemos, en primer lugar, que pues r y s son los respectivos valores medios de Q
y P, es plausible hacer recorrer a r y s, independientemente el uno del otro, sen
dos sistemas de números cuyos elementos estén distribuidos en el primer siste
ma con densidad aproximadamente igual a e y en el segundo con una densidad
igual a h aproximadamente. Resulta por esto más práctico elegir como unidades
h h
2 π ⋅ ε = hγ y 2 π ⋅ η = , es decir, ρ = hγ µ y σ = ν (µ , ν = 0, ±1, ±2, …).
γ γ
h
y σ= ν (µ , ν = 0, ±1, ±2, …). Las ψ µ ,ν = ϕ ( µ , ν = 0, ±1, ±2, …) han de corresponder, por
γ h
hγ µ , ν, γ
γ
ende, a las jn(n = 1, 2, …)—evidentemente carece de importancia que en vez de
un solo índice n tengamos ahora dos, m y n.
Sin embargo, estas ym,n no son todavía ortogonales, aunque sí normalizadas y
tales que
h
Qψ µ, ν − hγ µψ µ, ν = ε, Pψ µ, ν − νψ µ, ν = η.
γ
Basta, empero, «ortogonalizarlas» en cualquier orden siguiendo el método de

E. Schmidt (cf. II.2, demostración del teorema 8); no ofrece entonces ninguna
372
Fund_MAT_05.indd 372 7/5/18 18:20

particular dificultad demostrar que el sistema ortonormal y'm,n que así resulta es
completo y, además, sentar las acotaciones
h
Qψ' µ, ν − hγ µψ' µ, ν ≤ C ε, Pψ' µ, ν − νψ' µ, ν ≤ C η ,
γ
en las que es C ~ 60, valor éste que es muy probable se pudiera reducir conside
rablemente. La demostración de estos resultados requiere cálculos bastante penosos
que omitimos, si bien, por lo demás, no exige nuevos puntos de vista. Poco im
h
porta la presencia del factor C ~ 60, pues eh = es de una exorbitante pequeñez
-28
4p
(¡cerca de 10 !) cuando se mide en unidades macroscópicas (unidades C. G. S.).
Por lo tanto podemos decir, en resumen, que hay razones para admitir la per
mutabilidad de todos los operadores macroscópicos, en particular también la de
los operadores de proyección macroscópicos E introducidos más arriba.
Estos E corresponden a todas las cuestiones E a las que se puede contestar
macroscópicamente, es decir, a todas las disyuntivas que se refieren al sistema en
estudio y que se pueden resolver macroscópicamente. Conforme vimos, todos los
E macroscópicos son entre sí permutables; además, de acuerdo con III.5, a ellos
pertenecen, junto con E, 1 - E y junto con E y F, EF, E + F - EF, E - EF. Es
muy natural suponer que de ellos haya sólo un número finito: E1, …, En. Intro
duzcamos por un momento la notación E (+) = E, E (-) = 1 - E y consideremos
todos los 2n productos E1(s1) … En(sn) (s1, …, sn = ±). El producto de cada dos de
éstos distintos es nulo: si, en efecto, … E1(s1) … En(sn) y E (t1) … En(tn) están en estas
condiciones, por ejemplo sn ≠ tn, en su producto aparecen los factores En(Sν), En(tν)
es decir, En(+) = E y En(-) = 1 - E cuyo producto es, evidentemente, cero. Cada En
es suma de productos E1(s1)… En(sn), a saber:
∑
(s ) (s )
Eν = E1(s1) … Eν ν−1−1 ⋅ Eν(+) ⋅ Eν ν+1+1 … En(sn).
s1, …, sν −1, sν +1, …, sn = ±
Llamemos E'1, …, E'm aquellos de entre los E1(s1) … En(sn) que sean diferentes de
cero (evidentemente es m ≤ 2n; pero incluso debe ser m ≤ n - 1, pues E'1, …, E'm
son ±0 y han de estar entre los E1, …, En); se tiene entonces: E'm ≠ 0; E'm E'n = 0,
para m ≠ n; cada Em es suma de algunos E'n. (De esto último se sigue n = 2m.)
Obsérvese que nunca puede ser Em + En = E'r, a menos que Em = 0, En = E'r, o bien
Em = E'r, En = 0. En efecto, en caso contrario Em, En, serían sumas de algunos E'p
y, por ende, E'r lo sería de un número ≥ 2 de E'p (eventualmente con repetición).
Según II.4 teoremas 15 y 16, éstos serían todos distintos entre sí, y pues son en
número ≥ 2, también lo serían de E'r; luego su producto por E'r es nulo y cero
también es el de su suma por el mismo E'r, lo que contradice la hipótesis de ser
iguales aquélla y éste.
Las propiedades E'1, …, E'm que corresponden a E'1 …, E'm son, por consi
guiente, propiedades macroscópicas de la siguiente clase: 1, ninguna es absurda;
373
Fund_MAT_05.indd 373 7/5/18 18:20

2, cada dos se excluyen mutuamente; 3, toda propiedad macroscópica resulta por

disyunción de algunas de entre ellas; 4, ninguna de ellas puede ser descompuesta
por disyunción en dos propiedades macroscópicas más precisas. Luego E'1, …, E'm
son las más amplias disyuntivas macroscópicas que cabe plantear: son macroscó
picamente indescomponibles.
En lo que sigue no postularemos la finitud de su número, sino tan sólo la
existencia de las propiedades macroscópicamente indescomponibles E'1, E'2, …
Sean E'1, E'2 sus respectivos operadores de proyección, todos ellos ≠ 0 ortogonales
dos a dos y tales que cada E macroscópico es suma de algunos Ei.
En consecuencia, también 1 es una suma de ese tipo. Si en ésta no entrase un
cierto E'n, E'n sería ortogonal a dicha suma y, por lo tanto, a 1, es decir, E'n = E'n.
1 = 0, lo que es imposible; luego E'1 + E'2 + … = 1. Prescindamos de los acentos
y llamemos B1, B2, … las variedades lineales cerradas asociadas a E1, E2, …, varie
dades cuyas dimensiones designaremos con s1, s2, …, respectivamente.
Si todos los sn fuesen iguales a 1, es decir, unidimensionales todas las Bn, se
tendrían Bn = [jn], En = P[jn] y a causa de ser E1 + E2 + … = 1, los j1, j2, …
constituirían un sistema ortonormal completo. Esto significaría que ya las medi
ciones macroscópicas hacen posible la completa determinación del estado del sis
tema que se considera. Dado que normalmente no se presenta este caso, en gene
ral es sn > 1 e incluso sn >> 1.
Sé echa de ver, además, que los En, que son los materiales elementales para la
descripción macroscópica del Universo, corresponden en un cierto sentido a la
división en celdas, habitual en la teoría clásica, del espacio de las fases. Por otra
parte, hemos podido reconocer que dichos operadores están en condiciones de
reproducir aproximadamente el comportamiento de los operadores no permuta
bles, en particular el de los operadores Q, P, tan importantes para el espacio de
las fases.
Ahora bien, ¿qué entropía tiene la mezcla U para un observador macroscópico
cuyos operadores de proyección indescomponibles son E1, E2, …? Más exactamen
te: ¿cuánta entropía puede obtener como máximo un tal observador en la trans
formación de U en V ?, es decir, ¿qué disminución de entropía (disminución que,
naturalmente, puede ser ⪌ 0) es capaz de provocar, en el mejor de los casos, en
los objetos exteriores como compensación al tránsito U → V ?
En primer lugar hay que poner de relieve el hecho de que nunca podrá distin
guir entre sí dos colectividades U y U' en las cuales todos los E1, E2, … tienen los
mismos valores medios, es decir, en las que traza (UEn) = traza (U'En) (n = 1, 2, …).
De hecho podría hacerlo transcurrido algún tiempo, pues U, U' evolucionan
de acuerdo con 2 y en general204 ya no será traza (AUA-1En) = traza (AU'A-1En)
( 2 π
)
i
A = e - h t H ; pero es el caso que consideramos sólo mediciones realizables in
mediatamente. En estas condiciones, por lo tanto, debemos mirar U y U' como
indiscernibles. Además, el observador macroscópico únicamente puede utili
zar paredes semipermeables tales que dejan pasar las j de algunos En, mientras
reflejan inalteradas las de los restantes. Inspirándose en el método indicado en
V.2, es fácil cerciorarse de que esto basta para transformar reversiblemente un
374
Fund_MAT_05.indd 374 7/5/18 18:20

∞ ∞
U' = ∑ xn En en un V' = ∑ yn En, de manera que la diferencia de entropía sigue sien
n =1 n =1
do c traza (U' ln U' ) - c traza (V' ln V' ), es decir, la entropía de U' igual a
-c traza (U' ln U' ). Por supuesto que para que existan tales U' con traza U' = 1,
las trazas En, es decir, los números sn, han de ser finitos. Supondremos, pues, que
todos los sn lo son. Sentado esto, U' tendrá por valores propios a x1, x2, … con
los órdenes de multiplicidad s1, s2, …; luego los valores propios de -U' ln U'
serán -x1 ln x2, -x2 ln x2, … múltiples de órdenes s1, s2, …, respectivamente. Por
∞
lo tanto, la condición traza U' = 1 significa que
∞
∑ sn xn = 1 y la entropía vale
n =1
− χ ∑ sn xn ln xn. A causa de ser
n =1
∞
U'Em = ∑ xn En Em = xm Em, traza (U'Em) = xm traza Em = sm xm,
n =1
traza (U'Em )
de donde xm = , la anterior expresión puede escribirse
sm
∞
traza (U'En )
− χ ∑ traza (U'En ) ln .
n =1 sn
También para un U cualquiera (traza U = 1) la entropía debe ser igual a

∞
traza (UEn )
− χ ∑ traza (UEn ) ln ,
n =1 sn
porque si hacemos
∞
traza (UEn )
xn = , U' = ∑ xn En,
sn n =1
se tendrá traza (UEn) = traza (U'En), y siendo así indiscernibles U y U' sus entro
pías han de coincidir.
Es necesario observar aún que esta entropía nunca es menor que la ordinaria,
o sea, que
∞
traza (UEn )
− χ ∑ traza (UEn ) ln ≥ − χ traza (U ln U ),
n =1 sn
∞
y que el signo = vale únicamente para U = ∑ xn En. De acuerdo con los resultados
de V.3, con seguridad ocurre así cuando n =1
375
Fund_MAT_05.indd 375 7/5/18 18:20

∞
traza (UEn )
U' = ∑ En
n =1 sn
se origina de U merced a algunas aplicaciones del proceso 1, no necesariamente

macroscópicas, porque entonces el primer miembro es -χ traza (U' ln U' ) y
∞
U = ∑ xn En significa lo mismo que U = U'. Tomemos un sistema ortonormal
n =1
j1(n), …, js(n), cuya extensión lineal cerrada sea la variedad Bn que corresponde a
n
∞
En. En virtud de ser ∑ En = 1, el conjunto de las jn(n) (n = 1, 2, …; n = 1, …, sn)
n =1
es un sistema ortonormal completo. Sea R un operador cuyas funciones propias
(con valores propios todos simples) sean las jn(n) y R la magnitud física asociada.
De la medición de R en U resulta, a causa de 1, la colectividad
∞ sn
U'' = ∑ ∑ (U ϕν(n), ϕν(n)) ⋅P[ϕν(n)].
n =1 ν =1
Pongamos luego
sn
1 2π i µν
ψ µ(n) =
sn
∑e s n ϕν(n) (µ = 1, 2,…, sn );
ν =1
las funciones y1(n), …, ys (n) forman un sistema ortonormal que define la misma
n
variedad lineal cerrada que las j1(n), …, js (n): la Bn. En consecuencia, también las
n
yn(n) (n = 1, 2, …; n = 1, …, sn) integran un sistema ortonormal completo. Sea S

un operador que las tenga como funciones propias y S la correspondiente magni
tud física. Es fácil comprobar que
⎧0 para m ≠ n
⎪
(P[ϕν(n)]ψ , ψ ) = ⎨ 1
(m)
µ
(m)
µ ,
⎪ sn para m = n
⎩
sn sn
∑ P[ϕν(n)] = ∑ P[ψν(n)] = En .
ν =1 ν =1
Por lo tanto, la medición de S en U' da lugar, en virtud de 1., a la colectividad

∞ sm
= ∑ ∑ (U''ψ µ(m), ψ µ(m))P[ψ µ(m)]
m =1 µ =1
∞ sm
⎡ ∞ sn ⎤
= ∑ ∑ ⎢∑ ∑ (U ϕν(n), ϕν(n))(P[ϕν(n)]ψ µ(m), ψ µ(m))⎥P[ψ µ(m)]
m =1 µ =1 ⎣n =1 ν =1 ⎦
∞ sm
⎡ sm (U ϕν(m), ϕν(m)) ⎤
= ∑ ∑ ⎢∑ ⎥P[ψ µ(m)] =
376 m =1 µ =1 ⎣ν =1 sm ⎦
∞ sm ∞
traza (UEm ) traza (UEm )
=∑∑ P[ψ µ(m)] = ∑ Em = U' .
m =1 µ =1 sm m =1 sm
Fund_MAT_05.indd 376 7/5/18 18:20

∞ sm
= ∑ ∑ (U''ψ µ(m), ψ µ(m))P[ψ µ(m)]
m =1 µ =1
∞ sm
⎡ ∞ sn ⎤ Consideraciones generales
= ∑ ∑ ⎢∑ ∑ (U ϕν(n), ϕν(n))(P[ϕν(n)]ψ µ(m), ψ µ(m))⎥P[ψ µ(m)]
m =1 µ =1 ⎣n =1 ν =1 ⎦
∞ sm
⎡ sm (U ϕν(m), ϕν(m)) ⎤
= ∑ ∑ ⎢∑ ⎥P[ψ µ(m)] =
m =1 µ =1 ⎣ν =1 sm ⎦
∞ sm ∞
traza (UEm ) traza (UEm )
=∑∑ P[ψ µ(m)] = ∑ Em = U' .
m =1 µ =1 sm m =1 sm
Luego bastan dos procesos 1. para cambiar U en U', y esto es todo lo que
necesitábamos para la demostración.
En el caso particular de los estados (U = P[j], traza (UEn) = (Enj, j) = ∙∙Enj ∙∙2)
esta entropía vale
2
∞ Enϕ
−χ∑
2
Enϕ ln
n =1 sn
y no adolece de los inconvenientes de la entropía «microscópica»: en general ni se

mantiene constante en el tiempo (es decir, en los procesos 2.) ni es igual a cero
para todos los estados U = P[j]. En efecto: que traza (UEn), a partir de la cual se
construye nuestra entropía, no es temporalmente constante, es algo que discutimos
ya en la Nota 202. Pero, además, es fácil determinar cuándo el estado U = P[j] tiene la
∙∙E j ∙∙2 ∙∙E j ∙∙2
entropía 0: Dado que 0 ≤ n ≤ 1, todos los sumandos ∙∙Enj∙∙2ln n que
sn sn
aparecen en la expresión de la misma son ≤ 0, y para que la entropía sea nula to
∙∙E j ∙∙2
dos deben ser = 0, es decir, n = 0 ó 1. Lo primero significa que Enj = 0, lo
sn
segundo que Enϕ = sn ; mas como
∙∙Enj ∙∙ ≤ 1 y sn ≥ 1,
ha de ser sn = 1, ∙∙Enj ∙∙ = ∙∙j ∙∙ y, por ende, Enj = j. En resumen: o Enj = 0 o

sn= 1 y j está en Bn. Es claro que esto último no puede ocurrir para dos valores
diferentes de n; pero tampoco cabe que no suceda para ningún valor de n, pues si
∞
así fuera, se tendría Enj = 0 (m = 1, 2, …) y siendo ∑ En = 1 de ello se seguiría
n =1
j = 0. Por lo tanto, si la entropía es nula, j pertenece a una Bn tal que sn = 1.
Ahora bien, anteriormente hicimos constar que en general todas las sn son >> 1;
luego es imposible que la entropía en un estado sea cero, es decir, siempre es po
sitiva.
Puesto que la entropía macroscópica cambia con el tiempo, la siguiente cues
tión a resolver es ésta: ¿Su comportamiento es igual al de la entropía de la Termo
dinámica fenomenológica en el mundo real? ¿Predominan los casos en que aumen
ta? En la Mecánica clásica la respuesta es afirmativa, lo que constituye el llamado
377
Fund_MAT_05.indd 377 7/5/18 18:20

teorema H de Boltzmann, aunque para llegar a él son necesarias ciertas hipótesis

estadísticas, las «hipótesis de desorden».205 El autor consiguió demostrar el teorema
correspondiente en la Mecánica cuántica sin acudir a tales supuestos.206 Dado que
el entrar en detalles acerca de este punto, como también tocante al principio er
gódico con él íntimamente vinculado (cf. loc. cit. Nota 206, donde también ése se
demuestra), nos llevaría demasiado lejos, hemos de renunciar a reproducir aquí
esas investigaciones. Remitimos al lector interesado en esta dirección a las citadas
memorias.
378
Fund_MAT_05.indd 378 7/5/18 18:20

VI
La medición
1. Formulación del problema

Las discusiones que preceden nos han permitido examinar la relación de la
Mecánica cuántica con los diferentes métodos causales y estadísticos para la des-
cripción de la Naturaleza; pero en el curso de las mismas hemos hallado una sin-
gular duplicidad en el comportamiento de aquélla que no ha podido ser puesta en
claro suficientemente: De una parte, un estado j sometido a la influencia de un
operador de energía H durante el intervalo 0 ≤ t ≤ t, se transforma en un estado
j' de acuerdo con la ley
∂ 2p i
jt = − H jt , (0 ≤ t ≤ t)
∂t h
j0 = j, jt = j' .
es decir,
2π i
− tH
ϕ' = e h ϕ,
de una manera puramente causal por lo tanto. Conforme a esto, una mezcla U se
transforma en
2π i 2π i
− tH tH
U' = e h Ue h
de suerte que, en particular, los estados U = P[j] se transforman en estados U' = P[j'],

con arreglo al cambio causal de j en j' (proceso 2, en V.1). De otra parte, en una
medición —por ejemplo de una magnitud con valores propios todos simples y
funciones propias j1, j2, …— el estado j experimenta un cambio no causal,
pudiendo aparecer cada uno de los estados j1, j2, … y precisamente con las res-
pectivas probabilidades [(j, j1)∙2, ∙(j, j2)∙2, … Con otras palabras, el resultado es
∞
la mezcla U' = ∑ (ϕ , ϕn ) P[ϕn] . En el caso general de una mezcla U, la medición
2
n =1 ∞
en cuestión la transforma en la mezcla U' = ∑ (U ϕn, ϕn )P[ϕn] (proceso 1. en V.1).
n =1
Dado que aquí los estados pasan a mezclas, este proceso no es causal.
379
Fund_MAT_06.indd 379 7/5/18 18:32

La diferencia entre los dos procesos U → U' es fundamentalísima: prescindien-

do incluso de su distinto comportamiento respecto del principio de causalidad, se
distinguen aún por ser el primero termodinámicamente reversible y el último no.
(Cf. V.3)
Comparemos ahora ese estado de cosas con el que se da realmente en la Na-
turaleza o en el resultado de su observación. En primer lugar es en sí y de por sí
absolutamente cierto que el medir y el proceso de la apercepción subjetiva con él
ligado son algo nuevo respecto del mundo físico en torno, irreductible a éste. Ese
algo, en efecto, nos lleva fuera de él, o más exactamente: nos conduce a dentro de
la vida intelectual íntima del individuo, incontrastable en cuanto supuesto previo
de todo intento de constrastación. (Cf. lo que se dirá más adelante.) Sin embargo,
es una exigencia fundamental para la visión del mundo propia de la Ciencia na-
tural, el que ha de ser posible describir el proceso, en realidad extrafísico, de la
apercepción subjetiva como si tuviese lugar en el mundo físico (principio del pa-
ralelismo psicofísico). Es decir, debe ser posible coordinar a sus elementos fenó-
menos físicos en el mundo objetivo en torno, en el espacio ordinario. (Natural-
mente, en esa coordinación hay que atenerse a la necesidad de localizar tales
procesos en puntos que se encuentren en la porción de espacio ocupada por nues-
tro cuerpo. Con todo, ello no cambia en nada su pertenencia al mundo en torno.)
Esta concepción podría aplicarse a un sencillo ejemplo de la siguiente manera:
Supongamos que se trata de medir una temperatura. Si se quiere, podemos perse-
guir el proceso por medio del cálculo hasta tener la temperatura del entorno del
depósito de mercurio y decir entonces: esta temperatura es medida por el termó-
metro. Pero podemos también llevar los cálculos más allá y calcular el calentamien-
to, dilatación y longitud de la columna de mercurio a partir de las propiedades de
éste que se explican por la teoría cinético-molecular y entonces decir: esta longitud
es vista por el observador. Siguiendo todavía más adelante, podríamos tomar en
consideración el foco luminoso, la reflexión de los quanta de luz en la columna de
mercurio opaca y determinar la trayectoria de los que penetran en los ojos del
observador, su refracción en el cristalino y la formación de una imagen en la reti-
na; sólo entonces cabría decir: esta imagen es registrada por la retina del observa-
dor. Y si nuestros conocimientos fisiológicos fuesen más exactos de lo que hoy son,
podríamos ir aún más allá, seguir las reacciones químicas que esta imagen provo-
ca en la retina, en los nervios y en el cerebro y sólo al final pudiérase decir: el
observador apercibe estos cambios químicos en las células de su cerebro. Pero por
lejos que llevemos los cálculos, hasta el depósito de mercurio, hasta la escala del
termómetro, hasta la retina o hasta el cerebro, llega un momento en que hay que
decir: y esto es percibido por el observador. Con otras palabras, siempre hemos de
dividir el Universo en dos partes: una es el sistema observado, la otra el observador.
En la primera podemos seguir todos los procesos físicos con tanta precisión como
queramos (por lo menos en principio), en la última esto carece de sentido. El lí-
mite entre ambas es ampliamente arbitrario y así, en el ejemplo anterior, vimos
que existían para él cuatro posibilidades diferentes; en particular, el observador no
tiene por qué ser identificado, en este sentido, con el cuerpo del observador real
380
Fund_MAT_06.indd 380 7/5/18 18:32

La medición
—en el ejemplo que precede, una vez involucrábamos en él incluso el termómetro,

mientras en otra no incluíamos en el observador ni sus ojos ni su sistema nervio-
so—. Que el límite en cuestión puede hacerse retroceder cuanto se quiera en el
interior del cuerpo del observador real, es el contenido del principio del paralelis-
mo psicofísico. Sin embargo, esto nada quita a que sea necesario fijarlo en algún
sitio para cada modalidad de descripción, si ésta no ha de discurrir en el vacío, es
decir, si ha de ser posible una comparación con la experiencia. Y ello es así, porque
ésta conduce a enunciados del siguiente tipo: un observador ha llevado a cabo un
determinado acto de percepción (subjetiva). Nunca conduce a enunciados de este
tenor: una magnitud física tiene un determinado valor.
Pues bien, la Mecánica cuántica describe por medio del proceso 2. (V.1) los
sucesos que tienen lugar en la parte observada del mundo en tanto no esté en
interacción con la parte que observa; pero tan pronto existe una tal interacción,
es decir, una medición, prescribe la aplicación del proceso 1. Queda así justificada
la duplicidad que señalábamos.207 No obstante, existe el peligro de que el principio
del paralelismo psicofísico se vea vulnerado mientras no se demuestre que el lími-
te entre el observador y el sistema observado puede correrse arbitrariamente en el
sentido arriba indicado.
Para discutir este punto, dividamos el mundo en tres partes I, II, III: sea I el
sistema propiamente observado, II el aparato de medida, III el propio observa-
dor.208 Hay que demostrar que el límite puede establecerse lo mismo entre I y
II + III que entre I + II y III. (En el ejemplo anterior, en la comparación del pri-
mero y segundo casos I era el sistema a investigar, II el termómetro, III el sistema
luz + observador; en la del segundo y tercero, I era el sistema que se estudia + el
termómetro, II la luz + los ojos del observador, III el observador a partir de su
retina; finalmente, en la del tercero y cuarto, I lo es todo hasta la retina del obser-
vador, II su retina, nervios y cerebro, III su «Yo» abstracto.) Es decir, en el primer
caso hay que aplicar 2. a I y 1. a la interacción de I y II + III; en el segundo, se
debe aplicar 2. a I + II y 1. a la interacción de I + II y III. (III, él mismo, perma-
nece en ambos casos fuera del cálculo.) Nuestro problema es ahora la demostración
de que ambos procesos conducen a los mismos enunciados acerca de I (éste, y sólo
éste, pertenece ambas veces a la parte observada del mundo).
Sin embargo, para poderlo acometer eficazmente, debemos primero estudiar
con detenimiento el proceso de reunión de dos sistemas físicos (el que conduce de
I y II a I + II ).
2. Sistemas compuestos
Conforme a lo anunciado al final del párrafo anterior, consideremos dos siste-
mas físicos I, II (cuyo significado no es necesariamente el mismo que el que antes
hemos atribuido a I, II ) y su reunión I + II. Supongamos que I tiene, desde el
punto de vista de la Mecánica clásica, k grados de libertad y sean q1, …, qk sus
coordenadas, en vez de las cuales, para abreviar, usaremos siempre del símbolo q;
análogamente, sean l los grados de libertad de II, r1 … rz sus coordenadas y r el
381
Fund_MAT_06.indd 381 7/5/18 18:32

símbolo que representa su conjunto. El sistema I + II, por lo tanto, tiene k + l
grados de libertad y las coordenadas q1 …, qk, r1, …, rz o, abreviadamente, q, r.
En consecuencia, en la Mecánica cuántica las funciones de onda del sistema I son
de la forma j (q), las de II de la forma ξ(r) y las del sistema I + II de la forma
Φ (q, r). En los correspondientes espacios hilbertianos EI, EII, EI + II, los productos
interiores están definidos por ∫ ϕ (q)ψ (q)dk , ∫ ξ (r)η(r)dr , ∫∫ Φ(q, r)Ψ(q, r)dqdr ,
respectivamente. Las magnitudes físicas do I, II y I + II corresponden a los ope-
radores hermíticos (hipermáximos) A, A, A de los espacios EI, EII, EI + II.
Cada magnitud física de I es, naturalmente, una magnitud física de I + II y
su A se deduce de A de la siguiente manera: para determinar A Φ (q, r) considé-
rese r como una constante y aplíquese A a la función de q Φ (q, r).209 Esta norma
de coordinación es en todo caso correcta para los operadores de coordenadas,
⎛ h ∂ h ∂ ⎞
Q1, …, Qk (es decir, q1…, …, qk…), y para los de impulso P1, …, Pk ⎜ esto es, , …,
⎝ 2π i ∂q1 2π i ∂qk ⎟⎠
⎛ h ∂ h ∂ ⎞
⎜⎝ esto es, 2π i ∂q , …, 2π i ∂q ⎟⎠ (cf. I.2), y concuerda con los principios de coordinación I., II. de
1 k
IV.2 210, por lo que la postularemos con carácter general. (Su uso es corriente en
Mecánica cuántica.)
Del mismo modo, cada magnitud física de II lo es de I + II y su A resulta de A
de acuerdo con la regla siguiente: A Φ (q, r) es igual a A F (q, r), donde se conci-
be q constante y F(q, r) como función de r.
Si jm(q) (m = 1, 2, …) es un sistema ortonormal completo en EI y ξn(r) (n = l,
2, …) es un sistema de igual naturaleza en EII, evidentemente Fm/n(q, r) = jm(q)
ξn(r) (m, n = 1, 2, …) es un sistema ortonormal completo en EI + II. Por consiguien-
te, los operadores A, A y A se pueden representar por las matrices
{am/m' }, {an/n' } y {amm' /nn' } (m, m' , n, n' = 1, 2, …),211
hecho del que haremos uso en más de una ocasión. La significación de cada una
de esas matrices es la siguiente:
∞ ∞
Aϕm(q) = ∑ ϕm' (q) ⋅ am'/m, Aξn (r) = ∑ ϕn' (r) ⋅ an'/n
m' =1 n' =1
y
∞
AΦmn(q, r) = ∑ Φm' n' (q, r)α m'n' /mn,
m',n' =1
es decir,
∞
Aϕm(q)ξn (r) = ∑ ϕm' (q)ξn' (r)α m'n' /mn.
m',n' =1
382
Fund_MAT_06.indd 382 7/5/18 18:32

La medición
En particular, la correspondencia A → A equivale a

∞
Aϕm(q)ξn (r) = [Aϕm (q)]⋅ ξn (r) = ∑ ϕm' (q)ξn (r)am' /m,
m' =1
o lo que es lo mismo
⎛ ⎧ 1, para n = n' ⎫⎞
α mn/m'n' = am/m' δ n/n' , ⎜δ n/n' = ⎨ 0, para n = n' ⎬⎟ .
⎝ ⎩ ⎭⎠
Análogamente, la correspondencia A → A indica que para este A es
amn/m'n' = dm/m' an/n' .
Una colectividad estadística I + II está caracterizada por su operador estadísti-

co U o por su matriz {vmn/m'n' }. Este determina todas las propiedades estadísticas de
todas las magnitudes de I + II, en particular, por ende, también las de las magni-
tudes de I. En consecuencia, a esa colectividad le corresponde asimismo una co-
lectividad estadística en el sistema I solo; de hecho, un observador que únicamen-
te fuese capaz de percibir I y no II concibiría la colectividad de sistemas I + II como
colectividad de sistemas I. ¿Cuál es el operador U, o su matriz {um/m' }, que corres-
ponde a esa colectividad I ? He aquí cómo determinarlo: a la magnitud-I cuya
matriz es la {am/m' }, le corresponde la matriz {am/m' dn/n' }, cuando se la considera
como magnitud-I + II; luego el valor medio que para ella resulta del cálculo en I es
∞
∑ uu/m' am'/m,
m, m' =1
mientras que el cálculo en I + II nos da
∞ ∞ ∞
⎛∞ ⎞
∑ vmn/m'n' am' /m δ n' /n = ∑ vmn/m'n am' /m = ∑ m' /m ⎜ ∑ vmn/m'n ⎟ .
a
m, n, m', n' =1 m, n, m' =1 m, m' =1 ⎝ n =1 ⎠
Para que ambas expresiones sean iguales ha de ser
∞
um/m' = ∑ vmn/m'n.
n =1
De manera en todo semejante, nuestra colectividad-I + II determina una co-

lectividad-II, supuesto que se considere sólo II y se ignore I, colectividad a la que
383
Fund_MAT_06.indd 383 7/5/18 18:32

corresponden un operador estadístico U y su matriz asociada {un/n' }. Se obtiene

análogamente al caso anterior
∞
un/n' = ∑ vmn/mn' .
m =1
Hemos determinado así reglas de coordinación también para los operadores

estadísticos de I, II y I + II, es decir, U, U y U, las cuales, sin embargo, son esen-
cialmente diferentes de las que valen para los operadores A, A y A de las magni-
tudes físicas.
Conviene advertir todavía, que las correspondencias U → U, U → U sólo en
apariencia dependen de la elección de los sistemas ortonormales completos jm(q)
y ξn(r), pues se han deducido de una condición invariante que únicamente queda
satisfecha por ellas, a saber, la coincidencia de los valores medios de A y A, de una
parte, y de A y A de otra.
El operador U expresa la estadística en I + II, mientras U y U traducen las
estadísticas limitadas a I y II, respectivamente. Cabe preguntarse: ¿determinan
unívocamente a U los operadores U y U o no? La respuesta que en general pode-
mos esperar es una negativa, porque en el solo conocimiento de U y U, es decir,
de los sistemas separados I y II, se pierden todas las «correlaciones estadísticas» que
acaso existan entre ambos sistemas. Pero cuando se conoce exactamente, no sólo
el estado de I, sino también el de II, no cabe entren en cuenta dichas correlaciones
y, por ende, también el estado de I + II se conoce exactamente. Dado que una
discusión matemática rigurosa es siempre preferible, sin embargo, a consideracio-
nes cualitativas como las que preceden, abordaremos ahora el problema desde ese
punto de vista.
La cuestión es ésta: dadas dos matrices {um/m' } y {un/n' }, hallar una tercera matriz
{vmn/m'n' } tal que
∞ ∞
∑ vmn/m'n = um/m' , ∑ vmn/mn' = un/n' .
n =1 m =1
∞ ∞ ∞
(De ∑ um/m = 1 y ∑ un/n = 1 se sigue, sin más, que ∑ vmn/mn = 1, es decir, la
m =1 n =1 m,n =1
normalización correcta se conserva). El problema tiene siempre solución, pues
vmn/m'n' = um/m' un/n' , por ejemplo, es siempre una solución (es fácil reconocer que
esta matriz es definida); pero de lo que se trata es de saber cuándo es la única.
Vamos a demostrar que ello ocurre siempre y sólo cuando una de las dos ma-
trices {um/m' }, {un/n' } es un estado. Demostremos primero la necesidad de esta con-
dición, es decir, la existencia de infinitas soluciones cuando ambas matrices corres-
ponden a mezclas. Se tiene en tal caso (cf. IV.2)
um/m' = a vm/m' + b wm/m' , un/n' = g vn/n' + d wn/n' ,
384
Fund_MAT_06.indd 384 7/5/18 18:32

La medición
(vm/m' y wm/m' son definidos y difieren no sólo en un factor constante; igualmente

vn/n' y wn/n' . Además
∞ ∞ ∞ ∞
∑ vm/m = ∑ wm/m = ∑ vn/n = ∑ wn/n = 1,
m =1 m =1 n =1 n =1
y a, b, g, d > 0, a + b = 1, g + d = 1), y fácilmente se comprueba que, en estas

condiciones,
vmn/m'n' = p vm/m' vn/n' + r wm/m' vn/n' + s wm/m' wn/n' + t wm/m' wn/n'
es solución si
p + s = a, p + t = b, p + r = g, s + t = d,
p, r, s, t > 0.
Las constantes p, r, s, t pueden elegirse de infinitas maneras. En efecto, a causa
de ser a + b = g + d, sólo tres de estas cuatro ecuaciones son independientes y así
cabe tomar, por ejemplo, r = g − p, s = a - p, t = (d - a) + p. Para que todos
esos valores sean >0, debe ser a - d = g - b < p < a, g, y sucede para infinitos
valores p. Dos sistemas de valores p, r, s, t diferentes conducen a diferentes
vmn/m'n' , pues los vm/m' vn/n' , …, wm/m' wn/n' son linealmente independientes por cuan-
to lo son vm/m' , wm/m' y asimismo vn/n' , wn/n' .
Demostremos ahora la suficiencia y supongamos, cual podemos hacerlo, que
um/m' , corresponde a un estado (la otra hipótesis se trata exactamente igual). Tene-
mos, por lo tanto, U = P[j], y dado que el sistema ortonormal completo era cual-
quiera, cabe admitir que j1 = j. La matriz de U = P[j ] es, evidentemente,
1
⎧ 1, para m = m' = 1
um/m' = ⎨ ;
⎩ 0, en caso contrario
luego
∞
⎧ 1, para m = m' = 1
∑ vmn/m'n = ⎨ 0, en caso contrario .
n =1 ⎩
∞
En particular, para m ≠ 1 es ∑ vmn/mn = 0; pero como en virtud del carácter defi-
n =1
nido de vmn/m'n' todos los vmn/mn son ≥ 0 —porque vmn/mn = (UΦmn, Φmn)—, en este
caso es vmnlmn = 0; luego (U𝚽mn, Fmn) = 0 y a causa del carácter definido de U
también será (UFmn, Fm'n' ) = 0 (cf. II.5, teorema 19), donde m' y n' son cualesquie-
385
Fund_MAT_06.indd 385 7/5/18 18:32

ra. Por lo tanto, de m ≠ 1 se deduce que vmn/m'n' = 0, y en virtud de la hermiticidad

esto se sigue también de m' ≠ l. Ahora bien, para m = m' = 1 resulta
∞
v1n/1n' = ∑ vmn/mn' = un/n' ;
m =1
luego la solución vmn/m'n' está unívocamente determinada, conforme habíamos afir-

mado.
Resumiendo, podemos formular ese resultado en los siguientes términos: Una
colectividad estadística en I + II cuyo operador es el U = {vmn/m'n' } está determinada
unívocamente por las colectividades estadísticas que induce en I solo y en II solo,
colectividades cuyos operadores son, respectivamente, el U = {um/m' } y el U = {un/n' },
siempre y sólo cuando aquél cumple las siguientes condiciones:
1. Se tiene
vmn/m'n' = vm/m' vn/n'
∞ ∞ ∞
(De traza U = ∑ vmn/mn' = ∑ vm/m ∑ vn/n se deduce que, multiplicando vm/m
m,n =1 m =1 n =1
y vn/n, por dos factores constantes recíprocos, podemos conseguir que sea
∞ ∞
∑ vm/m = ∑ vn/n = 1. Pero entonces se advierte que um/m' = vm/m' , un/n' = vn/n' .)
m =1 n =1
2. O bien es vm/m' = xm x‒m' (*) o bien vn/n' = yn ‒y n' . (En efecto, U = P[j], donde
∞
ϕ= ∑ xmϕm significa que um/m' = xm x‒m' y lo mismo para vm/m' . De mane-
m =1
ra en todo análoga resulta vn/n, para U = P[ξ], ξ = ∑y ξ ).
n n n
Llamaremos a U y U las proyecciones de U en I y en II, respectivamente.212

Consideremos ahora los estados de I + II, U = P[F]. Las correspondientes fun-
ciones de onda F (q, r) se pueden desarrollar según el sistema completo Fmn (q, r) =
= jm(q) ξn(r):
∞
Φ(q, r) = ∑ f mnϕm (q)ξn (r).
m,n =1
* En esta versión hemos procurado mantener constantemente un mismo criterio por lo que a la
notación de los elementos de matriz se refiere, que es el que el autor sigue en la primera parte de la
obra y sienta explícitamente en la Nota 60: amn = (Ajn, jm). Hemos creído preferible hacerlo así y no
seguir al autor en sus cambios de notación, no siempre puestos claramente de manifiesto. (N. del T.)
386
Fund_MAT_06.indd 386 7/5/18 18:32

La medición
Cabe, pues, sustituirlas por los coeficientes fmn (m, n = 1, 2, …) que están some-
∞
tidos sólo a la condición de que sea finita la ∑ f mn = Φ .
2 2
m,n =1
–
Definamos cuatro operadores, F, F , F * y F' mediante las relaciones
∫ ∫
F ϕ (q) = Φ(q, r)ϕ (q)dq, F ϕ (q) Φ(q, r)ϕ (q)dq
(*)
F *ξ (r) = ∫ Φ(q, r)ξ (r)dr, F' ξ (r)∫ Φ(q, r)ξ (r)dr,
*
operadores que son lineales, pero que tienen la particularidad de estar definidos,
los dos primeros, en EI y, los dos últimos, en EII, mientras que toman sus valores
–
en EII aquéllos y en EI éstos. La relación entre F y F * (e igualmente entre F y F' )
es la existente entre operadores adjuntos dado que, evidentemente (Fj, ξ) = (j, F *ξ)
(¡el producto interior del primer miembro hay que tomarlo en EII, el del segundo
en EI !). Puesto que la diferencia entre EI y EII es de poca monta desde el punto de
vista
– matemático, podemos aplicar los resultados – de II.11: así, por cuanto F y F *,
F y F' son operadores integrales, ∑(F ), ∑(F ), ∑(F *) y ∑(F' ) son iguales a
2
∫∫
2
Φ(q, r) dqdr = Φ = 1(! Φ en E I +II !)
y, por lo tanto, finitas. Luego todos estos operadores

– son continuos, más aun,
completamente continuos–y tanto F *F como F F' , son definidos, siendo traza
(F *F ) = ∑(F ) = 1, traza (F F' ) = ∑(F' ) = 1. Si de nuevo se tiene en –cuenta la di-
ferencia entre EI y EII, se echa de ver que F *F está definido en EI y F F' en EII.
∞
–
Dado que Fjm resulta ser igual a ∑ f mnξn(r) la matriz de F en las bases (j; ξ )
– n =1
es la { f mn} (el primer índice designa aquí –la columna, el segundo la fila !) y, aná-
logamente, la matriz de F * en las bases (ξ ; j) es la { fm n} (el primer índice indica
la fila, el segundo la columna). Luego, la matriz de F *F (base j) es
⎧∞ ⎫
⎨∑ f mn f m'n ⎬ .
⎩n =1 ⎭
–
Un cálculo en todo semejante prueba que la matriz de F F' (base ξ) es
⎧∞ ⎫
⎨∑ f mn f mn' ⎬ .
⎩m =1 ⎭
* Hemos modificado ligeramente el razonamiento que desarrolla Neumann (página 229 de la

∞
edición alemana) ante el hecho de que se basa en la igualdad F ϕm(q) = ∑ f mnξn (r) que no es cierta
n =1
si el sistema ortonormal completo ξn(r) es cualquiera como supone (pág. 225). (N. del T.)
387
Fund_MAT_06.indd 387 7/5/18 18:32

– parte, U = P[F] tiene, en el sistema Fmn(q, r) = jm(q)ξn(r), la ma-

Por otra
triz { fmn f m'n' }(*); luego sus proyecciones en I y II, U y U, tienen las matrices
213
⎧∞ ⎫ ⎧∞ ⎫
⎨∑ f mn f m'n ⎬, ⎨∑ f mn f mn' ⎬ , de suerte que
⎩n =1 ⎭ ⎩m =1 ⎭
–
U = F *F, U = F F',
y estas relaciones son independientes de la elección de las ϕm, ξn, porque tal son
U, U y F.
Los operadores U y U son completamente continuos y en virtud de II.11 y
IV.3 pueden escribirse en la forma
∞ ∞
U = ∑ w'k P[ψ k ], U = ∑ w"k P[ηk ],
k =1 k =1
donde las yk constituyen un sistema ortogonal completo en EI, las hk forman un

sistema de igual naturaleza en EII y todos los w'k, w"k son ≥ 0. Prescindamos ahora
en cada una de ambas fórmulas de los términos en que w'k = 0, w"k = 0 y nume-
remos de nuevo consecutivamente los restantes: k = l, 2, … En estas condiciones,
las yk, hn forman aún dos sistemas ortonormales, pero no necesariamente com-
∞ M' M"
pletos; en lugar de las ∑ aparecen sumas ∑ , ∑ en las que M' y M" lo mismo
k =1 k =1 k =1
pueden ser iguales a ∞ que ser finitas, pero todos los w'k, w"k son ahora > 0.
Consideremos una ψk. Se tiene Uψk = w'k ψk, de donde
F * Fψk = w'kψk, FF *Fψk = w'kFψk, U Fψk = w'k Fψk.(**)
Además
(Fψk, Fψl) = (Fψl , Fψk) = (F *Fψl , Fψk) = (Uψl , ψk) =

⎧ w' , para k = l
= w'l (ψl , ψk) = ⎨ k
⎩ 0 para k ≠ l
Fψ k
en particular, por lo tanto, ∙∙Fyk∙∙2 = w'k. En consecuencia, las constituyen
w'k
un sistema ortonormal en EII y a la vez son funciones propias de U con los mismos
valores propios que las yk respecto de U (esto es, w'k). Con otras palabras: cada
‒
* P[F] = (…, F) F, vmn/m'n' = [(jm' ξn' , F) F, jmξn] = (F, jmξn) (jm' ξn' , F) = fmn f m'n' (N. del T.)
** Son evidentes las igualdades
‒ ‒ ‒
Fj = F‒ · j‒, F‒j = F · j‒, F *ξ = F'ξ, F'ξ = F *ξ.
(N. del T.)
388
Fund_MAT_06.indd 388 7/5/18 18:32

La medición
valor propio de U lo es también de U y con el mismo orden de multiplicidad, por

lo menos. Basta permutar U y U en este enunciado para llegar a la conclusión de
que ambos operadores tienen los mismos valores propios con iguales órdenes de
multiplicidad. Los w'k y w"k' , por consiguiente, coinciden salvo acaso en el orden
en que se siguen; luego M' = M" = M, y es posible conseguir que w'k = w"k' = wk
sin más que cambiar la numeración de los w"k . Una vez hecho esto, evidentemen-
1
te podemos elegir en general ηk = Fψ k . Se tiene entonces
wk
1 1
F *ηk = F *Fψ k = ψ k .
wk wk
Luego:
1 1 212
ηk = Fψ k , ψ k = F *ηk .
wk wk
Completemos ahora el sistema ortonormal y1, y2, … hasta formar uno que
sea completo: y1, y2, …, y'1, y'2, … e igualmente el h1, h2, … hasta constituir
el sistema ortonormal completo h1, h2, …, h'1, h'2, … (cada uno de los sistemas
y'1, y'2, …, y h'1, h'2, … puede ser vacío, finito o infinito, y ello independiente-
mente el uno del otro). Puesto que cuanto llevamos dicho no depende de la elec-
ción de los sistemas ortonormales completos j1, j2, … y ξ1, ξ2, …, podemos
hacerlos coincidir con y1, y2, …, y'1, y'2, … y h1, h2, …, h'1, h'2, …, respectiva-
mente. Sea jm el elemento al que corresponde yk y ξn aquel al que corresponde
k k
hk (m1, m2, … son distintos entre sí y lo mismo n1, n2, …). Entonces es
F ϕ µk = wk ξνk , F ϕk = 0 para m ≠ µ1, µ2,…;
luego
⎧ wk , para m = µk , n = ν k , k = 1, 2, …,
f mn = ⎨
⎩⎪ 0, en los demás casos
o lo que es equivalente
M
Φ(q, r) = ∑ wk ϕ µk (q)ξνk (r).
k =1
Hemos conseguido así, mediante una adecuada elección de los sistemas jm(q)

y ξn(r), que cada fila y cada columna de la matriz {fmn} contenga como máximo
389
Fund_MAT_06.indd 389 7/5/18 18:32

un elemento diferente de cero (carece de importancia para lo que sigue que éste
sea incluso real y > 0, a saber, el wk ). ¿Cuál es el significado físico de este enun-
ciado formal?
Sea A un operador, j1, j2, … sus funciones propias y supongamos que todos
sus valores propios a1, a2, … son diferentes. Del mismo modo, sea B un operador
con las funciones propias x1, x2, … y los valores propios b1, b2, … (simples). El
operador A corresponde a una magnitud física de I, el B a una de II, y ambas son,
por lo tanto, simultáneamente medibles. Fácilmente se reconoce que los enun
ciados: «A tiene el valor am» y «B tiene el valor bn» determinan, juntos, el es
tado Fmn(q, r) = jm(q)xn(r), y que su probabilidad en el estado F(q, r) es
(P[F ] F, F) = ∙F, Fmn)∙2 = ∙fmn∙2. Por consiguiente, la proposición antes demostrada
mn
significa que A y B son mensurables simultáneamente y que cuando uno de ellos se

mide en F el valor del otro queda por esto unívocamente determinado. (En nin-
gún caso puede resultar un am para el cual todos los fmn sean nulos (n = 1, 2, …),
∞
∑ f mn
2
pues su probabilidad total no puede ser cero si efectivamente se ha en-
n =1
contrado; luego, para un n por lo menos, es fmn ≠ 0. Lo mismo vale para bn). En
otros términos: cierto es que en el estado F son posibles varios valores de A (cada
∞
∑ f mn
2
am para el cual > 0, es decir, para el que exista un n tal que fmn ≠ 0; como
n =1
máximo, todos los amn) y que igualmente lo son muchos valores de B (cada bn para
∞
∑
2
el cual f mn > 0, es decir,, para el que exista un m tal que fmn ≠ 0), pero F es-
m =1
tablece entre los valores de A y los de B una correspondencia biunívoca.
Llamemos m1, m2, … los posibles m y sean n1, n2, … los correspondientes n
posibles; se tiene
⎧ c ≠ 0, para m = µk , n = ν k , k = 1, 2, …
f mn = ⎨ k ,
⎩ 0 en caso contrario
de donde (M finito o ∞)
M
Φ(q, r) = ∑ ck ϕ µk (q)ξνk (r)
k =1
y, por lo tanto,
∞ ⎧ 2
um/n' = ∑ f mn f m'n ⎨ ck , para m = m' = µk , k = 1, 2, … ,
n =1 ⎩ 0 en caso contrario
390
Fund_MAT_06.indd 390 7/5/18 18:32

La medición
∞ ⎧ ck 2, para n = n' = ν k , k = 1, 2, …
un/n' = ∑ f mn f mn' ⎨ ;
m =1 ⎩ 0 en caso contrario
luego
M M
U = ∑ ck P[ϕµk ], U = ∑ ck P[ξνk ].
2 2
k =1 k =1
Por consiguiente, el resultado de la proyección de F en I o en II es en general

una mezcla: sólo en I + II es un estado. Y ello es así, porque F implica un enun-
ciado relativo a I + II que no cabe aplicar a I sólo o a sólo II, a saber: la corres-
pondencia biunívoca entre los valores de A y los de B.
Para cada F podemos, pues, elegir A y B, es decir, las jm y xn de modo tal que
se cumpla aquella condición, condición que, naturalmente, no queda satisfecha
por A y B arbitrarios. Cada estado F establece, por ende, una particular conexión
entre I y II, dependiendo de F las magnitudes A, B así vinculadas. No es difícil
resolver hasta qué punto determina F dichas magnitudes, es decir, las jm, xn: si
todos los ∙ ck ∙ son diferentes entre sí y ≠ 0, los operadores U y U (que están fijados
por F) determinan unívocamente las jm y xn, respectivamente. Dejamos a cargo
del lector la discusión general.
Finalmente haremos notar que, a causa de ser ∙ ck ∙2 > 0, para M ≠ 1 ni U ni U
son estados. Para M = 1, ambos lo son:
U = P[jm ], U = P[xn ]

1 1
y entonces es F (q, r) = c1jm (q) · xn (r). Ahora bien, el coeficiente c1 cabe incluirlo
1 1
en jm ; luego, la condición necesaria y suficiente para que U y U sean estados es

1
que F (q, r) sea de la forma j (q) x (r), en cuyo caso U = P[j] y U = P[x ].

En virtud de los resultados anteriores llamaremos la atención sobre los siguien-
tes puntos: Si I se halla en el estado j (q) y II en el estado x (r), I' + II se encuen-
tra en el estado F (q, r) = j (q) x (r). Por el contrario, si I + II se halla en un esta-
do F (q, r) que no es un producto j (q) x (r), I y II son mezclas, pero F establece
una correspondencia biunívoca entre los valores posibles de ciertas magnitudes en
I y en II.
3. Discusión del proceso de medición

Antes de acabar de discutir el proceso de medición con ayuda de los recursos
formales obtenidos en VI.2, y de acuerdo con las ideas desarrolladas en VI.1, nos
valdremos de los resultados de VI.2 para excluir una posibilidad de explicación del
carácter estadístico del proceso 1 (V.1) que ha sido propuesta repetidas veces. El
argumento en cuestión se apoya en la siguiente idea: Sea I el sistema observado,
391
Fund_MAT_06.indd 391 7/5/18 18:32

II el observador. Si, antes de la medición, I se halla en un estado U = P[j] y II, por

∞
el contrario, en una mezcla U = ∑ wn P[ξn], el sistema I + II es una mezcla U uní-
n =1
∞
vocamente determinada, a saber: U = ∑ wn P[Φn], Fn (q, r) = j (q) xn (r), expresión
n =1
ésta que se calcula fácilmente gracias a VI.2. Si ahora tiene lugar una medición de
una magnitud A en I, este proceso debe entenderse en el sentido de una interacción
de I y II, es decir, se trata de un proceso 2 (V.1) con un operador de energía H.
2π i 2π i
− tH tH
Sea t su duración; al final, U se ha transformado en U' = e h U h
e y, eviden-
temente,
∞
U ' = ∑ wn P⎡ 2 πi ⎤
.
n =1 ⎢ − h tH
⎣e Φn ⎥⎦
Si ahora cada F'n(q, r) fuese de la forma yn (q) hn (r), donde las yn son las funcio-
nes propias de A y las hn un sistema ortonomal completo cualquiera fijo, esta
intervención presentaría las características de una medición, pues transforma cada
estado j de I en una mezcla de las funciones propias yn de A. El carácter estadís-
tico procede de que, si bien antes de la medición el sistema I se encontraba en un
estado homogéneo, II era una mezcla y este carácter de II ha «contagiado» I + II
durante la interacción, en particular ha hecho una mezcla de la proyección de
I + II en I. Es decir, el resultado de la medición es indeterminado porque no se
conoce exactamente el estado del observador antes de llevarla a término. Cabría
concebir la realidad de un tal mecanismo, pues el conocimiento del observador
acerca de su propio estado acaso tenga límites dentro de las leyes naturales. Estos
se pondrían de manifiesto en los valores de los wn que debieran estar determinados
por el sólo observador, por lo tanto ¡independientes de j !
Y aquí se estrella ese intento de explicación: la Mecánica cuántica exige, en
efecto, que sea wn = (P[y ]j, j) = ∙(j, yn)∙2, es decir, ¡que los wn dependan de j !
n
De nada sirve tampoco el que exista eventualmente alguna otra descomposición

∞
U' = ∑ w'n P[Φ'n] (¡las F' (q, r) = jn (q) hn (r) son ortonormales!), puesto que los w'n,
n =1
salvo en el orden de sucesión, están unívocamente determinados por U' (IV.3) y,
por ende, son iguales a los wn.214
La no-causalidad del proceso 1, en consecuencia, no está motivada por un
incompleto conocimiento del estado del observador, y por esto, en lo que sigue,
lo supondremos siempre exactamente conocido.
Dediquémonos nuevamente al problema formulado al final de VI.1. El signi-
ficado de los símbolos I, II y III es el mismo que allí; para la investigación de I y
II desde el punto de vista de la Mecánica cuántica, usaremos de las mismas nota-
ciones que en VI.2, mientras que III queda fuera del cálculo (cf. lo dicho acerca
392
Fund_MAT_06.indd 392 7/5/18 18:32

La medición
de esto último en VI.1). Sea A la magnitud que propiamente hay que medir (en I )
y j1(q), j2(q), … sus funciones propias. Supongamos, además, que I se encuentra
en el estado j (q).
Si I es el sistema observado y II + III el observador, hemos de aplicar el pro-
ceso 1 y llegamos así al siguiente resultado: la medición hace pasar el sistema I del
estado j a uno de los estados jn (n = 1, 2, …); las respectivas probabilidades son
∙(j, jn)∙2, (n = 1, 2, …). Ahora bien: ¿Cómo reza la descripción cuando I + II es
el sistema observado y III el observador?
En este caso hay que decir: II es un instrumento de medida que indica sobre
una escala el valor de A (en I ); la posición del índice sobre la misma es una mag-
nitud física B (en II ) que es la propiamente observada por III (si II pertenece ya
al cuerpo del observador, en vez de escala e índice surgen los correspondientes
conceptos fisiológicos: por ej., retina e imagen sobre la retina, etc.); los valores
de B están en correspondencia biunívoca con los de A. Sean a1, a2, … los valores de
A, b1, b2, … los de B y admitamos que la numeración es tal que an está vinculado
con bn.
Inicialmente I se halla en el estado j (q) (desconocido) y II se encuentra en el
estado x (r) (conocido); luego I + II se halla en el estado F(q, r) = j (q) x (r). La
medición (considerada como efectuada por II en I ), es llevada a cabo durante el
tiempo t por medio de un operador de energía H (en I + II ), como en el ejemplo
2π i
− tH
anterior: se trata, pues, del proceso 2, que cambia F en Φ' = e h Φ. Desde el
punto de vista del observador III, sólo cabe hablar de una medición cuando se
cumplen las siguientes condiciones: si el observador III midiera las dos magnitudes
simultáneamente mensurables A y B (en I y en II, respectivamente, o ambas en
I + II ) acudiendo a un proceso 1, los pares de valores am, bn tendrían la probabi-
lidad 0 para m ≠ n, mientras que para m = n resultarían ciertas probabilidades wn.
Es decir, en tal caso basta «mirar» II, y A queda medido en I. La Mecánica cuán-
tica exige, además, que wn = ∙(j, jn)∙2.
Si así acontece, queda teoréticamente «explicada» la medición en cuanto tiene
lugar en II, es decir, el límite de que hablábamos en VI.I se ha corrido de I / II + III
a I + II / III.
El problema matemático es, pues, éste: Dado un sistema ortonormal completo
j1, j2, … en EI, hay que hallar un sistema de igual naturaleza x1, x2, … y un es-
tado x en EII, un operador de energía H en EI + II y, finalmente, un tiempo t, tales
que valga la siguiente proposición: si j es un estado arbitrario en EI y
2π i
− tH
F(q, r) = j (q) x (r) y si hacemos F' (q, r) = e h F(q, r), la función F' (q, r) es
∞
de la forma ∑ cn ϕn(q)ξn(r) (los cn dependen, naturalmente, de j). Además, debe
n =1
tenerse ∙ cn ∙2 = ∙(j, jn)∙2. (Que esto último equivale a la condición física más arri-
ba formulada, lo discutimos ya en VI.2.)
En lo que sigue, junto a j1, j2, …, daremos de antemano x1, x2, … y x y
2π i
− tH
veremos de determinar el operador unitario Δ = e h en vez de H.
393
Fund_MAT_06.indd 393 7/5/18 18:32

El problema matemático nos conduce de nuevo al ya resuelto en VI.2: allí nos

daban F' y demostramos la existencia de cn, jn, xn; ahora son fijos jn y xn, nos dan
F y cn en función de j y hemos de determinar D tal que, para F' = DF, resulten
precisamente estos cn, jn, xn.
Demostraremos que la determinación de ese D es, en efecto, posible, si bien,
dado que lo que nos importa es lo fundamental, es decir, la existencia de un
tal D, cualquiera que sea, no nos ocuparemos de las restantes cuestiones, de si los
2π i
− tH
Δ = e h de los más sencillos dispositivos de observación (por ejemplo, los
de III.4) gozan también de esta propiedad. Y la razón de ello estriba en que la
Mecánica cuántica debería dar resultados que contradirían burdamente la intuición
si esos D no cumplieran nuestras condiciones, por lo menos aproximadamente,
pues, conforme vimos, éstas equivalen de hecho al criterio intuitivo del carácter
de medición en un proceso, y los citados dispositivos poseen en cualquier caso el
carácter intuitivo de la medición. Es decir, lo que hay que indicar en lo que sigue
es un sólo D abstracto que satisfaga con exactitud las repetidamente citadas con-
diciones.215
Por lo tanto, sean jm (m = 0, ± 1, ± 2, …) y xn (n = 0, ± 1, ± 2, …) dos sistemas
ortonormales completos dados en EI y EII, respectivamente, y, para simplificar, su-
pongamos que el estado x coincide con x0 (sólo por razones técnicas, y sin que ello
tenga la menor transcendencia, hacemos recorrer a m y n, no la sucesión 1, 2, …,
sino la 0, ± 1, ± 2, …). Sea D el operador definido por
∞ ∞
Δ ∑ xmn ϕm (q)ξn (r) = ∑ xmn ϕm (q)ξm + n (r),
m,n = −∞ m,n = −∞
operador que es unitario, dado que tanto las jm (q) xn (r) cuanto las jm (q) xm + n (r)
forman un sistema ortonormal completo en EI + II. Ahora bien,
∞
ϕ (q) = ∑ (ϕ , ϕm ) ⋅ ϕm (q), ξ (r) = ξ0 (r);
m = −∞
luego
∞
Φ(q, r) = ϕ (q)ξ (r) = ∑ (ϕ , ϕm ) ⋅ ϕm (q)ξ0 (r),
m = −∞
∞
Φ' (q, r) = ΔΦ(q, r) = ∑ (ϕ , ϕm )ϕm (q)ξm (r),
m = −∞
Con esto hemos alcanzado nuestro propósito e incluso es cn = (j, jn).

Lograremos una mejor visión de conjunto acerca del mecanismo de este pro-
ceso si damos de él un ejemplo mediante concretas funciones de onda de Schrö-
dinger y, en vez de D, determinamos el propio H.
394
Fund_MAT_06.indd 394 7/5/18 18:32

La medición
Supongamos que lo mismo el objeto observado que el observador (es decir, I

y II, respectivamente) están caracterizados por una única variable —la variable q
el primero y la r el segundo— que recorre de modo continuo el intervalo -∞, +∞,
es decir, pensemos a uno y a otro como puntos materiales, con lo que sus funcio-
nes de onda tienen siempre la forma y (q), h (r). Admitiremos que sus masas, m1
y m2 son tan grandes que la parte del operador de energía que corresponde a la
⎡ 1 ⎛ h ∂⎞
2
1 ⎛ 1 ∂⎞ ⎤
2
energía cinética ⎢esto es, + ⎜ ⎟ ⎥ puede despreciarse. En

⎣ 2m1 ⎜⎝ 2π i ∂q ⎟⎠ 2m2 ⎝ 2π i ∂r ⎠ ⎦
estas condiciones, sólo queda de H la parte correspondiente a la energía de in
teracción, que es la decisiva para la medición. Elijamos para ella la forma particu-
h ∂
lar q .
2π i ∂r
La ecuación temporal de Schrödinger reza entonces, para la función de onda
yt = yt (q, r) de I + II,
h ∂ h ∂
ψ t (q, r) = − q ψ t (q, r),
2π i ∂t 2π i ∂r
⎛∂ ∂⎞
⎜⎝ + q ⎟⎠ ψ t (q, r) = 0
∂t ∂r
es decir,
yt (q, r) = f (q, r - tq).
Si para t = 0 es yt (q, r) = F (q, r), deberá tenerse f (q, r) = F (q, r), de donde
yt (q, r) = F (q, r - tq).
En particular, si los estados iniciales de I y II están representados por j (q) y x (r),

en virtud de nuestro esquema de cálculo será (elegido igual a 1 el tiempo t que en
él figura)
F (q, r) = j (q) x (r)
F' (q, r) = y1(q, r) = j (q) x (r - q).
Vamos a demostrar que este resultado puede utilizarse para una medición de la
posición de I por II, es decir, que las coordenadas q y r están acopladas. (Sólo cabe
conseguirlo aproximadamente, pues q, r tiene espectros continuos y, por ende, son
mensurables sólo con arbitraria precisión, pero no con exactitud absoluta.)
395
Fund_MAT_06.indd 395 7/5/18 18:32

Para ello admitamos que x (r) sólo es diferente de 0 en un estrecho intervalo

-e < r < e (es decir, que se conoce con gran exactitud la coordenada r del obser-
vador antes de la medición) y que está normalizada, cual, naturalmente, debe estar:
∫ ξ (r)
2
ξ = 1, es decir, dr = 1.
La probabilidad de que q se encuentre en el intervalo q0 - d < q < q0 + d y r en

el intervalo r0 - d' < r < r0 + d' es
q0 + δ r0 + δ ' q0 + δ r0 + δ '
∫ ∫ ∫ ∫
2 2 2
Φ' (q, r) dq dr = ϕ (q) ξ (r − q) dq dr.
q0 − δ r0 − δ ' q0 − δ r0 − δ '
Cuando q0, r0 difieren en más de d + d' + e, esta integral es nula, es decir, q y r
están tan fuertemente acoplados que la diferencia entre ambos nunca puede ser
> d + d' + e. Para r0 = q0 y si elegimos d' ≥ d + e, dicha integral es igual a
q0 + δ
∫
2
ϕ (q) dq en virtud de la hipótesis acerca de x. Pero como podemos elegir d,
q 0 −δ
d' y e arbitrariamente pequeños (¡sólo deben ser > 0!), esto nos dice que q y r están
acoplados con cuanta precisión se quiera y que la densidad de probabilidad tiene
el valor ∙j (q)∙2 que exige la Mecánica cuántica.
Luego las circunstancias de la medición, tal cual las habíamos discutido en
VI.1 y en este párrafo, se dan efectivamente.
La discusión de ejemplos más complicados, cual uno semejante al de cuatro
términos considerado en VI.1, o el contraste, por un segundo observador III, de
la bondad de la medición que II efectúa en I, etc., puede llevarse a cabo análoga-
mente y la dejamos a cargo del lector.
396
Fund_MAT_06.indd 396 7/5/18 18:32

Notas
(1) Así, por ejemplo, en lengua alemana existen, entre otras, las siguientes obras de síntesis:
Sommerfeld «Ergänzungsband zur 4. Aufl. v. Atombau und Spektrallinien». Braunsclweig, 1928.
Weyl «Gruppentheorie und Quantenmechanik». Leipzig, 1928, segunda edic. Leipzig, 1931.
Fraenkel: «Einführung in die Quantenmechanik». Berlín, 1929. Born y Jordan: «Elementare
Quantenmechanik». Berlín, 1930. Dirac: «Prinzipien der Quantenmechanik». (Trad. de W. Bloch).
Leipzig, 1931.
(2) Cf. Proc. Roy. Soc., London, vol. 109 (1925) y ss., en particular vol. 113 (1926). Indepen-
dientemente de Dirac, P. Jordan: Z. Physik, Bd. 40 (1926), y F. London: Z. Physih, Bd. 40 (1926),
establecieron la teoría sobre bases similares.
(3) Cf. Cap. IV y VI.3.
(4) Cf. Cap. V.
(5) Sus etapas principales fueron: el descubrimiento de las leyes de los quanta por Planck, en
el caso de la radiación «negra» en el vacío (cf., p. e., la exposición de Planck en su libro «Wärmes-
trahlung», Leipzig, 1906); la demostración de la naturaleza corpuscular de la luz (Lichtquantentheo-
rie) por Einstein (Ann. Physik [4], Bd. 17, [1905]), con lo que se daba el primer ejemplo de la
duplicidad ondas-corpúsculos, la cual, conforme hoy sabemos, rige toda la Microfísica); la aplicación
de estos dos grupos de leyes al modelo del átomo por Boiir; Fysisk Tidskr., Bd. 12 (1914); Z. Physik,
Bd. 6 (1920).
(6) Desde Epstein-Sommerfeld eran conocidas las leyes de cuantificación para los movimien-
tos multiperiódicos que había que añadir a las leyes mecánicas (cf., p. e., Sommerfeld: «Atombau
und Spektrallinien», Braunschweig, 1924). Por el contrario, era un hecho indiscutido que un punto
material móvil libremente, o un planeta sobre una órbita hiperbólica (en oposición a los que se
mueven sobre órbitas elípticas) no están «cuantificados». Una exposición completa de estos diversos
grados en el desarrollo de la teoría cuántica la encontrará el lector en los libros de Reiche: «Die
Quantentheorie, ihr Ursprung und ihre Entwicklung», Berlín, 1921, y Landé: «Fortschritte der
Quantentheorie», Dresden, 1922.
(7) Tal demostró Schrödinger: Ann, Physik [4], Bd. 79 (1926).
(8) Z. Physik. Bd. 37 (1926).
(9) Cf., las memorias citadas en Nota 2. Las memorias de Schrödinger han aparecido en for-
ma de libro: «Abhandlungen zur Wellenmechanik», Leipzig, 1928.
(10) El actual estado de cosas puede caracterizarse diciendo que la teoría es completamente
eficaz en tanto se trata de electrones aislados o de las capas electrónicas de los átomos o las molécu-
las, y ello lo mismo cuando se trata de fuerzas electrostáticas que en los procesos electromagnéticos
de emisión, propagación y absorción de la luz. En cambio, al tratar de los núcleos atómicos y en el
intento de sentar una teoría del electromagnetismo, general y relativista, parece conducir, a pesar de
los notables éxitos parciales, a grandes dificultades poco menos que insuperables si no se acude a
ideas esencialmente nuevas.
(11) Es sabido que en la Mecánica clásica el movimiento está totalmente regido por la función
de Hamilton, dado que ésta proporciona las ecuaciones del movimiento
∂H ∂H
q·l = , p·l = - (l = 1, …, k)
∂pl ∂ql
397
Fund_MAT_07_notas.indd 397 9/5/18 10:20

Antes del descubrimiento de la Mecánica cuántica se intentó incluir en ellas los fenómenos
cuánticos, aun conservando las ecuaciones del movimiento, mediante la imposición de «condiciones
de cuantificación» suplementarias (cf. Nota 6). Las ecuaciones del movimiento determinaban, . para
cada sistema de valores de las q1, …, qk, p1, …, pk correspondientes al instante t = 0, la ulterior evo-
lución temporal, la «trayectoria» del sistema en el «espacio 2k - dimensional de las fases» (q1 …, qk,
p1, …, pk) luego cada condición suplementaria viene a ser lo mismo que una limitación de todos los
valores iniciales posibles, de todas las órbitas posibles a un cierto conjunto parcial. (En correspon-
dencia con las pocas órbitas permitidas, también son pocos entonces los niveles de energía posibles).
Aunque la Mecánica cuántica ha acabado con ese método, sin embargo es claro de antemano que la
función de Hamilton también en ella ha de representar un gran papel, pues la experiencia toda
muestra la validez del principio de correspondencia de Bohr, según el cual la teoría de los quanta
debe dar resultados que coincidan con los de la Mecánica clásica en el caso límite de grandes núme-
ros cuánticos.
(12) Los tres últimos conceptos se toman del círculo de ideas acerca de la teoría de los quanta,
desarrollado sobre todo por Bohr, anterior a la Mecánica cuántica. Más tarde los analizaremos am-
pliamente desde el punto de vista de ésta (cf., la teoría de la luz de Dirac, expuesta en III.6). Dichos
conceptos se encuentran expuestos, en su conexión histórica, en las memorias de Bohr acerca de la
estructura del átomo, desde el año 1913 hasta 1916 (traducidas al alemán por H. Stintzing, Brauns-
chweig, 1921).
(13) Cual lo muestra un análisis matemático más exacto, se trata necesariamente de matrices
infinitas. No entramos aquí en los pormenores de tales matrices, puesto que más adelante conside-
raremos ampliamente sus propiedades. Basta por el momento que el cálculo algébrico-simbólico con
esas matrices se entienda en el sentido de las conocidas reglas para la adición y multiplicación de
matrices. En particular, entendemos por 0 y 1 la matriz nula y la matriz unidad, respectivamente
(todos los elementos de la primera son ceros, y también lo son los de la segunda salvo los de la dia-
gonal principal que son iguales a la unidad).
(14) Si Q1, P1, son hermíticos, no tienen por qué serlo ni Q1P1 ni P1Q1; pero en cambio sí lo
1 1
es siempre (Q 1P1 + P1Q 1). En el caso del operador Q12P1 y cabe considerar (Q 21P1 + P1Q 21) y
2 2
h
Q1P1Q1 (por casualidad estas dos expresiones son iguales si Q1 y P1 son tales que P1Q1 - Q1P1 = ⋅ 1),
2pi
1
en el de Q 21P 21 podemos utilizar (Q 21P 21 + P 21Q 21), Q1P 21Q1, P1Q 21P1, etc. (estas expresiones no coin-
2
ciden ni aun en el caso particular antes citado). No entramos en detalles tocante a este punto, dado
que el cálculo con operadores que desarrollaremos más tarde permitirá dominar esas circunstancias
mucho más claramente.
(15) Se tiene:
h ∂ h ∂ h
(q1y) = q1 y+ y.
2pi ∂q1 2pi ∂q1 2pi
h ∂ h ∂ h
Por consiguiente, ⋅ q 1 - q1 = ⋅ 1, si 1 es la operación idéntica (que trans-
2pi ∂q1 2pi ∂q1 2pi
h ∂H
forma y en sí misma); luego y q1 cumplen las mismas relaciones de permutación que las
matrices P y Q . 2 pi ∂q1
1 1
(16) Cf. sus dos primeras memorias en el libro citado en la Nota 9 (Ann. Phys. [4], Bd. 79,
1926).
(17) Cf. el primero de los trabajos de Schrödinger citados en la Nota 16. Definiremos rigu
rosamente el espectro y sus elementos en II.6 hasta 9.
(18) En la primitiva forma de la Mecánica matricial (cf., lo dicho más arriba) no se daba este
concepto general de estado, del que es un caso particular el de estado estacionario. El objeto de
dicha teoría eran sólo los estados estacionarios, coordinados a los valores propios de la energía.
398

Notas
(19) H = H (q1, …, qk, p1, …, pk) puede contener el tiempo t explícitamente. Claro está que
entonces no existirán, en general, estados estacionarios.
(20) Cuando sólo existe espectro discreto, cf. II.6.
(21) Este desarrollo, al igual que todos los que siguen, converge «en media». Abordaremos este
punto detalladamente en II.2.
(22) Que tales oscilaciones dejan de presentarse en los estados estacionarios y sólo en ellos, era
uno de los más importantes postulados fundamentales de Bohr en 1913. La Electrodinámica clási-
ca está en contradicción con esto.
(23) Cf. el segundo trabajo de Schrödinger citado en la Nota 16.
(24) Cf. Nota 7.
(25) Cf., p. e., los §§ 20, 23 del libro de Born y Jordan citado en la Nota 1.
(26) A causa de ser
S-1 ⋅ 1 ⋅ S = 1, S -1 ⋅ aA ⋅ S = a ⋅ S -1AS,
S -1 ⋅ (A + B) ⋅ S = S -1AS + S -1 BS, S-1 ⋅ AB ⋅ S = S -1 AS ⋅ S -1 BS,
para todo polinomio de matrices P(A, B, …) vale la relación
S -1 ⋅ P(A, B, …) ⋅ S = P(S -1 AS, S -1 BS, …).
Si elegimos para P el primer miembro de las relaciones de permutación,
– de lo que –precede se
sigue la invariancia de dichas relaciones; si elegimos para P la función H, obtenemos S -1H S = H.
(27) dmn = 1 para m = n e = 0 para m ≠ n, es el conocido símbolo de Kronecker-Weierstrass.
(28) Las columnas s1r, s2r, … de la matriz S, cuyos subíndices corresponden a wr = l, forman
un sistema completo de soluciones y deben ser linealmente independientes por cuanto son columnas
de una matriz que posee una inversa.
(29) Dado que una permutación arbitraria de las columnas de S, junto con la correspondiente
permutación de las filas de S -1, permuta del mismo modo los elementos diagonales de H, de hecho
el orden en que se siguen los w1, w2, … ni está definido ni cabe determinarlo.
(30) La teoría de las ecuaciones integrales ha adquirido su forma definitiva en manos de Fre-
dholm y Hilbert. Una detallada exposición, como también bibliografía, se encuentra en el libro
de Courant-Hilbert «Methoden der mathematischen Physik», Berlín, 1931.
(31) Más exactamente: si tomamos por base el concepto de integral de Lebesgue, debe ser
h(q) = 0 para q ≠ 0, salvo en un conjunto de medida—L nula, es decir, salvo en un tal conjunto
es h(q) = 0.
(32) Hay que imaginar el área limitada por d (q) como infinitamente estrecha e infinitamente
a −aq 2
alta. Este es, por ejemplo, el comportamiento límite de la función e para a → + ∞, pero no
por eso es tanto menos imposible. π
(33) Una tal unificación persiguió E. H. Moore, el creador del llamado «Análisis general», por
cierto que mucho antes de la Mecánica cuántica. Cf. acerca de esto el artículo de Hellinger-
Toeplitz en la Math. Enzyklopädie. Vol. II.3.9, Leipzig, 1927.
(34) Es un hecho sobre el que repetidas veces se ha llamado la atención que, en la teoría de
Schrödinger, lo esencial en la función de onda j es que haga finita la integral ∫! … ∫ ϕ (q1, …, qk ) 2
Ω
dq1 … dqk. Así la función j puede, por ejemplo, presentar singularidades, acaso hacerse infinita, con
tal que dicha integral permanezca finita Un ejemplo instructivo de esto lo constituye el átomo de
hidrógeno en la teoría relativista de Dirac, cf. «Proc. Roy, Soc.», Lond. Vol. 117, 1928; además, W.
Gordon: Z. Physih Bd. 48 (1928).
(35) En el curso de nuestras consideraciones acerca del espacio de Hilbert quedará demostra-
do este teorema (cf. II.2.3, en particular teorema 5 en II.2). Es digno de mención que la mitad del
mismo, suficiente para muchos fines y más fácil de demostrar, es la que afirma el isomorfismo de FΩ
y una cierta parte de FZ; se la encuentra por primera vez en Hilbert, Gött. Nachr., 1906. Así Schrö-
dinger se apoyó sólo en ella para su primitiva demostración de la equivalencia (cf. Nota 7).
399

(36) Se tiene
qm ⋅ qn ⋅ ϕ (q1, …, qk ) = qn ⋅ qm ⋅ ϕ (q1, …, qk ),
∂ ∂ ∂ ∂
ϕ (q1, …, qk ) = ϕ (q1, …, qk ),
∂qm ∂qn ∂qn ∂qm
∂ ∂ ⎧ϕ (q1, …, qk ) para m = n,
qn ⋅ ϕ (q1, …, qk ) − qn ⋅ ϕ (q1, …, qk ) = ⎨
∂qm ∂qm ⎩ 0, para m ≠ n,
de donde resultan inmediatamente las relaciones pedidas entre operadores.

(37) La caracterización del En por A, B, C(n) se debe a Weyl (cf., p. e., «Raum, Zeit, Materie»,
Berlín, 1921). Si, en vez de En, se quiere obtener el E∞, deberemos sustituir, naturalmente, C(n) por
C (∞); pero entonces son necesarios D, E, cf., lo dicho en el texto más abajo.
(38) Además del punto origen o del vector nulo 0 de E, existe el número 0, de suerte que se
aplica el mismo símbolo a dos objetos diferentes. Sin embargo, las circunstancias son tales que de
ello no puede originarse error alguno.
(39) Bastaría postular que, junto con f , también af pertenece a B y con f , g, también f + g. En
estas condiciones, a la vez que f 1, …, f k, pertenecen a B a1 f1, …, ak fk sucesivamente, a1 f1 + a2 f 2,
a1 f 1 + a2 f 2 + a3 f 3, …, a1 f 1 + … + ak f k.
(40) De la simetría hermítica se sigue ya el carácter real de ( f, f ), pues ésta nos dice que para
f = g, ( f , f ) = ( f , f ).
(41) Si f tiene las componentes x1, …, xn, de acuerdo con lo que se dice en g ), II.1. (¡limitán-
donos a un número de componentes finito!) es
n
∑ xν
2
(f , f ) = ,
ν =1
es decir, la longitud euclídea ordinaria.

(42) Dado que ( f, f ) es real y ≥ 0, ∙ f ∙ es real y de la raíz cuadrada se elige la determinación
positiva. Lo mismo vale, por lo tanto, para ∙ f - g ∙.
(43) Según el teorema 2, aplicado aquí a f - g, g - h, ha de ser necesariamente 0 o f - g = 0,
c
es decir, g = f, o g - h = 0, esto es, g = h, o g - h = c ( f - g) (c real y > 0), es decir g = f +
1 c c + 1
+ h. En todo caso es, pues, g = a f + (1 - a)h, donde a = 1 ó 0 o , respectivamente, lo
c+1 c+1
que nos dice, traducido al lenguaje geométrico, que el punto g pertenece al segmento f , h.
(44) A menudo se da del punto de acumulación f la definición siguiente: para cada e > 0 exis-
te un f elemento de C tal que ∙ f - g ∙ < e. Se demuestra le equivalencia de ambas definiciones lite-
ralmente como en el Análisis numérico.
(45) Para abreviar aplicamos el «terminus technicus» topológico (cf., p. e., B. Hausdorff
«Mengenlehre», Berlín, 1927), el cual se explica en el texto más adelante.
(46) Se tiene, en efecto, f = ( f , f ) = 1.
(47) Vemos, pues, que los sistemas ortogonales completos corresponden a los sistemas de coor-
denadas cartesianos del En (es decir, a los vectores unitarios que determinan las direcciones y sentidos
de sus ejes).
(48) Por causa de su carácter lineal debe contener a {C} y, pues es cerrada, también los puntos
de acumulación de {C}.
(49) Sea j1, j2, … completo; j2, j3, … no lo es ya ¡y, sin embargo, es infinito!
(50) Considérese que una sucesión doble gmn(m, n = 1, 2. …) puede también disponerse for-
mando una sucesión simple: g11, g12, g21, g13, g22, g31, …
400

Notas
(51) Este capítulo no es necesario para entender los que siguen.

(52) P. e., Carathéodory: «Vorlesungen über reelle Funktionen», Leipzig, 1927, en particular,
pp. 237, 274; Kamke: «Das Lebeguesche Integral», Leipzig, 1925.
(53) De modo general
∙ x + y ∙2 = (x + y) (x– + –y ) = xx– + yy– + (xy– + x–y) = ∙ x ∙2 + ∙ y ∙2 + 2 Re (xy–).
(54) Esto es corriente en la teoría de la integral de Lebesgue.

(55) Aunque a varía de modo continuo, se trata de una suma y no de una integral, pues en la
suma ¡sólo aparece una sucesión de estas a !
(56) (x(a), y(a)) lo definimos, claro está, como igual a ∑ x(α ) y(α ).
α
(57) Este es el teorema de la teoría de conjuntos acerca de la «no-numerabilidad del continuo
numérico». Cf., p. e., el libro de Hausdorff citado en la Nota 45.
d
(58) Sea, por ejemplo, E∞ un FΩ, donde Ω es el espacio de todas las x reales, -∞ < x < ∞).
dx
es una función dependiente de función, es decir, un operador, pero sólo está definido en nuestro
2
∞ d
sentido para aquellas f (x) que, primero, son derivables, y segundo, tales que la ∫−∞ f (x) dx es
dx
finita. (Cf. II.8, donde se discute esto con más exactitud.) En estas condiciones, en general no exis-
2 2
d 2 ∞ d
tirá f (x)
dx 2 3
ni tiene por qué ser convergente ∫−∞ dx 2
f (x) dx . Así se comporta por ejemplo,
2
f (x) = x 2 e −x .
(59) En virtud de lo dicho en II.3 (al discutir la condición E) basta que se puedan aproximar
cuanto se quiera las combinaciones lineales de las siguientes funciones: f (x) = 1 en un conjunto
constituido por un número finito de intervalos e igual a 0 fuera de él. Ello, a su vez, se consigue si
podemos aproximar cada una de estas funciones, y esto se logra cuando cabe aproximar funciones
que son iguales a 1 en un único intervalo (las demás son sumas de éstas). Sea a < x < b el intervalo
en cuestión; la función
f (x) = 0 para x < a − ε o x > b + ε,

π a−x
f (x) = cos 2
, para a − ε ≤ x ≤ a,
2 ε
π x − b
f (x) = cos2 , para b ≤ x ≤ b + ε ,
2 ε
f (x) = 1 para a < x < b,
satisface, en efecto, nuestras condiciones de regularidad y constituye una aproximación tan buena
cuanto se quiera para e (> 0) suficientemente pequeño.
(60) Esta consideración no es rigurosa, ya que aplica el carácter lineal a sumas de infinitos su-
mandos. Sin embargo, cabe completarla como sigue: Sean j1, j2, …, un sistema ortonormal com-
∞ ∞
pleto y A, A* operadores adjuntos; sea f = ∑ xνϕν , Af = ∑ yνϕν . Se tiene entonces:
ν =1 ν =1
∞
yµ = (Af , ϕ µ ) = ( f , A * ϕ µ ) = ∑ ( f , ϕν ) (A * ϕ µ , ϕν )
ν =1
(según teorema 7, g )
∞ ∞
= ∑ xν (ϕ µ , Aϕν ) = ∑ (Aϕν , ϕ µ )xν .
ν =1 ν =1
401

∞
Luego, si hacemos amn = (Ajn, jm) se tiene la fórmula del texto, yµ = ∑ aµν xν y queda demos-
trada, además, la convergencia absoluta. ν =1
En el espacio hilbertiano de las sucesiones x1, x2, …, las sucesiones j1 = {1, 0, 0, …},
j2 = {0, 1, 0, …}, … constituyen un sistema ortonormal completo, como fácilmente se reconoce.
∞ ∞
Para f = {x1, xot …} es f = ∑ xνϕν , para Af = {y1, y2, …}, Af = ∑ yνϕν , con lo que se consigue
ν =1 ν =1
totalmente el enlace con el texto.
Al formar a m*n para A*, se ve que
a*mn = (A*jn, jm) = (jn, Ajm) = (Ajm, jn) = a–nm
(61) (Af, f ) es siempre real, porque es igual a
(A* f , f ) = (f, Af ) = (Af, f )
(62) Por consiguiente, U y U * deben tener sentido doquier. Además, son inversos entre sí y,
por ende, ambos toman todo valor, y cada valor lo toman una sola vez.
∞ ∞
∫−∞ ϕ (q)
2
∫−∞ q 2 ϕ (q)
2
(63) Para una dq dada, tanto dq como
2
∞ d
∫−∞ dq
ϕ (q) dq
pueden hacerse tan grandes cuanto se quiera. Por ejemplo: j (q) = a e-bq2; las tres integrales son fini-
1 3 1
− −
tas (¡b > 0!), pero proporcionales, respectivamente, a a 2b 2 , a 2b 2 , a 2b 2 , de manera que el valor de
dos de ellas puede ser prefijado arbitrariamente.
(64) Gött. Nachr., 1906.
(65) Ello resulta del carácter hermítico de R en la transformación
⎛ R f + g , f + g ⎞ − ⎛ R f − g , f − g ⎞ = (Rf , g) + (Rg, f ) =
⎝ 2 2 ⎠ ⎝ 2 2 ⎠ 2
(Rf , g) + ( f , Rg) (Rf , g) + (Rf , g)
= = = Re(Rf , g)
2 2
(Obsérvese el tercer paso).

(66) Cf., la quinta memoria en el libro citado en la Nota 9. (Ann. Phys. [4] Bd. 80 (1926)).
(67) De propósito no abordamos las delicadas cuestiones de convergencia, que tampoco fueron
formuladas con exactitud en las formas originales de las teorías matricial y ondulatoria. Por lo demás,
ya las resolveremos más tarde (cf., p. e., II.9).
(68) Lo último es claro, sin más, sólo para un H continuo y doquier pleno de sentido; es decir,
cuando de fn → f se sigue que también H f n → H f . Sin embargo, también basta, como se reconoce
fácilmente, la siguiente propiedad menos restrictiva: de fn → f y H f n → f * se sigue H f = f *. (De un
operador H que goza de ella se dice que es «cerrado». Cf., el trabajo del autor en Math. Ann. Bd.
102, 1929). Esta se da siempre en los operadores de la Mecánica cuántica, incluso en los disconti-
nuos. Más exactamente: de un operador hermítico no cerrado puede hacerse un operador hermítico
cerrado mediante una prolongación unívoca de su dominio de definición (lo que, por ejemplo, en
el caso de la continuidad no es posible). Cf. II.9, p. 104.
(69) Cf., p. e., el método de Schrödinger para el estudio del átomo de hidrógeno, loc. cit.
Nota 16.
402

Notas
(70) Cf. loc. cit. Nota 64.

(71) Cf., p. e., Courant-Hilbert, loc. cit. Nota 30. n
(72) Es decir, E(l ) = [emn(l )], E (l ; x, y) = ∑ eµν (l)xν yµ , de donde
µ ,ν =1
eµν (l) = ∑ xρµ xρν ,

λρ ≤l
(73) Para el concepto de integral de Stieltjes, cf. Perron: «Die Lehre von den Kettenbrüchen»,
Leipzig, 1913; además, en atención a las necesidades de la teoría de los operadores, Carleman:
«Équations intégrales singulières», Uppsala, 1923. A los lectores menos interesados en esas cuestiones
les basta con la definición: Para cada división Λ0, Λ1, Λk del intervalo (a, b)
a ≤ Λ0 < Λ1 < … < Λk ≤ b,

se forma la suma
k
∑ f (Λτ ){ g(Λτ ) − g(Λτ −1)}.
τ =1
Cuando para divisiones cada vez más y más tupidas esta suma converge, se dice que la integral
b
∫a f (x) dg(x) tiene sentido y es igual a dicho límite. (Para g(x) = x, la integral de Stieltjes se trans-
forma en la conocida integral de Riemann.) ∞
En nuestro caso, por lo tanto, la ecuación deducida nos dice que
∞ ∫−∞ λ dE(λ ; x, y) existe y es
igual a ∑ hµν xν yµ .
µ, ν =1
(74) Dados los números reales a, b, …, e, en número finito, Mín(a, b, …, e) es el menor de

ellos, Máx(a, b, e), el mayor.
(75) Cf., loc. cit. Nota 64, como también el citado libro de Carleman (Nota 73). Mucho ten-
dremos que ocuparnos aun de este «espectro discreto». Cf. II.8.
(76) Por A(l) → B (A(l) y B son operadores del E∞, l un parámetro) entendemos que para
todo f de E∞ es A(l)f → Bf . Se trata, pues, de una abreviatura para los enunciados de convergencia
en el espacio hilbertiano.
(77) Esto se sigue de la definición de la integral de Stieltjes dada en la Nota 73. Para la demos-
tración, cf. las obras allí citadas.
(78) Cf. Math. Arm. Bd., 102 (1929).
(79) Esto se demostró solamente para sucesiones l. Sin embargo, el límite debe ser el mismo
para todas (l → l0 y l < l0 o l > l0), pues dos cualesquiera de entre ellas se pueden reunir en una
sola, y dado que ésta tiene límite, las dos partes que la integran deben tener también el mismo lími-
te. De aquí se sigue que la convergencia (hacia el límite común correspondiente a todas las sucesio-
nes) tiene lugar igualmente para una variación continua de l.
(80) Esto es la exacta transcripción de la definición de E(l; x, y) dada en II.7.
(81) Como prueba la construcción llevada a cabo al demostrar el teorema 10, se tiene P[j] f = ( f,
j)j (cuando ∙j ∙ = l), de donde
∙P[j] f ∙ = ∙(f, j)∙ = ∙(j, f )∙
(82) Se tiene (teorema 7)
f = ∑ ( f , ϕ ρ ) ⋅ ϕ ρ = ∑ P[ϕρ ] f ,
ρ ρ
lo cual, por otra parte, se deduce también de lo dicho al final de II.4.
403

(83) Según la Nota 78,
∞ k
∫ λ 2 d ⎛ ∑ xρ ⎞ = lim ∑ Λ2τ ∑ xρ .
2 2
−∞
⎝ λρ ≤ λ ⎠ τ =1 Λτ −1 < λρ ≤Λτ
Cuando sin excepción es Λt2 - Λ2t - 1 < e (es decir, para una división Λ0, …, Λk suficientemente
∞
∑ xρ
2 2
tupida), la suma anterior varía en menos de e ⋅ =ε f cuando la sustituimos por
ρ =1
k
∑ ∑ ∑
2 2
λρ2 xρ = λρ2 xρ
τ =1 Λτ −1< λρ ≤ Λτ Λ0 < λρ ≤ Λk
∞
∑ λρ2 xρ
2
y ésta, a su vez, difiere de en tan poco cuanto se quiera para Λ0 suficientemente pequeño
ρ =1
y Λk suficientemente grande. Esta última suma es, pues, el límite buscado, es decir, el valor de la
integral.
Igual exactamente se demuestra la fórmula integral que sigue
(84) En este punto se separa el método que seguimos, matemáticamente correcto, de la técni-
ca simbólica de Dirac (cf., p. e., su libro citado en la Nota 1). En ella se consideran efectivamente
como soluciones las f tales que (q - l )f (q) = 0 (para mayor sencillez hacemos l = j = 1, qj = q); pero
como cada ( f, g) = ∫f (q)g(q)dq = 0 y ha de ser f ≠ 0, es necesario imaginar que f (q) es infinito en el
punto q = l (¡el único en que es ≠ 0!) y en grado tal que (f, g) ≠ 0. Ahora bien, dado que para q ≠ l
es f (q) = 0, la ∫f (q)g(q)dq sólo puede depender de g (l), y es claro que, en virtud de la propiedad
aditiva de la integral, aquélla debe ser proporcional a g(l), es decir, = cg(l), donde c ≠ 0. Sustitu-
1
yendo f (q) por f (q) se consigue que el factor de proporcionalidad sea la unidad. En consecuencia,
c
tenemos una función ficticia f (q) tal que ∫f (q)g(q)dq = g(l).
Basta, naturalmente, considerar el caso l = 0. Llamemos entonces d(q) a f(q); la función d(q)
está definida por
∆. ∫
qd(q) ≡ 0, d (q)f (q)dq = f (0).
La solución para l cualquiera es d(q - l). Aunque un a función d que goce de la propiedad ∆
no existe, existen sí sucesiones de funciones cuyo comportamiento tiende al de la función d (el lí-
mite, claro está, no existe), por ejemplo:
{ }
1
, para ∙ x ∙ < e
fe(q) = 2e para e → 0,
0, para ∙ x ∙ ≥ e
o bien
a − ax 2
f a (q) = e , para a → +∞
π
(Cf. también 1.3, en particular Nota 32).

(85) La realización exacta de esta idea (que hay que estimar aquí sólo como conjetura heurís-
tica) se encuentra en las Memorias de Hellinger (J. f. Math. Bd. 136, 1909) y Weyl (Math. Ann.,
Bd. 68, 1910).
(86) Naturalmente sólo el éxito en la aplicación física puede justificar este punto de vista y su
pretensión de validez en la Mecánica cuántica.
404

Notas
(87) Plancherel: Circ. Math. di Pal. Vol. 30 (1910); Titchmarsh: London Math. Soc. Proc.
Vol. 22 (1924).
h d
(88) Es decir, E'(l) corresponde no al propio A' = , sino a un operador cuyo dominio
2pi dq
de definición abarca el de A' y que en éste coincide con A'. Cf. para esto II.9.
(89) Se anulan todos los coeficientes de Fourier y, por lo tanto, también la función. Cf., p. e.,
Courant-Hilbert (loc. cit. Nota 30).
(90) Es decir, M-1M f (q) = f (q) (basta definir f (q) como igual a 0 para q < 0 y aplicar los an-
teriores teoremas); pero no siempre es MM-1F( p) = F( p), porque en general ∙M -1F ∙ < ∙F ∙ y, por
ende, ∙MM -1F ∙ < ∙F ∙. Luego M -1M = 1 y MM -1 ≠ 1, esto es, M-1 no es realmente el inverso de M.
(No puede haber tampoco ningún otro, pues de haberlo éste debiera ser tal que M -1M = 1, es decir,
debería coincidir con M-1.) En consecuencia, cabe concluir de E'(l) = ME(l)M-1 por ejemplo,
que E' 2(l) = E'(l) (pues en ello sólo interviene M -1M), pero en cambio, E'(l) → MM -1 ≠ 1
(para l → + ∞).
(91) Esto debiera demostrarse, propiamente, de modo no simbólico, acudiendo a la ecuación
rigurosa
∫
(Af , g) = λ d [E(λ) f , g].
En tal caso, el cálculo discurre así:
∫ ∫
(AFf , g) = λ d[E(λ)Ff . g] = λ d [FE(λ) f , g] =
∫
= λ d [E(λ) f , Fg] = (Af , Fg) ≡ (FAf , g).
De aquí se sigue AF = FA.

(92) Esto se deduce de la ecuación, válida en general para la integral de Stieltjes,
∫ f (λ) ⋅ d ⎡⎢⎣∫ g(λ') · dh(λ')⎤⎥ =

⎦ ∫ f (λ)g(λ) ⋅ dh(λ),
λ
ecuación cuya validez parece obvia sin más en virtud de la relación de reciprocidad entre d e
autor dio de ella una demostración rigurosa: Annals of Mathematics, vol. 32 (1931).
∫ . El
(93) Es decir,
∞ ∞
(Bf , g) = ∫
−∞
r(λ)d[E(λ)f , g], (Cf , g) = ∫−∞
s(λ)d [E (λ) f , g].
(94) El autor estableció rigurosamente este concepto de función en Annals. of Math., vol. 32
(1931). F. Riesz fue el primero que definió, mediante el paso al límite partiendo de polinomios, las
funciones de operadores más generales.
(95) La teoría de los operadores hermíticos no acotados a la que, junto con la teoría de Hilbert
de los operadores acotados, deberemos referirnos particularmente en lo que sigue, fue establecida
por el autor (loc. cit. Nota 78). M. Stone obtuvo independientemente resultados semejantes (Proc.
Nat. Ac., 1929 y 1930).
(96) Math. Ann., Bd. 69 (1911).
(97) También el conjunto de las funciones f (q) analíticas en -∞ < q < +∞ (con integrales
∞ ∞
∫−∞ f (g) dq, ∫−∞ f ' (q) dq, … finitas) es denso doquier en el E∞. En efecto, según II.3, D, el con-
2 2
405

{
junto de las combinaciones lineales fa, b(q) = 1, para a < q < b
0, en caso contrario }
es donde quiera denso; luego
basta demostrar que éstas pueden aproximarse cuanto se quiera mediante aquéllas f (q). Efectivamente
1 1 (x − a)(x − b) 1
f a(,bε) (q) = − th = (x − a)(x −b)
2 2 ε 2
e ε +1
es de esa clase y converge para e → + 0 hacia fa,b(q).

(98) De nuevo basta aproximar las fa,b(q), 0 ≤ a < b ≤ 1 con funciones de A0. Como tales pue-
den aplicarse, por ejemplo,
1 1 ⎡ 1 (x − a − ε )(x − b + ε ) ⎤
f a(,bε) (q) = − th ⎥,
2 2 ⎢⎣ ε x(1 − x) ⎦
donde e → + 0.
(99) Dado que podemos imaginar aproximada la función f (l) mediante polinomios, basta
considerar éstos y, por lo tanto, sus elementos, las potencias: f (l) = ls (s = 0, 1, 2, …). Además,
podemos suponer que A es una matriz diagonal, puesto que nada altera aquí la introducción de una
transformación unitaria. Ahora bien, los elementos diagonales de A son sus valores propios; luego
esos elementos son precisamente l1, …, ln. Por consiguiente, sólo hay que demostrar que As es
también una matriz diagonal y que tiene por elementos diagonales l1s, …, lns; pero esto es evidente.
(100) Que estas propiedades determinan el carácter hermítico o unitario de un operador,
nuevamente basta comprobarlo en las matrices diagonales. La matriz diagonal A* con los elementos
diagonales l1, …, ln es la conjugada transpuesta de la matriz diagonal A, cuyos elementos diagona-
les son l1, …, ln; luego A = A* nos dice que l1 = l1 …, ln = ln, es decir, que l1,…ln son reales.
Y, a su vez, AA* = A*A = 1 nos dice que l1l1 = 1, …, lnln = 1 esto es, que
∙l1∙ = … = ∙ln∙ = 1.
(101) Para la demostración de este hecho, cf. el trabajo del autor, loc cit., Nota 78; además,
A. Wintner: Math. Z., Bd. 30 (1929). —La convergencia absoluta de todas las integrales
1
∫ 0
f (σ )d[E (σ )f , g] en las que f (s)es acotada, se reconoce como sigue: basta considerar Re(E(s)f , g),
puesto que la sustitución de f , g por i f , g cambia ésta en Im(E(s) f , g). A causa de
f + g f + g⎞ ⎛ f − g f − g⎞
Re[E (σ ) f , g] = ⎛ E (σ ) , − E (σ ) , ,
⎝ 2 2 ⎠ ⎝ 2 2 ⎠
1
hay que estudiar solamente los (E (s) f, f ). Pero en ∫0 f (σ )d[E (σ )f , f ] el integrando es acotado y
la función de s que sigue al símbolo d es monótona; luego es obvia nuestra afirmación.
(102) Es decir, aplicamos las integrales de Stieltjes a los elementos del E∞ en vez de aplicarlas
a los números. Todas nuestras relaciones deben entenderse en el sentido de que valen cuando se
elige un elemento fijo g del E∞ y se sustituye cada uno de los elementos del E∞ que en ellas figuran por
su producto interior por g, y ello cualquiera que sea g. En comparación con la integral de Stieltjes
aplicada a operadores en II.7, el método aquí seguido podría calificarse de semisimbólico: en vez
de elegir arbitrariamente un solo g del E∞, en II.7 cabía elegir dos f, g, y en vez de (…, g) formar
(… f, g) (donde están los …, se coloca el operador).
(103) Se supone aquí tácitamente que existe realmente un tal operador ∞
para cada descomposi-
2
ción de la unidad F(l). En otros términos, se admite que para cada ∫−∞ λ 2 d F(λ)f finita cabe
406

Notas
∞
hallar un f * tal que, para todo g, (f *, g) = ∫ λ d[F(λ)f , g], y que el conjunto de esos f es doquie-
−∞ –
ra denso. (El carácter hermítico del operador así definido se deduce entonces de S 3: se permutan
entre sí f y g en la última ecuación y se forman los complejos conjugados). Estas dos aserciones se
encuentran demostradas en loc. cit. Nota 78.
(104) Para que el problema de valores propios relativo a A fuese siempre resoluble, debiera
poder seguirse de aquí el carácter unitario de U, es decir, D = F = En o E∞, respectivamente. No se
da este caso en el E∞, conforme demostraremos a partir de la existencia de operadores A no-máximos.
En el En, por el contrario, debe presentarse dicha circunstancia, lo que, por lo demás, es fácil ver
directamente: toda variedad lineal del En es cerrada; luego también lo es la de los j - Uj, y dado
que es doquier densa ha de coincidir con En. El conjunto D de los j no tiene menos dimensiones
que su imagen lineal, el conjunto de los j - Uj; por lo tanto, el número de dimensiones de D es
el mayor posible, es decir, n. El mismo debe ser el del conjunto F, por cuanto es imagen lineal uní-
voca de D. Si n es finito, de aquí se sigue que D = F = En.
(105) De todos modos, como demostró el autor (loc. cit. Nota 78), el siguiente operador es
máximo, pero no hipermáximo: Sea E∞ el espacio de todas las f (q) definidas en 0 ≤ q < +∞ y tales
∞ d
que ∫0 f (q) dq es finita; R el operador i que, por ejemplo, está definido para todas las f (q)
2
∞
dq
continuas y derivables tales que ∫0 f ' (q) dq es finita y f (0) = 0 y que se prolonga luego hasta hacer
2
2p
de él un operador cerrado. Este operador es igual a - A', si A' es el operador introducido en II.8,
h
para el intervalo 0, ∞; luego es hermítico. Este operador, el R, es máximo, pero no hipermáximo, lo
que se puede verificar mediante el cálculo efectivo de D, F.
h
Este caso es particularmente notable, porque A' = R suele interpretarse físicamente como
2p
operador de impulso en el semiespacio limitado por la pared q = 0.
(106) Este concepto se debe a Erhard Schmidt, cf. loc. cit. Nota 78.
(107) Puesto que R · 1, 1 · R tienen sentido siempre y sólo cuando lo tiene R (cf. II.5), lo
mismo vale para R · a1 y a1 · R si a ≠ 0. Luego estos dos productos son iguales, es decir, R y a · 1
son permutables. La permutabilidad de R y a1 vale, pues, con una sola excepción: a = 0, R no de-
finido en todo el espacio. Esta circunstancia es muy enojosa y justifica que se cambie la definición
de permutabilidad.
(108) A a · 1 corresponde la siguiente descomposición de la unidad:
{ }
f (m) = 1, para m ≥ a . La verificación es fácil.
0, para m < a
(109) Para dos operadores hermíticos A, B pertenecientes a una clase particular (los llamados
«completamente continuos», cf. loc. cit. Nota 70) demostró Toeplitz (cf., p. e., loc. cit. Nota 33) un
teorema del que se sigue el que precede (a saber, la existencia de un sistema ortonormal completo de
funciones propias comunes a A, B). El teorema general para A, B, cualesquiera, o para A, B, C, …,
lo demostró el autor, loc. cit. Nota 94.
1
(110) Hay que elegir acotado el conjunto c1, c2, …, p.e., cm = para que R sea continuo. En
m
efecto, de la continuidad de R, es decir, de ∙ R f ∙ ≤ C ∙ f ∙ se sigue desde luego que ∙ Rym ∙ = ∙ cmym ∙ =
= ∙ cm ∙ ≤ C ∙ ym ∙ = C, ∙ cm ∙ ≤ C. Recíprocamente, si ∙ cm ∙ ≤ C (m = 1, 2, …),
2 2
⎛ ∞ ⎞ ∞ ∞
= R ⎜ ∑ xmψ m ⎟ = ∑ xm χmψ m = ∑ xm χ m ,
2 2 2
Rf
⎝ m =1 ⎠ m =1 m =1
∞ 2 ∞
∑ xmψ m ∑ xm
2 2
f = = ,
m =1 m =1
y, por lo tanto, ∙ Rf ∙2 ≤ C 2 ∙ f ∙2, ∙ Rf ∙ ≤ C ∙ f ∙, es decir, R es continuo.
407

(111) ¡Cabe admitir excepciones en un conjunto q1, q2 de medida -L nula!

(112) Cf., p. e., loc. cit. Nota 45.
(113) {amn} representa la transformación (es decir, el operador)
n
yµ = ∑ aµν xν
ν =1
(m = 1, 2, …, n, cf., lo dicho en II.7). Efectuemos el cambio de referencia cartesiana.
n n
xµ = ∑ xµν X ν , yµ = ∑ xµνYν (µ = 1, …, n);
ν =1 ν =1
n
de aquí se sigue Yµ = ∑ Aµν X ν (µ = 1,…, n), donde
ν =1
Aµν = ∑ xρµ aρσ xσν (µ, ν = 1, …, n)

ρ ,σ
es la matriz {Amn} transformada de la {amn}. Evidentemente
n n n
⎛ n ⎞ n
∑ Aµµ = ∑ xρµ aρσ xσµ = ∑ aρσ ⎜ ∑ xρµ xρµ ⎟ = ∑ aρρ ,
µ =1 µ , ρ ,σ =1 ρ ,σ =1 ⎝ ν =1 ⎠ µ =1
es decir, la traza es invariante.

(114) La proposición exactamente reza así: Si A es hipermáximo y definido, existe un operador
A', y sólo uno tal que A' 2 = A. He aquí la demostración de su existencia:
∞
Sea ∫−∞ λ dE (λ) la representación de A por valores propios.
– Puesto que A es definido, E((l) es
constante para l < 0 (igual a 0, por lo tanto, en virtud de S1), porque de no serlo, eligiendo con-
venientemente l1 < l2 < 0, sería E(l2) - E(l1) ≠ 0 y, por consiguiente, cabría encontrar un f ≠ 0
tal que (E(l2) - E(l1))f = f. Pero de esto se seguiría, cual lo hemos hecho en más de una ocasión,
que
⎧ f , para λ ≥ λ2⎫
E(λ)f = ⎨ ⎬ y, por ende,
⎩0, para λ ≤ λ1 ⎭
∞ λ2 λ2
(Af , f ) = ∫
−∞
λ d[E (λ)f , f ] = ∫λ1
λ d[E (λ)f , f ] ≤ ∫ λ1
λ2 d[E (λ)f , f ]
= λ2 ([E(λ2 ) − E (λ1)] f , f ) = λ2( f , f ) < 0.
En consecuencia es
∞ ∞ ∞
A= ∫ −∞
λ dE (λ) = ∫ 0
λ dE (λ) = ∫0
µ 2 dE (µ 2 ),
∞
y A' = ∫
0
µ dE (µ 2 ) satisface la ecuación A' 2 = A.
Obsérvese que del carácter definido de A hemos concluido que E(l) = 0 para l < 0; pero como,
a su vez, de E(l) = 0 para l < 0 se sigue evidentemente dicho carácter, esto, es decir, el hecho de
ser todo el espectro ≥ 0, caracteriza el operador como definido.
408

Notas
(115) Cf. loc. cit. Nota 64. Se consigue una demostración directa de la siguiente manera: Sean
l0 < l1 < l2 < … < ln todos ≥ e o todos ≤ e y E(l0) ≠ E(l1) ≠ E(l2) ≠ … ≠ E(ln). En estas con-
diciones, E(ln) - E(ln - 1) ≠ 0 y, por lo tanto, existe jn ≠ 0 tal que (E(ln) - E(ln - 1)) jn = jn, de
donde se sigue
{
E (l)jn = jn, para l ≥ ln ;
0 para l ≤ ln - 1 }
además, siempre podemos lograr que ∙jn ∙ = 1. De lo que precede se deduce que (jm, jn) = 0 para
m ≠ n. Los j1, …, jn forman, por ende, un sistema ortonormal que es posible ampliar hasta cons-
tituir un sistema completo: j1, j2, …, jn, jn + 1,…
Se tiene (n = 1, …, n)
∞ λν λν
∫ ∫ ∫
2 2 2 2
Aϕν = λ 2 d E (λ)ϕν = λ 2 d E (Λ)ϕν ≥ ε 2 d E (λ)ϕν =
−∞ λν −1 λν −1
= ε 2 ⎡⎣ E(λν )ϕν − E(λν −1)ϕν ⎤⎦ = ε 2 ϕν

2 2 2
= ε 2;
luego
⎧ n
⎪ ≥ ∑ Aϕ µ ≥ nε 2
2
∞
∑
2
Aϕ µ ⎨ µ =1
µ =1 ⎪ = ∑ (A) = C 2,
⎩
C 2 C 2
es decir, n ≤ . Por consiguiente, para ∙ l ∙ ≥ e, E(l) únicamente puede tomar ≤ 2 ⋅ valores
e2 e2
diferentes y varía así sólo en un número finito de saltos, de los cuales cada dos consecutivos deter-
minan un intervalo en el que es E(l) constante. Dicho de otro modo, para ∙l ∙ > e existe sólo espec-
tro discreto. Ahora bien, esto debe valer para todo e > 0; luego el espectro es un espectro discreto
puro.
(116) Aparte las memorias originales citadas en el curso de la discusión hay que tomar en con-
sideración el artículo enciclopédico de Hellinger y Toeplitz (cf. Nota 33).
(117) Por analogía geométrica, la esfera en el E∞ de centro en j0 y radio r debe ser el conjunto
de los puntos tales que ∙ f - j0 ∙ ≤ r; su interior, el conjunto de los ∙ f - j0 ∙ < r; su superficie, el
conjunto ∙ f - j0 ∙ = r. Para la esfera unidad es j0 = 0 y r = 1.
(118) Los primeros enunciados estadísticos acerca del comportamiento de un sistema en el
estado j se deben a M. Born; más detallados se encuentran en Dirac y Jordan. Cf., las citas en las
Notas 8 y 2.
(119) De esta coordinación, en la que se hace corresponder a cada magnitud física un operador
hermítico, hablaremos extensamente en IV.1. Por de pronto solo sabemos, por lo dicho en I.2, que
h
a las coordenadas corresponden los operadores q1 …, …, qk …; a los impulsos, los operadores
∂ … h ∂ … 2 pi
,… ; a la energía, el «operador de la energía» H.
∂q1 2pi ∂qk
(120) Un excelente ejemplo ilustrativo de este estado de cosas lo proporciona la teoría cinética
de los gases.
Un mol (16 gr.) de oxígeno contiene 6 · 1023 moléculas de O2 y constituye así un sistema me-
cánico de 2 ⋅ 3 ⋅ 6 ⋅ 1023 = 36 ⋅ 1023 = k grados de libertad cuando se tiene en cuenta que cada
molécula de O2 consta de dos átomos O (de cuya estructura interna prescindiremos, de modo que
se tratarán como puntos materiales con 3 grados de libertad). Con ayuda de 2k parámetros se podría,
por lo tanto, abarcar su comportamiento causalmente, pero la teoría de los gases aplica sólo dos: la
presión y la temperatura, que son ciertas complicadas funciones de esos 2k parámetros.
409

En consecuencia, dicha teoría únicamente puede formular enunciados estadísticos (probabilísi-

mos). En nada altera ese carácter fundamental de los hechos el que en muchos casos tales enunciados
sean quasi-causales, esto es, que las probabilidades sean próximas a 0 ó a 1.
∂
(121) Si Ft(l) es una función dependiente de t, Ft(l) = Gt(l) y H es un operador hermíti-
∂ ∂ ∂ t
co, se tiene Ft (H) = Gt (H), porque la resulta de substraer, dividir y pasar al límite. Para
∂t ∂t
2π i
− (t −t0)⋅ λ
Ft = (λ) = e h resulta de esto
(
e )
∂ − 2hπi (t −t0)H
=−
2π i −
H⋅e h
2π i
(t −t0)H
∂t h
y, aplicándolo a j, se obtiene la ecuación diferencial pedida. −

2π i
(t −t0)H
A causa de ser ∙Ft(l)∙ = 1, y Ft(l) Ft(l) = 1, será Ft (H) ⋅ {Ft(H)}* = 1, es decir, Ft (H) = e h
es unitario. Además, dado que evidentemente es igual a 1 para t = t0, la condición jt0 = j queda
también satisfecha.
(122) Z. Physik, Bd. 37 (1926). Todo el desarrollo que sigue (cf. Nota 2) descansa en este pun-
to de vista.
(123) Physic. Rev., vol. 26 (1925). Cf. también el resumen de W. Bothe en el Handbuch der
Physik, Bd. 23 (Quanten), Berlín, 1926, cap. 3, en particular el § 73.
(124) Sobre estos conceptos fundamentales construyen Bohr, Kramers y Slater una teoría
estadística de los fenómenos elementales. Cf. Z. Physik, Bd. 24 (124), como también loc. cit. Nota 123.
El experimento de Compton-Simon puede considerarse como una refutación a este punto de
vista.
(125) Fue Jordan el primero en reconocer que este concepto de salto es análogo al de «salto
cuántico» de la primitiva teoría cuántica de Bohr (Z. Physik, Bd. 40 (1924) ).
(126) En todo esto se supone que la estructura del sistema observado y del aparato de medida
—es decir, todos los campos de fuerza que actúan, etc.— son conocidos exactamente y que sólo se
busca el estado, esto es, los valores instantáneos de las coordenadas. Cuando esta hipótesis (mera-
mente esquemática) no corresponde a la realidad, surgen, naturalmente, otras fuentes de indetermi-
nación.
También en nuestro modo de definir la medición no exacta reside una cierta idealización; ad-
mitíamos, en efecto, que consiste en decidir con certeza absoluta si un valor pertenece o no al inter-
valo I = {l', l'' } (l' < l'' ). De hecho los límites l', l'' son imprecisos; es decir, la decisión tiene lugar
en estas condiciones sólo con una cierta probabilidad. Sin embargo, nuestro punto de vista parece
ser, por lo menos provisionalmente, el más idóneo matemáticamente.
(127) ¡La verificación del último aserto se lleva a cabo a cabo con ayuda de P! Las descompo-
siciones de la unidad que corresponden a R y S fórmanse en virtud de II.8.
(128) Este teorema, según el cual el operador de R + S es la suma de los operadores correspon-
dientes a R y a S, lo hemos demostrado para magnitudes R, S simultáneamente medibles. Pero es
válido incluso para dos R, S cualesquiera, si bien entonces no se puede demostrar, sino que consti-
tuye uno de los postulados fundamentales de la teoría. Cf., lo que se dirá al final de IV.1 y en IV.2.
(129) Dejamos a cargo del lector la discusión detallada de la «mensurabilidad simultánea para
los j de M», para los R, S no medibles con absoluta precisión (espectros continuos), etc. Es en todo
semejante a las consideraciones hechas en III.3.
(130) El cálculo discurre así:
e2 = [(R - r ⋅ 1)2 j, j] = (R2 j, j) - 2r ⋅ (Rj, j) + r2 =

= ∙Rj ∙2 - 2 (Rj, j)2 + (Rj, j)2 = ∙Rj ∙2 - (Rj, j)2,
e igualmente para h2
410

Notas
(131) Z. Physik, Bd. 43 (1927). Bohr profundizó en estas consideraciones, Naturwiss., Bd. 16
(1928). El método analítico que aplicaremos en lo que sigue fue llevado a la práctica por Kennard,
Z. Physik, Bd. 44 (1926), y su forma actual se debe a Roberston.
(132) Bohr realzó la significación fundamental de esta circunstancia, loc. cit. Nota 131. Hay que
advertir, además, que la descripción que de ese proceso se hace más adelante, no es del todo clásica
en un punto: se apoya en la existencia de quanta de luz, es decir, en el hecho de no aparecer jamás
la luz de frecuencia v en cantidades de energía menores que hv.
(133) Cf. en loc. cit. Nota 131 la subsiguiente discusión, según Heisenberg y Bohr.
(134) Cf., p. e., la memoria original de Einstein, Ann. Physik, Bd. 14 (1905), o cualquier
tratado moderno.
(135) Para la teoría del microscopio, cf., p. e., Handbuch der Physik, Berlín, 1927, Bd. 18, cap.
2 G. En mediciones muy precisas e, y por lo tanto también A, es muy pequeño, es decir, debe usar-
se de rayos g o de luz de longitud de onda aún más corta. Una lente normal no sirve en estas con-
diciones; sólo cabría emplear una lente cuyas moléculas ni fuesen destruidas ni arrancadas de su
posición por los rayos g. Dado que la existencia de tales moléculas o partículas no vulnera ninguna
ley natural conocida, es legítima su aplicación para los fines del experimento ideal.
mc∆n h∆n mc2 –
(136) grande respecto de significa que n es pequeño frente a esto es, E = hv
n c h
pequeño comparado con mc 2. En otros términos, la energía del quantum luminoso L es pequeña
relativamente a la masa en reposo de T —hipótesis ésta que, de todos modos, es inevitable en un
cálculo no-relativista.
(137) Sea, por ejemplo, F(x) un tren de ondas monocromático, limitado, de frecuencia n0 y
que se extiende de a hasta t:
{
F (x) = a sen 2pn0x, para 0 ≤ x ≤ t
0, en caso contrario }
n
(En fuerza del enlace continuo debe ser sen 2pn0t = 0, es decir, n0 = , n = 1, 2, 3, …). En estas
2t
condiciones y en virtud de las conocidas fórmulas de inversión de la integral de Fourier (cf. loc. cit.
Nota 87) (a2n = b2n + c2n)
bν
cν { =2 ∫
−∞
∞
cos 2πν x ⋅ dx = 2a
F (x) sen ∫
0
τ
cos 2πν x ⋅ dx =
sen 2πν 0 x ⋅ sen
∫ ( sen
cos π (ν + ν )x − cos π (ν − ν )x ) ⋅ dx =
τ
=±a sen
0 0
−∞
τ
⎡ cos π (ν + ν 0 )x cos π (ν − ν )x ⎤
= − a ⎢ sen − sen
0
⎥ =
⎢⎣ π (ν + ν 0 ) π (ν − ν 0 ) ⎥⎦0
⎧ ⎡(−1)n cos πντ − 1 (−1)n cos πντ − 1⎤ 2aν 0 (1 − (−1)n cos πντ )
⎪ −a ⎢ − ⎥ =− ,
⎪ π (ν + ν 0 ) π (ν − ν 0 ) ⎦ π (ν 2 − ν 02 )
⎨ ⎣
⎪ −a ⎡(−1) sen πντ − (−1) sen πντ ⎤ = − 2aν 0 (−1) sen πντ ;
n n n
⎢
⎪⎩ ⎣ π (ν + ν 0 ) ⎥
π (ν − ν 0 ) ⎦ π (ν − ν 02 )
2
luego
aν = =
sen 1
2aν0 2 − 2(−1)n cos πντ 4aν 0 cos 2 πντ
=
{ }
4aν 0 sen π (ν − ν 0 )τ
.
π (ν − v0 )
2 2
π (ν − v0 )
2 2
π (ν 2 − v02 )
411

Vemos, pues, que lo que predomina es el entorno de la frecuencia n = n0 y que la mayor parte
de la energía del tren de ondas corresponde a aquel dominio de frecuencias en el que p (n - n0)t
tiene un valor moderado. Por consiguiente, la dispersión de n - n0 (o, lo que es lo mismo, la de n)
1
es del orden de .
t
Al mismo resultado conduce el cálculo exacto de la expresión normal
∫
0
aν2 (ν − ν 0 )2 d ν
∞ .
∫ 0
aν2 d ν
(138) Proc. Roy Soc., London, vol. 114 (1927). Cf. también la exposición de Weyl en: «Grup-
pentheorie und Quantenmechanik», 2.a edición, pp. 91 y ss., Leipzig, 1931.
(139) El lector interesado en estas cuestiones encontrará expuesta la teoría electromagnética de
la luz en cualquier tratado de Electrodinámica, p. e., Abraham-Becker: «Theorie der Elektrizitát»,
Berlín, 1930. Cf. también el estudio que sigue, dentro del marco de la teoría de Maxwell.
(140) Cf. R. Courant y D. Hilbert: «Methoden der mathematischen Physik», I, pp. 358-363,
Berlín, 1924.
(141) Se tiene, en efecto,
! ! ! !
∫ ∫ ∫ a × rot b dx dy dz = ∫ ∫ ∫ rot a × b dx dy dz,
H H
a causa de
! ! ! ! ! !
a × rot b − rot a × b = grad (a ∧ b )
     
(a ∧ b es el producto vectorial o exterior de a , b ), supuesto que la componente normal de a ∧ b se

anule en la frontera de H. Tal ocurre
 con seguridad cuando a o bes perpendicular
 a dicha
 frontera,
  
pues a ∧ b es ortogonal a a y a b . En nuestro caso, a = rot Am ⋅ b = An, de modo que b cumple tal
condición.
(142) Cf., p. e., loc. cit. Nota 138.
(143) Dado que P nx es permutable con Q yn, Q zn, y sólo no lo es con Q xn, para justificar la trans-
formación que sigue hemos de demostrar
 la siguiente relación (en la que suprimimos los subíndices,
aquí superfluos, y sustituimos A por F ):
h
PF (Q) - F (Q)P = F' (Q),
2pi
h ∂… …
si P = , Q = q . Esta relación, de gran importancia para la teoría matricial, puede com-
2pi ∂q
probarse fácilmente mediante un cálculo directo.
(144) Que los sistemas de índices k, M1, M2, … definidos de esta manera constituyen efecti-
vamente una sucesión, se reconoce con la mayor facilidad así: sea p1, p2, p3, … la sucesión de los
números primos 2, 3, 5, … Los productos p1k - 1p2M1p3M2 … son finitos ya que, prescindiendo de un
número finito de excepciones, todos los Mn son = 0, es decir, iguales a 1 los factores p Mn + 1
n . Cuando
k, M1, M2, … recorre todos nuestros sistemas de índices, p1k - 1 p2M1 p3M2 …, recorre la sucesión de los
números naturales 1, 2, 3, … y coincide con cada uno una sola vez. Por consiguiente, es posible
aplicar p1k - 1 p2M1 p3M2 … para conseguir una enumeración simple de los akM, kM2 …
412

Notas
(145) Como coordenadas del quantum de luz cabe tomar sus impulsos px, py, pz y una coorde-
nada p que describa su estado de polarización. px, py, pz determinan la dirección de dicho quantum,
es decir, sus cosenos directores ax, ay, az(ax2 + ay2 + az2 = 1) como también la frecuencia n, la longi-
hn
tud de onda l y la energía, puesto que, según Einstein, el módulo del vector de impulso es
134
(cf. Nota ) y, por lo tanto, c
hn hn hn
px = a , py = a , pz = a,
c x c y c z
es decir,
c c
ν= px2 + py2 + pz2 , λ = , energía = hν,
h ν
cp cpy cp
ax = x , a y = , az = z .
hν hν hν
!
Ahora bien, las oscilaciones propias An (x, y, z) ⋅ γ cos 2πρn(t − τ ) son, por desgracia, ondas lu-
minosas estacionarias, cual no podía dejar de suceder en el recinto vacío H a causa de que sus  pare-
des se comportan como un espejo, con lo que no es posible establecer una relación entre An y una
«dirección del rayo» ax, ay, az. Se reconoce desde luego que junto a ax, ay, a2, existe por lo menos la
dirección opuesta -ax, -ay, -az y lo mismo vale para el impulso. Por lo tanto, en H debemos emplear
otras coordenadas distintas de px, py, pz, p.
Cabe superar este obstáculo acudiendo a nuevas representaciones en las que se supone H para-
lelepipédico:
-a < x < a, -b < y < b, -c < z < c,
pero de manera que las superficies límite x = ± a, y = ± b, z = ± c no sean paredes, antes bien se
identifique x = a con x = -a, y = b con y = -b y z = c con z = -c. Es decir, la luz que alcanza el
plano x = a en (a, y, z) prosigue su camino en (-a, y, z) (de nuevo hacia el interior de H) cual si
nada hubiera ocurrido, etc.
(Cf., p. e., una memoria de L. Landau y R. Peierls: Z. Physik, Bd. 62, 1930). En otros términos:
se supone periódico el espacio en las direcciones x, y, z con los períodos 2a, 2b, 2c, respectivamente.
 El método  analítico sigue siendo el mismo, salvo
 las condiciones
 de contorno, que son ahora
A(a, y, z) = A(-a, y, z), A(x, b, y) = A(x, -b, y) y A(x, y, c) = A(x, y, -c), en vez de (A) norm. = 0.
Las «soluciones elementales», en serie de las cuales se desarrolla la solución general, son en el pre-
cos
sente caso [2p(t - c(axx + ayy + azz))], en lugar de A(x, y, z) p(t). Las n = rn y ax = an,x , ay = an,y ,
sen
az = an,z (n = 1, 2, …) que corresponden a las soluciones propias se determinan fácilmente, y el ul-
terior desarrollo de la teoría coincide con el indicado en el texto.
(146) ¡Este paso al límite, S → +∞, es diferente del N → +∞ efectuado en la teoría electro-
magnética! Porque, aun cuando también en ésta interpretábamos M1, M2, …, como números de
quanta, N era un límite para el número de quanta incoherentes (es decir, tales que no coinciden en
frecuencia, dirección y polarización —las dos primeras determinan el impulso cf. Nota 145), mientras
que S lo es para el número de quanta,
– sin más.
(147) Esta introducción de E ∞(S) en lugar de E∞(S) equivale a sustituir la estadística ordinaria por
la llamada estadística de Bose-Einstein, en tanto no se consideren las consecuencias de esta sustitución
como aplicación de la Mecánica cuántica. Cf., acerca de esto, p. e., Dirac, loc. cit. Nota 136.
(148) Discusiones más detalladas tocante a cómo se concebía esa «duplicidad de naturaleza» y
a cómo era sentida en ella la paradoja, las encontrará el lector en la literatura de aquel tiempo. Cf.,
p. e., las obras citadas en la Nota 6.
Se ha dicho en más de una ocasión que la Mecánica cuántica atribuye a la materia la misma
duplicidad de naturaleza, puesto que las partículas discretas (electrones, protones) se describen me-
413

diante funciones de onda y muestran propiedades típicamente ondulatorias, por ejemplo, la difrac-
ción en rejas, etcétera. (Cf., los experimentos de Davison-Germer: Physic. Rev., vol. 30, 1927; Proc.
Nac. Acad. Sci. U. S. A., vol. 14, 1928; además, C. P. Thompson: Proc. Roy. Soc. Lond., vol. 117,
1928, y Rupp: Ann. Physik, Bd. 85, 1928). En contra de esta opinión hay que recalcar que la Me-
cánica cuántica deduce ambas «naturalezas» de una única teoría unificada de los fenómenos elemen-
tales. La paradoja de la primitiva teoría de los quanta consistía en que debía recurrir alternativamen-
te a dos teorías entre sí contradictorias (la electromagnética de la luz, de Maxwell-Hertz, y la de
los quanta luminosos, de Einstein) para lograr la explicación de los hechos experimentales.
(149) Weisskopf y Wigner (Z. Physik, Bd. 63, 1930) dieron la solución exacta de estas ecua-
ciones diferenciales, a partir de la cual se reconoce la verdad de estos enunciados.
(150) N. Bohr, como es notorio, sentó en 1913 la hipótesis (cf. loc. cit. Nota 5) de que el
átomo, al pasar de un estado estacionario de energía W (1) a otro estado estacionario de energía W (2)
W (1) - W (2) W – - W k
(W (1) > W (2)), emite luz de frecuencia . En nuestro caso corresponde a esto k
(151) Se tiene: h h
2
e ix − 1 = (e ix − 1)(e ix − 1) = (e ix − 1) (e −ix − 1) =
= 2 − e ix − e −ix = 2 − 2 cos x = 2(1 − cos x)
(152) Se tiene (cf. Courant-Hilbert, p. 49):
1 − cos x
∞ ∞ 1 − cos x ∞ 1 − cos 2y ∞ sen2 y
∫−∞ x2
dx = 2 ∫ 0 x2
dx = ∫0 y2
dy = 2 ∫
0 y2
dy = π .
(153) P xn es permutable con todos los Q xm, Q ym, Q zm, P xm, P ym, P zm, excepto con (Q zn) y en este caso
vale la relación
h
PνxQνx − Qνx Pνx = ⋅1.
2π i
Por lo tanto, es
1 1 h 1 x
H 0Qνx − Qνx H 0 = (Pνx )2 Qνx − Qνx (Pνx )2 = Pν ,
2mν 2mν 2π i mν
(cf. Nota 143).
(154) Physik. Z., Bd. 18, 1917.
(155) Es necesario insistir en la diferencia que existe entre el concepto de sistema, sin más, y
el de sistema en un cierto estado. Por ejemplo, un átomo de hidrógeno, es decir, un electrón y un
protón y las fuerzas que ejercen entre sí, es un sistema —descrito formalmente en cuanto se indica
que el espacio de los estados es de 6 dimensiones, que llamamos q1, …, q6 a las coordenadas y
p1, …, p6 a los impulsos, y que la función de Hamilton es:
p12 + p22 + p32 p42 + p52 + p62

H (q1, …, q6; p1, …, p6 ) = + +
2me 2mp
e2
+ .
(q1 − q4 ) + (q2 − q5)2 + (q3 − q6 )2
2
414

Notas
En cambio, para fijar un estado son menester aún otros datos: así, en la Mecánica clásica, hay
que atribuir valores numéricos q10, …, q60, …, p10, …, p60 a las coordenadas y a los impulsos q1 …,
q6, p1,…, p6; en la Mecánica cuántica, debemos dar la función de onda j(q1, …, q6). Más datos no
son ya necesarios: conocido el complejo sistema-estado, la teoría da normas unívocas para contestar,
mediante el cálculo, a todas las cuestiones.
(156) Esas colectividades son absolutamente necesarias para poder establecer el cálculo de pro-
babilidades como teoría de las frecuencias. Su introducción es debida a R. v. Mises, quien reconoció
su significado para dicho cálculo y llevó a término una construcción consecuente del mismo (cf.,
p. e., su libro: «Wahrscheinlichkeit, Statistik und ihre Wahrheit», Berlín, 1928).
(157) w(a' ) es la probabilidad de a ≤ a', es decir, corresponde al intervalo -∞, a'. Es preferible
usar de la notación wR(a) para designar a w(a), porque de esta manera se pone de manifiesto su depen
dencia de R. Así, pues, la función wR(a) goza de las siguientes propiedades: Para a → -∞, wR(a) → 0;
para a → + ∞, wR(a) → 1; para a ≥ a0 y a → a0, wR(a) → wR(a0); para a'< a'' es wR(a' ) ≤ wR (a'' ).
(En Mecánica cuántica, si E(l) es la descomposición de la unidad que corresponde a R, se tiene
wR(a) = ∙E(a)j ∙2 = (E(a) j, j).).
d
Si wR(a) es derivable, cabe introducir en su lugar la conocida «densidad de probabilidad»
da
wR(a); si wR(a) es discontinua en el punto a = a0 (a la izquierda, naturalmente), el punto a = a0 po-
see la «probabilidad discreta» wR(a0) - wR(a0 - 0). El más amplio concepto utilizable en general es,
pues, el de wR(a). Cf. loc. cit. Nota 156.
(158) Esto se sigue de la llamada ley de los grandes números, del teorema de Bernoulli.
(159) Así, por ejemplo, se consideraba como uno de los inconvenientes fundamentales de la
definición de campo eléctrico el que el «cuerpo de prueba» eléctricamente cargado que se debe uti-
lizar para ello, no puede ser menor que un electrón.
(160) Al valor preciso a0 corresponde la función de probabilidad
{
wR(a) = 1, para a ≥ a0 ;
0, para a < a0 }
En éste y sólo en este caso la dispersión e2 es nula. En el caso general, el valor medio r y la
dispersión e2 se calculan de la siguiente manera (¡integrales de Stieltjes!):
∞
ρ= ∫
−∞
a ⋅ dwR (a),
∞
ε2 = ∫
−∞
(a − ρ )2 ⋅ dwR (a)
∞ ∞ ∞
= ∫
−∞
a 2 dwR (a) − 2 ρ ∫ −∞
a ⋅ dwR (a) + ρ 2 = ∫
−∞
a 2 dwR (a) − ρ 2
∞ ∞ 2
⎛ ⎞
= ∫
−∞
a 2 dwR (a) −
⎝ ∫
−∞
a 2 ⋅ dwR (a) .
⎠
(Cf. con III.4, Nota 130).

(161) Se trata de mediciones independientes en varios sistemas; mediciones sucesivas en el
mismo sistema darían siempre el mismo valor (cf. III.3).
(162) Piénsese, por ejemplo, en lo que ocurre cuando R, S son las magnitudes q (coordenada
cartesiana) y p (impulso conjugado), no mensurables simultáneamente (a causa de las relaciones de
indeterminación). Si en una colectividad la coordenada q apenas presenta dispersión, la medición
de p con la exactitud (es decir, con la dispersión) e aumenta la dispersión de q por lo menos hasta
h
(cf. III.4); es decir, echa a perder todo nuestro conocimiento de q.
4pe
415

(163) a R, S2, R + S + … significan, en virtud de la definición dada más arriba, que hemos de
sustituir las magnitudes R o S, o R, S, … en las funciones f (x) = ax, f (x) = x2, f (x, y, …)= x + y + …,
respectivamente.
(164) Por ejemplo, en la teoría de Heisenberg el operador de la energía correspondiente a un
electrón que se mueve en un campo de fuerzas conservativo V(x, y, z):
(P x )2 + (P y )2 + (P z )2
H0 = + V (Q x , Q y , Q z )
2m
(cf., p. e., III.6) es suma de dos operadores no permutables:
(P x )2 + (P y )2 + (P z )2
R= , S = V (Q x , Q y , Q z ).
2m
Mientras que la medición de la magnitud R asociada a R es una medición de impulso y la de

la magnitud S correspondiente a S es una medición de coordenadas, la magnitud R + S que corres-
ponde a R + S se mide de una muy otra manera: p. e., midiendo la frecuencia de las rayas espectra-
les emitidas por ese electrón (vinculado), dado que éstas fijan los niveles de energía, esto es, los va-
lores de R + S, en virtud de la relación de Bohr para las frecuencias. Sin embargo, en todo caso es:
Vm (R + S) = Vm (R) + Vm (S).
(165) En el caso de colectividades libres de dispersión, no hay, empero, motivo alguno para no
introducir los valores medios correctos.
(166) Es decir,
Uϕn = ∑ ϕm ⋅ umn,
m
∞
∑ umn
2
para lo cual, por supuesto, es necesario que sea finita (m = 1, 2, …) Cabe establecer esto
m =1
∑ xn = 1 y hacemos ϕ = ∑ϕm ⋅ xm, la matriz de R = P[j] es la {xm, xn};
2
de la siguiente manera. Si
n m
luego el valor medio de R será Vm(R) = ∑ umn xn xm. A causa de ser P[j] = P2[j] y 1 - P[j] = (1 - P[j])2,
m,n
esta suma será ≥ 0 y ≤ Vm(1); luego, por lo menos para Vm(R), normalizado, es 0 ≤ Vm (R) ≤ 1. Si
xN + 1 = xN + 2 = … = 0, esto nos dice que la forma hermítica de N dimensiones
N
∑ umn xn xm toma va-
m, n
∑ xn
2
lores ≥ 0 y ≤ 1 para = 1, es decir, los valores propios de la matriz umn(m, n = 1, 2, … N ) son
n =1 N
≥ 0 y ≤ 1. Por consiguiente, la longitud del vector ym = ∑ umn xn es siempre ≤ que la del vector xm.
Para n =1
xn = { 0,1, enparacason =contrario

m'
} es y m = umm' ;
luego
N N N
∑ xm ≥ ∑ ym , 1 ≥ ∑ umm' .
2 2 2
m =1 m =1 m =1
∞
∑ umm'
2
Dado que esta relación vale para todo N, necesariamente es ≤ 1.
m =1
416

Notas
(167) En rigor, todo este razonamiento sólo es válido cuando todos los j1, j2, … pertenecen
al dominio de definición de R. Cierto es que para cada R es posible hallar un sistema ortonormal
completo que esté en estas condiciones (cf. II.11); pero cuando R no tiene sentido dondequiera,
dicho sistema depende de R. Propiamente, pues, para cada sistema ortonormal completo j1, j2, …
tenemos un U que de él depende y tal que la relación
Vm (R) = traza (UR)
sólo vale necesariamente para aquellos R a cuyo dominio de definición pertenecen j1, j2, …
Sin embargo, todos esos U son iguales entre sí, porque si U', U'', son dos de ellos, la fórmula
anterior vale para ambos cuando R tiene sentido en todo el espacio, es decir, entonces se tiene traza
(U'R) = traza (U''R). Para R = P[j], por lo tanto, será (U' j, j) = (U'' j, j), [(U' - U'' ) j, j] = 0
y como esta última igualdad vale para todo j de módulo unidad, o sea, en último término, para
todo elemento del espacio hilbertiano, forzosamente ha de ser U' - U'' = 0; luego U' = U'' .
(168) No es posible escribir directamente S = R , es decir, S = g (R), g (x) = x , por cuanto
consideramos solamente funciones reales definidas para todo g(x) = x valor real de x y x no se
encuentran en este caso, pues para x < 0 toma valores imaginarios.
(169) Es también posible llevar a cabo una sencilla demostración directa: Sea j1, j2, … un
N
sistema ortonormal completo, amn = (A jn, jm) bmn = (Bjn, jm), traza (AB) = ∑ aµν bνµ . Esta es ≥ 0
µ, ν =1
N N N N
cuando todas las sumas ∑ aµν bνµ son ≥ 0. Si f = ∑ xµϕ µ , se tendrá: (Af , f ) = ∑ aµν xν ⋅ xµ ≥ 0, (Bf , f ) = ∑ bµν xν xµ ≥ 0;
µ,ν =1 µ,ν =1 µ ,ν =t µ,ν =1
N N
(Af , f ) = ∑ aµν xν ⋅ xµ ≥ 0, (Bf , f ) = ∑ bµν xν xµ ≥ 0; luego también las dos matrices finitas amn, bmn (m, n = 1, …, N ) son de-
µ ,ν =t µ,ν =1 N
finidas. Ahora bien, tanto el carácter de definido como el valor de la suma ∑ aµν bνµ son invarian-
µ,ν =1
tes ortogonales en el espacio de N dimensiones. Por otra parte, bmn es hermítico y, por consiguiente,
en el espacio de N-dimensiones puede ser reducido a la forma diagonal, de suerte que podemos
N N
suponer bmn = 0 para m ≠ n. En estas condiciones, ∑ aµν bνµ = ∑ aµµbµµ ; pero como por ser defini-
µ,ν =1 µ =1
das amn y bmn es amm ≥ 0 y bmm ≥ 0 (basta hacer xm = 0, para n ≠ m' la suma anterior es, efectivamen-
{ )
te, ≥ 0. 1, para n = m'
(170) Para j' = j'' es claro. Supongamos, pues, j' ≠ j'' . La «ortogonalización» del par j' , j''
(cf. II.2) conduce a un j1 (∙j1∙ = 1), que es ortogonal a j' y tal, además, que j'' es combinación
lineal de j' , j1 : j'' = a j' + b j1, ∙j'' ∙2 = ∙a ∙2 +∙b ∙2 = 1. Sea, por ejemplo, ∙a ∙ = cos θ, ∙b ∙ = sen θ,
de donde a = eia cos θ, b = e1b sen θ. Si hacemos a(x) = eixa cos xθ, b(x) = eixb sen xθ, será también
∙a(x)∙2 + ∙b(x)∙2 = 1; luego j(x) = a(x) j' + b(x)j1, varía de modo continuo desde j' (x = 0) hasta j'' (x = 1)
y es de módulo unidad, ∙j(x) ∙ = 1.
(171) A decir verdad, en virtud de 2. debiéramos imponer las condiciones V ≠ 0, W ≠ 0. Sin
embargo, los casos V = 0 ó W = 0 van implícitos con c' = 0, c'' = 1 ó c' = 1, c'' = 0.
(172) El proceso deductivo que muestran los dos últimos párrafos, proceso que conduce a las
colectividades homogéneas, fue indicado por el autor, Gött. Nachr., 1927. La existencia de tales co-
lectividades, como también su relación con las colectividades generales, fue descubierta independien-
temente por H. Weyl: Z. Physik, Bd. 46, 1927, y por el autor (loc. cit.). Un caso particular de
colectividades generales (dos sistemas acoplados, cf., la discusión en VI.2) se encuentra ya antes en
J. Landau: Z. Physik, Bd. 45, 1927.
(173) Si los «parámetros ocultos», que en conjunto designamos con la letra p, sólo toman va-
lores discretos p1, p2 …, pn (n > 1), las dos colectividades cuya mezcla es la primitiva se obtienen
reuniendo en una los sistemas en los que p = p1, y en la otra aquellos en los cuales p ≠ p1. Si p
varía de modo continuo en un dominio II, sea II' un dominio parte de II: una colectividad contie-
ne aquellos sistemas en que p pertenece a II' ; la otra, aquellos cuya p no pertenece a II' .
417

(174) El espacio de las fases tiene 6 dimensiones, y las 6 coordenadas de uno de sus puntos son
las 3 coordenadas cartesianas del punto material q1, q2, q3 y los tres correspondientes impulsos p1,
p2, p3. Según III.4, para las respectivas dispersiones e1, e2, e3, h1, h2, h3, valen las desigualdades
h h h
ε1η1 ≥ , ε 2η2 ≥ , ε 3η3 = ,
4π 4π 4π
es decir,
3
⎛ h⎞
ε1ε 2ε 3η1η2η3 ≥
⎝ 4π ⎠
y en cualquier caso la posición en el espacio de las fases de la Mecánica clásica está indeterminada
en un volumen de este orden.
(175) Cf., la disertación de Schrödinger, de una claridad sin par, tocante a este punto: Na-
turrwiss., Bd. 17 (1929), Heft 37.
(176) um → -um (o um → -un, o bien vn → -vm) es una operación de simetría que deja inva-
riante a K y cambia los signos de los primeros integrandos; sus integrales son, pues, nulas. Por otra
parte, um → vm, vm → um o um → un, un → um, son operaciones de simetría de K que transforman
entre sí los últimos integrandos; luego sus integrales son iguales todas ellas entre sí, y, por lo tanto,
1
iguales a su suma multiplicada por :
2s
∫ ∫ … ∫ ∫ (u + v
K
2
1
2
1 + … + uS2 + vS2 )d σ = ∫ ∫ …∫ ∫ d σ = superficie de K = C.
K
(177) La validez de la fórmula obtenida por substracción acaso parezca discutible si traza U es
infinita. Sin embargo, es posible establecerla también de la siguiente manera: Que R tenga el valor l*
significa que w(a', a'' ) = 0, es decir, traza U[E(a'' ) - E(a' )] = 0, para a'' < l* ó a' > l*. Esta traza es
siempre ≥ 0, no decreciente con a'' y no creciente con a' . Basta, pues, considerar’ su lím. para a'' < l*
a' → -∞
y su lím. para a' > l*. Resulta así: traza UE(a'' ) = 0 para a'' < l* y traza U[1 - E(a' )] = 0 para a' ≥ l*.
a'' → +∞
(178) Es decir, si la propiedad E se da, el estado es el j. Cuando así no ocurre, se da la propie-
dad «non –E», de suerte que en lugar de E = P[j] y M = [j] aparecen 1 - E = 1 - P[j] y E - M = E
- [j], lo cual no determina unívocamente a U. (E corresponde justamente a la cuestión: «¿es j el
estado?»). Una medición que, cualquiera que sea el punto de partida, fija unívocamente el estado,
es una medición de una magnitud R cuyo operador R tiene un espectro discreto puro y valores pro-
pios todos ellos simples (cf. III.3). Después de la medición, el sistema S se encuentra en uno de los
estados j1, j2, … (las funciones propias de R), o sea, la medición altera en general el estado de S.
De un modo semejante, también la medición de E altera el estado; porque, tras ella, si el resultado
es positivo, U = P[j], y si es negativo, U(1 - P[j]) = U, de donde UP[j] = 0, es decir, Uj = 0, mien-
tras que antes no tenía por qué ocurrir ninguno de los dos casos. Esta «determinación» mecánico-
cuántica del estado lo altera, por consiguiente, cual era de esperar.
(179) Por ejemplo, porque
RP[jn] f = R[(f , jn) ⋅ jn] = ( f , jn) · Rjn = ln( f , jn) · jn,
P[jn] R f = (R f , jn)jn = ( f , Rjn)jn = ln( f , jn) · jn.
(180) En todos los tratados de Mecánica clásica (hamiltoniana) se habla de estas relaciones.
(181) Las relaciones de indeterminación para el par tiempo-energía se han discutido repetidas
veces. Cf., la síntesis de ello en Heisenberg: «Die physikalischen Prinzipien der Quantentheorie»,
§ II.2, Leipzig, 1930.
(182) Todos los demás pormenores del dispositivo de medición persiguen solamente el aco
plamiento de la magnitud que propiamente interesa, de su operador R, con Mn o P x, P y, P z, o
Q x, Q y, Q z. Este es, justamente, el lado prácticamente más importante de la técnica de la medición.
418

Notas
(183) Cf., p. e., Nernst: «Theoretische Chemie», Stuttgart (numerosas ediciones desde 1893),
libro IV, discusión de la demostración termodinámica de la «ley de acción de las masas».
(184) El sistema fenomenológico de la Termodinámica construido sobre estos principios, lo
encontrará el lector en numerosos tratados, p. e., Planck: «Vorlesungen über Thermodynamik»,
Berlín, 1930. Para lo que sigue es sobre todo conveniente la concepción estadística de los dos prin-
cipios, cual se expone, p. e., en las siguientes memorias: Einstein: Verh. d. dtsch. physik. Ges., Bd.
12, 1914; L. Szilárd: Z. Physik, Bd. 32, 1925).
(185) Este es el método de Maxwell-Boltzmann en Mecánica estadística (cf. el resumen en
el artículo de P. y T. Ehrenfest: Enzykl. d. Math. Wiss. Bd. II.4. D. Leipzig, 1907). En la teoría de
los gases, por ejemplo, el sistema «muy complicado» es el gas, que consta de muchas moléculas en
interacción, y las moléculas se estudian estadísticamente.
(186) Este es el método de Gibbs (cf. loc. cit. Nota 185). Aquí el sistema único es todo el gas, lo
que se observa es la suerte que siguen muchos ejemplares del mismo y las propiedades se aprecian
estadísticamente.
(187) Cf. loc. cit. Nota 184. El mismo punto fue ampliamente desarrollado por L. Szilárd.
(188) Es sabido que así es cómo la teoría cinética de los gases describe el proceso en el cual las
paredes transfieren su temperatura al gas que limitan. Cf. loc. cit. Notas 184 y 185.
(189) Cuando en esta transformación se consumen las cantidades de calor Q1, .., Qi, a las
Q1 Q
temperaturas T1, …, Ti, respectivamente, la diferencia de entropías es igual a + … + i . Cf. loc.
T1 Ti
cit. Nota 184.
(190) Si c ( T ) es el calor específico del gas cuántico en cuestión a la temperatura T, la cantidad
de calor que toma al aumentar su temperatura de T a T + d T es c ( T )d T. Según la Nota 189, la dife-
rencia de entropías es, por lo tanto,
T2 c(T)d T
∫ T1 T
.
(191) Para un gas perfecto es c ( T ) = constante, lo que, con seguridad, deja de ser cierto para
valores muy pequeños de T. Cf., p. e., loc. cit. Nota 6. –
(192) Para esto es indispensable que el volumen B de K sea grande con relación al volumen
total de K1, …, KN y, además, que la «energía por grado de libertad» kT (k = constante de Boltz-
h2
mann) sea grande respecto de 2 y (h = constante de Planck m = masa de una molécula; esta
µB 3
magnitud tiene las dimensiones de una energía). Cf., p. e., Fermi: Z. Physik, Bd. 36, 1926.
(193) Cf., p. e., loc. cit. Nota 184.
(194) Cf. loc. cit. Nota 185. Una discusión detallada de las dificultades vinculadas con el concep-
to del «demonio de Maxwell» la encontrará el lector en L. Szilárd: Z. Physik, Bd. 53, 1929.
MxT
(195) Si un gas perfecto consta de M moléculas, su presión es . Al comprimirlo desde el
volumen B al B se efectúa el trabajo mecánico B
1 2
B2 B2 dB B
− ∫
B1
p d ν = − MxT ∫B1 B
= MxT ln 1 .
B2
N B
En nuestro caso es M = , B = B, B2 = .
2 1 2
(196) Es sabido que la energía de un gas perfecto depende sólo de su temperatura.
(197) Determinemos los valores propios de aP[j] + bP[y]. Ha de tenerse
(aP[j] + bP[y] )f = l f
419

El primer miembro es una combinación lineal de j y y ; luego también el segundo, si l ≠ 0.

El valor propio l = 0 es múltiple de orden infinito, pues todo f ortogonal a j y y corresponde a
este valor. Basta, pues, considerar l ≠ 0 y f = xj + yy. (j y y son linealmente independientes,
porque, en caso contrario, sería j = cy ∙c ∙ = 1, es decir, los dos estados serían idénticos.)
Entonces, la ecuación anterior reza así:
a[x + y (y, j)] ⋅ j + b [x(j, y) + y] ⋅ y = lx ⋅ j + ly ⋅ j,
o sea,
a ⋅ x + a(ϕ, ψ ) ⋅ y = λ ⋅ x, b(ϕ, ψ ) ⋅ x + b ⋅ y = λ ⋅ y.
El determinante de estas ecuaciones debe ser nulo:
a − λ a(ϕ, ψ ) 2
= 0, (a − λ)(b − λ) − ab (ϕ, ψ ) = 0,
b(ϕ, ψ ) b − λ
λ 2 − (a + b)λ + ab(1 − α 2 ) = 0,
a + b ± (a + b)2 − 4ab(1 − α 2 ) a + b ± (a − b)2 + 4α 2 ab
λ= =
2 2
1 1 1 2
Hagamos a = 1, b = 0, o bien a = , b = , o a = , b = : resultan así las fórmulas del texto.
2 2 3 3
(198) Dado que (x ln x)' = ln x + 1, y, por lo tanto,
⎛ 1 + y ln 1 + y + 1 − y ln 1 − y ⎞' = 1 ⎛ ln 1 + y + 1⎞ − 1 ⎛ ln 1 − y + 1⎞ = 1 ln 1 + y ,
⎝ 2 2 2 2 ⎠ 2⎝ 2 ⎠ 2⎝ 2 ⎠ 2 1− y
la derivada de nuestra expresión es
1 3 + 1 + 8α 2 1 8α 1 1+ α
−3 ⋅ ln ⋅ + 4 ⋅ ln =
2 3 − 1 + 8α 2 3 1 + 8α 2 2 1− α
⎛ 1+ α 2α 3 + 1 + 8α 2 ⎞
= 2 ⎜ ln − ln ⎟.
⎝ 1− α 1 + 8α 2 3 − 1 + 8α 2 ⎠
Que esta derivada sea > 0 equivale a que
1+ α 2α 3 + 1 + 8α 2
ln > ln ,
1− α 1 + 8α 2
3 − 1 + 8α 2
es decir,
1 1+ α 2 1 1+β 1 + 8α 2
ln > ⋅ ln , β= ,
2α 1 − α 3 2β 1 − β 3
420

Notas
y es evidente que esta relación quedará demostrada si se demuestra que su primer miembro es mayor
2 8
que el resultado de sustituir en el segundo el factor por el factor . Y, en efecto, a causa de ser
8 3 9
1 - b2 = (1 - a2) y a < b (lo que se sigue de la igualdad que precede y de ser a < 1), la nueva
9
desigualdad puede escribirse:
1 − α2 1 + α 1 − β2 1 + β
ln > ln
2α 1− α 2β 1− β
1 − x2 1 + x
y quedará justificada en cuanto se pruebe que ln es monótona decreciente en el inter-
2x 1− x
valo 0 < x < 1. Pero esto se puede ver, por ejemplo, en su desarrollo en serie de potencias:
1 − x2 1 + x ⎛ x2 x4 ⎞ 1 1 1
ln = (1 − x 2 ) ⎜1 + + + …⎟ = 1 − ⎛⎜1 − ⎞⎟ x 2 − ⎛⎜ − ⎞⎟ x 4 − …
2x 1− x ⎝ 3 5 ⎠ ⎝ 3⎠ ⎝ 3 5⎠
(199) Respecto de este artificio, que es característico para el método termodinámico-fenome-

nológico, cf., p. e., loc. cit. Nota 184.
(200) Aquí, naturalmente podríamos prescindir del factor Nx y considerar simplemente —tra-
za (U ln U ). O también, para conservar la proporcionalidad al número de elementos N, -N traza
(U ln U ).
(201) Cf., p. e., Planck: «Theorie der Warmestrahlung», Leipzig, 1913.
(202) L. Szilárd (loc. cit. Nota 194) ha mostrado que no cabe adquirir este «saber» sin que, en
compensación, disminuya la entropía por lo menos en x ln 2 (en general, x ln 2 es el «valor termo-
dinámico» del conocimiento que se reduce al de dos casos de una alternativa). Todo intento de llevar
a término el proceso arriba descrito, cuando no se sabe en qué mitad del recipiente se encuentra la
molécula, se puede acreditar de inadmisible, aunque eventualmente conduzca a mecanismos auto-
máticos muy complicados.
(203) Esta caracterización del observador macroscópico se debe a E. Wigner.
(204) Sin embargo, cuando En es permutable con H y, por consiguiente, con A, vale la igualdad
en virtud de
traza (A ⋅ UA-1En) = traza (UA-1En ⋅ A) = traza (UA-1AEn) = traza (UEn).
Pero no todos los En, es decir, no todas las magnitudes macroscópicamente observables son
permutables con H: muchos, p. e., el centro de gravedad de un gas en la difusión, cambian aprecia-
blemente con el tiempo, es decir, traza (UEn) no es constante. Ahora bien, dado que todas las mag-
nitudes macroscópicas son permutables, de ahí se sigue que H no es una magnitud macroscópica, o
sea, que la energía no se puede medir macroscópicamente con precisión absoluta. Esto, por lo demás,
es plausible.
(205) Para el teorema H de Boltzmann, cf.: «Vorlesungen über Gastheorie», Leipzig, 1896,
como también la en extremo instructiva discusión por P. y T. Ehrenfest, loc. cit. Nota 185. W. Pau-
li (Sómmerfeld-Festschrift, 1928) formuló la ((hipótesis de desorden» que en Mecánica cuántica
puede ocupar el lugar de la de Boltzmann, y con su ayuda demostró el teorema H Recientemente,
el autor consiguió demostrar también el principio ergódico de la Mecánica clásica (cf. Proc. Nat. Ac.,
enero y marzo de 1930), al igual que la forma más restrictiva que le dio G. D. Birkhoff: Proc. Nati.
Ac., diciembre de 1929 y marzo de 1930.
(206) Z. Physik, Bd. 57 (1929).
(207) N. Bohr (Naturwiss., Bd. 17, 1929) llamó la atención el primero sobre el hecho que la
duplicidad que la Mecánica cuántica hace inevitable en sentido formal, en la descripción de la Na-
turaleza, está también justificada objetivamente, y sobre la conexión con el principio del paralelismo
psicofísico.
421

(208) La discusión que se desarrolla en lo que sigue y en VI.3, encierra elementos esenciales
que el autor debe a sus conversaciones con el Sr. L. Szilárd. Cf. también consideraciones parecidas
en Heisenberg, loc. cit. Nota 181.
(209) Se demuestra fácilmente que A es hermítico o hipermáximo a la vez que A.
(210) Esto es claro para I, y para II lo es igualmente en tanto se trate sólo de polinomios. En
el caso de funciones cualesquiera se reconoce que así ocurre en el hecho de que la correspondencia
entre una descomposición de la unidad y su operador hermítico no se destruye al pasar de A a A.
(211) A causa del gran número y de la diversidad de índices, usaremos de esta notación para
las matrices, algo diferente de la seguida hasta aquí.
(212) Las proyecciones de un estado I + II son en general mezclas en I y II (cf. más adelante).
Esta circunstancia fue descubierta por L. Landau: Z. Physik, Bd, 45, 1927.
(213) La discusión matemática se apoya en una memoria de E. Schmidt: Math. Ann., Bd. 63,
1907.
(214) Esta hipótesis es susceptible de algunas variaciones, que no deben ser tenidas en cuenta
por motivos análogos.
(215) El cálculo correspondiente, para el caso discutido en III.4, de medición de la posición,
está contenido en una memoria de Weizsäcker: Z. Physik, Bd. 70, 1931.
422

CSIC
de la mecánica cuántica de la mecánica
cuántica
John von Neumann
John von Neumann

Textos Universitarios • 50
Publicado en alemán en 1932, Fundamentos matemáticos de la mecánica cuántica (1932), del po-
John von Neumann
livalente matemático húngaro John von Neumann (1903-1957), uno de los cerebros más pode-
rosos del siglo xx, contiene la presentación matemática más acabada y rigurosa de la mecánica Estudio preliminar de
cuántica, desarrollada en 1925-1926 por Werner Heisenberg, Erwin Schrödinger y Paul Dirac.
Es todo un clásico de la literatura científica. Pero, al contrario de lo que su título puede sugerir, José M. Sánchez Ron
no es solo un magnífico tratado de física matemática, con aportaciones seminales a la teoría de
los espacios de Hilbert, sino que también constituye una de las contribuciones más lúcidas al 3.ª edición
problema del significado físico de la mecánica cuántica, en particular al problema de la medida.
Cuestiones como el colapso de la función de ondas, la posibilidad de una versión causal de la
teoría cuántica (variables ocultas) o el papel del observador fueron analizadas en estas páginas por
John von Neumann con una maestría difícilmente superable, independientemente de que en
algún caso (como el de las variables ocultas) sus conclusiones fuesen matizadas más de dos déca-
das después.
ISBN: 978-84-00-10335-4
Consejo Superior de
Investigaciones Científicas
50 © Calamar Edición & Diseño.
Cub_50_TXT_Universitarios.indd 1 21/5/18 10:15

Fundamentos Matemáticos de La Mecánica Cuántica, 2018, (3. Edición) - John Von Neumann PDF

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Fundamentos Matemáticos de La Mecánica Cuántica, 2018, (3. Edición) - John Von Neumann PDF

Cargado por

Copyright:

Formatos disponibles

CSIC

John von Neumann

Cub_50_TXT_Universitarios.indd 1 21/5/18 10:15

Fund_MAT_00a.indd 3 9/5/18 10:11

CONSEJO SUPERIOR DE INVESTIGACIONES CIENTÍFICAS

Fund_MAT_00a.indd 5 9/5/18 10:11

Las noticias, los asertos y las opiniones contenidos en esta obra

Primera edición: CSIC, Instituto de Matemáticas Jorge Juan, 1949

Catálogo general de publicaciones oficiales:

Editorial CSIC: http://editorial.csic.es (correo: publ@csic.es)

Depósito Legal: M-14.900-2018

Maquetación, impresión y encuadernación: Gráficas Blanco, S. L.

En esta edición se ha utilizado papel ecológico sometido a un proceso de

Fund_MAT_00a.indd 6 9/5/18 10:11

Estudio preliminar a la tercera edición: «John von Neumann, el científico uni-

I. Consideraciones preliminares.......................................................................................  123

Fund_MAT_00b.indd 7 3/5/18 13:20

3. Equivalencia de las dos teorías: la teoría de las transformaciones.............  129

II. Generalidades acerca del espacio de Hilbert abstracto.......................................  141

III. La estadística de la Mecánica cuántica......................................................................  241

IV. Construcción deductiva de la teoría..........................................................................  307

V. Consideraciones generales.............................................................................................  337

VI. La medición........................................................................................................................  379

Fund_MAT_00b.indd 8 3/5/18 13:20

John von Neumann, el científico universal

La historia de la ciencia no es parca en científicos cuyos nombres permanecen

Fund_MAT_00c.indd 9 3/5/18 16:13

Fund_MAT_00c.indd 10 3/5/18 16:13

Aunque es imposible hacer justicia a un científico de semejante calibre, es

Los inicios de su carrera

Fund_MAT_00c.indd 11 3/5/18 16:13

Samuel J. Silverman, quien le estaba tomando declaración en ese momento,

Tradicionalmente, Rusia era un enemigo de Hungría. Hubo un intento de guerra

Fund_MAT_00c.indd 12 3/5/18 16:13

recibiera una educación adicional a cargo de matemáticos profesionales. Max von

Von Neumann era verdaderamente un prodigio y ya había hecho de las matemáti-

Es oportuno mencionar que en el campo de las ciencias físico-matemáticas,

Fund_MAT_00c.indd 13 3/5/18 16:13

en la Minta. Asimismo, todos, antes o después, abandonaron Hungría. Von Neu-

Un día, durante mi primer año en Aquisgrán, un conocido banquero de Budapest

Fund_MAT_00c.indd 14 3/5/18 16:13

convirtió en uno de los mejores matemáticos y llegó a impulsar la computadora digital,

Al mismo tiempo Von Neumann seguía estudios de Química, no solo en Zú-

Fundamentos de matemáticas: Von Neumann y Gödel

Fund_MAT_00c.indd 15 3/5/18 16:13

David Hilbert (1862-1943).

la obra de David Hilbert (1862-1943). Importante en este sentido es la célebre

Fund_MAT_00c.indd 16 3/5/18 16:13

entre Hilbert y los intuicionistas (Brouwer y Weyl, principalmente).10 Es intere-

Fund_MAT_00c.indd 17 3/5/18 16:13

Kurt Gödel (1906-1978).

matemáticas sí existen ignorabimus, esto es, proposiciones que son indecidibles;

Fund_MAT_00c.indd 18 3/5/18 16:13

Querido Sr. Gödel,

A continuación le explicaba lo que había hecho, para pasar después a decirle

Muchas gracias por su separata.16 Como usted ha establecido el teorema de la inde-

Fund_MAT_00c.indd 19 3/5/18 16:13

En 1931 parece que Von Neumann consideraba a Carnap lo suficiente para

El resultado de Gödel, recordemos, figura entre los más importantes de toda

Al desaparecer [debido a los resultados de Gödel] la principal esperanza de una

Fund_MAT_00c.indd 20 3/5/18 16:13

Como señalaba Von Neumann, la controversia sobre los fundamentos de la

Física y matemáticas en Gotinga

I. Consideraciones preliminares....................................................................................... 123

3. Equivalencia de las dos teorías: la teoría de las transformaciones............. 129

II. Generalidades acerca del espacio de Hilbert abstracto....................................... 141

III. La estadística de la Mecánica cuántica...................................................................... 241

IV. Construcción deductiva de la teoría.......................................................................... 307

V. Consideraciones generales............................................................................................. 337

VI. La medición........................................................................................................................ 379